ПО, ЭВМ и АСУ из Таможенного Союза

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.



Global WordNet

Сообщений 1 страница 5 из 5

1

https://ru.wikipedia.org/wiki/WordNet
https://zh.wikipedia.org/wiki/WordNet
https://en.wikipedia.org/wiki/WordNet

Включает в себя более 200 языков, лицензия BSD.
Является комбинацией словаря и тезауруса.

175 979 synsets

Если, допустим, тратить по одному дню на понятие, то на создание аналога потребуется 482 года жизни (и знание 200 языков).
Максимальный срок жизни человека - 125 лет, читать-писать учатся минимум в 5 лет. 480/120 = 4.
Из этого следует, что такие штуки можно делать только по принципам "толпотворения" (crowd source) или "командной разработки".

0

2

Проект изначально задумывался спецслужбами США,
DARPA участвовала,
для облегчения языкового общения американских спецагентов,
разбросанных по всему миру.

0

3

Установил программу.
Но только английский язык есть.
На сайте не нашёл, где русский можно скачать.
Может быть, для писателей будет полезна программа,
и для переводчиков.
Пока что как-то не очень.

0

4

NuShaman написал(а):

не нашёл, где русский можно скачать

https://ruwordnet.ru/ru

111.5 тысяч слов и выражений русского языка.

«Версия создана при поддержке фонда РФФИ (грант 18-00-01226 в составе комплексного проекта 18-00-01240 (K))»

https://pypi.org/project/ruwordnet/

    установите пакет и скачайте файл с тезаурусом (около 80 мб):

pip install ruwordnet
ruwordnet download

2016, Лукашевич Н.В. & Лашевич Г. & Герасимова А.А. & Иванов В.В. & Добров Б.В., Порождение тезауруса типа wordnet для русского языка
    https://istina.msu.ru/download/30140125 … yauUqcSnI/

описывается автоматизированная процедура создания русского тезауруса типа WordNet (RuWordNet) путем трансформации тезауруса русского языка РуТез (опубликованной версии РуТез-lite 2.0).
Первая версия RuWordNet создана и доступна для просмотра в Интернет и в виде xml файлов.

Отредактировано Лис (2022-07-11 14:36:09)

0

5

Лис написал(а):

Из этого следует, что такие штуки можно делать только по принципам "толпотворения" (crowd source) или "командной разработки".

Не следует. Представленные в словаре данные вполне выдяляемы машинными алгоритмами.

0