ПО, ЭВМ и АСУ из Таможенного Союза

Информация о пользователе

Привет, Гость! Войдите или зарегистрируйтесь.


Вы здесь » ПО, ЭВМ и АСУ из Таможенного Союза » философия » Зачем нужна контекстно-зависимая грамматика русского языка


Зачем нужна контекстно-зависимая грамматика русского языка

Сообщений 1 страница 13 из 13

1

Михалник давно упрекает Лиса в том, что пора уже переходить от застревания в контекстно-свободных грамматиках к стремительному прорыву в контекстно-зависимых.

Поэтому идея такая:
1) взять какую-нибудь готовую систему описания русского языка (должны же они уже быть? За столько лет развития лингвистики...)
2) на этой основе сваять грамматику для языка программирования
  (очевидно, что такую грамматику нельзя сделать на основе КС-грамматик, а жаль)
3) набить движок словарями
4) опробовать получившийся макет (пруф-концепт)

Павиа говорит, что читать научные работы многих российских учёных невозможно. Я согласен с тем, что это общая беда российской науки, когда изначально авторами не ставится цели обеспечить воспроизводимость научной работы сторонними исследовательскими коллективами.

Тем не менее, всё-таки имеет смысл поискать/прочитать более ранние работы, вдруг нагрянет вдохновение (когда совсем его не ждёшь)?

Отредактировано Лис (2019-11-10 22:22:29)

0

2

1) взять какую-нибудь готовую систему описания русского языка (должны же они уже быть? За столько лет развития лингвистики...)
2) на этой основе сваять грамматику для языка программирования
  (очевидно, что такую грамматику нельзя сделать на основе КС-грамматик, а жаль)

Нам же весь не нужен, только достаточно полноценная выборка, поэтому 2-е не очевидно.
Соответственно и словарей м.б. много не нужно.

Отредактировано MihalNik (2019-11-11 00:45:18)

0

3

MihalNik написал(а):

2-е не очевидно.

Сколько ты меня лет пилишь, что КС не нужна? Теперь всё, поздно убеждать в обратном.

Например на 47-ой страницы книги написано:

все, что необходимо ... для усвоения языка, доступно ... непосредственно из окружающей ... речи.

И мне очень нравится эта идея, потому что она означает, что написав достаточно длинный текст можно определить синтаксис языка.
А длина некритична, потому что давно уже существует концепция повторного использования текстов (ссылкой на другой текст).
Таким образом, можно будет создать библиотеку канонических текстов, и затем писать прикладные инструкции ссылаясь на те канонические тексты.

Эпичная же цель, по крутости сравнимая с комплектами бамбуковых палок Искусства войны и пагодой Куто-до Пайя, разве нет?

Отредактировано Лис (2019-11-11 06:04:42)

0

4

Кроме того, это такая общая идея, которую можно применить и к русскому и к английскому языкам одновременно, а затем (используя единый механизм) описывать способы и конкретные случаи заимствования англицизмов (например таких слов как "чекаутить", "коммитить", "пушить"). Всё как Уткин требует - чтобы было глобально и инклюзивно.

можно ли в рамках CxG описать глобальные языковые закономерности, которые действуют во всех или практически во всех языках?

Отредактировано Лис (2019-11-11 08:35:44)

0

5

Сколько ты меня лет пилишь, что КС не нужна? Теперь всё, поздно убеждать в обратном.

Во-первых, МихалНик не пользуется определениями Хомского. Почему: заведомые ограничения сомнительной ценности, включая бесконечные грабли при работе с естестественными языками + потеря передачи мысли из-за притянутых за уши слов. Вместо этого он пользуется понятиями сетей, потому что подобных костылей там нет. И понятиями нисходящего разбора, потому что он прост - для этого про какие-то там разные типы грамматик вообще ничего знать не обязательно, если мы делаем свой язык, а не разбираем какой-то имеющийся.
Во-вторых, грамматика, необходимая для вычислительной полноты языка - заведомо мала, а грамматика русского языка - заведомо велика и слишком избыточна относительно первой.
Вроде давно же обсудили встречные пороги: если рассматривать измененные по падежам слова как просто синонимы, не учитывая падеж, то это создает уязвимость понимания действительного использования значений путем обмена двух падежей местами. А Уткин на лисоместности показал простое приведение к именительному путем удлинения конструкции в духе Ады. У него еще вскрылась ошибка с кавычками. Но обходится даже без падежей.

Отредактировано MihalNik (2019-11-11 10:56:52)

0

6

Мне не понятно, что ты написал. Я прокомментирую:

MihalNik написал(а):

не пользуется определениями Хомского

Незнание законов не освобождает от последствий и ответственности. Так, если разбор сверху-вниз, то это LL(1) - https://ru.wikipedia.org/wiki/Нисходящий_синтаксический_анализ, который все ограничения Хомского в себе несёт.

MihalNik написал(а):

потеря передачи мысли

Ты нигде не описывал, как работает механизм прослеживания (tracking) мысли, чтобы мысль не терялась. Лис не вполне владеет телепатией, и не уверен, что понимает что такое "мысль" (ссылка вроде недавно была на текст про мыслеукладчики).

MihalNik написал(а):

Вместо этого он пользуется понятиями сетей

Эта фраза вообще ни о чём, потому что любая совокупность объектов в любой куче (Java, Python, и т.п.) является сетью. Т.е. мне трудно представить парсер, в котором такие понятия не используются.

MihalNik написал(а):

если рассматривать измененные по падежам слова как просто синонимы, не учитывая падеж, то это создает уязвимость понимания действительного использования значений путем обмена двух падежей местами.

Значит падеж учитывать надо. А каким формализмом?

MihalNik написал(а):

Уткин ... обходится даже без падежей.

Это заведомо провальный вариант. Придёт МихалНик и спросит: "А падежи там есть?". И всё... всё насмарку.

Отредактировано Лис (2019-11-11 13:38:41)

0

7

Так, если разбор сверху-вниз, то это

Достаточно для построения полноценного ЯП. Это главное, что нужно о нем знать.

Т.е. мне трудно представить парсер, в котором такие понятия не используются.

Зато навалом таких, где используется куча других избыточных определений.

Отредактировано MihalNik (2019-11-11 18:03:03)

0

8

О ПОГОВОРКЕ "МОЖЕТ БЫТЬ, ЭТО И ВЕРНО В ТЕОРИИ,НО НЕ ГОДИТСЯ ДЛЯ ПРАКТИКИ" 1793
Кант И. Собрание сочинений в восьми томах. Том 8., страница 158
1793, Кант, Über den Gemeinspruch: Das mag gut sein  für die Theorie, taugt aber nichts in der Praxis, 28 страниц

никто не может выдавать себя за человека практически опытного в той или иной науке и вместе с тем презирать теорию, если только он не хочет показать, что он невежда в своей специальности, поскольку думает, что, когда он предпринимает наугад разные попытки и приобретает новый опыт, не накапливая при этом определенных принципов (которые, собственно, и составляют то, что называется теорией) и не осмысливая своего дела как чего-то целого (которое, если при этом поступают методически, и называется системой), он может идти дальше, чем его в состоянии повести теория.

0

9

Лис написал(а):

О ПОГОВОРКЕ "МОЖЕТ БЫТЬ, ЭТО И ВЕРНО В ТЕОРИИ,НО НЕ ГОДИТСЯ ДЛЯ ПРАКТИКИ".

Все верно, ничего не дает для русскоязычного программирования бесконечное употребление словосочетаний "контекстно-зависимая", "контекстно-независимая", "LL(1)" и фамилии Хомского.

0

10

Вся тема как раз про это. Что теперь нужно повторять словосочетание "грамматика конструкций" и фамилию Рахлиной (Raxxla).

Отредактировано Лис (2019-11-12 03:27:41)

0

11

Лис написал(а):

Так, если разбор сверху-вниз, то это LL(1) - https://ru.wikipedia.org/wiki/Нисходящи … ий_анализ, который все ограничения Хомского в себе несёт.

Ничего не смущает?:

MihalNik написал(а):

МихалНик не пользуется определениями Хомского.

MihalNik написал(а):

Вместо этого он пользуется понятиями сетей, потому что подобных костылей там нет.

Это значит не надо заменять русские слова английскими, вставляя устоявшиеся словосочетания узкого смысла из чужого языка.
Во-первых, разбору дерева сверху вниз при переходе к произвольному графу на теорию и ограничения Вашего Хомского глубоко "положить".
Во-вторых, любая грамматика при этом получается однозначной. И может быть сложнее КС.
В-третьих, если длина конструкций и выражений достаточно ограничена (т.е. как раз на деле, а не в этих ваших теориях) работает быстро. Получить очевидно линейную зависимость времени ничего не стоит, хотя это вообще не существенно.

Лис написал(а):

нужно повторять словосочетание "грамматика конструкций"

Словосочетание "грамматика конструкций" либо не завершенное (требуется с уточнением, например, "грамматика конструкции цикла"), либо навешивает дополнительные ограничения на все конструкции (например, каждая конструкция пишется в скобочках, аля лисп, тогда можно говорить об их общей грамматике), либо не отличимо от слова "грамматика". В любом случае получается нагромождение слов и зачем повторять их не ясно.

Лис написал(а):

и фамилию

Образец практичности!

Отредактировано MihalNik (2019-11-12 11:57:55)

0

12

MihalNik написал(а):

Во-первых, разбору дерева сверху вниз при переходе к произвольному графу

Тут неясно, откуда берётся дерево. Входной текст-то он вообще говоря - строка.

MihalNik написал(а):

Во-вторых, любая грамматика при этом получается однозначной.

Грамматика не получается, грамматика берётся автором программы и кодируется в виде парсера.

MihalNik написал(а):

И может быть сложнее КС.

Это у Мельчука может, потому что он об этом пачку книжкек написал. А у МихалНика не может, потому что неясно как задумка МихалНика должна работать.

MihalNik написал(а):

это вообще не существенно.

Отлично, несущественно, значит пропустим пока.

    нужно повторять словосочетание "грамматика конструкций"

MihalNik написал(а):

Словосочетание "грамматика конструкций" ... и зачем повторять их не ясно.

Это потому что ты две соседние темы не прочитал:
(CxG) Construction Grammar (не знаю перевод, грамматика конструкций?)
FCG = Fluid Construction Grammar

MihalNik написал(а):

Образец практичности!

Человек занимается разбором русского языка более 40 лет, и настольно этим прославился, что попал в википедию.
Этот человек советует использовать грамматики конструкций. Я считаю, что практично воспользоваться советом.

Отредактировано Лис (2019-11-12 16:02:15)

0

13

неясно как задумка МихалНика должна работать

Причем здесь МихалНик, когда теории лет сто и она давно работает?

Тут неясно, откуда берётся дерево. Входной текст-то он вообще говоря - строка.

Чего тут непонятного? Что дерево - абстракция, частный случай сети? Непонятно в вики по ссылке?:

Алгоритм поиска описывается рекурсивно: перебираем все исходящие из рассматриваемой вершины рёбра. Если ребро ведёт в вершину, которая не была рассмотрена ранее, то запускаем алгоритм от этой нерассмотренной вершины, а после возвращаемся и продолжаем перебирать рёбра. Возврат происходит в том случае, если в рассматриваемой вершине не осталось рёбер, которые ведут в нерассмотренную вершину. Если после завершения алгоритма не все вершины были рассмотрены, то необходимо запустить алгоритм от одной из нерассмотренных вершин

Непонятно, что вершина - позиция в тексте? Что ребро - следующая конструкция?

Отлично, несущественно, значит пропустим пока.

Поздно, уже все себе головы забили этими ограниченными грамматиками)

грамматика берётся автором программы и кодируется в виде парсера

И магическими обрядами)

Человек занимается разбором русского языка более 40 лет

А не языками программирования и математикой. Поэтому вместо нового алгоритма он придумывает кучу определений.

нужно повторять словосочетание "грамматика конструкций"

В программировании оно десятки лет, без кавычек и скрытого смысла. Можете, конечно, называть им еще сами не знаете что)

Отредактировано MihalNik (2019-11-12 16:53:35)

0


Вы здесь » ПО, ЭВМ и АСУ из Таможенного Союза » философия » Зачем нужна контекстно-зависимая грамматика русского языка