Яр молчит уже 53-ий день, я волнуюсь.

Страница: 1

Сообщений 1 страница 16 из 16

Поделиться12017-09-06 10:29:24

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Последний публично озвученный план развития сообщества как сообщества был такой:
1) написать программу-калькулятор (кстати, не очень понятно, что тут имелось в виду) на русском языке программирования
2) после этого начать широкую компанию в интернете по привлечению новых людей на форум.

Тут у меня два вопроса:
1) зачем нужен калькулятор и нельзя ли начать привлекать людей сразу, до его написания
2) зачем нужен калькулятор сам-по-себе?

Написать калькулятор можно, например на языке КуМир, всё там для этого есть, вроде бы.
Написать на бумажке грамматику разбираемых выражений, устранить левую рекурсию, пострить детерминированный МП-автомат по грамматике (это то, что делает утилита yacc, и называется LALR, но ничто не мешает проделать это руками).
Стек расширенного МП-автомата можно сэмулировать при помощи массива, а больше, вроде бы ничего и не нужно.

Такую программу можно запустить на web, вот проект по этому поводу:
https://github.com/axelofan/kumir
"Программа пишется на школьном алгоритмическом языке, затем транслируется в JS код и исполняется в браузере."

Отредактировано Лис (2017-09-06 10:41:57)

Поделиться22017-09-06 10:51:44

Автор: MihalNik
Участник
Зарегистрирован: 2017-08-17
Приглашений: 0
Сообщений: 1132
Уважение: [+9/-1]
Позитив: [+7/-0]
Провел на форуме:
21 день 15 часов
Последний визит:
2026-02-08 03:36:31

Яр молчит уже 53-ий день, я волнуюсь.

Он, кажется, писал, что летом будет в отпуске.
Надо вернутся к вопросу парсинга с этих движков. Инженер вроде что-то делал.

Лис написал(а):

1) написать программу-калькулятор (кстати, не очень понятно, что тут имелось в виду) на русском языке программирования

Лис написал(а):

2) зачем нужен калькулятор сам-по-себе?

Скорее встал вопрос, почему мы не можем этого сделать, что такое калькулятор и какой именно калькулятор нужен и как он должен быть связан с русским языком.

Поделиться32017-09-06 11:35:17

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

MihalNik написал(а):

Надо вернутся к вопросу парсинга с этих движков.

Работой по сохранению полезного контента в интернете занимается web.archive.org
Если Вам особо понравилась какая-то страница, можно принудить его к сохранению состояния на текущий момент,
указав URL, который надо сохранить.

Если кто-то напишет нетленку, он может её сохранить в git-репозиториях, их много (github, bitbucket и другие), таким образом можно обспечить резервирование.

Зачем нужен парсинг форумов? Просто потому что мы можем?

Отредактировано Лис (2017-09-06 11:45:40)

Поделиться42017-09-06 14:42:11

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Лис написал(а):

Написать на бумажке грамматику разбираемых выражений

Грамматика Г это четвёрка <Н, Т, С, П>, где Н - это множество нетерминальных символов, Т - это множество терминальных символов, С - это стартовый символ, П - это множество правил вывода.

Нетерминальные символы Н = {н1,н2,н3,н4,н5}

Запишем терминалы для калькулятора Т={т₁,т₂,т₃,...,т₇}:
т₁ = '+'
т₂ = '-'
т₃ = '*'
т₄ = '/'
т₅ = '('
т₆ = ')'
т₇ = '1'

Стартовый символ С = { н₁ } (тут есть варианты, стартовый символ может быть один, а может быть несколько, если алгоритм типа CYK)

Запишем правила вывода для калькулятора П = {п₁,п₂,п₃,...,п₁₄}, где
п₁: н₁ -> н₂
п₂: н₁ -> н₃
п₃: н₂ -> н₄
п₄: н₂ -> н₄ н₅
п₅: н₃ -> т₁ н₂
п₆: н₃ -> т₂ н₂
п₇: н₃ -> т₁ н₂ н₃
п₈: н₃ -> т₂ н₂ н₃
п₉: н₄ -> т₃ н₅
п₁₀: н₄ -> т₄ н₅
п₁₁: н₄ -> т₃ н₅ н₄
п₁₂: н₄ -> т₄ н₅ н₄
п₁₃: н₅ -> т₅ н₁ т₆
п₁₄: н₅ -> т₇

Поделиться52017-09-06 14:51:05

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

устранить левую рекурсию

читаем это - https://neerc.ifmo.ru/wiki/index.php?title=Устранение_левой_рекурсии

Упорядочим нетерминалы, например по возрастанию индексов, и будем добиваться того, чтобы не было правил вида
н_и -> н_к остаток правила, где к < и

у нас таких правил нет, значит левая рекурсия устранена.

Поделиться62017-09-06 15:49:14

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Лис написал(а):

пострить детерминированный МП-автомат по грамматике

Читаем алгоритм 5.3 с этой страницы - https://studfiles.net/preview/4599551/page:11/

расширенный МП-автомат А это семёрка <Т, Ш, М, Х, сcа, Ф, Д>, где
Т - это множество символов входного алфавита
Ш - это символы, которые могут встречаться на стеке (терминалы и нетерминалы из грамматики выше, всего 7 + 14 = 21)
М - множество состояний автомата
Х - функция переходов, которая по текущей ситуации {м, т, ш*} выдаёт следующее состояние <м', ш'>
(расширенным этот автомат является, потому что он в стеке проверяет наличие цепочки символов стека, а не только одного)
сcа - стартовое состояние автомата
Ф - множество заключительных/конечных состояний автомата
Д - начальный символ в стеке

Состояний у автомата будет два: М = {р, з} - рабочее и завершающее

Функция переходов проверяет,
не находится ли на стеке правая часть какого-нибудь правила (если да, то производит свёртку)
если на стеке пара <Д, С> и символы закончились, то переходит в конечное состояние,
иначе кладёт терминал на стек и удаляет терминал из входного потока (выполняет сдвиг).

В этом алгоритме всё прекрасно, кроме одного - как автомат считать результат выражения будет - не описано.
мы пока предположим, что во время свёртки автомат выводит символы в выходной поток, они там оказываются в инверсной польской записи, что позволяет потом провести вычисления (но не всё тут так просто из-за унарных плюса и минуса).

Поделиться72017-09-06 20:25:54

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Тут внезапно обнаруживаются две вещи:
1) для LR-парсеров можно было не устранять левую рекурсию
а это нужно для сохранения ассоциативности операций,
потому что мы пишем не Recursive Descent-парсер, и хвостовая рекурсия не может быть заменена циклом
так что грамматику надо будет написать ещё раз.
2) таблицы при генерировании сжимаются,
примерно так:
https://www.cs.uic.edu/~spopuri/cparser.html#table-compression
обратите внимание, что англичане не поленились и проделали составление таблиц руками.

Новая грамматика (точнее только правила для неё):
п₁: н₁ -> н₂
п₂: н₁ -> н₃
п₃: н₂ -> н₄
п₄: н₂ -> н₂ т₁ н₄
п₅: н₂ -> н₂ т₂ н₄
п₆: н₃ -> н₅
п₇: н₃ -> н₃ т₁ н₄
п₈: н₃ -> н₃ т₂ н₄
п₉: н₄ -> н₆
п₁₀: н₄ -> н₄ т₃ н₆
п₁₁: н₄ -> н₄ т₄ н₆
п₁₂: н₅ -> т₂ н₆
п₁₃: н₅ -> н₅ т₃ н₆
п₁₄: н₅ -> н₅ т₄ н₆
п₁₅: н₆ -> т₇
п₁₆: н₆ -> т₅ н₁ т₆

Отредактировано Лис (2017-09-06 20:26:05)

Поделиться82017-09-06 21:05:40

Автор: MihalNik
Участник
Зарегистрирован: 2017-08-17
Приглашений: 0
Сообщений: 1132
Уважение: [+9/-1]
Позитив: [+7/-0]
Провел на форуме:
21 день 15 часов
Последний визит:
2026-02-08 03:36:31

Лис написал(а):

Зачем нужен парсинг форумов? Просто потому что мы можем?

Нет. Потому что часть страниц закрыта от чтения без рег-ции.

Вопрос тот же:
Каким боком поделка 4-7 к русскому языку, что считать калькулятором и какой калькулятор нужен?
Например, давал ссылку. где был спрос на эффективную длинную (не наивную) арифметику.
Т.е. потребность в хорошем средстве по-прежнему есть.

Отредактировано MihalNik (2017-09-06 21:16:47)

Поделиться92017-09-06 22:05:45

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

MihalNik написал(а):

часть страниц закрыта от чтения без рег-ции

Это плохие, не нужные всем людям России страницы. Если бы это были хорошие страницы, они были бы доступными для чтения.

MihalNik написал(а):

Вопрос тот же:
Каким боком поделка 4-7 к русскому языку, что считать калькулятором и какой калькулятор нужен?

Я первый спросил!

MihalNik написал(а):

Например, давал ссылку. где был спрос на эффективную длинную (не наивную) арифметику.
Т.е. потребность в хорошем средстве по-прежнему есть.

Лично у меня такой потребности нет, я не пользуюсь длинными числами. Кому надо - тот и делает!

Поделиться102017-09-07 01:01:57

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

https://en.wikipedia.org/wiki/LR_parser … tween_them

Ситуация - это Earley Item, то есть запись некоего правила с точкой (Earley Dot = •) внутри него

Группа ситуаций - несколько ситуаций, по каким-то причинам объединённых в одну группу.

Итак, составим список групп ситуаций (он же будет списком состояний ДКА).

Состояние {1}
$accept -> • н₁ $кон
+ н₁ -> • н₂
+ н₁ -> • н₃
+ н₂ -> • н₄
+ н₂ -> • н₂ т₁ н₄
+ н₂ -> • н₂ т₂ н₄
+ н₃ -> • н₅
+ н₃ -> • н₃ т₁ н₄
+ н₃ -> • н₃ т₂ н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₅ -> • т₂ н₆
+ н₅ -> • н₅ т₃ н₆
+ н₅ -> • н₅ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₂{2}, т₅{3}, т₇{4}, н₁{5}, н₂{6}, н₃{7}, н₄{8}, н₅{9}, н₆{10}

Состояние {2}
н₅ -> т₂ • н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₆{11}

Состояние {3}
н₆ -> т₅ • н₁ т₆
+ н₁ -> • н₂
+ н₁ -> • н₃
+ н₂ -> • н₄
+ н₂ -> • н₂ т₁ н₄
+ н₂ -> • н₂ т₂ н₄
+ н₃ -> • н₅
+ н₃ -> • н₃ т₁ н₄
+ н₃ -> • н₃ т₂ н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₅ -> • т₂ н₆
+ н₅ -> • н₅ т₃ н₆
+ н₅ -> • н₅ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₂{2}, т₅{3}, т₇{4}, н₁{12}, н₂{6}, н₃{7}, н₄{8}, н₅{9}, н₆{10}

Состояние {4}
н₆ -> т₇ •

Состояние {5}
$accept -> н₁ • $кон

Состояние {6}
н₁ -> н₂ •
н₂ -> н₂ • т₁ н₄
н₂ -> н₂ • т₂ н₄
Следующие символы: т₁{14}, т₂{15}

Состояние {7}
н₁ -> н₃ •
н₃ -> н₃ • т₁ н₄
н₃ -> н₃ • т₂ н₄
Следующие символы: т₁{22}, т₂{23}

Состояние {8}
н₂ -> н₄ •
н₄ -> н₄ • т₃ н₆
н₄ -> н₄ • т₄ н₆
Следующие символы: т₃{17}, т₄{18}

Состояние {9}
н₃ -> н₅ •
н₅ -> н₅ • т₃ н₆
н₅ -> н₅ • т₄ н₆
Следующие символы: т₃{26}, т₄{27}

Состояние {10}
н₄ -> н₆ •

Состояние {11}
н₅ -> т₂ н₆ •

Состояние {12}
н₆ -> т₅ н₁ • т₆
Следующие символы: т₆{13}

Состояние {13}
н₆ -> т₅ н₁ т₆ •

Состояние {14}
н₂ -> н₂ т₁ • н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₄{16}, н₆{10}

Состояние {15}
н₂ -> н₂ т₂ • н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₄{21}, н₆{10}

Состояние {16}
н₂ -> н₂ т₁ н₄ •
н₄ -> н₄ • т₃ н₆
н₄ -> н₄ • т₄ н₆
Следующие символы: т₃{17}, т₄{18}

Состояние {17}
н₄ -> н₄ т₃ • н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₆{19}

Состояние {18}
н₄ -> н₄ т₄ • н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₆{20}

Состояние {19}
н₄ -> н₄ т₃ н₆ •

Состояние {20}
н₄ -> н₄ т₄ н₆ •

Состояние {21}
н₂ -> н₂ т₂ н₄ •
н₄ -> н₄ • т₃ н₆
н₄ -> н₄ • т₄ н₆
Следующие символы: т₃{17}, т₄{18}

Состояние {22}
н₃ -> н₃ т₁ • н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₄{24}, н₆{10}

Состояние {23}
н₃ -> н₃ т₂ • н₄
+ н₄ -> • н₆
+ н₄ -> • н₄ т₃ н₆
+ н₄ -> • н₄ т₄ н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₄{25}, н₆{10}

Состояние {24}
н₃ -> н₃ т₁ н₄ •
н₄ -> н₄ • т₃ н₆
н₄ -> н₄ • т₄ н₆
Следующие символы: т₃{17}, т₄{18}

Состояние {25}
н₃ -> н₃ т₂ н₄ •
н₄ -> н₄ • т₃ н₆
н₄ -> н₄ • т₄ н₆
Следующие символы: т₃{17}, т₄{18}

Состояние {26}
н₅ -> н₅ т₃ • н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₆{28}

Состояние {27}
н₅ -> н₅ т₄ • н₆
+ н₆ -> • т₇
+ н₆ -> • т₅ н₁ т₆
Следующие символы: т₅{3}, т₇{4}, н₆{29}

Состояние {28}
н₅ -> н₅ т₃ н₆ •

Состояние {29}
н₅ -> н₅ т₄ н₆ •

Теперь можно составить пару таблиц (состояния x терминальные символы, состояния x нетерминалы) и начать рубить код на КуМир'е

http://ict.edu.ru/ft/005128/ch7.pdf, страница 5

Управляющая программа выглядит следующим образом:
Установить ip на первый символ входной цепочки w$;
while (цепочка не закончилась)
{
Пусть s – состояние на вершине магазина, a – символ входной цепочки, на который указывает ip.
if (action [s, a] == shift s’)
{
push (a);
push (s’);
ip++;
}
else if (action [s, a] == reduce A→β)
{
for (i=1; i<=|β|; i++)
{
pop ();
pop ();
}
Пусть s’ – состояние на вершине магазина;
push (A);
push (goto [s’, A]);
Вывод правила (A→β);
}
else if (action [s, a] == accept)
{
return success;
}
else
{
error ();
}
}

Отредактировано Лис (2017-09-09 10:51:22)

Поделиться112017-09-07 10:39:47

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

По алгоритму со страницы - https://en.wikipedia.org/wiki/LR_parser … oto_tables

	т₁	т₂	т₃	т₄	т₅	т₆	т₇	$кон	н₁	н₂	н₃	н₄	н₅	н₆
{1}	-	2	-	-	3	-	4	-	5	6	7	8	9	10
{2}	-	-	-	-	3	-	4	-	-	-	-	-	-	11
{3}	-	2	-	-	3	-	4	-	12	6	7	8	9	10
{4}	п₁₅	п₁₅	п₁₅	п₁₅	п₁₅	п₁₅	п₁₅	п₁₅	-	-	-	-	-	-
{5}	-	-	-	-	-	-	-	вых	-	-	-	-	-	-
{6}	14	15	-	-	-	-	-	-	-	-	-	-	-	-
{7}	22	23	-	-	-	-	-	-	-	-	-	-	-	-
{8}	-	-	17	18	-	-	-	-	-	-	-	-	-	-
{9}	-	-	26	27	-	-	-	-	-	-	-	-	-	-
{10}	п₉	п₉	п₉	п₉	п₉	п₉	п₉	п₉	-	-	-	-	-	-
{11}	п₁₂	п₁₂	п₁₂	п₁₂	п₁₂	п₁₂	п₁₂	п₁₂	-	-	-	-	-	-
{12}	-	-	-	-	-	13	-	-	-	-	-	-	-	-
{13}	п₁₆	п₁₆	п₁₆	п₁₆	п₁₆	п₁₆	п₁₆	п₁₆	-	-	-	-	-	-
{14}	-	-	-	-	3	-	4	-	-	-	-	16	-	10
{15}	-	-	-	-	3	-	4	-	-	-	-	21	-	10
{16}	-	-	17	18	-	-	-	-	-	-	-	-	-	-
{17}	-	-	-	-	3	-	4	-	-	-	-	-	-	19
{18}	-	-	-	-	3	-	4	-	-	-	-	-	-	20
{19}	п₁₀	п₁₀	п₁₀	п₁₀	п₁₀	п₁₀	п₁₀	п₁₀	-	-	-	-	-	-
{20}	п₁₁	п₁₁	п₁₁	п₁₁	п₁₁	п₁₁	п₁₁	п₁₁	-	-	-	-	-	-
{21}	-	-	17	18	-	-	-	-	-	-	-	-	-	-
{22}	-	-	-	-	3	-	4	-	-	-	-	24	-	10
{23}	-	-	-	-	3	-	4	-	-	-	-	25	-	10
{24}	-	-	17	18	-	-	-	-	-	-	-	-	-	-
{25}	-	-	17	18	-	-	-	-	-	-	-	-	-	-
{26}	-	-	-	-	3	-	4	-	-	-	-	-	-	28
{27}	-	-	-	-	3	-	4	-	-	-	-	-	-	29
{28}	п₁₃	п₁₃	п₁₃	п₁₃	п₁₃	п₁₃	п₁₃	п₁₃	-	-	-	-	-	-
{29}	п₁₄	п₁₄	п₁₄	п₁₄	п₁₄	п₁₄	п₁₄	п₁₄	-	-	-	-	-	-

Отредактировано Лис (2017-09-07 18:29:45)

Поделиться122017-09-07 11:20:39

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

В этой таблице мне не ясно, когда происходит свёртка для бинарных плюсов и минусов.

Состояние {6}
н1 -> н2 •
н2 -> н2 • т1 н4
н2 -> н2 • т2 н4
Следующие символы: т1{14}, т2{15}

Глядя на это состояние можно было бы предположить, что тут то-ли свёртка, то-ли сдвиг.

https://en.wikipedia.org/wiki/Simple_LR_parser
"A grammar that has no shift/reduce or reduce/reduce conflicts when using follow sets is called an SLR grammar"
"If a grammar has table conflicts when using SLR follow sets, but is conflict-free when using LALR follow sets, it is called a LALR grammar."

раз конфликты есть, значит эта грамматика не SLR, переходим к следующему алгоритму.

https://en.wikipedia.org/wiki/LALR_parser
описания смысла алгоритма на той странице нет, но есть ссылка - https://web.cs.dal.ca/~sjackson/lalr1.html
для этой грамматики нужно построить множества (начал/концов) и другие таблицы

https://ru.wikipedia.org/wiki/LALR(1)
На русской станице википедии есть удобочитаемое объяснение смысла алгоритма

Пусть есть грамматика, не разбираемая из-за конфликтов сдвиг-свертка или свертка-свертка по алгоритму SLR(1).

В этом случае грамматика преобразуется следующим образом:

- ищется нетерминал, на котором возникла вызвавшая конфликт свертка. Обозначим его A.
- вводятся новые нетерминалы A1, A2, …, An, по одному на каждое появление A в правых частях правил.
- везде в правых частях правил A заменяется на соответствующее Ak.
- набор правил с A в левой части повторяется n раз по разу для каждого Ak.
- правила с A в левой части удаляются, тем самым полностью удаляя A из грамматики.

Для преобразованной грамматики (она изоморфна исходной) повторяется попытка построения SLR(1) таблицы разбора.

Действие основано на том, что Follow(A) есть объединение всех Follow(Ak). В каждом конкретном состоянии новая грамматика имеет уже не A, а одно из Ak, то есть множество Follow для данного состояния имеет меньше элементов, чем для A в исходной грамматике.

Это приводит к тому, что для LALR(1) совершается меньше попыток поставить «приведение» в клеточку таблицы разбора, что уменьшает риск возникновения конфликтов с приведениями, иногда вовсе избавляет от них и делает грамматику, не разбираемую по SLR(1), разбираемой после преобразования.

К гадалке не ходить - в нашем случае это списки. Поэтому можно попробовать переделать второй вариант грамматики в третий.
Но применение в лоб русского описания алгоритма не даёт годного результата,
т.к. хотя конфликты сдвиг/свёртка пропадают, зато появляются конфликты свёртка/свёртка.

Происходит это так:
Преобразуемая грамматика-пример.
н1 -> н2
н2 -> н2 т1 т7
н2 -> т7

После преобразования:
н1 -> н2a
н2a -> н2b т1 т7
н2a -> т7
н2b -> н2b т1 т7
н2b -> т7

и всё бы хорошо, только
н2a -> т7
н2b -> т7
дают конфликт свёртка-свёртка...

Вывод: прийдётся всё-таки разбираться в оригинальной работе...

Отредактировано Лис (2017-09-08 09:20:49)

Поделиться132017-09-08 11:47:20

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Пробуем сделать новую таблицу состояний, как предлагают в описании алгоритма LALR - https://web.cs.dal.ca/~sjackson/lalr1.html

Будем теперь обозначать номера наборов - верхними индексами, чтобы индексы не путались.

п₁: н₁ -> н₂
п₂: н₂ -> н₂ т₁ т₂
п₃: н₂ -> т₂

Наборы:

набор {1}
$accept -> • н₁ $кон
+ н₁ -> • н₂
+ н₂ -> • н₂ т₁ т₂
+ н₂ -> • т₂
Следующие символы: ¹т₂², ¹н₁³, ¹н₂⁴

набор {2}
н₂ -> т₂ •

набор {3}
$accept -> н₁ • $кон

набор {4}
н₁ -> н₂ •
н₂ -> н₂ • т₁ т₂
Следующие символы: ⁴т₁⁵

набор {5}
н₂ -> н₂ т₁ • т₂
Следующие символы: ⁵т₂⁶

набор {6}
н₂ -> н₂ т₁ т₂ •

таблица переходов LR(0) выглядит так:

	т₁	т₂	$кон	н₁	н₂
{1}	-	2	-	3	4
{2}	-	-	-	-	-
{3}	-	-	вых	-	-
{4}	5	-	-	-	-
{5}	-	6	-	-	-
{6}	-	-	-	-	-

построим расширенную грамматику
¹н₁⁴ -> ¹н₂⁴
¹н₂⁶ -> ¹н₂⁴ ⁴т₁⁵ ⁵т₂⁶
¹н₂² -> ¹т₂²

Из полученного можно констатировать - перевести/понять раздел "Syntax Analysis Goal: Extended Grammars" с этой страницы мне не удалось (а там в начале инструкция - если не поняли, не двигайтесь дальше, сидите и медитируйте).

https://habrahabr.ru/post/140339/

Решение очевидно — детерминирование пунктов, порождающих свертку, по ожидаемому символу. То есть {C = B ·} трансформируется условно в {C = B · [expect EOF]} или для краткости {C = B ·, EOF}. Затрагиваются всего 2 момента — генерация пунктов (необходимо создавать пункты нового формата) и генерация ячеек со сверткой.

чувствую себя неочевиднящим

Рассмотрим вывод бизона (3-го):

Grammar

0 $accept: input $end

1 input: rule

2 rule: rule '+' '1'
3 | '1'

Terminals, with rules where they appear

$end (0) 0
'+' (43) 2
'1' (49) 2 3
error (256)

Nonterminals, with rules where they appear

$accept (5)
on left: 0
input (6)
on left: 1, on right: 0
rule (7)
on left: 2 3, on right: 1 2

State 0

0 $accept: . input $end

'1' shift, and go to state 1

input go to state 2
rule go to state 3

State 1

3 rule: '1' .

$default reduce using rule 3 (rule)

State 2

0 $accept: input . $end

$end shift, and go to state 4

State 3

1 input: rule . [$end]
2 rule: rule . '+' '1'

'+' shift, and go to state 5

$default reduce using rule 1 (input)

State 4

0 $accept: input $end .

$default accept

State 5

2 rule: rule '+' . '1'

'1' shift, and go to state 6

State 6

2 rule: rule '+' '1' .

$default reduce using rule 2 (rule)

У него есть совершенно чудесный пункт

Код:

State 3

    1 input: rule .  [$end]
    2 rule: rule . '+' '1'

    '+'  shift, and go to state 5

    $default  reduce using rule 1 (input)

https://www.gnu.org/software/bison/manu … nding.html
"some items are eligible only with some set of possible lookahead tokens. When run with --report=lookahead, Bison specifies these lookahead tokens"

но как он получен - непонятно

он выведен из правой части таблицы про переходы с нетерминалов.
http://3e8.org/pub/scheme/doc/parsing/Efficient Computation of LALR(1) Look-Ahead Sets.pdf
we focus attention on nonterminal transitions and define "follow sets" for them.
и там 35 страниц объяснений, как это правильно сделать.

Поэтому, прогоним грамматику через бизон, полученную таблицу используем (без понимания того, как она получена).
Но так - не спортивно, весь интерес пропадает.

Отредактировано Лис (2017-09-08 15:35:02)

Поделиться142017-09-08 16:05:45

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

http://www.larc.usp.br/~pbarreto/LR.pdf

most popular is undoubtedly DeRemer and Pennello’s
algorithm by Park, Choe and Chang (henceforth called simply PCC) is arguably more efficient,
and another by Ives is claimed to be even more so.
Recent research into the subject includes the method of Anzai.

2003, Paulo S. L. M. Barreto, "An Efficient LALR(1) and LR(1) Lookahead Set Algorithm," technical report.
1991, H. Anzai. Almost boolean algebraic computation of LALR(1) look-ahead set. Journal of Information Processing, 14(1):1–15.
(текст не нашел)
1986, Ives. Unifying view of recent LALR (1) lookahead set algorithms. SIGPLAN Notices, 21(7):131–135
(если бы у нас была подписка на ACM, то текст можно было бы прочитать там, в открытом интернете я его не нашел)
1985, Park, Choe, Chang, A New Analysis of LALR Formalisms
1982, DeRemer, Pennello. Efficient computation of LALR(1) look-ahead sets. ACM Transactions on Programming Languages and Systems, 4(4):615–649,

учитаться можно...

Вот тут вроде понятно расписано, как вычисляется LOOKAHEAD для каждого правила вывода. Надо будет как-нибудь при случае попробовать...

Отредактировано Лис (2017-09-08 22:59:57)

Поделиться152017-09-09 13:06:56

Автор: ВежливыйЛис
Администратор
Зарегистрирован: 2017-03-25
Приглашений: 0
Сообщений: 1120
Уважение: [+2/-1]
Позитив: [+4/-1]
Провел на форуме:
7 дней 15 часов
Последний визит:
2026-05-13 16:47:36

Калькулятор нужен какой-нибудь особенный. Назовём его "предельно простой целочисленный (ППЦ)".
Число будем использовать одно - "палочка", и операцию одну.
Поскольку операция одна, (например операция склейки/конкатенации.
Для стрелок Пирса/штрихов Шиффера нужны скобки, а лень)
то мы никак не будем её обозначать на письме.

На входе калькулятор будет получать палочки логически разделённые подразумеваемым символом склейки,
а на выходе будет выдавать результат склейки
(визуально выход не будет отличаться от входа, но нам важно не это).

грамматика
: выражение
;

выражение
: выражение палочка
| палочка
;

палочка
: '1'
;

Для краткости сократим названия нетерминалов до н₁ и н₂,
а терминала до т₁

н₁ -> н₂
н₂ -> н₂ т₁
н₂ -> т₁

Составим для автомата ситуации, но не как в прошлый раз для LR(0) а теперь для LR(1)

набор 1
н₁ -> • н₂, {$end}
здесь, наверное, должна быть сгенерирована "свёртка" п₁, она же (у нас) финальная
н₂ -> • н₂ т₁, {т₁}
н₂ -> • т₁, {т₁}

набор 2
н₂ -> н₂ • т₁, {т₁}
н₂ -> • т₁, {т₁}

набор 3
н₂ -> т₁ • , {т₁, $end}
здесь, наверное, и будет проверена правильность реализации алгоритма вычисления follow sets
здесь, наверное, должна быть сгенерирована "свёртка" п₃

набор 4
н₂ -> н₂ т₁ •, {$end}
здесь, наверное, должна быть сгенерирована "свёртка" п₂

Конфликта теперь вроде бы нет. Надо попробовать на грамматике по-крупнее...

Отредактировано Лис (2017-09-09 13:41:31)

Поделиться162017-09-09 18:24:31

Автор: utkin
Созидатель языка Валентина-2
Зарегистрирован: 2017-07-27
Приглашений: 0
Сообщений: 1105
Уважение: [+2/-0]
Позитив: [+4/-0]
Провел на форуме:
11 дней 18 часов
Последний визит:
2019-07-19 07:12:54

С Яром все в порядке. У него много работы и оффлайновых дел.

Страница: 1

Нужен автокод - иностранцам вежливо настраивать язык кириллический

Меню навигации

Пользовательские ссылки

Информация о пользователе

Яр молчит уже 53-ий день, я волнуюсь.

Сообщений 1 страница 16 из 16

Поделиться12017-09-06 10:29:24

Поделиться22017-09-06 10:51:44

Поделиться32017-09-06 11:35:17

Поделиться42017-09-06 14:42:11

Поделиться52017-09-06 14:51:05

Поделиться62017-09-06 15:49:14

Поделиться72017-09-06 20:25:54

Поделиться82017-09-06 21:05:40

Поделиться92017-09-06 22:05:45

Поделиться102017-09-07 01:01:57

Поделиться112017-09-07 10:39:47

Поделиться122017-09-07 11:20:39

Поделиться132017-09-08 11:47:20

Поделиться142017-09-08 16:05:45

Поделиться152017-09-09 13:06:56

Поделиться162017-09-09 18:24:31