Существуют разные языки программирования. Часто исходные тексты состоят из файлов.
В разных языках файлы имеют разную длину. Было бы интересно знать, какая средняя длина файлов в разных языках.
Тексты на языках программирования можно взять с github, затем построить диаграммы "ящик с усами"
Это помогло бы знать, подходит ли алгоритм CYK в реализациях для CPU и GPU для компиляции большинства файлов среднего языка.
Сложность у него |G|*(N^3), так что одно дело если исходные файлы в среднем по 10 килобайт, а другое - если по 100 килобайт.
Конечно, проектируемый язык можно ограничить, например один класс исполнитель - один файл, это приведёт к снижению среднего размера файлов, но хотелось бы знать наверняка, какая она - жизнь в дикой природе.