См. ранее
УТКА - альтернатива таблице кодепоинтов Юникода
Борис К. слился с темы, не потянул...
Поправим таблицу с учетом пожеланий Лиса:
▫ ▫ ▫ ▫ ▫ ▫ ▫ ▫ ▪ ▪ ▪ ▪ ▪ ▪ ▪ ▪
А Б В Г Д Е Ё Ж З И Й К Л М Н О
П Р С Т У Ф Х Ц Ч Ш Щ Ъ Ы Ь Э Ю
Я Ѣ І Ѳ Ѵ Ѯ Ѱ Ѡ Ѕ Ҷ Ӷ Ҳ Ҫ Қ Ў Ӂ
А́ Е́ И́ О́ У́ Ы́ Э́ Ю́ Я́ Ё́ Ѣ́ І́ Ѵ́ Ѡ́ Ӓ Ӧ
А̀ Ѐ Ѝ О̀ У̀ Ы̀ Э̀ Ю̀ Я̀ Ё̀ Ѣ̀ І̀ Ѵ̀ Ѡ̀ Ѿ Ѣ̈
а б в г д е ё ж з и й к л м н о
п р с т у ф х ц ч ш щ ъ ы ь э ю
я ѣ і ѳ ѵ ѯ ѱ ѡ ѕ ҷ ӷ ҳ ҫ қ ў ӂ
а́ е́ и́ о́ у́ ы́ э́ ю́ я́ ё́ ѣ́ і́ ѵ́ ѡ́ ӓ ӧ
а̀ ѐ ѝ о̀ у̀ ы̀ э̀ ю̀ я̀ ё̀ ѣ̀ і̀ ѵ̀ ѡ̀ ѿ ѣ̈
0 1 2 3 4 5 6 7 8 9 ∞ ∅ § № % ҂
. , : ; - — ? ! ( ) [ ] { } _ |
+ − × / ^ √ < > = ≤ ≥ ≠ ≈ ± ∙ \
« » „ “ ’ ° ′ ″ ← ↑ → ↓ □ △ ◇ ∠
¬ ∧ ∨ ⊻ ∩ ∪ ⊂ ⊆ ∈ ∉ ∥ ⟂ ▪ ▪ ▪ ▪
Непечатные символы:
0 терминальный ноль
1 пробел
2 табуляция
3 новая строка
4 неразрывный пробел
5 математический пробел
6 нулевой пробел
7 перенос
8-15 и 252-255 — временно не распределенные позиции, самые важные (продать при обсуждении стандарта).
А тут ещё работать и работать. Прежде всего не учтено, что при кодировке типа UTF-8 нужно использовать только половину от таблицы, то есть выбрать 128 наиболее важных символов.
Во-вторых, все управляющие коды надо переделать, не знаю как. И Лис хотел титло, но был проигнорирован. Вот и всё.
Вариант полутаблицы на 128 символов:
Подсчёт:
16 - титло над буквой
33 - малые буквы
33 - заглавные буквы
46 - прочих символов
128 всего
Детализация:
Не влезли:
Разделители строк и слов (см. сообщение ниже)
« - открывающая французская альтернативная кавычка для длинных цитат
» - закрывающая французская альтернативная кавычка для длинных цитат
индийские цифры
латинский символ номера
прочие разные символы - @, &, %, ^
будем их считать математическими и поместим в двухбайтовые.
Отредактировано Лис (Сегодня 04:46:07)