Я предлагал составить библиотеку из книг российских лингвистов применительно к разработке языков программирования.
Существуют разные файлообменные системы, например Retroshare, IPFS и т.п.
Существуют программы для ведения метаинформации о книгах, например Calibre.
Из Calibre можно настроить экспорт файлов в директорию, тогда нажатие одной кнопки "отправить на устройство" будет копировать файл с книгой из БД calibre в указанную директорию.
После этого можно из интерфейса Retroshare получить ссылку на эту книгу, например
[html]<a href="retroshare://file?hash=a2ce39967000b1ded7ec9095b52ead589fb69265&size=1541011&name=On%20the%20Translation%20of%20Languages%20from%20Left%20to%20Right%20-%20Donald%20E.%20Knuth.pdf">retroshare://file?hash=a2ce39967000b1ded7ec9095b52ead589fb69265&size=1541011&name=On%20the%20Translation%20of%20Languages%20from%20Left%20to%20Right%20-%20Donald%20E.%20Knuth.pdf</a>[/html]Здесь главное это hash файла, т.к. он не меняется от смены расположения файла, и размер - он позволяет уменьшить коллизии. Имя файла это так, для красоты.
В принципе, у Calibre, наверное, есть API (в любом случае есть исходные тексты на Python), значит можно попробовать публиковать некоторые книги, например помеченные некоторым тегом (Я не рассматриваю встроенный в calibre web-сервер, т.к. он не такой как надо).
Независимая от интернета ссылка на файл позволяет скачивать эту книгу и указывать на книгу.
Немного хуже обстоит с метаданными - пока не придумал как бы ими обмениваться удобно, но в целом форматов много разных именно для обмена метаданными придумано, и наверняка можно сделать как на каком-нибудь citeseer.
Почему бы просто не пользоваться киберленинкой? Два недостатка:
1) право читать и его покупка;
Кто-то может купить книгу и сослаться на неё в Retroshare, в киберленинке так не выйдет, так как там это публикация (незаконное копирование) а в Retroshare просто ссылка.
2) в киберленинке слишком обширная тематика и недостаточная специализация.
Искал термин IELR и не нашел никаких работ по компьютерной тематике. А в интернете они есть и могли бы быть подобраны.
Хотелось бы иметь некий feed, что "найдена такая-то книга", возможность писать к книге обзоры и комментарии. Форум всё это в принципе даёт, тут есть и Atom, и комментарии. С освоением возможности давать ссылки на Retroshare теперь обзоры можно делать более интенсивно и конкретно, чем было на remdev. Сделал для этого раздел книги. Проблема остаётся только с просмотром уже отобранного и поиском нужного в текущий момент.
Конкретно поисковик CiteSeer - неудачный как поисковик, потому что он использует индексатор Lucene, а это значит, что там алгоритм поиска BM25 (TF-IDF), а не "Swanson Linking". Они, конечно, пытаются бороться с разрозненностью книг, вручную создавая список ссылок между текстами, и пытаясь из этого изобразить Page Rank, но в современном изобилии обработка информации руками - не наш путь.
Это значит, что нельзя просто взять и напустить CiteSeer на интернет, нужно чтобы туда информацию вносили люди.
Я собственно хотел спросить, что вы (ну, кроме Павиа, мы ему завидуем, так как у него уже и так есть повод гордиться) думаете о совместном освоении литературы.
Отредактировано Лис (2019-01-01 17:48:19)