https://parselab.org/create-parsers.html
Парсеры на php разрабатываются на основе библиотеки curl, которая доступна практически на любом хостинге. В основном однопоточные парсеры, хорошо подходящие для парсинга маленьких и средних проектов. Ну или если вам необходим код именно на php.
Парсеры на python используют библиотеку Scrapy. Асинхронные, многопоточные - хорошо подходят для парсинга больших объемов данных.
Десктопные программы на С++ используют библиотеку Qt и движок браузера WebKit, встроенная поддержка Javascript и AJAX. Могут работать в Windows, и теоретически в Linux и Mac OS.
Извлекаемые данные могут быть сохранены в CSV, XML, JSON или Excel форматы. Также данные могут быть экспортированы в базу данных требуемой CMS (+1000 руб.).
Если вас интересуют только данные, то можем предоставить только результат парсинга. Цена - 1000 руб. за 10000 единиц данных, например, 10000 товаров + цена парсера.
База 2Gis - это данные по организациям из онлайн-каталога дубль гис, выгруженные в один из форматов баз данных, таких как Excel или MySQL. В базе 2gis содержится информация о фирмах и организациях городов россии. В 2гис база данных содержит такую информацию, как E-mail организаций, телефоны организаций, их почтовые адреса, веб-сайты и координаты, которые можно использовать в сервисах онлайн-карт.
Отредактировано Лис (2017-04-14 16:45:01)