![]() |
| первая понравившаяся мне картинка по запросу "очень хорошая" в гугле |
Так вот. Очень хорошая утилита import.io - автоматически скрапает данные с сайтов.
Можно грабить напрямую, можно грабить в таблички, можно заставлять эту приблуду пользоваться полем поиска по сайту.
Причем процесс настройки напомнил мне настройку нового куба в MS Analysis Services, т.е. с пол-пинка настраивается и поднимается ВСЁ.
Можно делать краулер, который будет собирать информацию с разных страниц по шаблону.
Можно сделать экстрактор, который будет структурировано вынимать неструктурированную информацию.
Можно сделать коннектор - такой экстрактор, который умеет взаимодействовать с полями сайта.
А еще можно смешивать всё это вместе!
В качестве форматов данных - html, json, csv, xls(щоб всем хватило).
Как оно монетизируется:
Скачиваешь апп. Апп представляет собой спец-браузер, который используется для настройки экстракторов и выбора опциональных плюшек.
После настройки экстрактор загружается обратно на сайт import.io, чтобы на серверной стороне сделать свое дело. Там же хранятся все датасеты, которые насобирает утилита.
А монетизация вот в чем - хочешь, чтобы экстракторы делали больше миллиона запросов в сутки - плати 150 баксов в месяц.
ps: вообще-то вы должны были залипнуть на картинке!
