воскресенье, 13 апреля 2014 г.

Очень хорошая утилита

первая понравившаяся мне картинка по запросу "очень хорошая" в гугле

 Так вот. Очень хорошая утилита import.io - автоматически скрапает данные с сайтов.
Можно грабить напрямую, можно грабить в таблички, можно заставлять эту приблуду пользоваться полем поиска по сайту.
Причем процесс настройки напомнил мне настройку нового куба в MS Analysis Services, т.е. с пол-пинка настраивается и поднимается ВСЁ.
Можно делать краулер, который будет собирать информацию с разных страниц по шаблону.
Можно сделать экстрактор, который будет структурировано вынимать неструктурированную информацию.
Можно сделать коннектор - такой экстрактор, который умеет взаимодействовать с полями сайта.
А еще можно смешивать всё это вместе!
В качестве форматов данных - html, json, csv, xls(щоб всем хватило).

Как оно монетизируется:
Скачиваешь апп. Апп представляет собой спец-браузер, который используется для настройки экстракторов и выбора опциональных плюшек.
После настройки экстрактор загружается обратно на сайт import.io, чтобы на серверной стороне сделать свое дело. Там же хранятся все датасеты, которые насобирает утилита.
А монетизация вот в чем - хочешь, чтобы экстракторы делали больше миллиона запросов в сутки - плати 150 баксов в месяц.

ps: вообще-то вы должны были залипнуть на картинке!