_DK Не сложно парсить те статьи, где кроме главной картинки и текста больше ничего нет! Я же сталкиваюсь с кучей сайтов, где "творческие подходы админов" в каждой статье и это называется верстка, для максимальной подачи информации.
UPDS парсер справляется с большей частью такого творчества. Он как минимум понимает что такое слайдеры, умеет выдергивать оттуда картинки и вставлять в поля слайдеров на моем сайте. Деление текстового контента и он не понимает, так как такое деление никак не выделено в коде. Но он умеет скачивать с источника и вставлять в текст внутренние картинки.
FlowCrawler вообще не понимает слайдеры и выдергивает из них только среднюю картинку, а что делать с внутренними в тексте вообще не понятно! FlowCrawler не доработан и еще не все умеет. А тут и разработчик совсем куда-то пропал. Хотя обещал видео по парсингу новостей.
Долго, тяжело и через одно место - это конечно наш подход, но хочется поменьше геморроя, ведь для этого покупаются программы. Девиз FlowCrawler какой - все что можно сделать в браузере руками, можно сделать ботом! Так вот в этом смысле FlowCrawler еще ребенок, которого учить и учить...
Покупая FlowCrawler была надежда получить хороший инструмент для парсинга новостей, но как вижу - для FlowCrawler это оказывается сложнее, чем все предыдущие наработки. А вы пишите, что просто....