Всем привет! Столкнулся с такой проблемой:
На страницах контента с которых веду парсинг имеется таблица из двух столбцов.
Столбец 1 - заголовки ( h4 ), которые мне не нужны для парсинга.
Столбец 2 - данные, которые необходимо спарсить. Все данные в них - обычный текст без классов и идентификаторов, ячейки тоже без классов и идентификаторов.
Логично конечно было бы указывать конкретную ячейку, но проблема в том, что на одних страницах интересующие меня данные расположены в 1,2,4,5,6 строках второго столбца, а на других страницах вклинивается четвертой строкой ненужная мне информация и требуется спарсить данные уже из 1,2,5,6,7 строки второго столбца и в довесок последняя строка на некоторых страницах отсутствует (т.е. она то 6, то 7, то ее вообще нет).
Попытался обойти проблему следующим образом:
1. Парсил не ячейки, а строки целиком. Т.е. получал список 5-7 строк в зависимости от наличия тех или иных полей на странице).
2. Там же в блоке Элементы в Фильтре указывал замену названий из первого столбца (они фиксированные) на "1###", "2###", "3###", "4###" и т.д. Т.е. пронумеровывал. В итоге получал строку вида "1### значение 1" и т.д.
3. Через строковый блок Разбить установил разделитель "### " (прихватил в конце пробел, чтобы сразу удалить при сегментировании).
4. В том же блоке сегмент 1 и сегмент 2 подал на выход под именами "Порядок" и "Данные".
5. Запустил цепочку из числовых блоков "Сравнение", где сегмент "Порядок" сравнивался на равенство с заданным числом. Т.е. в первом блоке проверялось Порядок=1, если да, то в локальную переменную записывалось значение из сегмента "Данные", если нет - все шло на следующий блок Сравнение, где проверялось Порядок=2 и т.д. до Порядок=7. В цепочке отсутствовало сравнение Порядок=3 и Порядок=4, т.к. эти строки меня не интересовали совершенно.
6. Создал блоки Чтения переменных с подстановкой данных в Экспорт, но почему то Экспорт не показывал содержимое.
Я не знаком с синтаксисом блоков с переменными. Возможно я там напортачил и не так вписал - в Документации примеров нет никаких - поди как угадай.
Вопросов два:
1. Как работать с переменными?
2. Может у кого есть соображения как обойти проблему с таблицей?