Я создаю скрипт, который получает контент и изображения сообщений в блогах, используя DOM и регулярные выражения.
Сценарий завершен, за исключением следующего. Моя цель состоит в том, чтобы получить содержимое (оно сделано) всех изображений Post, ЗА ИСКЛЮЧЕНИЕМ ПЕРВОГО и добавить их в новый контент со значением varcontent1, 2, 3 и так далее.
Сценарий работает 25 раз (количество сообщений на странице), и есть переменная $i
. Следующий код получает текущее содержимое сообщения и сохраняет его в $varcontent1
. Также он получает все изображения всего сайта (со списком плохих слов) и печатает их как массив.
Мой вопрос: как сохранить текущие изображения в текущем сообщении? Наконец, я преобразую их в <img src="xxxx">
(я думаю, что знаю, как это сделать).
ОБНОВЛЕНО: результаты будут представлены в форме. Что делать, если я помещаю текущие URL-адреса изображений в новую переменную сообщения?
Примечание. Я могу получить изображения с DOM, потому что загружаю страницу, а не loadHTML.
preg_match_all('!http://.+\.(?:jpe?g|png|gif)!Ui', $content, $matches); preg_match_all('/\S+(list|of|bad|words)\S+/i', $content, $bads); $filtered = array_values(array_diff($matches[0], $bads[0]));