Когда мы вводим слово в поиск изображений Google, возвращается страница. Эта страница содержит много изображений с эскизом. Я хочу сохранить URL-адрес местоположения этих изображений в моей базе данных (MySQL). Мне нужно закодировать это на PHP, и я хочу сохранить URL-адрес первых 10 изображений. Я разрабатываю динамическую страницу, я выберу эти URL-адреса изображений из базы данных и покажу их на своей динамической странице.
Я уже много пробовал, и проблема в том, что мой полный URL-адрес не сохраняется, потому что он содержит много недопустимых символов для MySQL. Я искал многие сайты и нашел разные функции, но я до сих пор не совсем понимаю это: я нахожусь в неудаче при разработке идеи, как я могу выполнять эту работу. Может кто-нибудь дать мне некоторый PHP-код или процедуру, как это можно сделать?
Я бы предложил вам использовать библиотеку DOM PHP. Он очень мощный и позволяет анализировать любую структуру DOM. См. Некоторые из его примеров, и вы можете легко реализовать его.
Идея заключается в том, что вы изучаете структуру HTML страницы, возвращенную Google, и, соответственно, используете библиотеку DOM для анализа определенных тегов. Из того, что я вижу, изображения организованы как теги <ul>
и <li>
, например:
<ul class="rg_ul" data-pg="1" data-cnt="6"> <li class="rg_li" data-row="1" style="width:216px;height:162px"></li> <li class="rg_li" style="width:231px;height:162px"></li> <li class="rg_li" style="width:218px;height:162px"></li> <li class="rg_li" style="width:216px;height:162px"></li> <li class="rg_li" style="width:216px;height:162px"></li> <li class="rg_li" style="width:217px;height:162px"></li> </ul>
Внутри каждого <li>
есть дополнительные теги, один из которых <a>
. У этого тега есть 2 атрибута – «imgrefurl» и «imgurl» – это может дать вам изображение, которое вам нужно. Какой из этих двух атрибутов вам нужен, вы сможете исследовать.
Кроме того, существует <img>
внутри <li>
который имеет атрибут «src», содержащий фактическое двоичное изображение. Таким образом, вы можете разобрать его. Обратите внимание, что двоичный файл предназначен для изображения, которое вы видите на странице поиска, а не для фактического изображения.
Для некоторых указателей на DOM этот метод может быть полезен – http://www.php.net/manual/en/domelement.getelementsbytagname.php и http://www.php.net/manual/en/domelement.hasattribute. php – читать все теги <li>
а затем анализировать их с помощью класса «rg_li».
Я надеюсь, что это имеет смысл
Вы можете добиться этого с помощью библиотек PHP curl и класса DOMDocument PHP, а затем использовать Mysql или Mysqli libreries для подключения к базе данных. Помощь MySQL можно найти здесь: MySQL Doc .