Я просматриваю данные одного веб-сайта. Я могу весь контент на странице. Но некоторые данные на странице появляются после наведения на некоторые значки и показаны в виде подсказок. Поэтому я также требую данных. Возможно ли это с любым искателем.
Я использую PHP и simplehtmldom для разбора / обхода страницы.
Данные Hover не могут быть получены с помощью любых сканеров.
Сканеры просматривают веб-страницу и получают целые данные (источник HTML-страницы). Это представление, которое мы можем просмотреть, как только мы нажмем URL. Наведите курсор мыши на действие над атрибутом HTML на странице, т.е. вручную. И в настоящее время никакие сканеры не выполняют действия для зависания и получения этих данных в соответствии с моими знаниями. Таким образом, невозможно получить данные об ошибках с помощью сканеров.
Одна из возможностей заключается в том, чтобы выполнить javascript, используя javascript-интерпретатор (быстро просмотрел этот http://php.net/manual/en/book.v8js.php, и это может быть то, что вам нужно), а затем напишите дополнительный код javascript для запуска событий наведения на нужные элементы.
Если страница использует AJAX для заполнения необходимых полей, может быть проще использовать такой инструмент, как Firebug, для просмотра вызовов AJAX и воссоздания их в вашем коде, чтобы заполнить отсутствующие элементы DOM.
Другой альтернативой является переосмысление искателя и, возможно, использование искателя на основе браузера. Это то, что у меня мало опыта, но я уверен, что другие сделали это.
Я предлагаю посмотреть в Селен . Я использовал его много раз, и он может определенно сделать onmouseover
Вы не можете получить динамический исходный код, который требует взаимодействия с простым php curl. Тем не менее, с PhantomJS вы можете достичь состояния зависания, а также захватить будущую аякс-загрузку страницы. Он имеет кривую обучения, и вам нужно установить его с помощью node.js на своем сервере, если у вас есть права.
С помощью PhantomJS вы сможете получать onmouseover или динамическое содержимое ajax, так как это браузер безгласного webkit, который посещает страницы с вашими командами.