Как экранировать царапины на определенном веб-сайте. Мне нужно войти на сайт, а затем очистить внутреннюю информацию. Как это можно сделать?
Пожалуйста, направляйте меня.
Дублировать: Как реализовать веб-скребок в PHP?
Вы хотите посмотреть на функции завитка – они позволят вам получить страницу с другого сайта. Вы можете использовать cookie или HTTP-аутентификацию для входа в систему сначала, а затем получить нужную страницу, в зависимости от того, на какой сайт вы входите.
После того, как у вас есть страница, вам, вероятно, лучше всего использовать регулярные выражения, чтобы очистить нужные данные.
Zend_Http_Client and Zend_Dom_Query
Вы должны смотреть на завиток.
Вы также можете взглянуть на BeautifulSoup, который является библиотекой Python, которая, как предполагается, очень хороша в создании плохого HTML-синтаксического анализа. Он нацелен на такие вещи, как скрипинг экрана.
Как легко было бы звонить из PHP, я не знаю, хотя.
Вы также можете проверить http://php.net/dom
Curl, и как только вы входите, используйте библиотеку PHP QueryPath. (querypath.org). Вы можете получить доступ к элементам dom, как в JQuery, с помощью селекторов CSS, есть цепочка методов …
Лучше, чем просто использовать собственные XML-функции php.
Он также работает как расширение drupal, но я полагаю, вы могли бы реализовать его в любом проекте php.