Articles of scrape

UDP Tracker Scraping 1 скрипт, работающий с другими

При использовании этого сценария мой трекер обновляет только семена и leechers от http tracker только 1st Tracker моего торрента. print("<tr><td class='desc'><b>" .T_("Torrent Stats"). ": </b></td><td valign='top' class='lista'>"); $seeders1 = $leechers1 = $downloaded1 = null; $tres = SQL_Query_exec("SELECT url FROM announce WHERE torrent=$id"); while ($trow = mysql_fetch_assoc($tres)) { $ann = $trow["url"]; $tracker = explode("/", $ann); $path […]

соскабливание страницы без RSS для создания фида

Я хочу очистить страницу, которая регулярно обновляется (добавляя новые статьи с той же структурой, что и предыдущие), чтобы генерировать RSS-канал. Я могу написать код для простого анализа страницы, но как я могу эмулировать пинг, т. Е. Когда страница обновляется, как может знать мой PHP-скрипт? Должна ли быть работа на cron? (Вероятно, дублированный вопрос, который я […]

Извлечь ссылки из фида активности Facebook

Я пытаюсь получить ссылки из фида активности в facebook, я попытался извлечь HTML из iframe, но это не работает из-за перекрестного домена. Затем я попробовал cURL, но это не работает из-за javascript. http://developers.facebook.com/docs/reference/plugins/activity Есть идеи?

Сколько результатов дает Google запрос на очистку?

Следующий PHP-код работает нормально, но когда он используется для сканирования 1000 результатов Google для указанного ключевого слова, он возвращает только 100 результатов. У Google есть ограничение на возвращаемые результаты или есть другая проблема? <?php require_once ("header.php"); $data2 = getContent("http://www.google.de/search?q=auch&hl=de&num=100&gl=de&ix=nh&sourceid=chrome&ie=UTF-8"); $dom = new DOMDocument(); @$dom->loadHtml($data2); $xpath = new DOMXPath($dom); $hrefs = $xpath->evaluate("//div[@id='ires']//li/h3/a/@href"); $j = 0; foreach […]

Получение цены от Amazon с помощью Xpath

на следующей странице: http://www.amazon.com/Jessica-Simpson-Womens-Double-Breasted/dp/B00K65ZMCA/ref=sr_1_4_mc/185-0705108-6790969?s=apparel&ie=UTF8&qid=1413083859&sr=1-4 Я пытаюсь получить цена с выражением '//span[@id="priceblock_ourprice"]' но результатом является пустая переменная. Интересная часть состоит в том, что на других страницах амазонки, таких как этот: http://www.amazon.com/SanDisk-Cruzer-Frustration-Free-Packaging–SDCZ36-032G-AFFP/dp/B007JR532M/ref=sr_1_1?s = рс & т = UTF8 & QID = 1413084653 & стер = 1-1 & ключевые слова = USB У меня есть выражение, которое работает […]

PHP Curl после перенаправления

Я пытаюсь быть немного неприхотливым и как часть учебного процесса попытаться улучшить свои навыки очистки страниц. Одна вещь, с которой я столкнулся, я еще не могу решить, что некоторые сайты будут использовать внутреннюю ссылку, которая затем перенаправляется на внешнюю ссылку. То, что я хочу сделать, это изменить некоторый curl-код, чтобы следить за перенаправлениями до тех […]

Очистить веб-сайт, созданный Javascript

Я думаю, что это настоящий вызов! Я пишу веб-сайт для своей местной футбольной лиги, www.rdyfl.co.uk, и включаю фрагменты кода JavaScript из системы Full-Time FA, где мы создаем наши приборы, связывая их с последними результатами таблицы и т. Д. Для другой функции, которую я хочу добавить на сайт, мне нужно очистить «предстоящие светильники» для каждой возрастной […]

Intereting Posts