Я хотел бы знать, можно ли проверить, проиндексирован ли URL Google с помощью PHP.
Это против их ToS?
Вы можете прочитать здесь (соответствующая цитата ниже) для ответа на часть ToS этого. В принципе, без ключа API и их разрешения, это, вероятно, не очень хорошая идея. Однако из-за объема, который они обрабатывают, вы можете уйти от него, если вы не делаете TONS запросов.
Проверка PageRank – это нечто другое, что люди часто пытаются сделать, но они не приносят столько же внимания на эту заслугу (по слухам, это так), а старые ключи API стиля очень трудно найти.
Не используйте неавторизованные компьютерные программы для отправки страниц, проверки ранжирования и т. Д. Такие программы потребляют вычислительные ресурсы и нарушают наши Условия обслуживания . Google не рекомендует использовать такие продукты, как WebPosition Gold ™, которые отправляют автоматические или программные запросы в Google.
Ну, не явным образом. Но вы можете проверить каждый просмотр страницы, используя:
$agent = $_SERVER['HTTP_USER_AGENT']; if (strstr($agent, 'googlebot')){ // tell the database that google has crawled this page. }
Сделать это без API – против TOS. Для малого объема вы можете:
// CHECK IF PAGE IS IN GOOGLE INDEX $domain = 'stackexchange.com'; if (strstr(file_get_contents("http://www.google.com/search?q=site:$domain"), 'did not match any documents')) { // Page is not in the index print 'No Go!'; } else { print 'All Good!'; } exit;
Для польского языка вы должны попробовать проверить между UTF-8 и ISO-8859-2 следующим образом:
$encAry = array('ISO-8859-2', 'UTF-8'); $contentEncoding = mb_detect_encoding( $content, $encAry ); $googleSearchResult = mb_convert_encoding($content, 'UTF-8', $contentEncoding);
Работает на меня.