Не могли бы вы помочь мне найти способ получить контент из мета-описания, мета-ключевых слов и содержимого роботов с помощью Goutte. Кроме того, как я могу настроить таргетинг на <link rel="stylesheet" href="">
и <script>
?
Ниже приведен PHP, который я использовал для получения <title>
контента:
require_once 'goutte.phar'; use Goutte\Client; $client = new Client(); $crawler = $client->request('GET', 'http://stackoverflow.com/'); $crawler->filter('title')->each(function ($node) { $content .= "Title: ".$node->text().""; echo $content; });
Вот ссылка на Goutte – https://github.com/fabpot/goutte
Вы можете использовать:
$crawler->filterXpath('//meta[@name="description"]')->attr('content');