cUrl – получение тела ответа html

Я уверен, что это довольно просто. Я использую функцию ниже для извлечения сайтов raw html для его анализа. во время моего тестирования я решил запустить свой код на stackoverflow.com

Вместо того, чтобы получать html-ответ, Chrome печатает фактический сайт, а затем присваивает html его истинности. Что мне не хватает?

function get_site_html($site_url) { $ch = curl_init(); curl_setopt($ch, CURLOPT_COOKIESESSION, true); curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); curl_setopt($ch, CURLOPT_MAXREDIRS, 4); curl_setopt($ch, CURLOPT_FORBID_REUSE, true); curl_setopt($ch, CURLOPT_CONNECTTIMEOUT, 30); curl_setopt($ch, CURLOPT_URL, $site_url); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); $response = curl_exec($ch); global $base_url; $base_url = curl_getinfo($ch, CURLINFO_EFFECTIVE_URL); $http_response_code = curl_getinfo($ch, CURLINFO_HTTP_CODE); curl_close ($ch); return $response; } 

Необработанный html-сайт должен быть присвоен $ response, а затем вернуть его.

Ваш код работает. Попробуйте echo htmlentities($response); Вы получите необработанный html для сайта, который вы скручиваете.