Мне было интересно, как я могу загрузить веб-страницу в php для синтаксического анализа?
Вы можете использовать что-то вроде этого
$ homepage = file_get_contents ('http://www.example.com/'); echo $ homepage;
Поскольку вы, вероятно, захотите проанализировать страницу с помощью DOM , вы можете загрузить страницу напрямую:
$dom = new DOMDocument; $dom->load('http://www.example.com');
когда ваш PHP разрешен allow_url_fopen .
Но в принципе, любая функция, поддерживающая обтекатели потока HTTP, может быть использована для загрузки страницы.
С библиотекой curl .
Просто добавьте еще один вариант, потому что он есть, хотя лучше всего использовать файл. Его другой вариант, который я не вижу никого, перечислил здесь.
$array = file("http://www.stackoverflow.com");
Его приятно, если вы хотите его в массиве строк, тогда как уже упомянутые file_get_contents помещают его в строку.
Еще одно, что вы можете сделать.
Затем вы можете прокручивать каждую строку, если это соответствует вашей цели:
foreach($array as $line){ echo $line; // do other stuff here }
Иногда это пригодится, когда некоторые API выплескивают простой текст или html с новой записью в каждой строке.
Вы можете использовать этот код
$url = 'your url'; $ch = curl_init(); curl_setopt($ch, CURLOPT_URL, $url); curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1); $data = curl_exec ($ch); curl_close ($ch); // you can do something with $data like explode(); or a preg match regex to get the exact information you need //$data = strip_tags($data); echo $data;