Я хочу анализировать данные с главной страницы на этом URL-адресе . Как вы можете видеть, этот URL-адрес является файлом HTML, и я читаю ниже:
// Create a DOM object from a HTML file $html = file_get_html('test.htm');
поэтому я просто набираю код ниже
include "simple_html_dom.php"; $html = file_get_html('eecs.kookmin.ac.kr/site/computer/notice.htm'); echo $html->plaintext;
Сообщение об ошибке:
Сообщение об ошибке Warning: file_get_contents (eecs.kookmin.ac.kr/site/computer/notice.ht m): не удалось открыть поток: нет такого файла или каталога в C: \ Bitnami \ wampstack-5.6.27-0 \ apache2 \ htdocs \ simple_html_dom .php в строке 76
что мне делать?
Вы можете получить код HTML с помощью класса Snoopy ( https://sourceforge.net/projects/snoopy ). Следующий код отображает HTML-код внутри <textarea>
, затем он отображает сама страницу, скопируйте следующий код в файл PHP и откройте его в своем браузере:
<!DOCTYPE html> <html> <head> <META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=euc-kr"> <META HTTP-EQUIV="Content-language" CONTENT="ko"> </head> <body> <?php require("Snoopy.class.php"); // ◄■■ GET SNOOPY FROM https://sourceforge.net/projects/snoopy $snoopy = new Snoopy; $snoopy->fetch("http://eecs.kookmin.ac.kr/site/computer/notice.htm"); $html = mb_convert_encoding( $snoopy->results, "UTF-8", "EUC-KR" ); // ◄■■ GET HTML CODE. echo "<textarea rows='25' cols='80'>$html</textarea>"; // ◄■■ DISPLAY THE HTML. echo $html; // ◄■■ DISPLAY THE WEBPAGE. ?> </body> </html>
Класс Snoopy – это только один файл, убедитесь, что файл находится в том же каталоге, что и ваш PHP-файл.