У меня есть следующий код PHP: <?php # URL #1 $ch = curl_init('http://www.google.com/'); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_exec($ch); # get the content type $content_type = curl_getinfo($ch, CURLINFO_CONTENT_TYPE); echo $content_type; echo "<br>"; # URL #2 $ch = curl_init('http://www.lemonde.fr/'); curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); curl_exec($ch); # get the content type $content_type = curl_getinfo($ch, CURLINFO_CONTENT_TYPE); echo $content_type; ?> Возвращает следующий результат: […]
Я царапаю некоторые сайты, которые иногда имеют символы UTF-8 в названии, но это не указывает UTF-8 как кодировку (пример qq.com). Когда я использую просмотр веб-сайта в своем браузере, данные, которые я хочу скопировать (т. Е. Заголовок), выглядят правильно (японский или китайский … не слишком уверен). Я могу скопировать заголовок и вставить его в терминал, и […]
У меня есть некоторый контент UTF-8, который включает в себя многобайтовые символы смарт-кавычек. Я обнаружил, что этот код легко преобразует эти символы в прямые котировки ASCII (код ASCII 34): $content = iconv("UTF-8", "ASCII//TRANSLIT", $content); ИЛИ $content = iconv("UTF-8", "ISO-8859-1//TRANSLIT", $content); Однако я бы предпочел преобразовать их в расширенные интеллектуальные кавычки ASCII (коды ASCII 147 и […]
у меня возникают проблемы с отображением турецких персонажей, они появляются как маленький вопросительный знак с бриллиантом в фоновом режиме в html. Как я могу использовать iconv, чтобы исправить это? Так как я думаю, что это лучший вариант? Сейчас моя страница закодирована в utf-8. Мне нужно поддерживать таких персонажей, как ı ş ş а также возможность […]