У меня есть куча файлов, которые не входят в кодировку UTF-8, и я конвертирую сайт в кодировку UTF-8.
Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке:
header('Content-type: text/html; charset=utf-8'); mb_internal_encoding('UTF-8'); $fpath="folder"; $d=dir($fpath); while (False !== ($a = $d->read())) { if ($a != '.' and $a != '..') { $npath=$fpath.'/'.$a; $data=file_get_contents($npath); file_put_contents('tempfolder/'.$a, $data); } }
Как сохранить файлы в кодировке utf-8?
file_get_contents / file_put_contents не будут магически конвертировать кодировку.
Вы должны явно преобразовать строку; например, с помощью iconv()
или mb_convert_encoding()
.
Попробуй это:
$data = file_get_contents($npath); $data = mb_convert_encoding($data, 'UTF-8', 'OLD-ENCODING'); file_put_contents('tempfolder/'.$a, $data);
Или, альтернативно, с фильтрами потока PHP:
$fd = fopen($file, 'r'); stream_filter_append($fd, 'convert.iconv.UTF-8/OLD-ENCODING'); stream_copy_to_stream($fd, fopen($output, 'w'));
Добавить спецификацию: UTF-8
file_put_contents($myFile, "\xEF\xBB\xBF". $content);
<? PHP function writeUTF8File ($ filename, $ content) { $ F = FOPEN ($ имя_файла, "ш"); # Теперь UTF-8 - Добавить байт fwrite ($ f, pack ("CCC", 0xef, 0xbb, 0xbf)); FWRITE ($ е, $ содержание); fclose ($ е); } ?>
Iconv на помощь.
В Unix / Linux простая команда оболочки может использоваться альтернативно для преобразования всех файлов из заданного каталога:
recode L1..UTF8 dir/*
Может быть запущен через PHPs exec ().
//add BOM to fix UTF-8 in Excel fputs($fp, $bom =( chr(0xEF) . chr(0xBB) . chr(0xBF) ));
Я получил эту строку от Cool
Если вы хотите использовать recode рекурсивно и фильтровать для типа, попробуйте следующее:
find . -name "*.html" -exec recode L1..UTF8 {} \;
Это работает для меня. 🙂
$f=fopen($filename,"w"); # Now UTF-8 - Add byte order mark fwrite($f, pack("CCC",0xef,0xbb,0xbf)); fwrite($f,$content); fclose($f);
Я собрал все вместе и получил простой способ конвертировать текстовые файлы ANSI в «UTF-8 No Mark»:
function filesToUTF8($searchdir,$convdir,$filetypes) { $get_files = glob($searchdir.'*{'.$filetypes.'}', GLOB_BRACE); foreach($get_files as $file) { $expl_path = explode('/',$file); $filename = end($expl_path); $get_file_content = file_get_contents($file); $new_file_content = iconv(mb_detect_encoding($get_file_content, mb_detect_order(), true), "UTF-8", $get_file_content); $put_new_file = file_put_contents($convdir.$filename,$new_file_content); } }
Использование: filesToUTF8 ('C: / Temp /', 'C: / Temp / conv_files /', 'php, txt');