Как записать файл в формате UTF-8?

У меня есть куча файлов, которые не входят в кодировку UTF-8, и я конвертирую сайт в кодировку UTF-8.

Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке:

header('Content-type: text/html; charset=utf-8'); mb_internal_encoding('UTF-8'); $fpath="folder"; $d=dir($fpath); while (False !== ($a = $d->read())) { if ($a != '.' and $a != '..') { $npath=$fpath.'/'.$a; $data=file_get_contents($npath); file_put_contents('tempfolder/'.$a, $data); } } 

Как сохранить файлы в кодировке utf-8?

file_get_contents / file_put_contents не будут магически конвертировать кодировку.

Вы должны явно преобразовать строку; например, с помощью iconv() или mb_convert_encoding() .

Попробуй это:

 $data = file_get_contents($npath); $data = mb_convert_encoding($data, 'UTF-8', 'OLD-ENCODING'); file_put_contents('tempfolder/'.$a, $data); 

Или, альтернативно, с фильтрами потока PHP:

 $fd = fopen($file, 'r'); stream_filter_append($fd, 'convert.iconv.UTF-8/OLD-ENCODING'); stream_copy_to_stream($fd, fopen($output, 'w')); 

Добавить спецификацию: UTF-8

 file_put_contents($myFile, "\xEF\xBB\xBF". $content); 
 <? PHP
 function writeUTF8File ($ filename, $ content) { 
         $ F = FOPEN ($ имя_файла, "ш"); 
         # Теперь UTF-8 - Добавить байт 
         fwrite ($ f, pack ("CCC", 0xef, 0xbb, 0xbf)); 
         FWRITE ($ е, $ содержание); 
         fclose ($ е); 
 } 
 ?>

Iconv на помощь.

В Unix / Linux простая команда оболочки может использоваться альтернативно для преобразования всех файлов из заданного каталога:

  recode L1..UTF8 dir/* 

Может быть запущен через PHPs exec ().

 //add BOM to fix UTF-8 in Excel fputs($fp, $bom =( chr(0xEF) . chr(0xBB) . chr(0xBF) )); 

Я получил эту строку от Cool

Если вы хотите использовать recode рекурсивно и фильтровать для типа, попробуйте следующее:

 find . -name "*.html" -exec recode L1..UTF8 {} \; 

Это работает для меня. 🙂

 $f=fopen($filename,"w"); # Now UTF-8 - Add byte order mark fwrite($f, pack("CCC",0xef,0xbb,0xbf)); fwrite($f,$content); fclose($f); 

Я собрал все вместе и получил простой способ конвертировать текстовые файлы ANSI в «UTF-8 No Mark»:

 function filesToUTF8($searchdir,$convdir,$filetypes) { $get_files = glob($searchdir.'*{'.$filetypes.'}', GLOB_BRACE); foreach($get_files as $file) { $expl_path = explode('/',$file); $filename = end($expl_path); $get_file_content = file_get_contents($file); $new_file_content = iconv(mb_detect_encoding($get_file_content, mb_detect_order(), true), "UTF-8", $get_file_content); $put_new_file = file_put_contents($convdir.$filename,$new_file_content); } } 

Использование: filesToUTF8 ('C: / Temp /', 'C: / Temp / conv_files /', 'php, txt');

  1. Откройте свои файлы в ноутбуке Windows
  2. Измените кодировку как кодировку UTF-8
  3. Сохраните файл
  4. Попробуй еще раз! : О)