Как написать файл в формате UTF-8?

У меня есть куча файлов, которые не находятся в кодировке UTF-8, и я конвертирую сайт в кодировку UTF-8.

Я использую простой скрипт для файлов, которые я хочу сохранить в utf-8, но файлы сохраняются в старой кодировке:

header('Content-type: text/html; charset=utf-8');
mb_internal_encoding('UTF-8');
$fpath="folder";
$d=dir($fpath);
while (False !== ($a = $d->read()))
 {

 if ($a != '.' and $a != '..')
  {

  $npath=$fpath.'/'.$a;

  $data=file_get_contents($npath);

  file_put_contents('tempfolder/'.$a, $data);

  }

 }

Как сохранить файлы в кодировке utf-8?

10 ответов


file_get_contents / file_put_contents не будет волшебным образом преобразовывать кодировку.

вы должны преобразовать строку явно; например, с iconv() или mb_convert_encoding().

попробуйте это:

$data = file_get_contents($npath);
$data = mb_convert_encoding($data, 'UTF-8', 'OLD-ENCODING');
file_put_contents('tempfolder/'.$a, $data);

или, альтернативно, с фильтрами потока PHP:

$fd = fopen($file, 'r');
stream_filter_append($fd, 'convert.iconv.UTF-8/OLD-ENCODING');
stream_copy_to_stream($fd, fopen($output, 'w'));

добавить BOM: UTF-8

file_put_contents($myFile, "\xEF\xBB\xBF".  $content); 

<?php
function writeUTF8File($filename,$content) { 
        $f=fopen($filename,"w"); 
        # Now UTF-8 - Add byte order mark 
        fwrite($f, pack("CCC",0xef,0xbb,0xbf)); 
        fwrite($f,$content); 
        fclose($f); 
} 
?>

Iconv к спасению.


в Unix / Linux простая команда оболочки может использоваться в качестве альтернативы для преобразования всех файлов из данного каталога:

 recode L1..UTF8 dir/*

также можно запустить через PHPs exec ().


//add BOM to fix UTF-8 in Excel
fputs($fp, $bom =( chr(0xEF) . chr(0xBB) . chr(0xBF) ));

Я получил эту строку с прохладный


Если вы хотите использовать рекурсивное перекодирование и фильтр для типа, попробуйте следующее:

find . -name "*.html" -exec recode L1..UTF8 {} \;

это работает для меня. :)

$f=fopen($filename,"w"); 
# Now UTF-8 - Add byte order mark 
fwrite($f, pack("CCC",0xef,0xbb,0xbf)); 
fwrite($f,$content); 
fclose($f); 

Я собрал все вместе и получил простой способ конвертировать текстовые файлы ANSI в "UTF-8 No Mark":

function filesToUTF8($searchdir,$convdir,$filetypes) {
  $get_files = glob($searchdir.'*{'.$filetypes.'}', GLOB_BRACE);
  foreach($get_files as $file) {
    $expl_path = explode('/',$file);
    $filename = end($expl_path);
    $get_file_content = file_get_contents($file);
    $new_file_content = iconv(mb_detect_encoding($get_file_content, mb_detect_order(), true), "UTF-8", $get_file_content);
    $put_new_file = file_put_contents($convdir.$filename,$new_file_content);
  }
}

использование: filesToUTF8 ('C:/Temp/','C:/Temp/conv_files/', 'php, txt');


  1. откройте файлы в Windows notebook
  2. измените кодировку на кодировку UTF-8
  3. сохраните файл
  4. попробуйте еще раз! : O)