Конвертировать UTF-16LE в UTF-8 в php

Я использую iconv функция php, но некоторые символы не преобразуются правильно:

...
$s = iconv('UTF-16', 'UTF-8', $s);
...
$s = iconv('UTF-16//IGNORE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE//IGNORE', 'UTF-8', $s);
...

Я тоже попробую mb_convert_encoding функция, но не может решить мою проблему.

пример текстового файла: 9px.ir/utf8-16LE.rar

1 ответов


iconv поддерживает UTF-16LE кодирование.

вы можете использовать его для транспонирования кодировки из UTF-16LE to UTF-8:

$result = iconv($in_charset = 'UTF-16LE' , $out_charset = 'UTF-8' , $str);
if (false === $result)
{
    throw new Exception('Input string could not be converted.');
}

посмотреть iconvDocs.

мне просто интересно, доступны ли все кодовые точки в UTF-16LE доступны UTF-8. Но я предполагаю, что это должно вписаться в ваш случай.


Edit: я не смог воспроизвести проблему на коробку, но на другое поле я наткнулся на это объявление:

Примечание: iconv () [функция.с iconv]: неправильная кодировка, преобразование из UTF-16LE' toUTF-8 ' не допускается ...

похоже, что не все iconv версии могут фактически преобразовать UTF-16LE to UTF-8.

это может быть обходной путь для использования mb_convert_encodingDocs вместо этого, по крайней мере, именно в этом случае (демо):

$result = mb_convert_encoding($str , 'UTF-8' , 'UTF-16LE');