Конвертировать UTF-16LE в UTF-8 в php
Я использую iconv
функция php, но некоторые символы не преобразуются правильно:
...
$s = iconv('UTF-16', 'UTF-8', $s);
...
$s = iconv('UTF-16//IGNORE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE', 'UTF-8', $s);
...
$s = iconv('UTF-16LE//IGNORE', 'UTF-8', $s);
...
Я тоже попробую mb_convert_encoding
функция, но не может решить мою проблему.
пример текстового файла: 9px.ir/utf8-16LE.rar
1 ответов
iconv
поддерживает UTF-16LE
кодирование.
вы можете использовать его для транспонирования кодировки из UTF-16LE
to UTF-8
:
$result = iconv($in_charset = 'UTF-16LE' , $out_charset = 'UTF-8' , $str);
if (false === $result)
{
throw new Exception('Input string could not be converted.');
}
посмотреть iconv
Docs.
мне просто интересно, доступны ли все кодовые точки в UTF-16LE
доступны UTF-8
. Но я предполагаю, что это должно вписаться в ваш случай.
Edit: я не смог воспроизвести проблему на коробку, но на другое поле я наткнулся на это объявление:
Примечание: iconv () [функция.с iconv]: неправильная кодировка, преобразование из
UTF-16LE' to
UTF-8 ' не допускается ...
похоже, что не все iconv
версии могут фактически преобразовать UTF-16LE
to UTF-8
.
это может быть обходной путь для использования mb_convert_encoding
Docs вместо этого, по крайней мере, именно в этом случае (демо):
$result = mb_convert_encoding($str , 'UTF-8' , 'UTF-16LE');