специальные символы (смайлики) в текстовом файле

У меня есть txt-файл разговора, экспортированный из WhatsApp. WhatsApp поддерживает смайлики в их разговоре, и экспортированный разговор также, к моему удивлению, содержит эти смайлики! То есть, если я открою текстовый файл в текстовом редакторе (Text Wrangler на Mac 10.8), я смогу увидеть смайлики. Текстовый файл закодирован в UTF-8, и нет никаких ресурсов, связанных с файлом, который я могу сказать.

кто-нибудь может объяснить мне, как эти смайлики включаются в текстовый файл и как они точно интерпретируются текстовым редактором? Это связано с кодировкой символов? Включены ли в текстовый файл дополнительные ресурсы?

1 ответов


Unicode содержит разделы, в которых emoji указывается как "символы". Это обычные символы, вам нужен только шрифт, который может отображать их. Также см. Unicode Emoji FAQ.

в текстовом файле символы в основном кодируются как числа в виде байтов. Чтобы отобразить их визуально на экране компьютера, вам нужно шрифт, который содержит визуальный символ чтобы отобразить этот символ. Так как процесс всегда числовой идентификатор → шрифт → видимый глиф, должно быть довольно очевидно, что" персонаж " может быть чем угодно визуальным, включая emoji или любое другое изображение.

character viewer