Экспорт JSON в CSV или Excel с кодировкой UTF-8 (например, греческой) с использованием JavaScript
Я пытаюсь экспортировать и загрузить JSON объект CSV-файла файл и у меня проблема с греческими символами. Мой код работает; он не идеален, но он работает.
проблема в том, что греческие символы выглядят как мусор.
вот мой код:
function downloadJsonToCsv(jsonObject) {
var array = typeof jsonObject != "object" ? JSON.parse(jsonObject) : jsonObject;
if (array == null) {
return; // No data found on the jsonObject
}
var str = "";
for (var i = 0; i < array.length; i++) {
var line = "";
for (var index in array[i]) {
line += array[i][index] + ";"; // Set delimiter
}
// Here is an example where you would wrap the values in double quotes
// for (var index in array[i]) {
// line += '"' + array[i][index] + '",';
// }
line.slice(0,line.Length-1);
str += line + "rn";
}
window.open("data:text/csv;charset=utf-8," + encodeURI(str));
}
У меня есть два вопроса.
- как экспортировать этот CSV-файла файл с правильными греческими символами?
- как я могу экспортировать этот данные в в Excel формат, а не в CSV-файла?
2 ответов
экспорт в CSV
экспорт в CSV с символами, отличными от ASCII, требует добавления файла с Метка Порядка Байтов он же Бом. В вашем коде измените
var str = "";
в:
var str = "\uFEFF";
вам нужна современная версия Excel для распознавания спецификации. Как упоминалось в этом полезном статья StackOverflow, Excel 2003 и более ранние версии не будут правильно выполнять спецификацию. У меня есть только доступ к Excel 2003 на Windows, поэтому я не могу проверить это на данный момент, но это довольно хорошо документировано.
к сожалению, Excel 2011 для Macintosh не является "современным Excel" в этом смысле. К счастью, Google Таблицы делают правильные вещи.
экспорт непосредственно в Excel
здесь jsFiddle реализация кода ниже. Он генерирует SpreadsheetXml документ. Достоинством этого метода можно очень сделать хитрый... добавление в формулах и делать гораздо больше вещей, специфичных для Excel.
// Test script to generate a file from JavaScript such
// that MS Excel will honor non-ASCII characters.
testJson = [
{
"name": "Tony Peña",
"city": "New York",
"country": "United States",
"birthdate": "1978-03-15",
"amount": 42
},
{
"name": "Ζαλώνης Thessaloniki",
"city": "Athens",
"country": "Greece",
"birthdate": "1987-11-23",
"amount": 42
}
];
// Simple type mapping; dates can be hard
// and I would prefer to simply use `datevalue`
// ... you could even add the formula in here.
testTypes = {
"name": "String",
"city": "String",
"country": "String",
"birthdate": "String",
"amount": "Number"
};
emitXmlHeader = function () {
var headerRow = '<ss:Row>\n';
for (var colName in testTypes) {
headerRow += ' <ss:Cell>\n';
headerRow += ' <ss:Data ss:Type="String">';
headerRow += colName + '</ss:Data>\n';
headerRow += ' </ss:Cell>\n';
}
headerRow += '</ss:Row>\n';
return '<?xml version="1.0"?>\n' +
'<ss:Workbook xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet">\n' +
'<ss:Worksheet ss:Name="Sheet1">\n' +
'<ss:Table>\n\n' + headerRow;
};
emitXmlFooter = function() {
return '\n</ss:Table>\n' +
'</ss:Worksheet>\n' +
'</ss:Workbook>\n';
};
jsonToSsXml = function (jsonObject) {
var row;
var col;
var xml;
var data = typeof jsonObject != "object"
? JSON.parse(jsonObject)
: jsonObject;
xml = emitXmlHeader();
for (row = 0; row < data.length; row++) {
xml += '<ss:Row>\n';
for (col in data[row]) {
xml += ' <ss:Cell>\n';
xml += ' <ss:Data ss:Type="' + testTypes[col] + '">';
xml += data[row][col] + '</ss:Data>\n';
xml += ' </ss:Cell>\n';
}
xml += '</ss:Row>\n';
}
xml += emitXmlFooter();
return xml;
};
console.log(jsonToSsXml(testJson));
это создает XML-документ ниже. Если этот XML сохраняется в файле с именем test.xls, Excel должен распознать это и открыть его с правильной кодировкой.
<?xml version="1.0"?>
<ss:Workbook xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet">
<ss:Worksheet ss:Name="Sheet1">
<ss:Table>
<ss:Row>
<ss:Cell>
<ss:Data ss:Type="String">name</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">city</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">country</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">birthdate</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">amount</ss:Data>
</ss:Cell>
</ss:Row>
<ss:Row>
<ss:Cell>
<ss:Data ss:Type="String">Tony Peña</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">New York</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">United States</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">1978-03-15</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="Number">42</ss:Data>
</ss:Cell>
</ss:Row>
<ss:Row>
<ss:Cell>
<ss:Data ss:Type="String">Ζαλώνης Thessaloniki</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">Athens</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">Greece</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="String">1987-11-23</ss:Data>
</ss:Cell>
<ss:Cell>
<ss:Data ss:Type="Number">42</ss:Data>
</ss:Cell>
</ss:Row>
</ss:Table>
</ss:Worksheet>
</ss:Workbook>
Я должен признать, однако, мое сильное желание было бы сделать это на стороне сервера, если это возможно. Я использовал библиотеку Python openpyxl
сделать это в прошлом и это довольно просто. Большинство серверных языков библиотека, которая генерирует файлы Excel, и они должны предоставлять гораздо лучшие конструкции, чем конкатенация строк.
в любом случае, увидеть это блог MSDN для основы. И это статья StackOverflow для некоторых плюсов / минусов различных других вариантов.
чтобы excel читал CSV-файл Unicode, вам нужно добавить Метка Порядка Байтов как самая первая строка в csv. Это можно сделать с помощью JavaScript, добавив в код следующую строку:
line="\ufeff"+line