Как вывести результат hadoop в формате csv
мне нужно вывести результат hadoop .формат CSV. как я это сделаю? Мой код :https://github.com/studhadoop/xml/blob/master/XmlParser11.java
должен ли я просто включить csvoutputFormat в свой код. Я использую API mapreduce
myjob.sh
bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita Vidyalayam, Karwar_Class 1 B_ENG.xml /user/root/ala_xmlrpt-outputshell4
bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit
cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv
решение
ys я отсутствовал > в cat
cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv
1 ответов
вы можете использовать TextOutputFormat. Разделитель ключ / значение по умолчанию-символ табуляции. Вы можете изменить разделитель, установив свойство "mapred.textoutputformat.separatorText " в вашем драйвере.
conf.set("mapred.textoutputformat.separatorText", ",");