Как вывести результат hadoop в формате csv

мне нужно вывести результат hadoop .формат CSV. как я это сделаю? Мой код :https://github.com/studhadoop/xml/blob/master/XmlParser11.java

должен ли я просто включить csvoutputFormat в свой код. Я использую API mapreduce

myjob.sh

bin/hadoop jar /var/root/ALA/ala_jar/clsperformance.jar ala.clsperf.ClsPerf /user/root/ala_xmlrpt/Amrita Vidyalayam, Karwar_Class 1 B_ENG.xml  /user/root/ala_xmlrpt-outputshell4

bin/hadoop fs -get /user/root/ala_xmlrpt-outputshell4/part-r-00000 /Users/jobsubmit


cat /Users/jobsubmit/part-r-00000 /Users/jobsubmit/output.csv

решение

ys я отсутствовал > в cat

cat /Users/jobsubmit/part-r-00000> /Users/jobsubmit/output.csv

1 ответов


вы можете использовать TextOutputFormat. Разделитель ключ / значение по умолчанию-символ табуляции. Вы можете изменить разделитель, установив свойство "mapred.textoutputformat.separatorText " в вашем драйвере.

conf.set("mapred.textoutputformat.separatorText", ",");