十年網(wǎng)站開發(fā)經(jīng)驗(yàn) + 多家企業(yè)客戶 + 靠譜的建站團(tuán)隊(duì)
量身定制 + 運(yùn)營維護(hù)+專業(yè)推廣+無憂售后,網(wǎng)站問題一站解決
本篇內(nèi)容介紹了“cdh3u3 hadoop 0.20.2 MultipleOutputs多輸出文件怎么實(shí)現(xiàn)”的有關(guān)知識,在實(shí)際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧!希望大家仔細(xì)閱讀,能夠?qū)W有所成!
創(chuàng)新互聯(lián)建站主要從事成都做網(wǎng)站、成都網(wǎng)站制作、網(wǎng)頁設(shè)計(jì)、企業(yè)做網(wǎng)站、公司建網(wǎng)站等業(yè)務(wù)。立足成都服務(wù)福田,十多年網(wǎng)站建設(shè)經(jīng)驗(yàn),價(jià)格優(yōu)惠、服務(wù)專業(yè),歡迎來電咨詢建站服務(wù):028-86922220
1.新建一個(gè)multest.txt文件
11111,username,password,22,河北師范大學(xué),軟件學(xué)院,2008 11112,username,password,22,河北師范大學(xué),計(jì)算機(jī)學(xué)院,2008 11113,username,password,22,xx大學(xué),軟件學(xué)院,2008 11114,username,password,22,xxx大學(xué),計(jì)算機(jī)學(xué)院,2008 11115,username,password,23,2008
2.在hdfs上新建一個(gè)目錄,hadoop dfs -mkdir multest
3.將新建到文本文件上傳到multest目錄下:hadoop dfs -put /home/wjk/hadoop/multest.txt multest
4.新建Map/Reduce工程,將格式不符合(7位)到保存到dirtydata中,將河北師范大學(xué)軟件學(xué)院以外到數(shù)據(jù)保存到otherschool中,將河北師范大學(xué)軟件學(xué)院到數(shù)據(jù)保存到默認(rèn)文件中。
public class Multest {
public static class MultestMapper extends
Mapper5.編譯,導(dǎo)出jar,運(yùn)行:hadoop jar ./../multest.jar com.wjk.test.Multest multest multestout
6.運(yùn)行截圖

=======注意==========================
缺陷:集群上運(yùn)行會有多個(gè)分散的文件
補(bǔ)充:按上述的寫法產(chǎn)生的文件很多,合并很難,可以執(zhí)行輸出目錄,合并的話按目錄getmerge就容易了。主要修改點(diǎn)在mos.write上,參考官方代碼,很簡單,自行領(lǐng)悟吧。
publicvoid write(String namedOutput, K key, V value) throws IOException, InterruptedException { write(namedOutput, key, value, namedOutput); } public void write(String namedOutput, K key, V value,String baseOutputPath) throws IOException, InterruptedException { checkNamedOutputName(this.context, namedOutput, false); checkBaseOutputPath(baseOutputPath); if (!(this.namedOutputs.contains(namedOutput))) { throw new IllegalArgumentException("Undefined named output '" + namedOutput + "'"); } TaskAttemptContext taskContext = getContext(namedOutput); getRecordWriter(taskContext, baseOutputPath).write(key, value); }
“cdh3u3 hadoop 0.20.2 MultipleOutputs多輸出文件怎么實(shí)現(xiàn)”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注創(chuàng)新互聯(lián)網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實(shí)用文章!