Hadoopのソースを読もう

続いて,



// Create the splits for the job

LOG.debug("Creating splits at " + fs.makeQualified(submitSplitFile));

InputSplit[] splits =

job.getInputFormat().getSplits(job, job.getNumMapTasks());


において,入力データをmap数の分だけ,分割をしてますね.

で,分割した結果得られた配列の要素の長さを比較してソートしています(なぜ?).で,分割されたファイルをJobTracker二通知するためにファイルに書き込むようです(idgt).



で,最後に

JobStatus status = jobSubmitClient.submitJob(jobId);

if (status != null) {

return new NetworkedJob(status);

} else {

throw new IOException("Could not launch job");

}


を実行します.やっとjobを登録できましたという感じですか.成功した場合には,NetworkedJobが帰ってくるんですね.次回は,jobSubumitClient.submitJob(..)から調査ですね.今日はここまで.