Hadoopのソースを読もう
続いて,
// Create the splits for the job
LOG.debug("Creating splits at " + fs.makeQualified(submitSplitFile));
InputSplit[] splits =
job.getInputFormat().getSplits(job, job.getNumMapTasks());
において,入力データをmap数の分だけ,分割をしてますね.
で,分割した結果得られた配列の要素の長さを比較してソートしています(なぜ?).で,分割されたファイルをJobTracker二通知するためにファイルに書き込むようです(idgt).
で,最後に
JobStatus status = jobSubmitClient.submitJob(jobId);
if (status != null) {
return new NetworkedJob(status);
} else {
throw new IOException("Could not launch job");
}
を実行します.やっとjobを登録できましたという感じですか.成功した場合には,NetworkedJobが帰ってくるんですね.次回は,jobSubumitClient.submitJob(..)から調査ですね.今日はここまで.