![]() | この記事は 検証可能 な 参考文献や出典 が全く示されていないか、不十分です。 出典を追加 して記事の信頼性向上にご協力ください。(2017年12月) |
データ前処理(データまえしょり)は、データマイニングの過程における重要なステップである。「ガベッジイン、ガベッジアウト」という考えは、データマイニングや機械学習において特に適用可能である。取り扱い範囲外の値や、組み合わせ不可能なデータがあるなどといった結果として、データ収集の方法は大雑把になってしまう場合が多い。そのような問題に対処するために、データ収集の段階で注意深くスクリーニングを行うことは誤解を生まずに済むため有効である。