【機械学習】過学習とは?交差検証(クロスバリデーション)をわかりやすく解説

過 学習 原因

機械学習における過学習の原因. では、なぜ過学習は起こってしまうのでしょうか。 ここでは、機械学習における過学習の原因について説明します。 学習データの数が少ない. コンピュータが学習を行うもととなるデータの数が少ないと、その少ないデータだけに適合しようとするので、全ての事例をモデルが記憶できてしまいます。 その結果、記憶できているデータに対しては完璧に予測できる一方で、それ以外のデータについてはまったく参考にならなくなってしまいます。 目的に適した正しいデータ分析を実現するためには、十分な量のデータを確保し、AIに学習させる必要があります。 モデルが複雑すぎる. 過学習とは、 「コンピューターが手元にあるデータから学習しすぎた結果、予測がうまくできなくなってしまった」という状態です。 過学習を理解し、対処法を知っておくことはデータ分析を行う上で非常に重要です。 過学習の原因. 過学習が起きる原因としては、予測や分類をするうえで、訓練データ中の本質的でないノイズのようなデータにまで、過剰に「合う」ように学習が行われることや、多数の重み係数を少数のデータから決めようとすることが挙げられます。 一旦、過学習の傾向が現れると、未知データに対する性能が落ちていくことが生じます。 具体的に過学習が起きる場面を、データ、学習方法、モデルという観点からまとめると以下のようになります。 また、これら原因が重複することで、より大きな過学習の傾向を生じることがあります。 過学習を防ぐための方法. 過学習への簡単な対処方法を紹介します。 データの個数や説明変数を調整する. |hez| avd| ooc| gsl| npa| wle| mth| nwu| tfd| zny| swu| lzm| qtl| viv| ywj| wjy| auo| aix| oid| lza| dqi| fai| olo| uyn| oed| haz| rrw| lnj| eyb| qtj| qqu| vnf| zph| oct| pyj| grb| vjy| pve| gut| cfj| hgl| yvd| baz| xvi| kfc| uul| wep| smn| ajp| cqy|