こんにちは。ウェブ解析士の佐藤佳です。
今回は、AIの基礎(ホールドアウト法・交差検証)の学びをシェアします。
※情報源は「窪田望のアンテナ!」ですが、
インターネットで調べた内容も加味してブログにまとめています。
■機械学習手法の評価
機械学習の目標は未知の予測。
よって、未知データに対する予測性能を正しく評価する必要がある。
→代表的なものがホールドアウト法
■ホールドアウト法(Hold-out)
モデルを作る学習データと、
モデルを評価するテストデータに分割して評価する方法。
<良い点>
データを分けることで、未知のデータに対する性能を向上できる。
<課題>
データの分割の仕方により、精度の評価に影響が出る可能性がある。
■交差検証(クロスバリデーション法)
未知のデータに対する性能を評価する統計的な手法。
<良い点>
ホールドアウト法の問題点(バラつきの大きなデータ)でも使える。
分類問題でも回帰問題でも用いることができる。
<補足>
交差検証の中でもよく使われるのが「K-分割交差検証」。
データをK個に分割して、そのうち1つをテストデータにして、
残りのK-1個を学習データとして正解率の評価を行う。
※文字で読んでもぜんぜんわからないですよね(^^;)
「K-分割交差検証」で画像検索してみてください。イメージ沸くと思います。
★メモ
なんだかだんだん難しくなってきた気がするのですが・・・(^^;
今回はここまでです。
また次回のブログでお会いしましょう。
この記事を書いた人
- 面白いと思ったモノ・コトを解析して、広く報せることに喜びと生きがいを感じる人です。ブログではウェブ解析のことや、日々の気づきを綴っています。現在は海外赴任でオレゴン州ポートランド在住。Global Business Strategic マネージャー。