適切なモデル選択

適切なモデル選択 #

未来の動向を予測するためには、様々な種類のAIモデルが利用されます。データに適したモデルを選択することは、予測の精度向上に欠かせない要素です。

各モデルの理解を深めることで、扱っているデータに最適なAIモデルを選ぶことが可能となり、より正確な未来の予測をすることが可能です。

AIモデルとは
AIモデルとは、機械学習を用いた数理モデルのことを指します。これらのモデルは、入力されたデータから法則性やパターンを学習し、それに基づいて予測値などのアウトプットを生成する仕組みをもっています。

深層学習モデル(MLP) #

深層学習モデル(MLP)は、データ内に非線形かつ複雑な関係が多く含まれている場合に有効なモデルです。例えば、株価の終値予測などは、経済の状況といった様々な要因によって変動するものなので深層学習モデル(MLP)が有効になる場合があります。

有効な場面 #

  • データが大量にある場合
  • データが非線形の関係にある場合
  • 予測精度を重視する場合

注意点 #

  • データが少量の場合、望む精度が得られない場合がある
  • 他のモデルと比較するとモデルの解釈性が低い(※)

※ただし、Node-AIでは 要因分析カードを用いることで、一般的には解釈性が低いとされる深層学習モデル(MLP)においても「どの入力が、どのようにして」出力に影響を与えているのかを確認することができ、解釈性を高めることが可能です。

線形モデル #

線形モデルは、説明変数と目的変数が直線的な関係にあるときに非常に有効なモデルです。例えば、売上が年々上昇傾向にあるデータに対して予測モデルを作成するときは、線形モデルが有効になる場合があります。

有効な場面 #

  • 説明変数と目的変数に線形関係がある場合
  • シンプルなAIモデルを作成したい場合
  • 学習時間を短くしたい場合

注意点 #

  • データが非線形の場合は望む精度が得られない場合がある
  • 多くの特徴量をもつデータには適切に正則化を行う必要がある(※)

※Node-AIでは、Ridge/Lasso/ElasticNetの3種類の正則化を行うことが可能です。正則化を行うことで、学習データにのみ過剰に適合することを防ぎ、汎化性能の高いAIモデルを作成することが可能です。それぞれの正則化手法については以下を参照してください。

手法 メリット 選定方法
Ridge すべての特徴量を保持しながら過剰適合を抑えられる 特にAIモデルの過剰適合が大きい場合
Lasso 不要な特徴量を削除し、単純なモデルが作成できる 解釈性をより高めたい場合
ElasticNet RidgeとLassoの特徴を兼ね備えている 過剰適合を抑えつつ、解釈性も高めたい場合

決定木回帰モデル #

決定木回帰モデルは、急激な変動をもつデータや多くのカテゴリ変数が含まれているときに有効なモデルです。例えば、季節ごとに気温の変動が大きいデータなどには、決定木回帰モデルが有効になる場合があります。

有効な場面 #

  • データに急激な変動が多く含まれている場合
  • データにカテゴリ変数が多く含まれている場合
カテゴリ変数とは
カテゴリ変数とは、文字列や記号であらわされるようなデータや、数値でもそれらの差が意味をもたないようなデータを指します。

例えば、「A」「B」「C」や「犬」「猫」「鳥」、アンケートにおける「良い」「普通」「悪い」をそれぞれ「1」「2」「3」に対応させたデータなどはカテゴリ変数です。

Node AIでは、AIモデルを作成するために文字列や記号で表されたデータはすべて数値に変換する必要があります( 1.1.文字列置換)。

注意点 #

  • 学習データに過剰に適合することを防ぐために適切なハイパーパラメータの調整が必要

モデル選定に迷ったとき #

AIモデルの選定に悩んだとき、以下の質問に答えることで有効なモデルがわかります。ただし、質問に対する結果が扱っているデータに必ずしも有効とは限りません。

各AIモデルのメリットとデメリットを深く理解し、試行錯誤を行い適切なAIモデルを選ぶことが重要です。

次の3つの質問にすべて答えてください







各AIモデルに関するリンク