適切なモデル選択 #

未来の動向を予測するためには、様々な種類のAIモデルが利用されます。データに適したモデルを選択することは、予測の精度向上に欠かせない要素です。

各モデルの理解を深めることで、扱っているデータに最適なAIモデルを選ぶことが可能となり、より正確な未来の予測をすることが可能です。

AIモデルとは

AIモデルとは、機械学習を用いた数理モデルのことを指します。これらのモデルは、入力されたデータから法則性やパターンを学習し、それに基づいて予測値などのアウトプットを生成する仕組みをもっています。

深層学習モデル(MLP) #

深層学習モデル(MLP)は、データ内に非線形かつ複雑な関係が多く含まれている場合に有効なモデルです。例えば、株価の終値予測などは、経済の状況といった様々な要因によって変動するものなので深層学習モデル(MLP)が有効になる場合があります。

※ただし、Node-AIでは要因分析カードを用いることで、一般的には解釈性が低いとされる深層学習モデル(MLP)においても「どの入力が、どのようにして」出力に影響を与えているのかを確認することができ、解釈性を高めることが可能です。

線形モデルは、説明変数と目的変数が直線的な関係にあるときに非常に有効なモデルです。例えば、売上が年々上昇傾向にあるデータに対して予測モデルを作成するときは、線形モデルが有効になる場合があります。

※Node-AIでは、Ridge/Lasso/ElasticNetの3種類の正則化を行うことが可能です。正則化を行うことで、学習データにのみ過剰に適合することを防ぎ、汎化性能の高いAIモデルを作成することが可能です。それぞれの正則化手法については以下を参照してください。

決定木回帰モデルは、急激な変動をもつデータや多くのカテゴリ変数が含まれているときに有効なモデルです。例えば、季節ごとに気温の変動が大きいデータなどには、決定木回帰モデルが有効になる場合があります。

カテゴリ変数とは

カテゴリ変数とは、文字列や記号であらわされるようなデータや、数値でもそれらの差が意味をもたないようなデータを指します。

例えば、「A」「B」「C」や「犬」「猫」「鳥」、アンケートにおける「良い」「普通」「悪い」をそれぞれ「1」「2」「3」に対応させたデータなどはカテゴリ変数です。

Node AIでは、AIモデルを作成するために文字列や記号で表されたデータはすべて数値に変換する必要があります( 1.1.文字列置換)。

AIモデルの選定に悩んだとき、以下の質問に答えることで有効なモデルがわかります。ただし、質問に対する結果が扱っているデータに必ずしも有効とは限りません。

各AIモデルのメリットとデメリットを深く理解し、試行錯誤を行い適切なAIモデルを選ぶことが重要です。

質問1：データセットは大量にありますか？

質問2：説明変数と目的変数に線形関係はありますか？

質問3：データにカテゴリ変数が多く含まれていますか？

各AIモデルに関するリンク