クイックスタート

クイックスタート #

※所要時間目安は約10-15分です。
本クイックスタートではNode-AI側であらかじめ用意されている CSV データを使用するのでこのまま始めていただけます。

1. クイックスタートを実施することで達成できること #

本クイックスタートを実施することで、以下のことができるようになります。

  1. ノーコードAIモデル開発ツール Node-AI の操作方法を理解できます。
  2. Node-AI を用いて AI モデルを作成するための基本的な流れを理解できます。
  3. Node-AI を用いて前処理からAIモデルの作成、評価、予測までを実施できます。
分析題材はこちら

本データ分析の設定 #

あなたは電力会社で電力の調達を担当している社員であるとします。 コストを最適化するために、将来の電力需要を予測して調達量を適切に調整する必要があります。 電力需要の変動は複雑ですが、ベテラン担当者の経験から気温や天候等が影響することがわかっています。 しかし、それ以外にも因子は多数あると考えられ、簡単な数式で求めることは難しそうです。 そこであなたは機械学習を用いて過去のデータを元に未来の電力需要を予測することを考えました。

電力需要予測を行う意義
電力需要予測は電力供給の安定化、環境保護、経済効率の向上など、多くの利点があるため、予測が必要とされています。例えば、以下のような利点が考えられます。

  1. 電力供給の効率化: 電力需要予測を行うことで、電力会社は適切な発電量を計画し、供給の効率化を図ることができます。これにより、無駄な電力の生産を抑制し、エネルギー資源の有効活用が可能になります。

  2. ピーク時の負荷緩和: 予測によってピーク時の電力需要が事前に把握できるため、電力会社は適切な対策を講じて、供給網への負荷を緩和することができます。これは、停電リスクの低減や電力インフラの維持・管理にも寄与します。

  3. コスト削減: 需要予測が正確であれば、電力会社は過剰な発電設備投資や燃料購入コストを抑制することができます。これにより、経済的な電力供給が可能となり、最終的には消費者の電気料金の抑制にもつながります。

2. 手順 #

アカウント作成後に表示されるチーム(トレーニング)で、プロジェクトとキャンバスを作成します。 チーム、プロジェクト、キャンバスの説明については 1.1. チーム・プロジェクト・キャンバスについて をご参照ください。

2-1. プロジェクト作成 #

  • プロジェクトを追加します。

    • “+ プロジェクト追加” または “プロジェクトを作成する” ボタンをクリックし、プロジェクト作成モーダルを表示してください。
      • “プロジェクトを作成する” ボタンは、プロジェクトが未作成の場合に現れるボタンです。
    • “プロジェクト名” に作成したいプロジェクトの名称を入力してください。
    • “概要” にプロジェクトの説明文を入力してください。(任意入力)
    • “作成” ボタンを押してプロジェクトを作成してください。

2-2. キャンバス作成 #

  • 作成したプロジェクトでキャンバスを作成します。

    • “キャンバスを作成する” ボタンをクリックし、キャンバス作成モーダルを表示してください。
    • “キャンバス名” に作成したいキャンバスの名称を入力してください。
    • “概要” にキャンバスの説明文を入力してください。(任意入力)
    • “作成” ボタンを押してキャンバスを作成してください。
    • プロジェクトはキャンバスを複数包含できます。
  • 作成したキャンバスをクリックすると、キャンバス画面に移動します。

2-4. データの準備 #

以下について説明します。

  • 公開データをNode-AIに取り込み、データカードとして使える状態にします。
  • 学習に用いる目的変数・説明変数を選択し、状態を保存します。

2-4-1. 公開データアップロード #

Node-AIに公開データをアップロード(インポート)します。
(参考: 3.1.1.2. 公開データをインポート)

  1. データツールの “公開データ” ボタンを押してください。
  1. “オーストラリア電力需要予測” を選択して「このデータを追加」をクリックしてください。
  1. アップロード中を表す画面が表示されます。処理が終わるまでお待ちください。
  2. “時刻カラムを選択” 画面で時刻の入ったカラムを選択し、“実行” ボタンを押します。通常 “日付” が自動選択されています。
  1. データの変換中を示す画面が表示され、完了するとキャンバス画面に戻ります。

2-4-2. データカードを配置して詳細画面を開く #

  1. アップロードが完了したデータは “データツール” にデータカードとして表示されます。
  2. 上記のカードをドラッグアンドドロップでキャンバスエリアに配置します。
  1. カードをダブルクリックし、カードの詳細画面を表示します。

2-4-3. 目的変数・説明変数を保存する #

“目的変数” は予測する対象、“説明変数” はAIへの入力の対象となります。

今回は “総電力需要(MWh)” を他データから予測するので、以下のように設定します。
(参考: 3.2. データ確認/説明変数・目的変数の設定)

  • “目的変数” に 総電力需要(MWh) を選択
  • “説明変数” に他のデータを選択
  1. “目的変数” に “総電力需要(MWh)” を選択します。
  2. “説明変数” は “総電力需要(MWh)” を除くすべての項目を選択します。3点メニューで “すべて選択” を選ぶと、すべての項目を選択できます。(“すべて選択"を選ぶと、目的変数にもチェックが付くので外してください。)
  3. “実行” ボタンを押して設定を保存します。実行完了後に「説明変数と目的変数を保存しました」とカード下部に表示されます。
  4. カードの詳細を右上の×ボタンか、カード外をクリックすることで閉じます。

2-5. ツリー作成と実行 #

2-4. でデータカードが用意できました。
次はデータを分析するためのカードを配置します。
今回はあらかじめ用意されている公開レシピによって回帰ツリーを作成します。

※ カードを一枚ずつ手動で配置する場合は、 チュートリアルの手順を参照ください。

2-5-1. 公開レシピの取り込み #

公開レシピをダウンロードします。
公開レシピはマニュアル内の 別ページにまとめてあります。
(参考: 4.3. レシピのインポートと公開レシピのダウンロード)

  1. 上記画像のように、レシピツールを開いてください。
  2. レシピツール内の「公開レシピをダウンロード」を押してください。
  1. マニュアルのレシピページが表示されるので、「クイックスタートレシピ」横の「ダウンロード」を押してください。(jsonファイルのダウンロードが始まります)

2-5-2. 公開レシピのインポート #

2-5-1. でダウンロードしたレシピ(jsonファイル)をNode-AIにインポートします。

  1. レシピツール内の「レシピをインポート」を押してください。
  2. 2-5-1. でダウンロードしたレシピを選択してください。

これでレシピの準備ができました。

2-5-3. レシピ配置 #

レシピを使用して、AIモデル作成のためのツリーを配置します。

  1. 2-5-2. でインポートしたレシピをドラッグアンドドロップでキャンバスエリアに配置します。
  1. ダイアログで「レシピを展開しますか?」と聞かれるので「OK」を押してください。
  2. 下記画像のようになっていることを確認してください。

2-6. データカードをツリーに接続 #

公開レシピのツリーの配置後は、扱いたいデータカードをレシピに接続します。
以降、接続したカードを上から順に開いて実行を繰り返してください。

なお、「詳細はこちら」については読み飛ばして進めることができます。

2-6-1. データカードを欠損値補間カードと接続し実行 #

詳細はこちら

今回の “オーストラリア電力需要予測” データには欠損値(NaN)が含まれています。
欠損値が含まれているままだと、以降の処理が適切にできないので事前に取り除く必要があります。

欠損値があるかどうかを確認します。

  1. キャンバスエリアに配置されているデータカードをダブルクリックで開き、統計タブを押します。
  2. 統計タブの中の “日光エネルギー(MJ/m^2)” , “降水量” のカラムを見ると、欠損値が存在することが確認できます。

欠損値を取り除くためには欠損値補間カードを使いましょう。
(参考: 1.3. 欠損値補間)

  1. データカードを欠損値補間カードの近くまでドラッグアンドドロップで移動させ、データカード下部の点から欠損値補間カードの上部の点までドラッグアンドドロップし線をつなげます。
    結線は上のカードが持っているデータを下に繋げたカードに渡すことを意味します。
  2. 欠損値補間カードをダブルクリックで開き、「線形補間」が選択されていることを確認します。
  3. 欠損値補間を「実行」します。メッセージ「欠損値を補間」がでることを確認してください。

2-7. 各カード実行(学習) #

同じ要領で、学習をするのに必要なデータ分割・正規化・時間窓切り出し・MLP・学習の順でカードを実行していきます。ただし、今回においては各カードの設定は変更せずに実行してください。
学習が実行し終わった段階でAIモデルが作成されます。

詳細はこちら
  1. データ分割カードを開き、下記のようにfrom, toを設定されていることを確認し、実行します。
    (参考: 3.1. データ分割)
  • 学習データ
    • from: 2015-01-01 00:00:00
    • to: 2018-12-31 00:00:00
  • テストデータ
    • from: 2019-01-01 00:00:00
    • to: 2020-10-06 00:00:00
  1. データ分割の学習側から結線されている正規化カードを開き、下記のように初期値として標準化が選択されていることを確認し、実行します。
    (参考: 1.6. 正規化)

03. データ分割の学習側から結線されている時間窓切り出しカードを開き、下記のようにN, M, L, Sが設定されていることを確認し、実行します。
(参考: 3.2. 時間窓切り出し)

  • N: 予測先 = 1
  • M: 窓幅 = 10
  • L: 丸め幅 = 1
  • S: ストライド幅 = 10
  1. MLPカードを開き、モデルと設定値を見てそのまま実行します。 本来はモデル構造やパラメータの値を調整し、精度の高いモデルを作ることが目的となります。
    ただし初期値でも学習は行えるため、今回は初期設定のままで実行しています。
    (参考: 4.1.a. 深層学習モデルの設計 (MLP))
  1. 学習カードを開き、下記のように「バリデーションしない」が選択されていることを確認し、実行します。
    実行が進むとともに学習結果のグラフが随時更新されていくのが確認できます。
    (参考: 4.2. 学習)

学習完了時

ここまでの手順でキャンバスは以下の状態になっています。 ご確認ください。

これでAIモデルが作成できました。

2-8. 各カード実行(評価) #

2-7. で作成したAIモデルを評価します。
データ分割カードの評価側から結線されているツリーを上から順に実行していきます。

詳細はこちら

学習側のカードから評価側のカードに伸びているコンフィグリンクが確認できます。

これは繋ぎ元のカードの設定を繋げ先のカードに持たせる機能があります。
学習側で実行したカードと同様の設定値が既に設定されているので、評価側のカードは実行するだけで学習側と同等の処理が行えます。

  1. データ分割の評価側から結線されている正規化カードを開き、実行します。
  2. データ分割の評価側から結線されている時間窓切り出しカードを開き、実行します。
  3. 評価カードを開き、実行します。
    (参考: 5.1. 評価)

評価カードの実行が終わると以下のようなグラフが表示されます。

予測値と実測値が俯瞰グラフに表示されると共に評価指標(RMSE/CORR/MAE/MAPE/R^2)が表示されます。(評価指標の説明は下記の詳細をご覧ください。)

詳細はこちら

各評価指標の説明

指標 説明
RMSE(Root Mean Squared Error/二乗平均平方根誤差) 予測値と実測値の誤差を二乗し、それらの平均を取った後、平方根を求めることで算出される指標です。RMSEは、予測誤差の大きさを考慮し、外れ値の影響を強調する特徴があります。モデルの予測精度を評価する際によく用いられ、値が小さいほど予測精度が高いとされます。
CORR(Correlation Coefficient/ピアソンの相関係数) 予測値と実測値の間の直線的な関係の強さを示す指標で、-1から1の範囲の値を取ります。1に近い場合、正の相関が強く、予測値が増加すると実測値も増加することを示します。-1に近い場合、負の相関が強く、予測値が増加すると実測値は減少することを示します。0に近い場合、予測値と実測値の間にはほとんど相関がないことを示します。ピアソンの相関係数は、予測モデルの適合度を評価する際に参考にされることがあります。
MAE(Mean Absolute Error/平均絶対誤差) 予測値と実測値の絶対誤差の平均を表します。予測誤差の大きさを直感的に理解しやすい指標で、予測モデルの精度を評価する際に使用されます。
MAPE(Mean Absolute Percentage Error/平均絶対パーセント誤差) 予測値と実測値の絶対誤差を実測値で割り、その平均をパーセント表示したものです。予測誤差が実測値に対してどの程度の割合で発生しているかを示す指標で、予測モデルの相対的な精度を評価する際に用いられます。
R^2(Coefficient of Determination/決定係数) 予測モデルが実測値をどの程度説明できるかを示す指標で、0から1の範囲の値を取ります。1に近いほど予測モデルが実測値をよく説明していると言え、モデルの適合度を評価する際に使用されます。R^2は、予測値と実測値の相関関係の強さを示すピアソンの相関係数を二乗したものです。

2-9. 各カード実行(予測) #

モデルは評価までで終了ではなく、業務への活用のため、新しいデータに対して繰り返し未来予測を行う必要があります。予測カードを使うことで、新しいデータへの前処理、予測を一気に行うことができます

2-7. で作成したAIモデルを用いて将来データの予測を行います。

トレーニング用チームでは公開データから予測用のデータを選択できます。 FreeプランまたはBusinessプランではオリジナルのCSVデータをアップロードできます。

FreeプランまたはBusinessプランで将来データの予測に用いるデータは こちらからダウンロードしてください。

トレーニング用チームの場合 #

  • 予測に用いる公開データを選択してください。
  • “実行” ボタンを押してください。

FreeプランまたはBusinessプランの場合 #

  • 予測カードを開き、ダウンロードした csv ファイルをアップロードしてください。
  • “実行” ボタンを押してください。

(参考: 6.1. 予測グラフの確認)

予測カードの実行が終わると以下のようなグラフが表示されます。

3. 次のステップ #

このクイックスタートではNode-AIの基本的な概念や操作について説明しました。 さらに本格的な分析やビジネス利用を検討するには以下をご参照ください。