データの準備・確認と処理の実行

データの準備・可視化・統計量確認 #

データのアップロード #

Node-AIに公開データをアップロード(インポート)します。
(参考: 3.1.1.2. 公開データをインポート)

  1. データツールの “公開データ” ボタンを押してください。
  1. “ガスセンサーCO濃度予測” を選択して「このデータをインポート」をクリックしてください。
  1. アップロード中を表す画面が表示されます。
  2. “時刻カラムを選択” 画面で時刻の入ったカラムを選択し、“実行” ボタンを押します。通常 “time” が自動選択されています。
  1. データの変換中を示す画面が表示され、完了するとキャンバス画面に戻ります。

カード詳細画面 #

  1. アップロードが完了したデータは “データツール” にデータカードとして表示されます。
  2. 上記のカードをドラッグアンドドロップでキャンバスエリアに配置します。
  3. カードをダブルクリックし、カードの詳細画面を表示します。

データの可視化 #

カード詳細画面の “グラフ” タブから今回の予測する対象である “CO(ppm)” を可視化します。

  1. “グラフ” タブを選択します。
  2. “グラフ表示” パネルから “CO(ppm)” を選択します。(初期状態で選択済みです)
  3. “俯瞰グラフ” から詳細表示したい部分を選択します。初期状態では全期間が選択してあります。

データを可視化すると、今回の予測すべきデータは離散的な動きをしており予測の難易度が高いデータであることがわかります。

追加のデータの可視化 #

次に、 “CO(ppm)” 以外のセンサーも可視化します。
例として、 “R3(MOhm)” 、“R5(MOhm)” 、“R12(MOhm)” を選択します。

センサーRX のデータは “CO” とは傾向が異なり、上下に激しく動いたデータとなっています。

統計量の確認 #

“統計” タブを選択します。

カラムごとの最大値・最小値が、大きく異なる事が分かります。 また、“欠損値数” が全て 0 であるので、欠損値の除外処理は不要ということがわかります。

※欠損値の除外は 欠損値補間(Interpolate Missing Value)カード で行えます。

外れ値が少しありますが、可視化による目視では外れ値が見られなかった(他と大きく外れるような飛び値がなかった)ので、そのまま使用します。

このように、可視化や統計情報を見ることで様々なことがわかります。

目的変数・説明変数の選択 #

目的変数と説明変数を選ぶ #

“目的変数” は予測する対象、“説明変数” はAIへの入力の対象となります。

今回は “CO” を他のセンサーから予測すると言う課題なので、以下のように設定します。

  • “目的変数” に CO を選択
  • “説明変数” に他のセンサーを選択
  1. “テーブル” タブを選択します。
  2. “目的変数” に “CO(ppm)” を選択します。
  3. “説明変数” は “CO(ppm)” を除くすべての項目を選択します。一番左のチェックボックスを選択することで、すべての項目を選択できます。
  4. “実行” ボタンを押して設定を保存します。
  5. 保存完了後に「説明変数と目的変数を保存しました。」と表示されます。
詳細はこちら

このチュートリアル内容と関連する 3.2. データ確認/説明変数・目的変数の設定も参考にして下さい。