チュートリアル概要

チュートリアルの概要 #

オープンデータを用いて、センサー類から CO(一酸化炭素)の濃度を予測する課題を Node-AI で解く場合のチュートリアルを説明します。 チュートリアルを進めることで、Node-AIでのモデル構築・モデル評価などの主要な機能を下図のようなレシピを作成することで体験できます。

なお、▶︎詳細はこちら 部分については、一旦読み飛ばしてチュートリアルを進めても作業に支障はありません。

利用するデータ #

チュートリアルではNode-AIで公開しているガスセンサーデータを利用します。 後ほど公開データからアップロードする方法を示します。

カラムの概要 #

カラム名 説明
CO (ppm) CO の濃度を示す値
Humidity (%r.h.) 湿度
Temperature (C) 温度
Flow rate (mL/min) ガスの流量
Heater voltage (V) センサーを操作するヒーターの電圧
RX (MOhm) MOX(金属酸化物)センサー
詳細はこちら

今回のチュートリアルで仕様しているデータは、オープンデータが集まる UCIリポジトリ のガスセンサーのデータです。 このデータはガス室に対して一定の割合の空気と CO を送り込んだ時の CO の濃度の変化をみる実験をした際に収集されたデータとなります。

なお、公開データは一部元のデータからクレンジングしたものになります。

分析指針 #

このチュートリアルでは 1 秒後の CO の濃度を他のセンサーの値から予測し、予測に影響のあったセンサーを可視化する という課題を Node-AI を使って解きます。

分析プロセス #

  1. データを可視化し、統計量を確認する
  2. 目的変数と説明変数を選ぶ

  3. データをクレンジングする
  4. 学習データと評価データに分割する
  5. 正規化する
  6. 時間窓を切り出す
  7. モデルを作成する
  8. モデルを学習する
  9. モデルを評価する
  10. 要因を分析する

この手順は標準的なデータ分析を行う場合の手順を踏襲しています。 (要因の分析はNode-AIの特徴的な機能の1つです。)