3.2. 時間窓切り出し

3.2. 時間窓切り出し #

3.2.1. 機能概要 #

時系列データを学習可能な形式に変換します。時系列データを一定の期間の「窓」で切り取り、AIモデルが学習できるようにする処理です。必ず学習カードの手前で処理を行ってください。

3.2.2. 入力と出力 #

種別
データ
種別
時間窓切出し実行済みデータ

3.2.3. 操作方法 #

3.2.3.1. 結線 #

処理対象データを結線してください。

3.2.3.2. パラメータの設定 #

N(予測先、または、遅れ時間)

  • N 分後の値を推定します
  • 教師なし機械学習では、0に固定されます(目的変数と説明変数は同一になります)

M(窓幅)

  • 連続する M 分間のデータを説明変数とします

L(丸め幅)

  • 窓幅 M のデータを L 分毎に分割し、区間内の平均値に丸めます。L は M の約数にしてください
  • カラム数 × 窓幅が大きく、学習が実行できない場合に、L を適切に定めることによりデータサイズを小さく出来ます。

S(ストライド幅)

  • ストライド幅 S 毎に、データを作成します
  • データ数が多く、学習時間が長くなる場合ストライド幅を調整してください
  • ストライド幅を大きくすると、学習データが減少するので注意してください

パラメータの設定についての解説動画




データセットで欠落している期間がある場合

データセットで欠落している期間がある場合、その期間は自動的に回避して時間窓切り出しを行います。 すなわち予測先時刻のデータが存在しない、もしくは説明変数の中に必要な時刻が存在しないデータは時間窓切り出しされません。

ただし、この機能は一部のユースケースでは適切な時間窓を切り出せなくなるリスクが存在します。

例えば証券価格など取引時間中や平日にのみ記録されたデータでは、休日などのデータが欠落する場合があります。この場合は、欠落の前後のデータが連結しているとみなすこともできますが、自動的に回避しては不都合が生じます。

そのため、データセットが欠落している区間を自動的に回避せずにデータを切り出したい場合では、設定パネルに存在する"欠落区間自動スキップ"チェックボックスからチェックを外してください。

3.2.3.3. 実行 #

“実行"ボタンを押し実行します。

  • パラメーターに従い時系列データが作成されます。
  • 教師なし機械学習の場合は、説明変数と目的変数は同じ値になります。
  • 作成が成功すると、メッセージが表示されます。
  • 処理時間が 20 分を超えるとタイムアウトし、処理が強制終了されます。