1.1. 文字列置換

1.1. 文字列置換 #

1.1.1. 機能概要 #

  • 与えられたデータに対し、文字列を指定された値で置き換えます

実際のデータは必ずしもAIモデルがそのまま扱えるものであるとは限りません。AIモデルでは数値データのみ扱うことが可能なので、文字列データはすべて数値データに変換する必要があります。文字列のデータが登録されるケースは次のような事象が考えられます。

  • 欠損値が"NULL"という文字列になって登録されている

    この場合は欠損値であることを表す"NULL"を外れ値(99999999など)に一度変換し、あとで外れ値補間を行い数値データに変換します。

  • そもそも文字列としてデータが登録されている

    例えば、アンケートの回答として「良い」「普通」「悪い」のようなものです。このような、順序や大小に意味があるデータ(順序尺度)の場合は、「1」「2」「3」の数値にそれぞれ変換することが考えられます。

1.1.2. 入力と出力 #

種別
データ
種別
データ

1.1.3. 操作方法 #

1.1.3.1. 結線 #

処理対象データを結線してください

1.1.3.2. パラメータの設定 #

A. 例として、‘PM2.5濃度’の列にある’data_xxxxx’を'100’に置換した場合

B. Fromにdata_xxxxx Toに100と入力します

設定項目 説明 初期値
From 置換前の文字列
To 置換後の数値

C. “ペアの追加"を押すことで、複数の置換を同時に行うことが可能です。

1.1.3.3. 実行 #

D. “実行” ボタンを押し、実行します。

  • パラメーターに従い置換処理が行われます
  • 置換が成功すると、メッセージが表示されます
    • 処理された件数が表示されます
  • 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。

1.1.3.4. 処理結果の確認 #

E. 必要に応じて、表形式、統計量、グラフ形式で分割結果を確認してください(data_xxxxx が 100 に置換されています)。