2.10. ヒストグラム #
2.10.1. 機能概要 #
ヒストグラムは、あるデータを対象とし、一定の値の範囲(レンジ)に区切ることでデータの発生頻度や分布の形状を可視化するために用いられるカードです。レンジは指定したビン数に対応する形で決定されます。ビン数が大きいほどレンジの幅は狭くなり、ビン数の値が小さいほどレンジの幅は大きくなるため、可視化されるデータの解像度に違いを持たせることができます。
2.10.2. 入力と出力 #
種別 |
---|
データ |
なし
2.10.3. 操作方法 #
2.10.3.1. 結線 #
対象データを結線してください。
2.10.3.2. パラメータの設定 #
設定項目 | 任意/必須 | 初期値 | 説明 |
---|---|---|---|
対象カラム | 必須 | 無し | ヒストグラム適用の対象のカラム |
ヒストグラムのビン数 | 必須 | 10 | ヒストグラムの解像度を決定するビン数 |
2.10.3.3. 実行 #
- “実行"ボタンを押してください。
- 処理時間が 10 分を超えるとタイムアウトし、処理が強制終了されます。
2.10.3.4. ヒストグラムの結果の確認 #
- この例は公開データである「シェアサイクル利用の総台数予測クイックスタート」のcnt(自転車の総利用台数)のヒストグラムを可視化しています。
- ヒストグラムで可視化された分布の形状だけでなく、要約統計量や他の可視化(散布図、相関行列など)の結果も踏まえた上で分析のネクストアクションを検討してください。