FUJIFILM IWpro
Intelligent Assistantオプション
アナリティクス使い方
ガイド
2.データを用意する

学習用データの作り方を知る
学習用データには、目的変数と説明変数が必要です。
目的変数
- 分析で結果を得たい項目(AIモデルの学習時に正解として指定する項目)

説明変数
- 結果に対して原因となる項目、または関係があると思われる項目

作成するデータの構成
- 扱えるデータは、行と列で構成されている表形式データ(テーブルデータ)
- 扱えるデータのタイプは、テキストデータのみ(文字、数字、記号)
- 扱える言語は、日本語と英語
- 先頭行は目的変数、説明変数等の項目名が横に配列され入力されていること
- 2行目以降は1項目ごとに目的変数と説明変数がセットで入力されていること
作成例

上記の表は、送付したDMに顧客が反応したかを示すデータです。
年齢や性別、購入内容などの「顧客情報」と送付したDMに対して反応したかどうかをAIに学習させます。
注意
- 目的変数の項目に値が入力されていない行は、学習には使用されません。
- 項目のデータがすべて欠損している、もしくはすべて同じデータ入力されている場合は、学習には使用されません。
エラーの場合
- 1つのデータ内に同じ項目名はありませんか?
- 項目が空欄になっている列はありませんか?
エラーになる例を確認する
データフォーマット
- ファイル形式は、CSVファイル(カンマ区切り)
- 対応しているエンコーディングファイルは、UTF8(BOM有)、UTF8(BOM無)、Shift-JIS
- ファイルサイズは、2GB以内

分類
分類は、目的変数と説明変数を含めた単一のデータファイルが必要です。
分類データの作り方
- 推論したい項目(目的変数)と学習に使用する項目(説明変数)を含めたデータファイルを作成する。
データ量の制約
上限:5万行 × 100項目
下限:100行 × 2項目


データマッチング
データマッチングには、マッチングさせる2つのデータファイルが必要です。
マッチング元データとマッチング先データの対応関係をAIモデルに学習させます。
正解ペアとなる二つのデータを紐づけるために共通キー項目を作成します。
マッチングデータの作り方
- マッチング元データに、マッチング先データを紐づけるための共通キー項目(例では注文ID)を追加する。
データ量の制約
- マッチング元データ、マッチング先データ
どちらも同様
上限:4万行 × 50項目
下限:100行 × (共通キー項目+最低他1項目が必要)

エラーの場合
- マッチング先データの共通キー項目に重複している値はありませんか?
- マッチング元データに入力されている共通キー項目は、マッチング先データの共通キー項目に含まれていますか?
エラーになる例を確認する

入金請求突合
入金請求突合には、突合させる2つのデータファイルが必要です。
入金データと請求データの対応関係をAIモデルに学習させます。
1つの入金データに対して、複数の請求データを紐づけることもできます。
入金データと請求データを紐づけるために共通キー項目を作成します。
入金請求突合データの作り方
- 入金データには、入金データを識別できる項目(入金IDや入金番号など)を含める。
- 入金データには、請求データと紐づけるための共通キー項目(例では請求ID)を含める。
- 入金データ1行に対して、複数行の請求データを紐づける場合は、入金データの行を複製し、請求データと紐づけるための共通キー項目の列に複数行分の値を入力する。この時、複製した行の識別項目/金額/名称/日時が複製元と一致すること。
データ量の制約
- 入金データ
上限:4万行 × 50項目
下限:100 行 × 5項目(識別項目/共通キー項目/金額/名称/日時が必要) - 請求データ
上限:4万行 × 50項目
下限:100 行 × 4項目(共通キー項目/金額/名称/日時が必要)

エラーの場合
- 入金データ、請求データの共通キー項目に重複している値はありませんか?
- 入金データと請求データに入力されている共通キー項目は全て一致していますか?
- 入金データを複製した場合、識別項目とその他の項目が正しく複製されていますか?
エラーになる例を確認する

需要予測
需要予測には、日付と実績値(目的変数)を含めた単一のデータファイルが必要です。
需要予測データの作り方
- 推論する項目には、過去の日付ごとの実績値を数値で入力する。
- 学習に使用する項目には日付を含める。分析対象ごとに推論する場合は系列(例では商品、店舗)を、気象情報を考慮したい場合は、地点の情報を取得するために「郵便番号を表す項目」を含める。
- 参考
- 気象情報の考慮
データ量の制約
上限:30万行 × 100項目
下限:3行 × 2項目

注意
- 日付の項目は、項目内に形式の異なる値が複数存在すると日付として判定しません。1つの形式に統一してください。
エラーの場合
- 日付項目は設定されていますか?
- 推論する項目(目的変数)に空欄はありませんか?
エラーになる例を確認する
推論用データの作り方を知る
- 推論用データの作り方は基本的に学習用データの作り方と同じです。
- 学習に使用した全ての説明変数が含まれている必要があります。
(不要な説明変数が含まれていても、アナリティクス側で除外して推論します)

分類
分類には、学習時に使用した説明変数を含む単一のデータファイルが必要です。

データマッチング
データマッチングには、マッチングさせる2つのデータファイルが必要です。
マッチングデータの作り方
- マッチング元データ、マッチング先データには学習に使用した全ての項目を含める。
データ量の制約
- マッチング元データ
上限:1000行 × 50項目
下限:1行 × 学習時と同じ項目が必要 - マッチング先データ
上限:2万行 × 50項目
下限:1行 × 学習時と同じ項目が必要

エラーの場合
- マッチング先データの共通キー項目に重複はありませんか?
- マッチング元データ、マッチング先データの上限行数を超えていませんか?
エラーになる例を確認する

入金請求突合
入金請求突合には、突合させる入金データと請求データの2つのファイルが必要です。
入金請求突合データの作り方
- 入金データ、請求データには学習に使用した全ての項目を含める。
データ量の制約
- 入金データ
上限:1000行 × 50項目
下限:1行 × 学習時と同じ項目が必要 - 請求データ
上限:2万行 × 50項目
下限:1行 × 学習時と同じ項目が必要

エラーの場合
- 入金データの識別項目に重複はありませんか?
- 請求データの共通キー項目に重複はありませんか?
- 入金データ、請求データの上限行数を超えていませんか?
エラーになる例を確認する

需要予測
需要予測では、推論期間に応じてファイルを準備する必要があります。
学習用データの期間から連続して推論する場合、追加のデータファイルは必要ありません。
学習用データの期間から期間を空けて推論する場合、学習時に使用した項目を含む実績データが必要です。
需要予測データの作り方
- 学習に使用したすべての項目を含める。
- 学習用データの期間の翌日から推論期間の前日までの期間のデータを用意する(図の「実績データの期間」)。

データ量の制約
-
実績データ
上限:30万行 × 100項目
下限:1行 × 学習時と同じ項目が必須
エラーの場合
- 実績データの期間に、学習用データの期間より後の日付が含まれていますか?
エラーになる例を確認する
エラーが表示されるデータの例

エラーの場合
- 1つのデータセット内に同じ項目名はありませんか?…①
- 項目名が空欄になっている項目はありませんか?…②
エラーが表示されるデータの例

エラーの場合
- マッチング先データの共通キー項⽬に重複している値はありませんか?…①
- マッチング元データに入力されている共通キー項目は、マッチング先データの共通キー項目に含まれていますか?…②
エラーが表示されるデータの例

エラーの場合
- 入金データ、請求データの共通キー項目に重複している値はありませんか?…①
- 入金データと請求データに入力されている共通キー項目は全て一致していますか?…②
- 入金データを複製した場合、識別項目とその他の項目が正しく複製されていますか?…③
エラーが表示されるデータの例

エラーの場合
- マッチング先データの共通キー項目に重複はありませんか?…①
- マッチング元データ、マッチング先データの上限行数を超えていませんか?…②
エラーが表示されるデータの例

エラーの場合
- 入金データの識別項目に重複はありませんか?…①
- 請求データの共通キー項目に重複はありませんか?…②
- 入金データ、請求データの上限行数を超えていませんか?…③
エラーが表示されるデータの例

エラーの場合
- 日付項目は設定されていますか?…①
- 推論する項目(目的変数)に空欄はありませんか?…②
エラーが表示されるデータの例

エラーの場合
- 実績データの期間に、学習用データの期間より後の日付が含まれていますか?