FUJIFILM IWpro
Intelligent
Assistantオプション
アナリティクス使い方
ガイド
2.データを用意する
学習用データの作り方を知る
学習用データには、目的変数と説明変数が必要です。
目的変数
- 分析で結果を得たい項目(AIモデルの学習時に正解として指定する項目)
説明変数
- 結果に対して原因となる項目、または関係があると思われる項目
作成するデータの構成
- 扱えるデータは、行と列で構成されている表形式データ(テーブルデータ)
- 扱えるデータのタイプは、テキストデータのみ(文字、数字、記号)
- 扱える言語は、日本語と英語
- 先頭行は目的変数、説明変数等の項目名が横に配列され入力されていること
- 2行目以降は1項目ごとに目的変数と説明変数がセットで入力されていること
作成例
上記の表は、送付したDMに顧客が反応したかを示すデータです。
年齢や性別、購入内容などの「顧客情報」と送付したDMに対して反応したかどうかをAIに学習させます。
- 目的変数の項目に値が入力されていない行は、学習には使用されません。
- 項目のデータがすべて欠損している、もしくはすべて同じデータ入力されている場合は、学習には使用されません。
- 1つのデータ内に同じ項目名はありませんか?
- 項目が空欄になっている列はありませんか?
データフォーマット
- ファイル形式は、CSVファイル(カンマ区切り)
- 対応しているエンコーディングファイルは、UTF8(BOM有)、UTF8(BOM無)、Shift-JIS
- ファイルサイズは、2GB以内
分類
分類は、目的変数と説明変数を含めた単一のデータファイルが必要です。
分類データの作り方
- 推論したい項目(目的変数)と学習に使用する項目(説明変数)を含めたデータファイルを作成する。
データ量の制約
上限:5万行 × 100項目
下限:100行 × 2項目
データマッチング
データマッチングには、マッチングさせる2つのデータファイルが必要です。
マッチング元データとマッチング先データの対応関係をAIモデルに学習させます。
正解ペアとなる二つのデータを紐づけるために共通キー項目を作成します。
マッチングデータの作り方
- マッチング元データに、マッチング先データを紐づけるための共通キー項目(例では注文ID)を追加する。
データ量の制約
-
マッチング元データ、マッチング先データ
どちらも同様
上限:4万行 × 50項目
下限:100行 × (共通キー項目+最低他1項目が必要)
- マッチング先データの共通キー項目に重複している値はありませんか?
- マッチング元データに入力されている共通キー項目は、マッチング先データの共通キー項目に含まれていますか?
入金請求突合
入金請求突合には、突合させる2つのデータファイルが必要です。
入金データと請求データの対応関係をAIモデルに学習させます。
1つの入金データに対して、複数の請求データを紐づけることもできます。
入金データと請求データを紐づけるために共通キー項目を作成します。
入金請求突合データの作り方
- 入金データには、入金データを識別できる項目(入金IDや入金番号など)を含める。
- 入金データには、請求データと紐づけるための共通キー項目(例では請求ID)を含める。
- 入金データ1行に対して、複数行の請求データを紐づける場合は、入金データの行を複製し、請求データと紐づけるための共通キー項目の列に複数行分の値を入力する。この時、複製した行の識別項目/金額/名称/日時が複製元と一致すること。
データ量の制約
-
入金データ
上限:4万行 × 50項目
下限:100 行 × 5項目(識別項目/共通キー項目/金額/名称/日時が必要) -
請求データ
上限:4万行 × 50項目
下限:100 行 × 4項目(共通キー項目/金額/名称/日時が必要)
- 入金データ、請求データの共通キー項目に重複している値はありませんか?
- 入金データと請求データに入力されている共通キー項目は全て一致していますか?
- 入金データを複製した場合、識別項目とその他の項目が正しく複製されていますか?
需要予測
需要予測には、日付と実績値(目的変数)を含めた単一のデータファイルが必要です。
需要予測データの作り方
- 日付を表す項目を含める。
- 推論する項目には、過去の日付ごとの実績値を数値で入力する。
- 商品ごと、店舗ごとなど、分析対象ごとに推論する場合は、系列(例:商品、店舗)を表す項目を含める。
- 気象情報を考慮したい場合は、地点の情報を取得するために「郵便番号を表す項目」を含める。
- 割引率や広告の掲載情報などのお客様固有の要因を学習に使用する項目(説明変数)に追加したい場合は、それらを示す項目を含める。
- 参考
- 気象情報の考慮
データ量の制約
上限:30万行 × 100項目
下限:3行 × 2項目
- 日付の項目は、項目内に形式の異なる値が複数存在すると日付として判定しません。1つの形式に統一してください。
- 日付項目は設定されていますか?
- 推論する項目(目的変数)に空欄はありませんか?
- 推論する項目(目的変数)に数値以外のデータが含まれていませんか?
推論用データの作り方を知る
- 推論用データの作り方は基本的に学習用データの作り方と同じです。
-
学習に使用した全ての説明変数が含まれている必要があります。
(不要な説明変数が含まれていても、アナリティクス側で除外して推論します)
分類
分類には、学習時に使用した説明変数を含む単一のデータファイルが必要です。
データマッチング
データマッチングには、マッチングさせる2つのデータファイルが必要です。
マッチングデータの作り方
- マッチング元データ、マッチング先データには学習に使用した全ての項目を含める。
データ量の制約
-
マッチング元データ
上限:1000行 × 50項目
下限:1行 × 学習時と同じ項目が必要 -
マッチング先データ
上限:2万行 × 50項目
下限:1行 × 学習時と同じ項目が必要
- マッチング先データの共通キー項目に重複はありませんか?
- マッチング元データ、マッチング先データの上限行数を超えていませんか?
入金請求突合
入金請求突合には、突合させる入金データと請求データの2つのファイルが必要です。
入金請求突合データの作り方
- 入金データ、請求データには学習に使用した全ての項目を含める。
データ量の制約
-
入金データ
上限:1000行 × 50項目
下限:1行 × 学習時と同じ項目が必要 -
請求データ
上限:2万行 × 50項目
下限:1行 × 学習時と同じ項目が必要
- 入金データの識別項目に重複はありませんか?
- 請求データの共通キー項目に重複はありませんか?
- 入金データ、請求データの上限行数を超えていませんか?
需要予測データの作り方①
学習時にお客様固有の説明変数を追加し、学習データから連続した期間で推論する場合
- 目的変数を除く学習に使用したすべての項目を含める。
- 推論期間(図の「推論期間」)のデータを推論用データとして用意する。
データ量の制約
-
推論用データ
上限:30万行 × 100項目
下限:1行 × 1行
- データの型は学習用データと一致していますか?
需要予測データの作り方②
学習時にお客様固有の説明変数を追加し、学習データから期間を空けて推論する場合
- 学習に使用したすべての項目を含める。
- 学習用データの期間の翌日から推論期間の前日までの期間(図の「実績値の期間」 )のデータと推論期間(図の「推論期間」)のデータを合わせたものを推論用データとして用意する。
- 推論期間のデータは推論する項目(目的変数)を空欄にする。
データ量の制約
-
推論用データ
上限:30万行 × 100項目
下限:1行 × 2列
- 推論用データをアップロードすると、実績値が入力された期間をもとに推論期間を自動判定します。
- 推論用データの期間に、学習用データの期間より後の日付が含まれていますか?
- データの型が、学習用データと一致していますか?
- 推論する項目(目的変数)に欠損はありませんか?
需要予測データの作り方③
学習時にお客様固有の説明変数を追加せず、学習データから期間を空けて推論する場合
- 学習に使用したすべての項目を含める。
- 学習用データの期間の翌日から推論期間の前日までの期間(図の「実績値の期間」 )のデータを推論用データとして用意する。
データ量の制約
-
推論用データ
上限:30万行 × 100項目
下限:1行 × 2列
- 推論用データをアップロードすると、実績値が入力された期間をもとに推論期間を自動判定します。
- 実績値の期間に、学習用データの期間より後の日付が含まれていますか?
- 推論する項目(目的変数)に欠損はありませんか?
エラーが表示されるデータの例
- 1つのデータセット内に同じ項目名はありませんか?…①
- 項目名が空欄になっている項目はありませんか?…②
エラーが表示されるデータの例
- マッチング先データの共通キー項⽬に重複している値はありませんか?…①
- マッチング元データに入力されている共通キー項目は、マッチング先データの共通キー項目に含まれていますか?…②
エラーが表示されるデータの例
- 入金データ、請求データの共通キー項目に重複している値はありませんか?…①
- 入金データと請求データに入力されている共通キー項目は全て一致していますか?…②
- 入金データを複製した場合、識別項目とその他の項目が正しく複製されていますか?…③
エラーが表示されるデータの例
- マッチング先データの共通キー項目に重複はありませんか?…①
- マッチング元データ、マッチング先データの上限行数を超えていませんか?…②
エラーが表示されるデータの例
- 入金データの識別項目に重複はありませんか?…①
- 請求データの共通キー項目に重複はありませんか?…②
- 入金データ、請求データの上限行数を超えていませんか?…③
エラーが表示されるデータの例
- 日付項目は設定されていますか?…①
- 推論する項目(目的変数)に空欄はありませんか?…②
- 推論する項目(目的変数)に数値以外のデータが含まれていませんか?…③
エラーが表示されるデータの例
- データの型は学習用データと一致していますか?
エラーが表示されるデータの例
- 推論用データの期間に、学習用データの期間より後の日付が含まれていますか?…①
- データの型が、学習用データと一致していますか?…②
- 推論する項目(目的変数)に欠損はありませんか?…③
エラーが表示されるデータの例
- 推論用データの期間に、学習用データの期間より後の日付が含まれていますか?…①
- 推論する項目(目的変数)に欠損はありませんか?…②