仕様

学習用データは、ヘッダー行とその値から構成されるCSVファイルとして作成します。CSVファイルの仕様は、次のとおりです。

項目 形式
拡張子 csv
サイズ 2 GB以下
エンコード
  • UTF-8(BOMなし)
  • UTF-8(BOMあり)
  • Shift-JIS(CP932)
使用できる言語
  • 日本語
  • 英語
データ行数*注1
分析タイプ「分類」の場合
100行以上、50,000行以下
分析タイプ「データマッチング」の場合
  • マッチング元:100行以上、40,000行以下
  • マッチング先:100行以上、40,000行以下
分析タイプ「入金請求突合」の場合
  • 入金データ:100行以上、40,000行以下
  • 請求データ:100行以上、40,000行以下
分析タイプ「需要予測」の場合
  • 3行以上、300,000行以下
列数
分析タイプ「分類」の場合
2列以上、100列以下
分析タイプ「データマッチング」の場合
2列以上、50列以下
分析タイプ「入金請求突合」の場合
入金データ:5列以上、50列以下
請求データ:4列以上、50列以下

  • 分析タイプが「入金請求突合」の場合は、次の列が必要です。
    • 入金データの場合
      - 識別項目
      - 共通キー項目として使用した項目
      - 金額、名称、日時
    • 請求データの場合
      - 共通キー項目として使用した項目
      - 金額、名称、日時
分析タイプ「需要予測」の場合
2列以上、100列以下
値の文字数*注2 40,000文字以内
入力できる数値の範囲
分析タイプ「分類」、「データマッチング」、「入金請求突合」の場合
-2147483647〜2147483647(整数の場合)
分析タイプ「需要予測」の場合
-1.7976931348623157×10^308〜1.7976931348623157×10^308

  • 学習用データでは、数値の前に付与された「△」および「▲」は、マイナスの数値を表す記号として処理されます。
  • データ行数は、ヘッダー行を含まない行数です。
  • 各項目の値1つあたりの文字数です。

分析タイプが「需要予測」の場合

日付を表す項目は、形式の異なる値が複数ある場合、日付を表す項目として判定されなかったり、学習エラーになる場合があります。
日付として判定される形式は次のとおりです。

形式
yyyy-M-d H:mm 2022-1-7 9:30
yyyy-M-d 2022-1-7
yyyy/MM/dd HH:mm:ss 2022/01/07 15:30:15
yyyy/MM/dd HH:mm 2022/01/07 15:30
yyyy/MM/dd H:mm:ss 2022/01/07 9:30:15
yyyy/MM/dd H:mm 2022/01/07 9:30
yyyy/MM/dd 2022/01/07
yyyy/MM/d HH:mm:ss 2022/01/7 15:30:15
yyyy/MM/d HH:mm 2022/01/7 15:30
yyyy/MM/d H:mm:ss 2022/01/7 9:30:15
yyyy/MM/d H:mm 2022/01/7 9:30
yyyy/MM/d 2022/01/7
yyyy/M/dd HH:mm:ss 2022/1/07 15:30:15
yyyy/M/dd HH:mm 2022/1/07 15:30
yyyy/M/dd H:mm:ss 2022/1/07 9:30:15
yyyy/M/dd H:mm 2022/1/07 9:30
yyyy/M/dd 2022/1/07
yyyy/M/d HH:mm:ss 2022/1/7 15:30:15
yyyy/M/d HH:mm 2022/1/7 15:30
yyyy/M/d H:mm:ss 2022/1/7 9:30:15
yyyy/M/d H:mm 2022/1/7 9:30
yyyy/M/d 2022/1/7
yyyy-MM 2022-01
yyyy-M 2022-1
yyyyMMdd 20220107
yyyyMM 202201
yyyy 2022
mmm-yy Jan-21
YYYY-MM-DD 2022-01-07
YYYY-MM-DDTHH:mm:ss 2022-01-07T15:30:15