付録:分析データの作成方法
分析データ作成のフローチャート
週毎のテキストデータファイル(item9901t〜item9952t:全商品を含む)にはすべてのデータが含まれているため、FORTRANプログラム(m9601.f)を用いてパスタのみのデータを作成した。
|
ステップ1: ↓ |
全店舗・パスタのみの週毎のPOSデータファイルpasta9901n〜pasta9952の作成 |
|
ステップ2: ↓ |
52個(または53個)の一週間分のファイルを一年間分の全店舗・牛乳のみのPOSデータファイルpasta99nとしてUNIXのcatコマンドを用いてひとつのファイルにまとめる |
|
ステップ3: ↓ |
日次POSデータのある店舗のコードのみを店舗属性ファイル(temp99##)から検索し、店舗コードリストを作成 |
|
ステップ4: ↓ |
FORTRANプログラム(PASTAP4.f)の中で店舗コードを指定してプログラムを実行し、店舗ごとのパスタのみの日次データP#####ファイルを作成(#####は店舗コード) |
|
ステップ5: ↓ |
FORTRANプログラムmis.fを用いて欠落データが“-999”で示されているカレンダーファイルC#####、データに含まれているJANコードファイルJ#####を作成(#####は店舗コード) |
|
ステップ6: ↓ |
J#####から対象商品を絞る(#####は店舗コード) |
|
ステップ7: ↓ |
店舗属性ファイルから分析対象となる店舗の決定 |
|
ステップ8: |
対象商品のみの日次販売量データSA#####ファイル及び日次価格データPR#####ファイルの作成 |
分析データ作成の詳しい手順
ステップ1:テキストデータへの変換による週別pasta99##nファイルの作成
全店舗で取り扱っている全ての商品のPOSデータは週毎にファイルitem99##に保管されているが、これらのデータはバイナリデータである。これらのデータをC言語のプログラム(cnv)で適すとデータに変換して、item99##tのファイルを作成した。item99##tの各行は、「どこで(店コード)」「いつ(日付)」「何が(JANコード)」「いくつ」「いくらで」売れたか、といったデータを含んでおり、各行の最後には「JICFS分類コード」が含まれている。このコードで、パスタ全般を示す商品カテゴリーコードを含んでいるデータだけをFORTRANプログラムで抜き出したのがpasta99##nである。できあがったpasta99##nには、その週の全店舗の全てのパスタ製品のPOSデータが含まれている。
ステップ2:一年分のファイルpasta99nの作成
pasta9901nからpasta9952nまでの各週のデータファイルを一年分まとめたpasta99nを作成した。
ステップ3:日別POSデータのある店舗コードを検索
temp9901〜temp9952というファイルがあって、これは各週のitem99##ファイルに含まれている店舗の情報を含んだデータである。つまり、temp9901に情報が記してある店舗のデータはitem9901に含まれているということである。逆に、item9902のデータはtemp9902に含まれている店舗からしかとっていない。このtemp99##には、日次・週次・月次にデータを収集している店舗が全て含まれており、このファイルの情報に基づき、日次POSデータのある店舗を抜き出す。
ステップ4:パスタカテゴリーの店舗別P#####ファイルの作成
pasta99nの各行の先頭は“店舗コード”である。そこで、ステップ3の手順で調べた店舗のコードを含んでいるデータ(行)をtemp99nから抜き出すのである。「item99nから行の先頭がP#####(店舗コード)を含む行を抜き出して、P#####というファイルに記しなさい」ということである。できあがったP#####には、その店舗の一年間日次の、全てのパスタ製品のPOSデータが含まれている。
ステップ5:店舗別カレンダーファイルC#####とJANコードファイルJ#####の作成
ステップ4で作成したP#####ファイルから、さらに各店舗ごとにC#####及びJ#####というファイルをFORTRANプログラムmis.fを使って作成した。C#####は一列目がカレンダーで二列目が牛乳の売上総計になっている。つまり、一行が一日のパスタ売上の合計を表している。J#####はその店舗で扱われているパスタ製品のJANコードを羅列したものである。また、C#####ファイルを作る際にカレンダーが年間の途中で終わってしまう店舗がいくつかあった。これは、年の途中のデータが数週間(数日だと「データの欠損」として扱われている)抜けている店舗があるためである。今回の分析では一年間データがそろった店舗のみを対象にしているので、こういった店舗は対象から外した。
ステップ6:分析対象商品の抽出(J#####から対象商品を絞る)
ステップ5で製作したJ#####ファイルは、その店舗で扱われている全てのパスタ製品のJANコードを羅列したものであるが、このJANコードの中にはインスタント製品や冷凍パスタなどの加工済み製品も含まれている。今回の分析の対象は「乾燥パスタ」であるので、これ以外のパスタ製品を示すJANコードに関してはこの段階で削除した。修正後のJ#####ファイルに羅列されているJANコードは全て乾燥パスタのものである。また対象商品を消す斎、それぞれのJANコードがどの製品を示しているか調べる必要があったため、同時にそれぞれの商品のコードも調べておいた。
ステップ7:分析対象店舗の決定
分析対象店舗としてプロモーションを行っている4店舗を選んだ。
ステップ8:対象商品のみの日次販売量データファイル及び日次価格データファイルの作成
実際にFORTRANプログラムで動かすためのファイルSA#####とPR#####を作成した。C#####ファイル、J#####ファイル及びP#####ファイルをもとに、1行に1日の各商品の売上数が並ぶようにファイルを作成した。1列目はJ#####に最初に書かれたJANコードの商品の売上数、2列目は2番目のコードの売上数、というように対応しているので、SAファイル自体にはラベルはないがどの列がどの商品の売上かを調べることが容易にできる。日次価格データPR#####ファイルも読み込みデータが価格となるようにFORMATで指定し、同様に作成する。