現在、システムトレードのため、CME日経先物の過去データを調べています。
現在、CMEのサイトからは過去データと直近データの両方が入手できるようです。
1)直近データ
http://www.cme.com/trading/dta/del/delayed_quote.html?ProductSymbol=NK&ProductFoiType=FUT&ProductVenue=R&ProductType=idx
2)過去データ
http://www.cme.com/ftp.wrap/japanese
しかし、2)の過去データで入手できるデータから、どのようにやれば1)にあるような4本値が作成できるのかが良く分かりません。2)のサイトには、データの見方を説明したエクセルファイルもありますが、素人の悲しさで、このファイルを見ても良く分かりません。
どなたか、2)の過去データから1)のような4本値を作成する方法をご存知でしたら教えて頂けませんでしょうか?
宜しくお願いします。
仕様書とデータを見てわかる範囲について書きます。
例として、2)はnikkei_2007.zipをダウンロードし、Excelで開いたものとします。
A列:日付です。1)のグレーの網掛け内の日付に対応します。
B列:シンボル(銘柄コード)です。1)に従い、「NK」だけ選びます。
C列:「NK」は、GLOBEX銘柄なので、「E」を選びます。
D列:先物/オプション区分です。「F」を選びます。
E,F列:先物の限月です。Eが「3」、Fが「2007」ならMAR07になります。
V列:出来高。ゼロ以外のレコードを選択します。
ここまでの絞り込みで1日当たり2レコードが残るはずです。
見たところ、まったく同じ内容が重複して存在しているようなので、
内容が全く同じレコードを削除します。(1件おきに重複レコードが
あります。)
これによって、726レコードが残ります。
1)のカラムとの対応を見てみます。
MTH/STRIKE E,F列を変換したもの
--- SESSION ---
OPEN I列
HIGH M列
LOW O列
LAST Q列 (ただし、2)では全部ゼロになっています)
SETT U列
PT CHGE 「PRIOR DAY」のSETT - SETT
EST VOL V列 (ただし、1)は予想値なので若干意味が異なります。
---- PRIOR DAY ----
SETT 前日のU列
VOL 前日のV列
INT 前日のW列
Openがゼロの日には、次のようなパターンがあるようです。
1)Highにゼロ以外の値が設定されている。この場合、L列にはBが設定されている。
2)Lowにゼロ以外の値が設定されている。この場合、N列にはAが設定されている。
3)High, Lowにゼロ以外の値が設定されている。この場合、L列にはB、N列にはAが設定されている。
4)High, Lowにゼロが設定されている。
1)は売り気配のみ、2)は買い気配のみ、3)は売り気配、買い気配の両方がある場合で、4)は気配が立たなかった状態だと思います。
SETTは、基準値のようなもので、気配だけに終わった日でも前日の終値などから算出しているものと思います。
日本では、「翌日基準値」と呼ばれているものを参考にして下さい。おそらくCMEでは異なる算出ルールを用いていると思いますが。
懇切丁寧な回答を頂き、誠に有難うございました。
良く分かりました。
回答有難うございます。こんな内容の質問でしたので、回答をいただける可能性はきわめて低いと考えておりました。
しかし、良く分からないのは、教えて頂いた内容では、Openが無くて、High、Low、SETTだけある日があります。これは、一体どのような仕組みになっているのでしょうか?
ご教示頂ければ幸いです。宜しくお願いします。