
あれっ?この条件!過去のレースでは抜群の成績なのに・・・

それは、ただのかたよったデータの可能性があるな
競馬を研究されている方は1度はやったことがあるのではないだろうか?
過去のデータにフィルターをかけていき、単勝回収率や複勝回収率をだすやつ。
例えば
【東京 芝 1600 1枠】の成績は?
【重賞レース デムーロ】の成績は?
こんなの調べたことありますよね?
これからこのブログでもいろんなデータを紹介していこうと思っております。
この回収率の高い条件を見つける作業をしていく上で超大事な事があります。
【かたより】なのか【傾向】なのか?
フィルターをかけていけばいくほど、回収率の高い条件は誰でも見つけることができます。
大事なことはその条件に再現性があるかないかです。
かたより→再現性のないただの結果論(いいところどりのデータ)
傾向→今後も同じような結果が期待できる
例を出してみますね
①2015年~2017年 東京芝1600 で期待値の高い馬を探してみます。
1番回収率の高い枠番は5枠になります。
②5枠 → 単回収率91.7% 複回収率85.9%
1番回収率の高い騎手は田辺騎手(件数10回以上)
③田辺騎手 → 単回収率283% 複回収率118%
つまり
東京芝1600で5枠に入った田辺騎手がいたら買いとなるわけです。
はたして本当にそれでいいと思いますか?
中身をみてみましょう。
1-1-1-10(1着ー2着ー3着ー着外)
そうなんです。3年間で1着が1回。2016年6月の安田記念8人気のロゴタイプでの1着です。単勝3690円ついたので単回収率がはねあがっています。
田辺騎手が東京芝1600を得意として、特に5枠に入った時には神がかり的な成績を収める!とはならないわけです。
同条件を年別でみてみます。
2015年 0-0-1-4 単0% 複156%
2016年 1-1-0-0 単3690% 複520%
2017年 0-1-0-6 単0% 複34.3%
仮に2016年の成績をみて、2017年同条件で狙っていたら、ボロ負けですね。
極端な例ですが、これは傾向ではなくかたよりと言えます。回収率の高い部分を抽出しただけの都合のいいデータです。
また高配当がデータに含まれると、簡単に信憑性がうすれてしまうことがわかりますね。
使えるデータ!傾向とは?
ではどんなのが、かたよりではなく傾向とよべるのか?私がおもう傾向とは・
- ある期間でくぎった時にも、平均して成績が高いもの
- 理論的にも説明できうるもの
詳しく説明しますね。
①ある期間でくぎった時にも、平均して成績が高いもの(低いもの)
例えば、過去10年間のデータで回収率の高い条件をみつけたとします。
その条件を【年】別でみるのです。
1年だけ回収率が高くて9年低いものは使えないデータといえるでしょう。
また、それを【月】別でみるのも大事です。1年のうち1か月だけ回収率が高く、11か月マイナスなら、これもあやしい条件です。
【月】単位でみるとサンプル数も少ないですから、収束しきれていないだけかもしれないので、そこは注意が必要です。
毎月その条件で回収率が高いなら再現性も期待できるので今後も同じ条件を狙っていけば良い。
毎年、同じような成績におちつくデータというのは【傾向】とよべるし。今後もある程度その結果におちつくのではと予想できます。
1番人気の分析データなどは、毎年同じ傾向なので使えるデータだと思います。
②理論的にも説明できうるもの
初めの田辺騎手の例だとなぜ田辺騎手が5枠にはいったら強くなるのか説明つかないですよね。こういう事です(雑)
「1番人気が1番もうからない」理由は説明がつきます。
分析をされる時には、それが【傾向】なのか【かたより】なのかを注意することが重要です。