競馬分析やりたい、AI作ってみたいとあなたのためのコンテンツです。
今回の記事では、競馬のデータを解析し、AIを作成するために、サンプルデータとchatgptを使って簡単に行ってみます。
まず http://www.jrdb.com/program/data.html のリンクから、JRDB成績データ(SED)をサンプルをダウンロードします。
JRDB Webツール(サンプルデータ用) https://keivacance-parser.s3.ap-northeast-1.amazonaws.com/sample-85bde3f8/index.html で取得したSEDファイルを投げこみます。jrdbのデータをブラウザ上でデータを整形するツールです。
データを投げ込んで少し待つと自動でファイルを取得できます。データが整理されています。
データ解析
データ解析は自分でコーディングを行うのも良いのですが、最近はChatGPTのData Analysis機能を使ってコーディングしてもらいます。
作成したコードは貼っておきました
結果は、
単勝の的中率: 約16.67%
単勝の回収率: 約40.83%
複勝の的中率: 約66.67%
複勝の回収率: 約77.50%
複勝の的中率・回収率はおおむね良さそうな数値感でした。特に回収率は大衆の人気一位に賭けると100パーから控除率(約20パー)を引いた値に近づいていくので、近い値です。
単勝の的中率・回収率が低い点は、データが少ない点が影響してそうです。データは約300件、レースはおよそ20件ほどのはずです。
・コード
https://colab.research.google.com/drive/1M4uDqY4yfCOZBdGYyVON1qktgdpRvx8K?usp=sharing
AIを作ってみる
GBDTモデルを利用して後ろ20パーセントをテストデータにしてAIを作って回収率を計算しました。これもコードは貼っておきました
-
学習データのボリューム(サンプル数): 259
-
テストデータのボリューム(サンプル数): 65
結果は
回収率いいですが、データが少ないので運がよかった可能性が高いです。データを増やすためには、JRDBのデータを契約して、JRDB Webツールを利用すれば、年単位でのデータ解析やAI作成が簡単にできます。
・コード
結論
JRDBとwebツールを利用して、さっとデータ分析や機械学習ができた。JRDBを契約して、下記JRDB Webツールを利用すれば、年単位でのデータ解析やAI作成が簡単にできます。是非ご利用ください。