ChatGPTと競馬データ(JRDB)で手軽に競馬予想

競馬分析やりたい、AI作ってみたいとあなたのためのコンテンツです。
今回の記事では、競馬のデータを解析し、AIを作成するために、サンプルデータとchatgptを使って簡単に行ってみます。

まず http://www.jrdb.com/program/data.html   のリンクから、JRDB成績データ(SED)をサンプルをダウンロードします。

SEDのサンプルデータを保存

JRDB Webツール(サンプルデータ用) https://keivacance-parser.s3.ap-northeast-1.amazonaws.com/sample-85bde3f8/index.html で取得したSEDファイルを投げこみます。jrdbのデータをブラウザ上でデータを整形するツールです。

データを投げ込んで少し待つと自動でファイルを取得できます。データが整理されています。

webツールに入力後、解析結果(SED.csv)を取得
解析したcsvの中身


データ解析

データ解析は自分でコーディングを行うのも良いのですが、最近はChatGPTのData Analysis機能を使ってコーディングしてもらいます。
作成したコードは貼っておきました

ChatGPTでデータ分析。質問して待つだけ

結果は、

単勝の的中率: 約16.67%
単勝の回収率: 約40.83%

複勝の的中率: 約66.67%
複勝の回収率: 約77.50%

複勝の的中率・回収率はおおむね良さそうな数値感でした。特に回収率は大衆の人気一位に賭けると100パーから控除率(約20パー)を引いた値に近づいていくので、近い値です。
単勝の的中率・回収率が低い点は、データが少ない点が影響してそうです。データは約300件、レースはおよそ20件ほどのはずです。

・コード
https://colab.research.google.com/drive/1M4uDqY4yfCOZBdGYyVON1qktgdpRvx8K?usp=sharing

AIを作ってみる

GBDTモデルを利用して後ろ20パーセントをテストデータにしてAIを作って回収率を計算しました。これもコードは貼っておきました

  • 学習データのボリューム(サンプル数): 259

  • テストデータのボリューム(サンプル数): 65

結果は

回収率いいですが、データが少ないので運がよかった可能性が高いです。データを増やすためには、JRDBのデータを契約して、JRDB Webツールを利用すれば、年単位でのデータ解析やAI作成が簡単にできます。

・コード

Google Colaboratory colab.research.google.com  

結論

JRDBとwebツールを利用して、さっとデータ分析や機械学習ができた。JRDBを契約して、下記JRDB Webツールを利用すれば、年単位でのデータ解析やAI作成が簡単にできます。是非ご利用ください。