Friday, September 05, 2008

野球チーム成績の主成分分析(2)

だれかがどこかでやったことがあるだろうことの続き・・・2000-2007年パリーグチーム成績による打率、安打率、二塁打率、三塁打率、本塁打率、打点率、盗塁率、防御率、セーブ率、完投率、完封率、奪三振率をもとに主成分分析をおこなった。

第三主成分は三塁打率、本塁打率、打点率とセーブ率に高い値が与えられる。

Thursday, September 04, 2008

主成分分析

同じく2000-2007年データ。打率、安打率、二塁打率、三塁打率、本塁打率、打点率、盗塁率、防御率、セーブ率、完投率、完封率、奪三振率をもとに主成分分析をおこなった。

すると第一主成分は寄与率36.8%で、奪三振率、防御率、完封率、完投率に高い値が与えられている。打率、打点率にマイナス値が与えられていることもあわせて、投手力、それも三振をばしばしとるような本格派の先発完投型投手を中心とした投手力を表すものと思われる(セーブ率には-0.25が与えられている!)。いっぽう第二主成分は寄与率22.5%で、全体的には第一主成分と似た構成であるように思える。大きな違いは、奪三振率が大きなマイナス値となっていることくらいだ。第二主成分は打たせてとる投手力なのか?

面白いことに順位の高いチームはいずれの主成分値も小さいように見える。とくに第二主成分は勝率と強いマイナスの回帰を示している(P=4.57E-08)。

勝率指数

前回とは違って、チーム勝率を従属変数とし、各種チーム成績を説明変数とした回帰式から変数選択した。2000-2007年パリーグのデータを使用。

すると、勝率=チーム打率 x 5.64 - チーム防御率 x 0.08 - チーム安打率 x 0.1 + チーム打点率 x 0.07 + チームセーブ率 x 0.23なる式を見いだした。ここでチーム安打率、打点率、セーブ率はそれぞれ一試合ごとの安打、打点、セーブの数である。

すると、今シーズン本日時点での各チームの成績をもとに最終章率を予測すると、西武 .691、オリックス .639、楽天 .608、日ハム .606、ロッテ .606、ソフトバンク .581。うーんほんとうかね。かなり違うような感じ。

Monday, September 01, 2008

野球

2004~2007年のパリーグチーム成績と優勝との関連をロジスティック回帰分析により検討した。

ステップワイズ解析によると、優勝する指数=1.4799*安打+27.4145*完封-0.3999*奪三振-1906によって計算される(ただし試合数の違いを考慮していない)。

これを現在のパリーグにあてはめると西武が-431.1で最も高く、楽天、ロッテ、ソフトバンク、日ハム、オリックスの順。