送りバントの効果に潜む「平均」の罠【統計の誤用を解説】

勝利数とWHIP・OPSの関係を表した図です。OPSと勝利数は正に比例し、WHIPと勝利数は負に比例するようです。

⓪本記事の3行要約

  • 送りバントの分析例から平均の罠を解説する。
  • 送りバントに正・負の大きな効果がある可能性を解説する。
  • 平均効果は全選手がバントする状況しか利用できないことを解説する。

➀平均について

-(1)平均とは

 平均とは算術平均・幾何平均・調和平均といった演算の総称です。ただし、実際には演算の総称ではなく算術平均のみを指して用いられます。なお、算術平均は次の通りに求まります。

・算術平均=x1+x2+…+xn
n

この算術平均は正規分布の代表値やデータの基礎統計量として利用されます。また、中心極限定理により標本の算術平均は正規分布に従うため、データの統計学的な検定にも利用されます。

-(2)本記事の方向性

 本記事では、平均の問題に陥ったオペレーションズリサーチの分析を例として挙げます。そして、方程式を用いたモデルから期待得点・得点確率を算出することで、平均値を用いた分析によって分析結果が歪められることを解説します。


➁本記事の分析方法

-(1)方程式による期待得点・得点確率の算出法

 本記事では、イニングを連立方程式として表現するモデルから期待得点・得点確率を算出します。この算出法の大枠については過去の記事にて解説したためここでは触れませんが、下の仮定のもとで野球を疑似的にシミュレーションしている点に留意する必要があります。

-(2)野球をリアルに再現する工夫

 大まかには野球を野球盤のように捉えたモデルであり、現実の競技とは大きくかけ離れた内容となっている点に注意が必要です。なお、ここでは2塁走者が単打で生還する確率を60%と仮定することにより、『野球のOR』や野球盤の再現において生じた2塁走者の扱いによるバイアスを解消しようと試みています。

-(3)送りバントの再現

 そして、ここでは2021年度NPBの送りバント成功率と守備率を用いて送りバントの効果を推定しました。その推定式は次の通りです。

・送りバントの効果=0.804×0.013×E[得点|送りバント成功後の場面]+0.804×0.987×E[得点|エラー後の場面]+
0.196×E[得点|送りバント失敗後の場面]−E[得点|送りバント前の場面]

[仮定]

  • 打席結果は表1の6種類のみで成績に従って確率的に決定される。
  • 走塁は打席結果のみに従い、表1のとおりに対応する。
  • 2塁走者が単打で生還する確率pは0.6である。
  • 以上の仮定で想定されないプレー(盗塁・失策等)は無視する。

各打席結果と打者の出塁・走者の進塁がどのように対応しているかを示した表です。2塁走者が単打時に確率pで生還する野球盤を想像して頂ければわかりやすいかと思います。

※方程式による期待得点と得点確率の算出法の解説はこちら


③送りバントの効果に潜む罠

-(1)送りバントの効果とは

 まず、作戦の実行が勝利確率に与える影響を作戦の効果といいます。そのため、送りバントの効果は送りバントを実行した場合と実行しなかった場合の勝利確率の差として表現されます。

 しかし、実際に勝利確率を観測・推定することは困難です(実際にはセイバーメトリクスにより実施されています)。そこで、期待得点と得点確率に与える効果を考えましょう。すると、期待得点と得点確率に与える送りバントの効果は次のように表すことができます。

・期待得点への効果=E[得点|ある状況のバント後]−E[得点|ある状況の強攻後]
・得点確率への効果=E[得点確率|ある状況のバント後]−E[得点確率|ある状況の強攻後]

-(2)オペレーションズリサーチの回答

前記のセ・リーグ標準成績を用いてこれらの値を計算したものを表4 に示す.無死一塁のときには3 回に2 度以上の成功を必要とし一死一塁ではパントは良策でないことが分かる.
鳩山由紀夫(1979)『野球のOR』より引用

 オペレーションズリサーチではしばしば上記のような分析を行います。送りバントの成功率を100%と仮定すると、無死一塁時の送りバントは一死2塁の状況をもたらします。そのため、これらの状況の比較で期待得点がどのように変化するのかを調べることで送りバントの効果を検証できます。

 しかし、この標準成績(平均成績)を用いた分析方法には統計学的な問題点が存在します。本記事では平均により失われる情報の問題を解説します。

[参考論文]・鳩山(1979)『野球のOR』

-(3)「平均」の罠

 ここでは、2021年度レギュラーシーズンのスターティングメンバ―を基準として、OPSと無死一塁時の送りバントの効果を計算しました。その結果をまとめたものが図1・2です。なお、ここでは全体の平均値を"+"で表現しており、単回帰分析の結果を黒の直線として表現しています。

 図1によると、全体における送りバントは平均的に負の効果を持つようです。つまり、全選手に対して送りバントを実行場合には期待得点が減少します。では、ここから送りバントは期待得点を下げる作戦であると結論付けて良いのでしょうか。

 次に、回帰分析の結果から得られる傾向を見ていきましょう。これによると、OPSが高くなるに従って送りバントの期待得点に与える効果は小さくなる傾向が明らかとなります。このとき、回帰分析の結果からOPSが0.3程度の選手には送りバントの効果が平均的に見込まれるようです。

 さらに、個別の標本から得られる傾向を見ていきましょう。これによると、OPSが0.6程度の選手にも送りバントの効果が見込まれる場合があるようです。

<図1 無死一塁時の送りバントが得点に与える影響>

 図2によると、全体における送りバントは平均的に正の効果を持つようです。つまり、全選手に対して送りバントを実行場合には得点確率がわずかに上昇します。では、ここから送りバントは得点確率を上げる作戦であると結論付けて良いのでしょうか。

 次に、回帰分析の結果から得られる傾向を見ていきましょう。これによると、OPSが高くなるに従って送りバントの得点確率に与える効果は小さくなる傾向が明らかとなります。このとき、回帰分析の結果からOPSが0.75程度の選手には送りバントの効果が平均的に見込まれるようです。

 さらに、個別の標本から得られる傾向を見ていきましょう。これによると、OPSが1.0程度の選手にも送りバントの効果が見込まれる場合があるようです。

2021年度レギュラーシーズンのスタメンにおける無死一塁時の送りバントが得点確率に与える効果とOPSの関係を表した図です。これによると、OPSが高くなるにしたがって送りバントの効果が小さくなる傾向がみられます。

 以上より、平均をとることで送りバントが期待得点を上昇させる状況や得点確率を減少させる状況の情報が失われます。よって、先の分析例では標準成績を用いたため平均的に正の効果が認められませんでしたが、実際には低OPSの選手において正の効果が認められたかもしれません。つまり、平均値は全体の傾向を掴むためには有益ですが、個別の情報が失われてしまう点に注意しなければなりません。


④「平均値」の罠を克服する

-(1)層別を利用する

 平均によって重要な情報を失わないために、層別を利用するという方法があります。これはOPSの大きさから分けられた各グループにおいて平均効果を求めるものです。これによって、OPSを考慮に入れた送りバントの効果を分析することができます。

-(2)回帰分析を利用する

 次に、回帰分析も有効な方法だと考えられます。これは最小二乗法によって送りバントの効果にフィットした直線(曲線)を引く方法です。事前にモデルを考える必要がありますが、より詳細にOPSを考慮に入れた送りバントの効果を分析をすることができます。

-(3)ばらつきの問題

 実際には、回帰分析であっても誤差(モデルから推定できなかった部分)は発生します。そのため、回帰分析結果からは効果が無いと思われるOPSであっても、実際には効果が見込まれる可能性は残ります。

-(4)平均のパラドックス

 また、データから実証分析を行う際には別の問題が発生します。例えば、送りバントの効果を検証するためにイニング得点数を収集する場合、得点は整数値しか得られないため算術平均を利用する必要があります。このとき、大数の法則より算術平均に用いる標本は多いほうが望ましいです。すると、層別のグループ数を少なくしたいという動機付けが生まれます。実証分析の際にはこれらのバランスをとって分析しなければなりません。

⑤おわりに

 本記事ではオペレーションズリサーチによる送りバントの分析を例に挙げて、平均によって失われる情報の問題点を解説しました。そして、『野球のOR』は送りバントの平均的な効果を求めているだけであり、個別の選手に当てはめることは不適切であることが明らかとなりました。


コメント