KATOH・ZiPS・Steamerの違いと使い方|プロスペクト評価モデル入門

KATOH・ZiPS・Steamerの3大プロスペクト予測モデルの仕組みとFanGraphs上での読み方を比較した解説図 セイバーメトリクス
この記事をシェアする𝕏B!FacebookLINEPocket

はじめに:なぜ「予測モデル」を知っておくと野球がもっと面白くなるのか

野球を観ていると「このマイナーの若手、本当にメジャーで通用するの?」とか「来季この選手はどのくらい打つだろう?」と気になる瞬間ってありますよね。実はそうした疑問に数字で答えてくれる「プロジェクションシステム(予測モデル)」というツールが存在します。

今回はその代表格であるKATOH(カトー)ZiPS(ジップス)Steamer(スティーマー)の3つを取り上げ、それぞれの違いと使い方を解説します。この記事を読み終えるころには、FanGraphsに並ぶ予測値の意味が分かり、ドラフトやトレード期の議論にも自信を持って参加できるようになります。

KATOH・ZiPS・Steamerという3つの代表的なプロスペクト評価・成績予測モデルを比較紹介する図解で、FanGraphsに並ぶ予測値の意味やマイナー選手のメジャー到達確率を読み解く導入を示すアイキャッチ

従来の「目利き評価」だけでは足りない理由

マイナーリーグの選手評価は長らく、スカウトによる20-80スケール(ツール評価)が主流でした。これは打撃・走力・守備・肩・パワーなどを20〜80点で採点する仕組みで、現在もとても重要です。ただし主観が入りやすく、「ツールはAだけど成績は伸び悩む」「地味だけど数字を残し続けてメジャーで開花する」といったケースを見落とすことがあります。

同じく、シーズン成績の予測も「去年の打率」「去年の防御率」だけ見ていると外れがちです。打率・打点・勝利数の限界はこのブログでも繰り返し触れているとおりで、運の要素(BABIPなど)を含まずに予測すると精度が出ません。そこで登場したのが、過去のデータから統計的に将来を推定するプロジェクションシステムです。

1. KATOH:マイナー成績から将来WARを予測する

どんなモデル?

KATOHは元FanGraphsライターのChris Mitchellが開発したプロスペクト評価モデルです。名前は元MLB選手のKazuo Matsui(松井稼頭央)に由来しています(本人いわく、響きが好きだったとのこと)。マイナーリーグの成績・年齢・所属レベル・守備位置などを入力に、その選手がメジャー昇格後6年間に積み上げるWARの期待値を回帰モデルで弾き出します。

WAR(Wins Above Replacement)の説明はリンク先に譲りますが、ざっくり言うと「控え選手と比べて何勝ぶん上乗せした選手か」を表す総合指標ですね。

KATOHが見ているもの

  • 年齢(年齢に対して上のレベルでやれているか)
  • BB%(四球率)・K%(三振率) — プレートディシプリンの質
  • ISO(純長打率)
  • 盗塁数・盗塁成功率
  • 守備位置(ショート/センターは加点)

計算イメージ(簡易例)

実際の式は非公開のランダムフォレスト/回帰系ですが、考え方を簡単な例で追ってみましょう。「AAレベル・21歳・BB% 12%・K% 18%・ISO .200・SS守備」の選手がいたとします。

将来6年WAR ≒ ベース値
  + (年齢の若さボーナス)
  + (BB% × 重み)
  − (K% × 重み)
  + (ISO × 重み)
  + (守備位置補正:SSなら+α)

このように、各特徴を重みづけて足し合わせるイメージです。仮にこの選手のKATOH予測が「6年WAR = 8.0」だったら、平均的なメジャー先発レギュラー級が見込めるという解釈になります。

実例のイメージ

KATOHは過去にMookie Bettsをマイナー時代から高評価していたことで知られます。当時のBettsはスカウトのツール評価は中庸でしたが、四球が多く三振が少なく、AAでも盗塁を量産していました。KATOHはそのスタッツの特徴から「メジャーで通用する」と早期にサインを出していたわけです。

KATOHモデルがマイナー時代のMookie Bettsを高評価した経緯を示す図解で、四球率や三振率、盗塁数などのスタッツ特徴量から6年WARを予測し、スカウト評価では見落とされがちな選手をプロスペクト評価する仕組みのイメージ

2. ZiPS:Dan Szymborskiが開発した長期予測の定番

どんなモデル?

ZiPSはDan Szymborski氏が開発したプロジェクションシステムで、過去3〜4年の成績をベースに、向こう1年〜数年の成績を予測します。名前は元MLB選手Todd Zeileの「Z」と、ベースとなった旧モデル「sZymborski Projection System」から来ています。

ZiPSの特徴は「コンプ(類似選手)」を内部で参照する点です。対象選手と年齢・体型・成績パターンが似た過去の選手たちが、その後どう推移したかを学習データに、将来曲線を描きます。

ZiPSが見ているもの

  • 過去3〜4年の打撃・投球成績
  • 年齢曲線(エイジングカーブ)
  • 類似選手の追跡データ
  • 球場補正(パークファクター)
  • 怪我リスク・出場可能試合数

実例:野手の年間予測を読む

たとえばAaron Juddgeクラスの主砲打者にZiPSをかけると、こんな出力が返ってきます(数値はあくまでイメージ)。

打率 .280 / 出塁率 .400 / 長打率 .580
HR 45 / BB 110 / K 175 / wRC+ 165 / WAR 6.5

注目すべきはwRC+やWARの数字です。打率や本塁打数だけでなく、リーグ・球場補正後の総合的な打撃力までセットで出てくるので、選手比較がとても楽になります。

長期予測の強み

ZiPSは「3年後・5年後どうなっているか」のロングタームの出力もあり、FA契約の妥当性議論などでよく引用されます。Mike Troutクラスの選手でも、エイジングカーブによって徐々にWARが下がっていく予測カーブが描かれます。コープス・フィールドでプレーする選手は球場補正で実力がやや差し引かれる、フェンウェイ・パークの左打者には補正がかかる、といった配慮もモデルに含まれます。

3. Steamer:翌シーズン予測の定番

どんなモデル?

SteamerはJared Cross、Dash Davidson、Peter Rosenbloomらが開発した、翌シーズンの成績予測に特化したモデルです。FanGraphsの「Depth Charts」ページで最も目立つ位置に表示されているのがSteamerで、シーズン前のファンタジー野球やトレード議論で世界中のファンに使われています。

Steamerの特徴

  • 直近3年の成績に「重み付き平均」をかける(直近年ほど重い)
  • 選手の年齢に応じた減退/成長補正
  • マイナー成績も入力に組み込む(つまり新人にも予測が出る)
  • 大量のサンプルから求めた「リーグ平均への回帰(regression to the mean)」

計算イメージ(手計算で追える例)

Steamerの内部処理はかなり複雑ですが、骨格は「重み付き平均 + リーグ平均への回帰 + 年齢補正」です。打率を例に、3年分の重み付き平均を計算してみましょう。

直近3年の打率: .310 / .280 / .270
重み: 5 : 4 : 3 (直近年ほど重い)

重み付き平均 = (.310×5 + .280×4 + .270×3) ÷ (5+4+3)
            = (1.55 + 1.12 + 0.81) ÷ 12
            = 3.48 ÷ 12
            ≒ .290

ここからさらに「リーグ平均.250に向けて少し引き戻す」処理(regression)と年齢補正を入れます。仮に200打席ぶんリーグ平均に回帰させ、本人サンプルが1500打席だったとしたら、

調整後 = (.290 × 1500 + .250 × 200) ÷ (1500 + 200)
       = (435 + 50) ÷ 1700
       ≒ .285

こうして「リーグ平均寄りに少し控えめ」な予測が出来上がります。これがSteamer予測が常に「ちょっと地味に見える」理由です。極端な好成績は確率的に再現が難しいので、モデルが冷静に引き戻してくれているわけですね。

Steamer予測モデルにおけるリーグ平均への回帰処理を示す図解で、本人成績1500打席の.290に200打席ぶんの.250を加重平均し、調整後打率.285へ控えめに引き戻す計算の流れをプロスペクト評価の文脈で表現

3モデルの違いを表で整理

項目KATOHZiPSSteamer
主な対象マイナー選手MLB選手中心MLB+マイナー
予測期間将来6年累積WAR翌年+長期(数年)翌シーズン
入力マイナー成績+年齢+守備過去3-4年+類似選手過去3年+リーグ平均
強み未MLBの選手も評価長期キャリア予測シーズン前の即戦力評価
開発者Chris MitchellDan SzymborskiJared Crossら

FanGraphsでの使い方

FanGraphsのProjectionsページで「Steamer」「ZiPS」「Depth Charts(両者の合成)」を選んで一覧表示できます。Depth Chartsは出場時間の補正も入った最も実用的な数字で、トレード議論やドラフト評価でよく使われます。

KATOHは現在公式運用は終了していますが、その遺産はFanGraphsのプロスペクト評価(Future Value)やSzymborski氏のZiPSプロスペクト出力に色濃く受け継がれています。データ系プロスペクト評価のパイオニアとして、概念を理解しておくと最近の各種モデル(THE BAT、Marcel、PECOTAなど)も同じ仲間として読めるようになります。

NPB選手への適用は?

残念ながらKATOH・ZiPS・Steamerは基本的にMLB・MiLBのデータを学習データにしており、NPBデータには標準では対応していません。ただしDelta Graphsや1.02 Essence of BaseballなどNPBデータ提供サイトも増えており、ZiPS的な考え方を日本人選手に応用する分析記事も少しずつ登場しています。たとえば、大谷翔平やイチローのMLB移籍時にもZiPSが翌シーズン予測を出していて話題になりました。日本のプロ野球でも、NPB→MLB移籍候補の見極めに将来こうしたモデルが普及するかもしれませんね。

限界と注意点

  • 怪我は予測しきれない:大怪我からの復帰や手術明けの選手は、過去成績ベースのモデルでは外れやすいです。
  • 飛躍はモデルが嫌う:いきなりブレイクする選手はモデルが過小評価しがちです。逆に言えば「予測を大きく超える=本物の変化が起きている」シグナルにもなります。
  • 守備指標の不確実性:特にWAR出力は守備評価(UZR・DRS等)に依存しており、ここは未だ揺れる領域です。
  • 球場・リーグ環境の前提:所属球団が変わると数字も大きく動きます。コープス・フィールドからフェンウェイ・パークへ移籍すれば、HR数や打率は普通に変化します。

FAQ:よくある質問

Q1. どれが一番当たるの?

用途次第です。翌シーズンの集計成績ならSteamer/ZiPSは過去研究で同程度の精度。長期予測やプロスペクト評価ならZiPS/KATOH系が向きます。実務的には「複数モデルの平均(Depth Chartsなど)を見る」のが鉄板です。

Q2. KATOHはなぜ「カトー」なの?

開発者Chris Mitchellが日本人選手Kazuo Matsui(松井稼頭央)の名前を気に入って付けた愛称、と本人が解説しています。日本人にとっては馴染み深い由来ですね。

Q3. ファンタジー野球で使うならどれ?

シーズン直前ならSteamer、シーズン途中の残り予測ならZiPS Rest-of-Season(ROS)が定番です。FanGraphsで両方確認するのがおすすめです。

Q4. 予測値とスカウト評価、どちらを信じれば?

どちらも欠かせません。マネーボールの時代から、データとスカウト評価は対立ではなく補完関係です。ハイブリッド評価(Future Value+KATOH)がFanGraphsの現在の標準です。

Q5. FIPなどの指標は予測モデルに使われている?

はい。投手予測ではFIP・K/9・BB/9などのDIPS系指標が重視されます。防御率より将来再現性が高いためです。

まとめ

KATOH・ZiPS・Steamerは、それぞれ「マイナー→将来WAR」「過去成績+類似選手→中長期」「直近成績→翌シーズン」と守備範囲が異なる予測モデルです。複数モデルを横並びで眺めると、その選手の「期待値の幅」が見えてきて、補強や移籍の議論が一気に立体的になります。

まずはFanGraphs・Baseball Reference・Baseball Savantの使い方を覚え、ProjectionsページでSteamerとZiPSを並べて見るところから始めてみてくださいね。

参考リンク

関連記事

この記事をシェアする𝕏B!FacebookLINEPocket