사이드바 영역으로 건너뛰기

야구장에 가지 않는 야구광

  • 등록일
    2008/10/17 15:56
  • 수정일
    2010/09/13 12:38

 

지인 중 한명이 이 블로그를 발견하곤 놀라 묻는다.

"야구 좋아했었어? 야구장에 잘 안가잖아?"

급작스러움에 우물쭈물하는 사이 다음 질문이 날아든다.

"야, 그런데 왜 한국야구 이야기는 없냐. 도통 모르는 외국사람 이야기들 뿐이니 어렵잖아. ㅎㅎ"

 

지금에 와서야 사실 의미가 많이 퇴색했지만, 사실 이 블로그는 야구를 보는 또 하나의 시각을 비춰보기 위해 만들어졌다. 개인의 나태함과 게으름, 이러저러한 주변 상황으로 블로그가 초심을 잃고 방황하고 있긴 하지만, 어쨋든 시작은 그러했다.

지인의 지적처럼, 난 야구장에 잘 가지 않는다. 그리고 될 수 있으면 좋아하는 팀도 많들지 않으려고 노력한다. 왜냐하면, (늘 그렇진 않지만) 때론 직접 경기를 보는 것이 실제 경기의 흐름을 읽는데 되려 방해가 될 때도 있기 때문이다. 또 (마음처럼 잘 안되지만) 좋아하는 팀을 만들지 않으려고 노력하는 것도 같은 맥락인데, 게임을 보다 객관적으로 보고 싶기 때문이다.

 

그런데 야구장에 가지 않는 야구광이라니, 좀 이상하지 않은가. 그렇다면 경기 내용과 결과, 과정을 오직 '스포츠 찌라시'에 의존해 얻는단 말인가. 물론 그렇진 않다. 아래 그림을 보자.

 

 

이 그림은 지난 10월16일(한국 시간으로 오늘) 열린 보스톤 레드삭스와 탬파베이 레이스 간의 ALCS 5차전 경기의 흐름을 그래프로 나타낸 것이다. 'win Probability Graph'라는 이름의 이 그래프는 Fan Graphs(http://www.fangraphs.com)이란 사이트에서 제공하고 있는데,  경기 진행에 따른 승리가능성 추이를 한 눈에 볼 수 있도록 하고 있다.

 

이날 경기에서 보스톤은 7회초까지 7점차로 힘없이 끌려가다가, 7회말과 8회말 각각 4점과 3점을 뽑으며 동점을 만든데 이어, 9회말 짜릿한 끝내기 안타로 1점을 더 쓸어담으며 8-7 승리를 거뒀다.

그래프를 읽는 법은 의외로 간단하다. 두 팀은 모두 50%의 동일한 승률을 가지고 경기를 시작한다. 그래프 가장 왼편의 숫자 '50%'에서 초록색 선이 시작하는 이유다. 경기가 진행됨에 따라 때론 레이스의 승리가능성이 높아지며(그래프 아래쪽으로 초록선이 내려가며), 때론 보스톤의 승리가능성이 높아진다(그래프 위쪽으로 초록선이 올라간다).

 

그래프의 꺾임은 무작위로 그려진 것이 아니라, 각각의 계기에 따른 것이다. 예컨데 3회초 레이스의 카를로스 페냐가 보스톤 투수 마쓰자카로부터 2점 홈런을 뽑아내며 그래프는 급격히 아래로 쏠린다. 이어 7회초 역시 레이스의 업튼이 보스톤 투수 파펠본으로부터 2타점 2루타를 쳐내며 0-7을 만들자 그래프는 사실상 바닥에 붙었다. 이 때 레이스의 승리가능성은 무려 99.3%였다.

 

하지만 7회와 8회 잇따라 득점에 성공한 보스톤이 동점에 다다를 때까지 그래프는 수직상승하고 있으며, 마침내 9회말 드류의 끝내기 안타가 작렬하며 그래프는 오른쪽 최상단 100%에 이르렀다. 경기가 보스톤의 승리로 끝난 것이다.

 

그렇다면 이 'Win Probability Graph'는 어떤 근거로 만들어질까. 이 사이트는 해당 경기의 매 상황을 빠짐없이 기록해 공개하고 있는데, 이른바 'Play Log'라는 이름의 표가 그것이다. 아래 그림이 바로 Play Log 표의 일부다.

 

 

이 표는 매회 투수와 타자간의 대결 결과를 표시하고, 이에 따른 팀의 승리가능성(WE)과 함께, 이 승리가능성에 어떤 선수가 어떤 기여를 했는지(WPA)까지를 수치화해 보여주고 있다. 예컨데 1회초 50%로 시작한 보스톤의 승률은 레이스의 선두타자 이와무라가 안타로 출루하자 46.5%로 낮아졌고, 이어서 터진 업튼의 홈런으로 31.7%까지 낮아진다. 이 상황에서 이와무라의 안타는 .035 포인트(3.5%)의 승률상승가치를 가졌으며, 업튼의 홈런은 .148 포인트(14.8%)의 승률상승가치를 보인 것이다.

 

위 표에서 WE(Win Expectancy)는 '승리가능성'을 뜻하며, RE(Run Expectancy)는 '득점가능성'을 나타낸다. LI(Leverage Index)는 득점과 아웃, 진루, 이닝 등의 조건에 따라 해당 상황이 얼마나 중요한지를 측정한 지표다. 또 WPA(Win Probability Added)는 특정 선수가 특정 상황에서 팀승률상승에 얼마만큼의 기여를 했는지를 타나낸 것이며, BRAA(Batting Runs Above Average)는 마찬가지로 특정 선수의 특정 상황에서의 득점기여도를 수치화한 것이다.

 

이처럼 매 상황에 따른 승률변화 및 선수의 기여도를 경기종료 시점까지 빠짐없이 기록한 표와 함께 봐야 하는 것은 바로 메이저리그 홈페이지(http://www.mlb.com)에서 제공하고 있는 'Game Day Data'다. Game Day Data는 투수가 타자를 상대로 던진 모든 공에 대한 구질과 초속-종속 변화, 투구의 움직임, 투구지점(같은 투수라도 투구폼과 투구지점 - 즉 릴리스 포인트가 구종과 체력에 따라 조금씩 달라진다. 이런걸 한국과 일본에서는 '쿠세'라고 한다던가...) 및 포구지점 등 경기의 모든 정보를 담은 PFX 데이터가 엑셀파일 형태로 제공된다. 이 데이터가 담긴 엑셀파일을 잘 활용하면, 특정 투수나 타자의 강점과 약점, 어떤 상황에서 어떻게 대처하는 것이 승리를 위해 보탬이 되는지 등을 파악할 수 있다.

 

[그림] mlb.com의 Game Day가 제공하는 PFX 데이터.  제 USB가 날라가서, 다른 이의 홈페이지에 올려져 있는 것을 샘플로 가져왔음.

 

자, 이제 지인의 다음 질문에 답할 차례다. 왜 한국 야구 이야기는 없는가.

어떤 이들은 '한국야구는 수준이 낮아서 못보겠다'고 하는데, 나는 이 말에 반대한다. 재미없는 야구는 없다. 객관적인 수준 차이가 나도 때론 승리할 수 있는게 또 야구다. 심지어 연예인 야구대회나 리틀야구 경기마저 흥미있다고 생각하는게 필자다.

그래서 나도 한국야구 이야기를 하고 싶다. 하지만 한국 프로야구는 내가 즐길 수 있는 방식의 서비스를 제공하지 않고 있다. 앞서 다른 포스트에서도 여러 차례 밝힌 것처럼, KBO가 제공하는 데이터는 가히 재앙수준이다. KBO가 생각하는 '야구팬'이란 야구장을 찾거나 TV로 경기를 보는 사람들일 뿐이다. 나처럼 경기데이터를 이리 만져보고 저리 만져보고 싶어하는 사람들은 제외하고 있는 것이 분명하다.

 

[사진] 세이버매트릭스(SaberMetrix)의 대부로 불리는 빌 제임스. 세이버매트릭스란 미국야구연구협회(SABR)에서 따온 단어로, 야구를 보다 객관적인 통계로 분석하는 작업을 말한다. 실제로 통계학자인 제임스는 매년 11월 메이저리그 선수들의 그해 성적을 통계학적으로 분석한 'Bill James' Hand Book'을 발간하고 있다. 지금은 널리 쓰이는 OPS(출루율+장타율) 개념 역시 그의 작품 중 하나다.

 

야구는 통계의 경기다. 다른 어떤 스포츠보다도 통계화하기 가장 좋은 경기일 뿐만 아니라, 그렇게 만들어진 통계가 경기에 영향을 미치고 있는 것도 사실이다. 불과 10년 전만 해도 아무도 거들떠 보지 않았던 '출루율' '장타율' 같은 수치가 태어나 빛을 보기 시작한 것은 '세이버 매트리션'이라고 불리는 야구통계가들 덕분이다.  현대 야구에서 이같은 수치가 매우 중요한 타격측정 요소로 자리잡은 점을 볼 때, 이런 작업이 아주 가치없는 것은 아니지 않을까.

 

진보블로그 공감 버튼트위터로 리트윗하기페이스북에 공유하기딜리셔스에 북마크

찾아보기

최근 글 목록

  1. '야구의 여신'과 루트케 소송
    약간느리게
    2011
  2. 야구 데이터의 진화(1)
    약간느리게
    2010
  3. 우리시대의 마구, 이퓨스(1)
    약간느리게
    2010
  4. 보직사임(2)
    약간느리게
    2010
  5. 백악관과 도둑맞은 퍼펙트게임(6)
    약간느리게
    2010

최근 트랙백 목록

  1. @nottora2님의 트윗
    @nottora2
    2010
  2. QS/W
    2008