컨텐츠 바로가기

(스압) '이상서의 스윙맨-한화 투수진은 혹사 당하지 않았다'에 대한 의문

http://shucream.egloos.com/3130887




언제나처럼 야구기사란을 돌아다니다가 이런 기사를 보았다.

[안지만] 8경기 10 2/3이닝 164구의 혹사도 >>> [권혁] 9경기 11/23이닝 188구의 혹사도 

라는 것이 쉽게 납득가지 않았다. 어쩌면 궈넥의 이닝수대비 투구수가 적었을지도 몰라 라고생각해서 찾아본 투구수였지만 권혁의 투구수도 훨씬 높았다는 점에서 의혹은 증폭. 

"당신이 한화팬이든, 안티팬이든 그 스탠스는 잠시 내려 놓자. 감정이 아니라 숫자로 접근해 보고자 한다. 최소한 ‘느낌상 많이 나온 것 같아서’ 단정짓진 말자는 뜻이다." - 이상서 기자

라는 말에는 백번 천번 공감하고, 기록의 스포츠인 야구에서 인상보다는 데이터로써 접근하자는 접근 자체는 맘에들었기때문에
기자의 말대로 듣도 보도 못한 Closer Fatigue라는 스탯의 정체를 포함해 해당 기사에서 다룬 일련의 데이터를 직접 찾아 계산해보고 접근하기로했다.

그 결과가 바로 이 포스트다. 


1/ Closer Fatigue란 무엇인가

우선, 나는 한 번도 듣지 못한 CF라는 스탯에 대한 이해가 필요하다고 느꼈다. 구글을 굴렸다. 모든 것은 구글링에서부터 시작되는 것. 하지만 시작부터 막혔다. 메이저 리그 세이버메트릭스의 양대 산맥이라고 불리우는 Fangraphs, Baseball Reference 양쪽에서 Closer Fatigue에 대한 정보를 전혀 찾을 수 없었던 것이다. 그 뿐이 아니었다, 기타 야구사이트나 일반적인 세이버메트릭스 이야기가 오가는 사이트들을 모두 훝어봐도 CF에 관한 것을 전혀 찾을 수가 없었다. 당혹스러운 레벨이었다. 일단 비중이 좆도 없는 스탯이라는 결론은 내릴 수 있었다. 합리화일지도 모르겠지만 모르는 것이 쪽팔린 그런 스탯은 아니었다. 이후 기사에서 빌 제임스가 만들어낸 스탯이라 적힌 점에 착안하여 찾은 것이 예전에 대충 흘겨보고 지나갔던 'Bill James' Gold Mine 2008'. 그 안에서, Closer Fatigue, 아니, Closer Workload Fatigue Score(이하, CWFS)를 찾아낼 수 있었다. 우선 짚고 가지만 Closer Fatigue는 CWFS라는 지표를 설명하는 페이지의 챕터명이었다. 지표의 명칭은 CWFS이다. 

그럼 다음 의문은 당연하게도 CWFS와, 직역하면 마무리 피로도 인 Closer Fatigue는 무엇인가일 것이다. 이에대해 저자인 빌 제임스는 자신의 Gold Mine 2008의 Closer Fatigue 목차에서 다음과 같이 언급하고 있다.

"만약 리베라가 피곤했다면 양키스가 이길 가능성은 떨어지겠지. 반대로 파펠본이 피곤했다면 레드삭스가 이길 가능성은 낮을거라고 생각하겠지. 하지만 정말로 그럴까? 마무리 투수의 피로도가 팀의 성공에 영향을 미칠지도 모르지만 단지 기분탓이었으며 사실이 아닐 가능성도 충분히 있다. 하지만 어떤 마무리투수가 피곤한지 어떠한지를 어떻게 파악해야 좋을까. 사람이 피로해지는데에는 수없이 많은 이유가 있지 않은가?" 

라며 본인이 표본으로 삼은 NYY 마무리 투수 마리아노 리베라의 취미인 카리부 사냥을 예시로 들기도 했다. 그의 말처럼 어느 선수가 피로해지는데에는 수많은 요인이 있을 수 있기때문에 빌 제임스는 그런 외적 요인을 완전히 무시하기로 결정하고, 실제 경기 중의 요소만으로 피로도를 산출하기로하는 데, 이를 위해 만들어진 지표가 CWFS였다. 

CWFS의 공식은 이상서 기자가 적은 대로이다. 지난 5일간 '상대한 타자수'에 배율을 매겨 산출하게 되며 공식은 다음과 같다.

5일 전 상대한 타자수*1 + 4일 전 상대한 타자수*2 + 3일 전 상대한 타자수*3 + 2일 전 상대한 타자수*4 + 1일 전 상대한 타자수*5

그 외의 조건은 반영되지 않는다.


2/ 직접 계산해본 CWFS 

[1] 해당 기사의 주제가 한화 불펜투수에 관련된 혹사 논란이었기때문에 해당 기사에서 한화내 CF Top3이라고 적혀있던 권혁 박정진 유창식과 전체 투수중 CF Top 5에 더해 겆빠로써 인상깊었던 윤규진과 송은범을 끼얹어보았다. 
[2] 표에 적힌 CF는 CWFS로. 1번의 설명충을 생략하고 바로 넘어올 독자들을 위하여 편의상 기사에 적힌대로 Closer Fatigue로 명시했다.
[3] 각각의 CF는 해당 일 아침의 기준이다. 해당 일 당일에 투구한 내용은 CF에서는 다음날부터 반영된다.
[4] CWFS수치가 볼드처리된 날은 이번 시즌 중 가장 CWFS가 높았던 날이다. 
[5] 모든 자료의 기준은 4월 15일이다. 마지막 등판 다음 날까지만의 CWFS를 적었으며, 공식상 이후로는 계속 내려간다는 점을 유의.

※4월 5,9일의 기록은 선발기록.
※4월 3일은 선발

아래쪽으로 올 수록 나중에 계산한 것이라 일부 데이터에 오류가 있을 수 있으나, 안지만, 권혁의 경우 몇번을 체크한 완제품이다.
놀랍게도 선발과 불펜을 오간 유창식의 121을 제하고 가장 높은 일일 CF를 보여준 권혁의 88조차도 이상서 기자가 '혹사지수'라고 언급하며 공개한 수치의 반에도 미치지 못하였다. 기자는 본인의 기사 중에 공식을 적어두고도 그를 무시한 자료를 내놓은 것이다. 실로 이해할 수가 없는 일이다.

그래도 어떻게든 비슷한 수치를 뽑아보고자 하던 중 이런 생각을 했다. 본 CWFS라는 지표가 단순히 상대한 타자수만 체크하며(다시말해 투구수 등을 등한시하며), 기자가 집에서 잘 자던 다르빗슈까지 등판시켜가며 포커스를 뒀듯이 '5일이라는 기간'에 구애받는다면 5일간의 누적 CWFS라면 기자가 뽑아낸 수치와 비슷한 수치가 나오지 않을까 생각했다.


예상은 반정도 적중했다. 본 수치, CWFS-5day는 필자가 어떻게든 기사에 쓰인 데이터와 유사한 값을 뽑아내려 만든 지표로. 실제로 존재하는지 확인되지도 않았으며 관심도 없는 수치인 점을 감안해주셨으면 한다. 다만 그래프에서 보이듯 4월 8일 시점에 피크를 찍은 안지만의 CWFS-5day는 216으로 기사에 나온 안지만의 혹사지수 213에 제일 근접한 값을 보였다. 반면 같은 4월 8일 권혁의 CWFS는 161으로 기사에 쓰인 193과는 무려 32나 되는 차이를 보였다. 

도저히 기자가 어떠한 데이터를 사용한 것인지 알 수가 없었으며  데이터로부터의 접근을 표방한 이가 이러한 모습을 보였다는 것은 실제로 혹사니 뭐니를 떠나서 무척이나 실망스러웠다. 어쩌면 필자가 미처 눈치채지 못한 다른 공인된 지표를 사용한 것일 수도 있으나 그랬을 경우에는 따로 고지를 하고 CF와는 별도의 지표임을 밝혀야했으며 그 공식 또한 공개하여 데이터의 투명성을 유지했어야하지 않았을까.

별도로 시험해본 CWFS-7day는 너무 큰 수치가 나오는 것을 확인했으며 기자가 사용한 지표가 이것일 가능성은 없다고 생각한다.


3/ 일단 기자가 원한대로 CWFS로 '혹사논쟁'에 접근하게 될 경우의 사실관계 정리

우선 기자가 의도한대로 CWFS를 가지고 이야기해보자.

선발과 불펜을 오간 한화 송은범과 한화 유창식의 데이터를 제껴봤을때 리스팅 된 선수 중 2015리그 내에서 가장 높은 CWFS값을 보인 것은 4월 11일 아침의 한화 권혁이다(88). 리스팅 된 선수중 권혁 다음으로 순간적인 '혹사'를 당한것은 4월 9일의 엔씨 최금강(78)이다. 3위는 4월 4일 아침의 엘지 정찬헌과 3월 30일의 한화 윤규진이다(61). 반면 권혁 이상의 혹사를 당했다고 기자가 언급한 삼성 안지만의 최고 CWFS는 4월 12일의 55로 권혁의 88에 크게 미치지 못하며, 권혁은 안지만의 최고 CWFS인 55를 세 번이나 넘었다.(4월 9일-61, 4월 11일-88, 4월 12일-63)

누적 CWFS로 접근하게될 경우 4월 6일~4월 10일까지 안지만은 권혁보다 '혹사' 당하며 최강의 혹사킹 자리를 차지하나하지만 실은 리그에서 가장 빡세게 굴려진 것은 정찬헌이며, 4월 7일에 박용택이, 4월 10일 시점에 최금강이 잠시 왕좌를 썪씨딩한다. 그리고 최금강의 일일천하는 4월 10일로 끝나고 50구 투사 이후 궈넥의 CWFS-5day는 최고로 가파르게 치솟아 현재는 궈넥의 시대가 도래한 상태이다.

놀랍게도 기자가 권혁을 뛰어넘는 혹사라고 주장한 안지만은 단 한 번도 '혹사계의 왕좌'를 차지하지 못했다.

이걸 이상서 기자가 본인의 기사 내에서 내린 결론과 비교해보자. 

"리그에서 혹사지수가 가장 높은 선수는 삼성의 안지만이다. 213이 나왔다. 유일한 200대를 찍은 불펜 투수였다. 2위는 191을 기록한 한화의 권혁이다. 10위권 안에 한화 투수는 권혁과 박정진 뿐이다. 뚜렷한 선발진이 없는 한화로서는 불펜 풀가동이 불가피했다. 그러나 타구단과 비교해 유달리 혹사를 시켰다고 보긴 힘들다. 10위권내의 혹사지수 평균은 160.2. 이것에 상회하는 한화 투수는 권혁 뿐이었다. 의외의 인물도 있다. NC의 최금강은 지난 달 28일 두산과의 개막전에 등판 이후 하루 이틀 간격으로 꾸준히 나왔다. 이번 달 들어서는 이틀 이상 쉰 적이 없다. 역시 리그 톱인 8경기에 등판했고, 혹사지수는 리그 3위인 188을 기록했다. 안지만의 삼성이나 최금강의 NC, 또는 혹사지수 10위권 내에 두 명이나 선수를 올린 LG는 왜 혹사 논란이 생기지 않았던 걸까?" -기사中

안지만의 이야기를 제외하고는 거의 유사하다. 우연의 일치일까? 필자가 급조한 CWFS-5day와 비슷한 무언가를 사용한 듯이 비슷한 결론을 냈다. 앞서 말했듯이 설령 CWFS를 기반으로 한 다른 지표일지라도 CF를 사용한다, 라고 소개해두고 공식까지 적어둔 기자가 정작 결론이라며 제시한 데이터가 CF가 아닌 다른 지표를 기반으로 한 것이라면 그것은 지탄받아 마땅하며, 또한 필자가 산출한 데이터와 유일하게 상궤를 달리하는 안지만의 데이터의 공정성에 대해 의문이 생긴다.

안지만에 대한 데이터를 제하면 기자와 데이터 사용에 불투명한 부분이 있지만 결론은 비슷했다. 그럼 어차피 기자가 말하고자 하려던 바는 사실이라는 것으로 좋지 않을까? 라고 생각할 지 모르겠지만. 이 모든 것은 3/의 제목대로 CWFS라는 지표와 '혹사'와의 연관관계를 인정할때에만 성립하는 것으로. 

사상누각에 지나지 않는다.


4/ 정말로 CWFS에는 '혹사'의 지표라고 불릴 자격이 있는가

이 지표를 만든 빌 제임스는 이 지표로써 접근해보고자 했던 Closer Fatigue, 마무리의 피로도를 논하기에 앞서 이제는 은퇴한 양키스의 전 마무리 마리아노 리베라의 1997-2007, 10년간의 데이터를 사용하였다. 앞서 파펠본도 이야기했고 본 포스트에서 언급하진 않았지만 프랜시스코 로드리게스의 이름도 해당 페이지에서 언급된 바가 있다. 그런데 왜, 하필이면 리베라였나. 단순히 그가 리베라의 팬이었기 때문일까?

당연하게도 아니다. 빌 제임스는 안그래도 다양한 요소가 개입되기 쉬운 '마무리 투수의 피로도'만을 변인으로 삼기 위해 무던히 노력했다고 밝혔다. 표본으로 삼을 데이터를 정할때에도 그것은 마찬가지였는데, 그가 '하필' 리베라를 선택한 이유는

1. 매년 잘했음
2. 양키스가 매년 성적도 좋았음.
3. 리베라는 거의 보직이 바뀐 적 없는 투수
4. 딱히 부상이라고 할 것도 없었다.

였다.

그렇게 외부 변인이 개입될 가능성이 낮은 리베라의 데이터가 마련되고 나서야 그가 꺼내든 것이 CWFS였다. CWFS는 정말로 단순한 지표다. 1구를 던져서 초구에 땅볼아웃시키건, 용큐놀이로 10구넘게 커트당하고 잡건 간에 같은 한 타자로 취급되는 것이 CWFS란 말이다. 3구던져 1이닝을 끝낸 투수가 30개를 던져 한 타자를 겨우 잡아낸 투수보다 '피로도'가 높다 라고 평가되는 것이다.  NP가 세이버메트릭스에서 최근 핫한 지표들에 사용되진 않지만 NP를 빼먹는 사이트는 없다. 심지어 므르브 공홈에서도 사용되는 지표였고 그리 된 것이 한두해의 일도 아니다. 그런 투구수를 빌 제임스가 과연 소홀히하고 정말로 타자 수 만이 중요하다고 생각해서 저런 허술한 지표를 만들었다고 생각할 수 있을까? 내겐 무리다. 

애초에 저 CF의 진정한 의미는 "최근 연투한 마무리 투수가 특정 일에 얼마나 괜찮은 퍼포먼스를 보여줄 것인가"의 연관성을 연구해보기 위한 실험적 접근으로 마무리 투수가 아닌 일반 불펜투수에 CWFS만 뜬금 꺼내쓸 수 있는가도 의문이다. 필자의 생각으로는 저것은 리베라 클래스를 위한 지표일 뿐이다. 빌 제임스는 애초에 이 지표를 흔해빠진 불펜투수에 쓰라고 만들지도 않았으며(이름부터가 클로저 패티그인 이유가 그것) 지나가는 마무리투수에 쓰라고 만든 것도 아니다. 수 년 후에 반도의 어느 기자가 뜬금없이 '혹사' 논쟁에 쓰라고 만든 지표는 더더욱 아닐 것이다. 리베라이기에 이야기할 수 있는 지표. 기자는 정말 저런 말도안되게 허술한 지표를, 정말로 '혹사'에 대해 진중히 접근하면서 개크보의 투수들을 분석하는데에 정말로 쓸 수 있다고 생각해서 그런 기사를 당당히 쓴 걸까? 

설마 싶지만 정말 이상서 기자가 그리 생각했다면 그는 빨리 자신의 기사의 결론을 수정하지 않으면 안될 것이다.

왜냐하면,

빌 제임스는 CWFS라는 지표를 만들때에 10년간의 마리아노 리베라 데이터를 사용했는데, 마리아노 리베라가 10년의 커리어 중 찍은 CWFS의 피크는 위에 보이는 89로, 저 수치를 찍은 것은 10년 중 단 두 번에 지나지 않는다고 한다. 

권혁이 한화로 옮긴지 불과 1년도 채 되지 않았다. 리그는 시작한지 한 달도 채 되지 않았다. 벌써 88을 찍었다. 팬들이 '혹사'를 우려하는 이유는 선수의 부상에 대한 염려가 대부분일 것이다. 자, 권혁은 과연 리베라보다 튼튼충이 될 수 있을까? 가 되기 때문이다.


모든 것은 이상서 기자가 적은대로 시간이 말해줄 것이다.


여담이지만 네이버 댓글들 진짜 개노답이다. 앰창 씨발 어떻게하면 
5일 전 상대한 타자수*1 + 4일 전 상대한 타자수*2 + 3일 전 상대한 타자수*3 + 2일 전 상대한 타자수*4 + 1일 전 상대한 타자수*5
이게 어떻게하면 200이 나오는가 베댓중 의심하는놈이 하나가 없어요 5일간 불꽃의 연투해서 10타자씩 잡아도 150인데 그냥 지들 유리한 기사 나오면 마냥 좋은거지. 보고 씨발 이게 말이되나 생각하는 정신박힌 새끼가 없나 

노까통! 노까통! 빼애애애애애애애애액!!!!


덧글|덧글 쓰기|신고