통계학자도, 데이터 과학자도 아닌 사람이 통계청장을 맡는 나라

생각
Published

May 17, 2025

통계는 결과가 아니라 선택의 산물이다.

지난 10여 년 동안 “데이터 기반 사회”라는 구호는 대중매체와 정책문서에서 반복되며 마치 상식처럼 자리 잡았다. 그러나 정작 통계를 전문적으로 다루지 않는 다수에게 통계는 여전히 객관적 진실의 숫자로 받아들여진다. 측정 방법과 표본 설계, 모형 설정이라는 전제조건이 빠진채로 말이다. 이 글은 바로 그 지점을 질문한다.

데이터는 누가 해석하고, 그 해석은 어떤 선택 위에 서 있는가?


통계를 둘러싼 대중적 오해를 간단히 정리해 보자.

  1. 숫자는 사실이다? 숫자는 사실이 아니라 측정이다.
  2. 표본은 전체를 대변한다? 샘플링 편향은 늘 존재한다.
  3. 모형은 중립적이다? 모형은 연구자의 가정을 반영한다.

이 세 가지는 통계를 “객관적 무오류의 지표”로 소비하게 만드는 위험한 환상을 드러낸다. 그리고 이 환상을 깨뜨릴 책임이 대한민국 통계청에 있다.

통계청의 미션과 “데이터의 구조”가 만나는 지점

통계청의 사명은 (1) 국가 국가통계 발전을 선도하며, (2) 신뢰할 수 있는 통계를 생산하여 (3) 국민에게 유용한 통계데이터 서비스를 제공하는 것이다1. 이 사명을 현실화하려면 최소한 세 단계의 ‘구조적’ 의사결정이 필요하다.

  • 측정 구조: 무엇을 지표로 삼을 것인가?
  • 수집 구조: 어떻게 데이터를 모을 것인가?
  • 해석 구조: 어떤 모형과 가정 아래 의미를 부여할 것인가?

통계청장은 이 세 구조가 일관된 설계로 이어지도록 조정·감독하는 최종 책임자다. 다시 말해, 행정능력만으로는 부족하며 모형의 한계를 인식하고 설계할 수 있는 전문성이 필수다.

왜 “경제학 중심”이 되었을까?

한국의 통계행정은 전통적으로 기획재정부 - 옛 경제기획원 - 와 가까웠다. 1970-80년대 산업화 과정에서 국민계정, 물가지수, 실업률처럼 거시경제 지표가 정책 결정의 핵심 도구였기 때문이다. 자연스럽게 경제학적 시각, 특히 계량경제학에 기반한 관점이 통계 조직을 지배했고 경제학 전공의 고위관료 또는 유관기관 경험자가 청장을 맡는 관성이 굳어졌다2.

이 구조는 장점도 있다. 거시지표의 정책적 활용과 정부 재정운용 경험이 풍부하기 때문이다. 그러나 데이터 환경이 대전환을 맞은 2020년대에는 몇 가지 한계가 분명해진다.

변화 경제학 중심 체계의 한계
대용량·비정형 자료 (행정데이터·모바일·IOT) 확률표본·전통적 회귀 모형에 익숙한 인력으로는 처리·모형화·품질관리 역부족
개인정보 보호·차등 프라이버시 법·제도와 알고리즘을 함께 이해해야 하는데 기술적 감수성이 부족
실시간 지표 및 예측 전산·클라우드·기계학습 인프라 설계 겅험이 필요하나 조직 내 전문성 편중

숫자는 선택의 산물

나는 데이터를 구조로 보는 연구자이다. 리만 기하학 기반의 데이터 과학의 언저리에서 연구를 이어나가며 얻은 확신 중 하나는, 숫자는 언제나 특정한 모델, 특정한 공간 위에서 생성된 그림자라는 점이다. 이 점에서 전설적인 통계학자 George Box는 다음과 같은 말을 남겼다3:

“모든 모델은 틀리다. 하지만 어떤 모델은 유용하다.”

이 명언은 불확실성이라는 피할 수 없는 운명 앞에서 우리가 필연적으로 갖추게 되는 겸손을 나타낸다고 생각하지는 않는다. 그것은 모든 수치가 하나의 가정된 구조 위에서만 의미를 갖는다는 제한적인 인식의 발로가 아니었을까.

통계를 바라보는 관점은 다양하다. 경제학자는 인센티브와 시장구조, 거시지표 등을 통해 정책의 효과를 설명하거나 예측하는 모델에 집중한다. 통계학자는 추론의 전제의 정당성을 평가하고 불확실성을 계량하고자 한다. 요즘 각광받는(다고 알려진) 데이터 과학자는 대규모 데이터에서 패턴을 추출하고 계산 가능성과 확장성에 주목한다.

동일한 실업률이라도, 경제학자는 경기순환을 모델링하고, 통계학자는 최적 추정량을 고민하며, 데이터 과학자는 고해상도의 지역 및 시간별 패턴을 추출한다. 즉, 숫자를 생산하는 과정도, 숫자를 해석하는 언어도 서로 다르다. 그렇기에 이러한 세 관점이 동시에 작동해야만 지표가 맥락을 획득한다.

해외는 어떻게 리더십을 설계할까?

  • 영국: 영국통계청(ONS)은 통계청장(UK Statistics Authority Chair)과 수석국장이 분리되어 있으며, 후자는 주로 통계학·사회통계학 출신이다. 독립성 확보를 위해 국회의 청문과 승인을 거친다.
  • 미국: 미국 인구조사국(US Census Bureau)의 국장은 조사통계·사회학·경제학 등 연구 경력이 핵심 자격으로 명시된다. 연방정부 내에는 데이터 과학 책임자(Chief Data Scientist)가 별도 직위로 존재한다4.
  • 독일: 독일 연방통계청은 통계학·IT 배경의 연구원들이 핵심 보직에 진출하며, 학계와 공동 연구를 제도화한다.

공통점은 다양한 학제적 배경을 가진 전문가들을 리더십 체계에 투입하여 구조설계-품질관리-해석까지 하나의 유기적인 흐름으로 관리한다는 점이다.

“잡종적 사고”가 필요한 이유

21세기의 “통계” 시스템은 전통적인 표본조사 + 회귀분석 만으로는 설명되지 않는 문제를 안고 있다5.

  1. 데이터 융합: 행정데이터·민간데이터·센서데이터를 결합할 때 발생하는 불일치, 결측, 그리고 중복을 어떻게 해결할 것인가.
  2. 알고리즘 편향: 기계학습 및 인공지능 기반 추정치가 특정 집단에 불리하게 작동할 위험은 어떻게 줄여야 할까.
  3. 실시간·고빈도 분석: 분초 단위의 관측치는 전통적 가정에서의 표본이라기 보다는 전체 모집단에 가까우느라 통계적 가정이 달라진다.

몇 해 전, 서울대의 한 통계학 교수는 데이터 과학을 두고 “잡종(hybrid)”이라고 표현한 적이 있다. 나는 이 말이 폄하도, 찬양도 아니라고 생각한다. 기존 학문 분과의 경계를 넘나드는 데이터 과학의 융합적 성격을 정확히 진단한 것이다. 데이터 과학자는 (이상적으로는) 수학과 통계, 컴퓨팅을 묶어서 사고하며 위의 문제를 통합적으로 다룰 수 있는 ‘잡종적’ 역량을 갖춘다 (역시나 이상적으로 말이다). 여기서 잡종성은 단순히 스킬셋의 나열이 아닌, 서로 다른 방법론의 충돌을 조정하고 불확실성을 정량화하며 사회적 맥락으로 번역하는 능력을 일컫는다.

행정 고위직 및 경제학 전공자들은 정책의 맥락을 이해하고 거시지표를 해석하는데 탁월한 강점을 지닌다. 그러나 대규모 행정데이터의 품질관리, 차등 프라이버시를 활용한 보호기법의 설계, GPU 기반 기계학습 파이프라인 구축과 같이 통계청이 직면한 기술·윤리·계산 문제에는 경험이 부족하다.

통계청 개편 논의와 리더십의 방향

최근 정부국회에서는 통계청을 통계데이터처로 확대·개편하는 방안을 검토해온 것으로 안다. 명칭 변경을 넘어 (1) 데이터 수집 및 품질관리 기능, (2) 분석 및 해석 기능, 그리고 (3) 정책연계 기능을 구분하여 전문성을 강화하겠다는 구상이다. 이런 구조개편이 실효를 거두려면 리더십 또한 데이터의 생애주기 전 과정 - 정의·측정·수집·해석 - 을 설계할 수 있는 전문가여야 하며 이는 경제학과 통계학, 컴퓨터 공학의 경계를 넘나드는 데이터 과학 리더십이 필요함을 의미한다.

마지막으로, 통계 혁신은 국민의 일상과 직결된다는 사실을 강조하고 싶다. 서울시의 경우 2010년대부터 이미 (이미는 흘러가버린 키워드인) 빅데이터를 이용하여 시민의 삶에 실질적인 영향을 미칠 수 있는 다양한 혁신 사례들을 만들어내는데 성공했다6. 그렇기에 새로운 리더십은 데이터를 생산하고 관리하는데 그치지 않고, 데이터가 설명 책임을 다하고 그 가치를 실현할 수 있도록 소통해야 한다. 통계가 정책의 언어를 넘어 사회적 합의의 기반이 되려면, 숫자 뒤에 숨은 가정과 한계를 투명하게 드러내고 다양한 해석이 공존할 수 있는 토론의 장을 마련해야 한다. 그래야지만 사회적 가치를 창출하기 위한 기회들을 만들어낼 수 있다.

Footnotes

  1. 통계청 홈페이지 참고↩︎

  2. 이명박 정부 이래로 총 10명의 통계청장이 임명되었다. 행정고시 이후 유학을 통해 경영학 석사를 받은 사람은 2명, 경제학 박사를 받은 사람은 3명이다. 나머지 5명은 모두 학계에서 경제학 박사를 받으신 분들로서 그들의 전공 분야는 계량 경제학(1), 마르크스 경제학(1), 노동 경제학(2), 그리고 재정학(1)이다.↩︎

  3. 통계학을 공부하며 이 말을 들어보지 못한 사람은 아마도 없을 것이다. 수업에서나 논문의 리비전에서도 정말 끝도 없이 나오는 걸 보면 아마도 맞는 말이 아닐까 싶다.↩︎

  4. 이 글을 쓰는 시점에서는 그보다 더 나아가 정부효율부(Department of Government Efficiency; DOGE)를 통한 대대적인 개혁에 나서고 있는 형편이다.↩︎

  5. 계량경제학의 영원한 친구 시계열 분석을 제대로 가르치는 통계학 학위 과정은 미국에서 많이 사라진 것으로 알고 있다. 물론, 나처럼 야매로 공부해서 가르치는 경우는 많지만.↩︎

  6. 2015년 서울시 자료를 살펴보자.↩︎