한국의 공공 부문이 데이터를 파편화하고 맥락 없이 제공하는 관행이 인공지능(AI) 발전의 심각한 장애물로 작용하고 있다는 지적이 제기된다. 이는 AI가 잠재된 패턴을 찾아내는 능력의 근간이 되는 ‘충분하고 맥락 있는 데이터’ 확보를 어렵게 만들어, AI의 지능 격차를 심화시킬 것이라는 분석이다.
문제는 정부 부처 내 데이터 관리 방식에서 비롯된다. ‘그 자료 어디 있어?’, ‘김 과장이 갖고 있습니다.’ 와 같은 대화에서 보듯, 정부의 데이터는 개인의 PC, 특히 D 드라이브에 파편화되어 저장되는 경우가 많다. 문제는 이러한 데이터가 개인의 퇴사나 PC 포맷과 함께 영구적으로 소실될 위험이 높다는 점이다. 이 과정에서 수많은 맥락, 암묵지, 그리고 의사결정 과정이 함께 사라지며, 미래에 사용될 인공지능이 학습할 데이터 기반 자체가 취약해지는 결과를 초래한다. 충분한 양의 데이터와 그 맥락 없이는 AI가 ‘과적합’의 함정에 빠져 부정확한 결론을 도출할 가능성이 높아진다.
보고서 작성 방식 역시 문제점으로 지적된다. 한국 공무원들은 높은 사람에게 올라갈수록 보고서가 짧아야 한다는 인식 하에 ‘1페이지 보고서’와 ‘개조식, 음슴체’ 문체를 선호한다. 이러한 방식은 자간, 장평 조절에 능숙함을 자랑하는 문화와 맞물려, 정보 전달의 효율성을 높이는 것처럼 보이지만, 실제로는 ‘엉성한 사고를 숨기기 쉽게’ 만들고 복잡한 내용을 제대로 분석하고 전달하는 데 한계를 드러낸다.
반면, 실리콘밸리의 아마존과 같은 선도 기업들은 ‘6 페이저(6 Pager)’라는 방식을 통해 문제 해결에 접근한다. 이는 모든 구성원이 6페이지 분량의 메모를 작성하고, 회의 초기 30분간 이 메모를 읽는 데 할애하며, 보고서는 완전한 서술체로 작성된다. 이러한 구조는 목표와 원칙을 명확히 제시하고, 사고의 깊이를 강제하며, 파워포인트와 같은 발표 도구의 한계를 극복하게 한다. 제프 베이조스 아마존 창업자는 “파워포인트의 불릿 포인트 뒤에는 많은 엉성한 사고를 숨길 수 있다”며, 서술 구조를 가진 완전한 문장이 더 나은 사고를 강제한다고 강조한 바 있다.
또한, 클라우드 기반의 협업 시스템과 공개 게시판 원칙은 실리콘밸리의 데이터 공유 문화를 혁신한다. 위키 엔진 기반의 게시판을 통해 모든 논의 과정과 자료가 공유되며, 이는 구성원들이 ‘맥락’을 공유하고 이해하는 데 지대한 영향을 미친다. 이러한 시스템은 문서 자체를 공유하는 것을 넘어, 정보의 흐름과 의미를 총체적으로 공유하게 함으로써 AI 학습에 매우 유리한 환경을 조성한다.
결론적으로, 한국 공공 부문의 파편화된 데이터 관리와 단편적인 보고서 작성 방식은 AI 발전의 근본적인 걸림돌이 된다. 1페이지 요약에 집착하는 것은 총소유비용(TCO) 관점에서 비효율적이며, 중요한 의사결정일수록 서술체 보고서를 통해 사고의 깊이를 명확히 하고 맥락을 공유해야 한다. 대한민국 공무원들이 더 뛰어난 인공지능을 활용하기 위해서는 데이터의 체계적인 관리와 맥락 기반의 정보 공유 문화 정착이 시급하다.