대한민국 공공 분야의 데이터 파편화, AI 발전 저해의 근본 원인

인공지능(AI) 기술의 발전은 방대한 데이터를 기반으로 잠재된 패턴을 찾아내는 과정에서 이루어진다. 그러나 대한민국 공공 분야의 데이터 관리 방식은 AI 발전에 필요한 핵심 요소를 심각하게 저해하고 있다는 지적이 제기된다. 핵심은 ‘어디에, 어떻게’ 데이터가 저장되고 공유되는가에 달려 있으며, 현재의 파편화된 데이터 관리 시스템은 AI가 제대로 학습하고 작동하는 데 치명적인 걸림돌이 되고 있다.

문제는 대한민국 정부의 데이터가 ‘D 드라이브’에 저장되는 관행에서 비롯된다. 이는 데이터의 수명과 직결되는 심각한 문제점을 안고 있다. D 드라이브에 저장된 데이터는 컴퓨터의 포맷과 함께 사라질 위험이 크며, 이 과정에서 수많은 맥락, 암묵지, 업무 처리 과정 등이 함께 소멸된다. 이는 미래에 활용될 AI가 학습해야 할 귀중한 정보의 손실로 이어지며, 결국 한국 공무원들이 장차 사용하게 될 AI의 성능 저하를 초래할 수밖에 없다.

더욱이, 보고서 작성 방식 역시 AI 학습에 비효율적이다. 높은 직책의 공무원일수록 1페이지 보고서를 선호하며, 자간, 장평을 조절하는 기술을 자랑하기도 한다. 문장은 모두 개조식, 즉 ‘음슴체’로 작성되는 경우가 많다. 이러한 형식은 간결함을 추구하지만, AI가 패턴을 인식하고 학습하는 데 필요한 충분한 맥락과 깊이 있는 정보를 제공하지 못한다. ‘음슴체’ 보고서는 엉성한 사고를 숨기기 쉬운 ‘판매 도구’에 불과하다는 분석도 있다.

이와 대조적으로, 세계 최고의 AI를 개발하는 실리콘밸리 기업들은 전혀 다른 방식으로 데이터를 관리하고 정보를 공유한다. 아마존의 경우, ‘6 페이저(6 Pager)’라는 회의 규칙을 통해 모든 구성원이 6페이지 분량의 완전한 문장으로 작성된 메모를 공유하고 회의에 임한다. 이 메모는 도입부, 목표, 원칙, 사업 현황, 교훈, 전략적 우선순위, 부록 등으로 구성되어 정보의 맥락과 깊이를 보장한다. 회의 참가자 전원이 이 메모를 읽는 데 30분을 할애하는 것은 단순한 정보 전달을 넘어, 사고의 깊이와 명확성을 확보하기 위한 과정이다.

또한, 실리콘밸리의 협업 시스템은 클라우드를 기반으로 하며, 위키 엔진을 활용한 게시판을 주로 사용한다. 대부분의 게시판은 공개를 원칙으로 하여, 모든 참가자가 논의 과정과 관련 자료를 확인할 수 있다. 이는 문서가 아닌 ‘맥락’을 공유하는 시스템으로, AI가 학습할 풍부한 데이터를 조직 내에 지속적으로 축적하게 한다. 이러한 체계적인 데이터 관리와 맥락 공유는 파편화된 정보만을 제공받는 조직과 비교했을 때 AI 지능 격차를 현격히 벌릴 수밖에 없다.

결론적으로, 대한민국 공공 분야의 AI 발전을 위해서는 근본적인 데이터 관리 시스템의 혁신이 시급하다. ‘D 드라이브’에 저장되는 파편화된 데이터, ‘음슴체’ 위주의 보고서 작성 관행을 탈피해야 한다. 대신, 클라우드를 기반으로 한 협업 시스템을 도입하고, 모든 논의 과정과 참고 자료를 포함하는 완전한 서술체 기반의 보고 문화를 정착시켜야 한다. 이러한 변화를 통해 AI가 효과적으로 학습하고 역량을 발휘할 수 있는 환경을 조성해야만, 대한민국 역시 훨씬 더 뛰어난 인공지능 기술을 활용할 수 있을 것이다. 이는 단순한 효율성 증대를 넘어, 국가 경쟁력 강화와 직결되는 중요한 과제이다.

이경섭

Administrator

Visit Website View All Posts

답글 남기기 응답 취소

Related Stories

일상 속 잠재된 안전 위험, ‘2025 대한민국 안전산업박람회’에서 답을 찾다

캄보디아 취업 사기·감금 사태, 국민 안전 위한 정부의 신속 대응 절실

2026년 예산안, 경기 부양 넘어 ‘성장 동력 전환’의 시험대

You may have missed