들어가며,
올해 8월 뉴스타파는 아동권리보장원의 백지 입양기록 사건을 보도하였고, 한동안 세간에 큰 화제였다. 아동권리보장원은 2013년부터 2022년까지 각 민간 입양기관에 산재한 입양기록물을 모아 전산화 작업을 진행해왔는데, 지금까지 스캔된 입양기록물 중에 백지(빈 페이지)가 다수 포함되어 있음이 올해 발견된 것이다. 그 외에도 뉴스타파에서는 스캔 오류, 가이드라인 미준수, 시스템 업로드 미비 등 다양한 문제점을 지적하였다.
아동권리보장원의 부실한 기록관리 실태가 드러난 것도 사실은 뉴스타파가 작년 말부터 보도한 “[해외입양과 돈] ①~⑩” 때문이다. 즉 해외입양에 관한 불편한 진실을 파헤치다가 우연히 드러난 것이다. 왜냐하면 전산화된 기록물들은 기록관 단계에서는 외부로 서비스되지 않기 때문에, 이런 특수한 경우가 아니고서는 밝혀지지 않는다. 아마도 이런 문제를 안고 있는 것이 아동권리보장원만은 아닐 것이다. 이참에 기록물 전산화, 소위 중요기록물 DB구축 사업의 문제점을 다뤄보고자 한다.
기록물 DB구축이란?
기록물 DB구축 사업은 2005년 당시 행정자치부가 시행하는 「행정정보 DB구축 사업」으로부터 비롯되었다. 33개 부문의 행정정보 DB구축 사업 중 ‘행정기관 기록물 DB구축 사업’이란 부문으로 시작되었으며, 이후 중앙부처를 중심으로 기록물관리전문요원이 배치되고, 특히 표준기록관리시스템이 보급되면서 더욱 활발하게 진행되었다.
기록물 DB구축은 비전자기록물을 디지털 스캔하고, 목록과 색인을 입력하여 기록관리시스템에 업로드하는 사업이다. 통상 물리적 정리상태가 열악하기 때문에 재편철하여 서가배치까지를 포함하는 경우가 많다.
이 사업의 의의는 비전자기록물을 디지털화함으로써, 디지털 환경에서 기록의 접근 및 열람, 활용을 가능케 한다는 것이다. 나아가 기록관리시스템에 등록됨으로써, 시스템을 통한 기록 보존·관리가 비로소 가능해진다. 지금껏 공공기록물관리 분야에서 가장 많이 발주된 사업이라는 점에서 그 중요성을 짐작할 수 있다.
기록물 DB구축 시 발생하는 오류와 문제
근 20년간 기록관리 업계에서 가장 많이 수행한 사업임에도 왜 백지 스캔과 같은 문제가 발생하는 것일까? 노하우가 쌓일 대로 쌓이고, 문제점은 다 보완하고도 남았을 시간인데 말이다. 지금부터는 기록물 DB구축 사업에서 어떤 오류와 문제들이 발생할 수 있는지 살펴본다.
○ 데이터 입력 오류
아무래도 사람이 직접 기록물을 보고 데이터를 입력하는 것이어서 오타와 띄어쓰기 같은 실수는 발생할 수밖에 없다. 사실 정말 치명적인 문제는 기록의 정리 상태가 엉망임에서 비롯된다. 실제로 DB구축 사업에 착수하여 기록을 마주하게 되면, 질서 속의 무질서를 맞딱드리게 된다. 겉으로는 문서보존상자, 철표지, 색인목록까지 잘 정리된 듯 보이지만, 막상 열어보면 온갖 혼란함이 가득하다.
이 외에도 정말 볼 때마다 상상치도 못한 경우들을 마주하게 된다. 작업자 분들에게 이런 복잡한 케이스들을 알아서 잘 판단해서 입력하라고 하긴 어렵다. 아마 발주기관의 기록물관리전문요원도 쉽지 않을 것이다. 시간만 넉넉하면 파악할 수도 있겠지만, DB구축 사업은 시간이 곧 돈이다. DB구축비 산정이 기록물의 면(面)당 계산되기 때문이다. 따라서 작업자 1인당 하루 할당량이 존재한다. 보통 동종대량 기록들을 만나 거기서 시간을 절약하고, 까다로운 것들을 남은 시간에 얼마나 빨리 처리하느냐가 관건이다. 그러다보니 애초에 정리가 잘 되어 있는 기록들에서는 문제가 덜하지만, 그렇지 않은 기록들은 데이터가 심하게 오류가 날 가능성이 있다.
이런 것도 숙련된 노하우가 있다면 헤쳐나갈 수 있다. 하지만 정말 큰 문제는 이러한 오류들을 검수과정에서 거르기 힘들다는 것에 있다. 검수 과정을 아무리 정교하게 거치더라도, 결국 발주기관의 담당자가 전체 대상을 검수할 수 없는 노릇이므로 보통 많이 봐야 10% 내외이다.
○ 기록물의 훼손
데이터 오류만 발생하는 것이 아니다. 기록의 훼손도 DB구축 과정에서 발생할 수 있다. 다음은 DB구축 과정에서 발생하는 물리적 훼손의 사례들이다.
기록물은 편철되어 있기에 스캔을 위해 해철 작업을 실시한다. 클립, 스테이플러, 끈, 테이프 정말 다양한 방식으로 편철이 되어 있고, 이들을 해철하는 과정에서 훼손이 빈번하게 발생한다. (보통 담당자들이 일일이 확인하기 어렵다.)
일반 평판스캐너를 활용해서 한 장씩 열고 닫고 스캔해서는 절대 사업기간을 맞출 수가 없다. 보통 고속스캐너를 사용하는데, 오래되어 약해진 종이나 살짝 구겨져 있는 종이들은 정말 무자비하게 구겨버리거나 찢어버릴 수 있다.
면표시도 훼손이 될 수 있다. 왜냐하면 면표시가 보통 한번에 완벽하게 끝나는 경우가 없다. 작업자 분들이 면표시를 하게 되는데, 나중에 검수할 때 보면 순서가 뒤틀려 있다. 애초에 순서가 뒤틀려 있는 경우가 생각보다 꽤 있기 때문이다. 알다시피 면표시는 건별로도 하지만 철 단위로도 한다. 중간에 한 건이라도 누락, 실수가 발생하면 그 뒤로는...
가끔 기록물 중에 면표시가 많게는 3~4번씩 덕지덕지 되어 있는 것들을 발견할 수 있는데, 아쉽게도 그렇게 했음에도 결국 틀리는 경우도 있다.
○ 맥락의 상실과 훼손
맥락의 상실은 처음부터 이루어진다. 서고에 잘 정리되어 있는 기록들을 대상으로 할 지라도 이들도 그 전에는 특정 부서의 캐비닛에 있었다는 것을 간과해선 안된다. 캐비닛에서 대상 기록물을 반출할 때 보통 기록물철들이 뒤섞이는 사고가 많이 발생한다. 잘 정리가 되어있지 않은 상태에서 특히 빈번하게 발생하는데, 제대로 철이 되어 있지 않아서 그 안에 기록물건이 쏟아진다거나, 아니면 신속하게 반출하려다 보니 캐비닛에 배치되어 있던 순서가 흐트러지거나 하는 일은 비일 비재하다.(※물론 애초에 캐비닛에 있을 때부터 무질서한 경우가 훨씬 많다.)
또 하나는 재편철 할 때 발생한다. 서고에 노란색 문서보존상자, 그 안에 황토색 문서보존용지에 파로클립으로 편철된 것을 보면, 해당 기록들이 DB구축한 기록들임을 알 수 있다. 더 없이 깔끔하게 정리된 것처럼 보이지만 이 과정에서도 날아가는 맥락들이 있다. 일단 황토색 보존용표지로 갈아끼우면서 기존에 철 표지와 내지에 기재된 정보가 날아간다. 간혹 발주기관의 요청에 따라 해철한 철표지를 같이 동봉하는 경우가 있는 경우도 있고, 색인 입력 시에 키워드란에 그 정보들을 입력하는 경우도 있기는 하지만 늘 그렇게 하진 않는다.
한편 시스템 업로드 과정에서도 맥락의 상실은 일어난다. 기록물 DB구축 사업을 진행할 때는 ‘DB구축 공정관리 프로그램’이라는 것을 활용한다. 이 프로그램을 활용하여 색인을 입력하고, 스캔한 이미지도 보정한다. 검수까지 마치고 나면 기록관리시스템에 업로드하기 위한 텍스트파일까지 생성해주는데, 문제는 기록관리시스템에 업로드할 때 발생한다. 기록관리시스템에는 DB구축 데이터를 업로드하는 기능이 없다. 그래서 공정관리프로그램에서 생성한 텍스트파일과 스캔파일을 기록관리시스템 DB와 스토리지에 직접 밀어넣는 방식이다. 문제는 그렇다보니 DB구축 이력이 제대로 남지 않는다. 이 기록물이 언제 DB구축되어 시스템에 등록되었는지, 실제 DB구축 가이드라인에 맞게 해상도나 DPI를 적용했는지 누가 담당했는지 등을 알 수가 없는 것이다. 기록관리 행위에 대한 기록이 없는 셈이다.
맺으며,
아동권리보장원의 백지 스캔 사태를 계기로 기록물 DB구축 사업에서 흔히 발생할 수 있는 오류나 문제점들을 정리해보았다. 물론 DB구축 공정 중에 발생하는 오류나 문제들도 많지만, 기록 생산 당시에, 그리고 기록관으로 이관하기 전까지 생산부서에서 보유하는 기간에 질서가 흐트러지는 것이 나중에 큰 위험요소가 될 수 있음을 간과해서는 안된다.
기록물 DB구축 사업을 한번이라도 진행해보면 원질서 존중의 원칙이 유명무실해지는 경우를 수없이 목도하게 된다. 게다가 DB구축 사업 특성 상 시간에 쫓기다 보면, 위에서 언급한 여러 오류들을 제대로 바로잡기 어렵다.
기록물 DB구축은 비전자기록물을 시스템으로 관리하기 위한 기초 작업이다. DB구축에서 문제가 발생하면, 그 뒤에 모든 보존·관리 및 활용에 문제를 일으킨다. 특히 데이터 오류로 인해 잘못된 정보를 제공하게 되면, 기록의 발견이 어려워지고 무엇보다 기록관리의 신뢰도가 떨어진다.
그러기 위해서는 목표 수량을 줄이더라도 사전에 정비하는 절차를 추가해서 애초에 정확하게, 시간에 쫓겨 대충 넘어가지 않게 하는 것이 필요할 것이다. 기록물 DB구축은 수량이 곧 성과로 평가받는데, 수량이 아니라 적은 오류율에 따른 검색 정확도를 추구해야 하지 않을까 싶다.
의견을 남겨주세요