기록의 신뢰성(Reliability)에 관한 여러가지 생각

젓가락 님이 보내주신 글입니다.

문득 상상의 나래를 펴다가 우주가 무한하거나, 유한하거나, 팽창한다거나, 수축한다면, 그 우주 속에 존재하는 정보의 양 또한 그렇지 않을까 하는 생각을 하게 되었다. 그래서 찾아보았다. 관측 가능한 우주에 존재하는 정보의 양을 연구한 결과가 있었다. 약6 × 1080 비트라고 한다. (https://pubs.aip.org/aip/adv/article/11/10/105317/661214/Estimation-of-the-information-contained-in-the)

생각은 본업으로 돌아와서, 기록이 담은 정보, 특히 기록의 내용정보 (content information)의 양에 대해서 생각하게 되었다. 일반적으로 구조정보와 맥락정보는 그 양이 제한적이다. 그에 비해 내용정보는 양적으로 유동적이며 ISO 15489에 따르면 그 내용을 신뢰할 수 있어야 한다.

5.2.2.2 신뢰성
신뢰성 있는 기록은,
a) 기록이 입증하고자 하는 처리행위, 활동 또는 사실의 완전하고 정확한 표현물로서 해당 기록의 내용을 신뢰할 수 있고
b) 이후의 처리행위 또는 활동 과정에서 의존할 수 있는 것이다.
기록은 사실에 대한 직접적인 지식을 가진 개인에 의해서 또는 처리행위를 위해 일상적으로 활용하는 시스템에 의해서, 관련된 사건이 일어난 시점이나 또는 바로 뒤에 생산되어야 할 것이다.
https://www.standard.go.kr/streamdocs/view/sd;streamdocsId=72622275541171951

이 표준 ISO 15489에서 아래와 같은 명제들을 도출해봤다. 표준의 내용은 사실명제지만 몇몇을 가치명제로 바꿔서 분석해보았다. (영문판도 참고했음)

① 신뢰성은 주로 내용정보에 관한 것이다.

② 처리행위, 활동 또는 사실을 완전하고 정확한 내용(contents)으로 기록해서 생산하거나 생산되어야 한다.

③ 내용의 완전성과 정확도에 따라서 그 내용이 믿을 만해야 한다.

④ 기록은 관련된 처리행위 또는 활동 맥락 속에 살아있어야 한다. (위 5.2.2.2 중 b)에서 도출된 명제)

⑤ 기록은 그와 관련된 업무활동과 동시 혹은 직후에 생산되어야 한다

⑥ 기록은 관련 업무사실에 관한 직접적 지식이 있는 사람 혹은 사람들이 생산하여야 한다

⑦ 기록은 관련된 업무처리를 일상적으로 하는 시스템에 의해서 생산되어야 한다.

이 명제들을 바탕으로 100% 신뢰성을 가진 기록을 생산하는 방법을 생각해보았다.

첫번째 방법은 명제 ⑦에서 완벽한 시스템을 통한 생산이다. 이 시스템은 전능한 시스템으로서 약6 × 1080 비트의 한도 내에서 정보량에 대한 제한 없이 기록을 생산할 수 있다. 시간과 공간의 축을 물리적 최소단위로 쪼개서 각 시간과 공간에서 벌어지는 업무행위와 관련된 모든 정보들을 기록에 담을 수 있다. 처리행위, 활동, 사실에 관련된 모든 사람의 생각과 행동까지 정보화되어 기록되며, 전자적, 비전자적 도구들에 의한 정보처리까지 모두 기록된다면 이것을 가장 완전하고 정확한 표현물로 볼 수 있다. 즉 명제 ②에서 내용의 완전성 및 정확도가 100%인 객관적 신뢰성을 가진 기록이 된다.

두번째 방법은 명제 ⑥의 업무담당자가 완전한 신뢰를 받고 있음을 가정한 상태에서 이야기할 수 있다. 기록내용이 믿을 만한지 (명제 ③), 기록 생산 시점이 업무활동 후 얼마나 직후인지 (명제 ⑤), 업무담당자가 직접적 지식이 있는지 (명제 ⑥) 등에 대한 판단은 주관적이다. 업무담당자가 받는 완전한 신뢰는 그 사람이 하는 모든 업무에 대한 신뢰를 뜻한다. 모든 업무는 신뢰성 있는 기록물의 생산 업무도 포함한다. 논리적으로 설명하면 100% 신뢰받는 업무담당자는 100% 신뢰성 있는 기록을 생산한다. 사실 이 추론에서는 주관성과 객관성 구별과, 영문판에서 보이는 신뢰 (trust와 reliability)라는 표현의 차이를 깊게 따지고 들어가면 복잡하게 된다. 하지만 글의 특성상 간단하게 예를 들어 설명할 수 있다. 검은 콩이 머리를 검게 하는데 도움이 된다는 내용을 내가 배우자에게 전했을 때, 배우자는 말도 안 되는 소리로 치부한다. 그런 배우자가 TV 프로그램 천기누설에서 검은 콩이 검은 머리에 도움에 된다는 것을 보고 그 내용을 신뢰하여 검은콩 식품을 구매하게 되는 경우가 있다. 바로 사람에 대한 신뢰가 내용에 대한 신뢰와 동일하게 적용되는 예이다.

완벽한 기록생산시스템을 만드는 위의 첫번째 방법은 현재의 과학기술로는 불가능하다. 두번째 방법과 같이 모든 업무에서 완전한 신뢰를 받는 경우는 현실에서 거의 존재하지 않는다. 앞에서 사실명제를 가치명제를 바꾼 이유는 기록관리전문가들에게는 신뢰성 있는 기록을 만들어야 하는 의무가 있기 때문이다. 비록 객관적으로 혹은 주관적으로 완벽한 신뢰성을 확보할 수는 없을지라도 기관의 규정과 정보 거버넌스의 범위 안에서 신뢰성의 수준을 유지하도록 해야 한다. 그 수준은 명제 ②에서 말하는 완전성과 정확도에 대한 기준을 세우는 것에서 시작한다. 그 기준이 없다면 내용이 얼마나 완전한지 정확한지 알 수 없기 때문이다. 이를 위해 기록의 구조와 맥락에 대해 다시 한번 살펴보았다. 처음으로 돌아가서 보면, 명제 ① 신뢰성은 주로 내용정보에 관한 것이다. 다만 기록내용을 담을 틀이 필요하다. 0 비트에서 약6 × 1080 비트 사이의 넓은 범위에서 무슨 내용이 어떻게 기록 안으로 들어가야 하는지 알려주는 구조가 필요하다. 예를 들어 일기라는 기록에 일시, 날씨, 숙제 라는 구조를 넣으면 일기 안에 ‘2024년 12월 25일’, ‘눈’, ‘눈사람 만들기’ 라는 내용이 들어갈 수 있다. 신뢰성은 내용정보에 관한 것이지만 구조정보의 확립을 통해서 내용이 한정되고 명확해질 수 있다. 같은 맥락에서, 업무 기록의 구조는 명제 ⑥의 기록 생산자들이 주축으로 만들어낼 수 있다. 기록의 구조를 만드는 과정에서 합리적 논의가 이루어지고 적합한 절차에 따라 그 구조가 확정된다면, 그 구조를 사용하여 생산된 기록에는 내용정보와는 별개로 구조정보 자체에 절차적 신뢰성이 부여될 수 있다. 그 구조는 명제 ⑦의 시스템에 탑재될 수 있다. 비록 시스템이 모든 업무내용을 완벽하게 기록하지는 못하지만 합의로 확정된 구조라는 틀 안에서는 기록의 내용이 온전한지 정확한지 가늠할 수 있다. 구조는 정보의 범위를 제한함으로써 오히려 정보의 온전성과 정확성을 드러내게 한다.

반면 맥락정보는 내용정보에 다른 정보를 더함으로써 내용정보의 온전성과 정확성을 제고한다. ISO 15489는 5.2.2.2의 b)에서 ‘신뢰성 있는 기록은 이후의 처리행위 또는 활동과정에서 의존할 수 있어야 한다.’ 고 말한다. 이를 위해서 업무기록은 그것이 담고 있는 내용과 관련이 있는 기타 업무활동과의 확실하게 연계되어 있어야 한다. 이 연계는 맥락정보에서 나타난다. 각종 메타데이터, 업무가 속한 정책 및 기능에서의 분류, 다양한 기록의 배경정보들이 기록 속 내용정보의 온전성과 정확성을 높여주게 된다. 이는 특히 수작업을 통한 종이문서가 아니라 자동화된 기록생산시스템에서 두드러진다. 앞서 일기 쓰기의 예를 다시 보면 이해하기 쉽다. 전자적 시스템을 통한 일기쓰기에서 날짜는 자동으로 생성되어 기입된다. 기록생산위치가 한국 서울이고 특정날짜가 주어지면 날씨 또한 자동으로 채워질 수 있다. 숙제는 작년 혹은 재작년 같은 시기의 숙제에서 목록을 가져와서 내용을 선택할 수 있다. 이렇게 쓰여진 일기는 믿을 수 있는 정보가 되어 방학 숙제인 탐구생활에도 필요한 내용을 공유하여 시간낭비를 줄이게 된다. 또한 이미 작성된 일기는 내년 이맘때에 쓰게 될 일기에 좋은 정보가 되는 선순환이 이루어진다.

정보기술이 발달함에 따라 업무기록생산에서 업무담당자의 자유도가 점점 줄어드는 걸 느낀다. 이미 짜인 틀 안에서 시스템에 의해 강제되는 내용창과 프로세스에 따라 업무내용들을 입력하고 있는 스스로를 발견한다. 어찌 보면 이메일을 작성할 때 가장 자유롭다. 내가 능동적으로 자유롭게 할 수 있는 부분들이 많이 없음에 무력감도 커질 때가 있다. 하지만 이렇게 강제되는 구조가 기록의 신뢰성을 높이기 위한 효율적인 방법임을 안다. 기록물관리전문가 혹은 업무담당자로서 우리가 자유도 높게 할 수 있는 일은 기록물 생산시스템의 개발 단계 혹은 업그레이드 단계에 있다. 적합한 기록 구조를 디자인하고 어떤 정보들을 수집할지 논의하고 확정하는 과정은 이후 생산되는 기록의 신뢰성을 결정한다고 봐도 무방할 정도이다. 그런데 이런 상황이 인공지능의 등장으로 조금씩 변해가고 있다. 인공지능이 기존 기록들을 학습하여 새로운 기록의 내용을 제안한다. 시스템이 업무담당자에게 내용 입력을 강제하는 것에서 발전하여, 인공지능이 이미 내용을 작성해놓고 담당자는 확인만 하면 되는 프로세스로 바뀌어 가고 있다. 가장 높은 수준의 자유도를 가진 이메일 또한 인공지능이 초안을 작성해준다. 많은 시간을 소요하며, 실수와 오류가 많은 회의록 작성과 검토 또한 인공지능의 도움으로 확인만 하면 끝난다. 인공지능이 제안하고 업무담당자가 확인해서 시스템에 등록한 기록은 명제 ⑥ 또는 명제 ⑦에 속한다고 보기 힘들다. 인공지능 출현 이전에는 구조정보와 맥락정보를 활용하여 기록정보를 정형화하기 위해 노력했다. 정형화는 효율적으로 기록의 신뢰성을 높여왔다. 정형화된 기록정보는 시스템을 통한 기록생산 자동화로 이어져서 지금에 이르렀다. 반면 인공지능은 방대한 정보를 접하고 배우며 사용자의 요구를 분석하여 그에 필요한 제안을 한다. 그 제안은 정형화된 정보만이 아니라 비정형의 정보, 구조화되지 않은 정보로부터 나온다. 인공지능은 방대한 정보접근 및 해석 능력을 가지고 있다. 때문에 구조적 틀을 만들어 정보를 제한하고, 특정 정보와 정보를 일정하게 연결시켜 맥락을 만드는 방식으로 기록의 신뢰성을 높이려 하지 않을 가능성이 높다. 어쩌면 인공지능은 앞서 언급한 100% 신뢰성을 가진 기록을 생산하는 가장 완벽하고 전능한 시스템을 향해 첫걸음을 뗀 것일수도 있다. 기록의 신뢰성에 관한 논의는 인공지능으로 인해 새로운 국면으로 들어서리라 예상한다.

우리는 반복되는 업무와 변화하지 않을 것 같은 매일매일에서 무력함을 느낀다. 그러면서 우리는 지금 종이기록물을 편철하고, 전자시스템에 현용기록물을 등록하고, 영구전자기록물을 이관하기도 하고, 인공지능의 도움으로 기록을 생산하고 있다. 역설적이게도, 우리는 생각보다 넓은 기록관리 스펙트럼 속 역동적인 변화의 현장에서 일하고 있는 것 같다고 독백하며 눈을 좀 크게 떠본다.

이 글에 대한 더 많은 이야기는 오픈 채팅 기록에 대한 모든 이야기에서

B.

기록의 신뢰성(Reliability)에 관한 여러가지 생각

기록과 사회 님에게 커피와 쪽지 보내기

다가올 뉴스레터가 궁금하신가요?

이번 뉴스레터 어떠셨나요?

기록과 사회 님에게 커피와 쪽지 보내기

이전 뉴스레터

다음 뉴스레터

다른 뉴스레터

메일리 도우미