공지
(●'◡'●) 공지사항

E.

영구기록물 해석을 위한 통시적 사전과 시소러스 구축의 필요성

글쓴이: 젓가락

2025.02.25 | 조회 672 |
0
|
from.
happyjoon79

90년대 이전에 나온 무협소설들을 일반적으로 구무협이라고 부른다. 당시에는 환생, 전생, 먼치킨 스타일의 무협은 존재하지 않았다. 구무협에 등장하는 주인공은 대부분 강한 의지와 기연을 통해 어려움을 극복하고 성장하여 무림세계에 우뚝 서게 된다. 그리고 그런 기연 중에 하나가 무공비급이다. 대략 이렇게 이야기가 전개된다. 주인공이 악인들에게 쫓기다가 절벽에서 떨어졌는데 절벽 틈에 소나무에 걸려 구사일생으로 목숨을 구한다. 정신을 차린 주인공이 소나무 부근에 있는 동굴을 보고 거기에 들어간다. 속에서 300 절대고수였던 전대 기인이 남긴 무공비급을 발견한다. 마침 함께 남겨져 있던 벽곡단을 먹으며 수년간 무공비급을 익혀 주인공은 무림고수가 된다. 그리고 복수를 시작한다.

ChatGPT 가 지은이의 요청에 따라 그린 그림
ChatGPT 가 지은이의 요청에 따라 그린 그림

무협 이런 전개를 보며 신기하고 가슴 떨리던 기억이 있다. 그런데 지금 생각해보면, 정말 주인공이 300 작성된 무공비급을 읽고 뜻을 정확하게 해석하고 적용하는 것이 가능했을까 하는 의문이 든다. 언어의 형태와 의미는 시간의 흐름에 따라 변한다. 300 절대고수가 생각해서 글로 표현한 내용과, 주인공이 글자를 해석해서 받아들인 의미에 차이가 생기게 된다. 주인공이 그런 의미 차이를 좁히지 못하면 아마도 무공을 익히다가 주화입마에 걸려 생을 마무리하게 것이다.

다시 본업으로 돌아와서 영구기록물에 대해 생각해본다. 영구기록물은 그대로 영구적으로 보존되어서 지속적으로 이용가능해야 한다. 그래서 영구기록물은 장기보존 전략에 따라 관리된다. 전자적 영구기록물은 종이 영구기록물과 달리 특수한 장기보존 전략이 필요하다. 대표적으로는 에뮬레이션과 마이그레이션 전략을 사용한다. 하지만 이들 전략을 통해 관리된 기록정보는 원본이 가진 표현정보를 생산 당시 그대로 100% 완벽하게 재현할 없다. 이들 전략에서는, 기록정보를 읽어내거나 출력하는 과정에서 혹은 기록데이터 자체에서 작은 변화들이 만들어지기 때문이다. 이와 달리 기록정보를 장기적으로 완벽하게 재현할 있는 전략이 있다. 그것은 IT 아카이브 전략이다. 기록물 생산 당시 사용되었던 하드웨어와 소프트웨어를 원본매체와 모두 함께 보존한다. 전자기록을 생산하고 운용했던 시스템들과 그것을 가능하게 했던 컴퓨터, 입력, 출력장치 등을 원본이 담긴 원본매체와 함께 보존하는 것이다. , 전자기록물 원본매체가 이용가능한 환경 자체를 보존하는 방법이다. 노후화 부적합한 보존환경에 따른 물리적 손상이 발생하지 않는다면 전략을 통해 영구기록물을 생산 당시의 모습 그대로 이용할 있다. IT아카이브 전략을 실행하게 되면 IT 환경 변화에 따라 보존해야 하드웨어와 소프트웨어들이 점차 늘어나게 된다. 막대하게 불어나는 비용과 공간에 대한 부담을 감수하고서도  IT아카이브 전략을 고수한다면 가장 목적은 원본기록정보의 100% 완벽한 재현이라고 있을 것이다.

그런데 원본기록정보를 완벽하게 재현한다고 하더라도 원본기록정보의 의미를 완벽하게 전달할 있는지는 의문이다. 시간의 흐름에 따라 언어와 의미가 달라지기 때문이다. 극명한 예를 경전과 해석에서 찾아볼 있다. 사서삼경, 사서 하나인 <<대학>> 이렇게 시작한다. 大學之道 在明明德. 쉽게 풀이하면 배움의 길은 밝은 덕을 밝히는 있다는 뜻이다. 그런데 내가 뜻풀이가 원래 <<대학>> 가지고 있던 의미와 같을 수는 없다. 선현의 뜻이 경전에 있음을 믿고, 뜻을 따르는 것이 유학자의 덕목이었다. 유학자들은 경서를 올바르게 해석하기 위해 힘썼는데 다산 정약용 선생 또한 마찬가지였다. 고증학을 바탕으로 다양한 문헌들을 조사하여 <<대학>> 올바른 해석을 위해 <<대학공의>> 저술하였다. 일부가 아래와 같다.

大學之道 [ 大,音泰。 ]

大學者,國學也,居胄子以敎之。大學之道,敎胄子之道也。○議曰:舊音大,讀爲泰,今人如字讀,非也。大學之道一句,不惟此經有之。《學記》曰:“大學之道,近者悅服,遠者懷之。”又曰:“大學之敎,時敎必有正業。”又曰:“大學之法,禁於未發。”其字例、句例,與此經首句,毫髮不殊。彼讀曰泰學,此讀曰大學,其亦不公甚矣。朱子作序,雖以《大學》之書爲太學敎人之法,而其實古者太學敎人之法,敎以禮樂,敎以詩書,敎以弦誦,敎以舞蹈,敎以中和,敎以孝弟,見於《周禮》,見於《王制》,見於《祭義》,見於《文王世子》、《大戴禮ㆍ保傅》等篇。而所謂明心復性、格物窮理、致知主敬等題目,其在古經,絶無影響,竝其所謂誠意正心,亦無明文可以爲學校之條例者。…….

https://ygc.skku.edu/ygc/sub.do#key=B_fob_DHG_0010_0010_0010

 

정약용, 1814, 『대학공의 (大學公議)』  (『여유당전서(與猶堂全書)』 제2집 제1권)
정약용, 1814, 『대학공의 (大學公議)』  (『여유당전서(與猶堂全書)』 제2집 제1권)

https://jsg.aks.ac.kr/viewer/viewIMok?dataId=K4-6268%7C013#node?depth=2&upPath=001&dataId=001

대학이라는 것이 무엇인지, 대학의 어떻게 읽었는지, ‘大學之道라는 문구가 어떤 다른 문헌에서도 사용되었는지, 성리학의 대가라 불리는 주희는 어떻게 해석했는지 등을 이야기하고 있다. ‘大學之道라는 글자에 관해 A4 넘는 분량으로 해석하였다. <<대학>> <<대학공의>> 저술시기의 차이는 1,800 안팎으로 추정된다. 사이에 <<대학>> 내의 문구와 해석은 계속 변화해왔으며, 정약용 선생은 변화를 거슬러 오르며 <<대학>> 원래 의미를 <<대학공의>> 통해 찾으려 했다. 과정에서 현존하는 다른 문헌들을 통해서 <<대학>> 해석하는 공시적 방법, 과거 다른 연구자들이 해석한 내용들을 차용해서 <<대학>> 의미를 분석하는 통시적 방법을 사용하였다.

현대에 생산되는 기록정보 없는 단어 혹은 문구가 있다면 사전이나 인터넷 검색을 통해 의미를 알아낼 있다. 발달된 IT 수준 덕분에 정약용 선생의 시대보다는 쉽게 의미 해석이 기능해졌다. 그러나 아이러니하게 IT 발달에 따라 정보의 양은 기하급수적으로 늘어나고 있으며 기존 단어와 개념들이 예전보다 빠르게 변해가고 새로운 용어와 의미들이 만들어지고 있다. 만약 오늘 생산된 영구기록물 건을 100 후에 어떤 연구자가 읽어보려 한다면, IT 아카이브에서 제공하는 원도우가 설치된 2025년도 PC 영구기록물관리시스템에 접속하여 건의 기록을 2125년에 사용하려 한다면, 기록에 기재된 내용을 제대로 이해할 있을까. 200, 300 후의 연구자라면 힘들어지겠지. 그래서 정약용 선생이 했던 것처럼 시간을 넘어 원래 의미에 다가가기 위한 노력이 필요하다. 기록정보에 사용되는 단어와 문구의 의미를 시대의 변화에 따라 연결하여 당대의 이용자가 과거의 기록정보를 온전하게 이해할 있도록 돕는 도구가 필요하다. 이것은 사전과 현대의 사전을 연결시켜 만드는 통시적 사전이 수도 있고, 통시적 사전에서 단어와 의미의 다양한 관계를 연결시키는 시소러스가 수도 있겠다.  이러한 도구가 어디선가 만들어지고 있을지도 모르지만 내가 아직 접해보지 못했기 때문에 필요성에 대해서 생각해보게 되었다. 와중에 Chat GPT AI 발전을 보면서 이것이 과연 필요한 일인가 하는 생각도 든다.

Chat GPT ‘P’ Pre-trained 약자이다. 인터넷에 있는 천문학적인 분량의 텍스트 정보에서 언어 패턴과 구조를 이미 학습한 상태라는 뜻이다. 마지막 글자 ‘T’ Transformer 약자이다. 이것이 기계에게 문장 단어와 문맥을 이해하게 만든다. Chat GPT 인간과 자연어로 대화가 가능한 것은 Transformer 제대로 작동했기 때문이다. 만약 50, 100 지금보다 발전된 형식의 GPT 영구기록물관리시스템에서 돌린다면, 연구자가 가장 이해할 있는 방식으로 2025년도의 문건을 해석해주지는 않을까. 이런 생각에 조금 무기력해지기는 하지만, 그래도 지금 필요하다고 생각한다면, 그리고 있다면 그것들은 해봐야겠지.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

기록과 사회 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

다른 뉴스레터

옛 여친 편지의 보존기간

기억을 위한 보존인가 안전을 위한 폐기인가. 올해 초 어머니께서 집을 이사하셨다. 어머니 혼자 사시기에, 이번에는 좀 작은 아파트로 들어가셨다. 불필요한 물건 중 상태가 좋은 것들은 당근에서 판매하고, 예전 옷들은 아름다운

2025.09.18·E.·조회 1.14K·댓글 1

이렇게는, 정말 그만 하고 싶은 일

평가심의를 평가합니다 #1. 아키비스트라운지 두 명의 에디터가 매일 나누던 카톡, 그 속에는 기록전문가로서의 고민과 솔직한 속마음도 날 것으로 담겨 있었습니다. 그렇게 쌓인 대화 중 밖으로 꺼내 함께 나누고

2026.03.12·E.·조회 638

'공공'아카이브 개방, 책임과 부담 사이에서

한국정책방송원(KTV), 2025년 9월부터 공공아카이브 <나누리> 대국민 개방 소식에 부쳐. 한국정책방송원(KTV)은 지난해 9월 <KTV 공공아카이브(나누리)> (이하 KTV나누리)를 대국민 개방하여 정책영상과 시청각 국정기록을 국민과 공유하기 시작하였다. 그 결과 대통

2026.04.02·E.·조회 928

아카이브 × AI 실험실, Archive AI Study 1기 스터디원을 찾습니다

아이디어는 당신이, 구현은 AI와 함께. 안녕하세요, tolerance입니다. 새로운 혁신과 패러다임의 변화에 대해 주절주절 글을 쓰는 한편 실천은 어려웠었는데 스터디를 만들게 되어 반갑습니다. 평소 AI와 아카이브의 접

2025.09.30·E.·조회 814

아무에게도 알려지지 않은 한 기록인과의 추억을 회고하며

"당신은 무엇을 때문에, 무엇을 위해, 남모르는, 당신은 불도 피워보지 못할 초를 닦아놓고 있었습니까.". 이 글을 그 분이 떠나신 2023년에 개인적으로 쓰는 공간에만 써두고 있다가 이제서야 먼지를 털어내고 광장에 꺼내어본다. 기회가 되면 꺼내야지 하고 생각을 하던 찰나 필자는 오늘도

2026.01.20·E.·조회 626

기술의 능동적 사용 : AI 시대를 살아갈 기록연구사의 생존 기술

* 이 글은 ‘제17회 전국기록인대회’ 2일차(2025.11.1.) 1세션에서 진행된 「경계 위의 아키비스트: 들여다보지 않는 고민」, 「디지털 환경 속 적정 기록관리 수행기」(발

2025.11.18·E.·조회 1.07K
© 2026 기록과 사회

기록에 대한 모든 이야기

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보

서비스 이용 문의admin@team.maily.so 채팅으로 문의하기

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울특별시 송파구 위례광장로 199, 5층 501-8호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스