공지
(●'◡'●) 공지사항

E.

영구기록물 해석을 위한 통시적 사전과 시소러스 구축의 필요성

글쓴이: 젓가락

2025.02.25 | 조회 487 |
0
|
from.
happyjoon79
기록과 사회의 프로필 이미지

기록과 사회

기록에 대한 모든 이야기

90년대 이전에 나온 무협소설들을 일반적으로 구무협이라고 부른다. 당시에는 환생, 전생, 먼치킨 스타일의 무협은 존재하지 않았다. 구무협에 등장하는 주인공은 대부분 강한 의지와 기연을 통해 어려움을 극복하고 성장하여 무림세계에 우뚝 서게 된다. 그리고 그런 기연 중에 하나가 무공비급이다. 대략 이렇게 이야기가 전개된다. 주인공이 악인들에게 쫓기다가 절벽에서 떨어졌는데 절벽 틈에 소나무에 걸려 구사일생으로 목숨을 구한다. 정신을 차린 주인공이 소나무 부근에 있는 동굴을 보고 거기에 들어간다. 속에서 300 절대고수였던 전대 기인이 남긴 무공비급을 발견한다. 마침 함께 남겨져 있던 벽곡단을 먹으며 수년간 무공비급을 익혀 주인공은 무림고수가 된다. 그리고 복수를 시작한다.

ChatGPT 가 지은이의 요청에 따라 그린 그림
ChatGPT 가 지은이의 요청에 따라 그린 그림

무협 이런 전개를 보며 신기하고 가슴 떨리던 기억이 있다. 그런데 지금 생각해보면, 정말 주인공이 300 작성된 무공비급을 읽고 뜻을 정확하게 해석하고 적용하는 것이 가능했을까 하는 의문이 든다. 언어의 형태와 의미는 시간의 흐름에 따라 변한다. 300 절대고수가 생각해서 글로 표현한 내용과, 주인공이 글자를 해석해서 받아들인 의미에 차이가 생기게 된다. 주인공이 그런 의미 차이를 좁히지 못하면 아마도 무공을 익히다가 주화입마에 걸려 생을 마무리하게 것이다.

다시 본업으로 돌아와서 영구기록물에 대해 생각해본다. 영구기록물은 그대로 영구적으로 보존되어서 지속적으로 이용가능해야 한다. 그래서 영구기록물은 장기보존 전략에 따라 관리된다. 전자적 영구기록물은 종이 영구기록물과 달리 특수한 장기보존 전략이 필요하다. 대표적으로는 에뮬레이션과 마이그레이션 전략을 사용한다. 하지만 이들 전략을 통해 관리된 기록정보는 원본이 가진 표현정보를 생산 당시 그대로 100% 완벽하게 재현할 없다. 이들 전략에서는, 기록정보를 읽어내거나 출력하는 과정에서 혹은 기록데이터 자체에서 작은 변화들이 만들어지기 때문이다. 이와 달리 기록정보를 장기적으로 완벽하게 재현할 있는 전략이 있다. 그것은 IT 아카이브 전략이다. 기록물 생산 당시 사용되었던 하드웨어와 소프트웨어를 원본매체와 모두 함께 보존한다. 전자기록을 생산하고 운용했던 시스템들과 그것을 가능하게 했던 컴퓨터, 입력, 출력장치 등을 원본이 담긴 원본매체와 함께 보존하는 것이다. , 전자기록물 원본매체가 이용가능한 환경 자체를 보존하는 방법이다. 노후화 부적합한 보존환경에 따른 물리적 손상이 발생하지 않는다면 전략을 통해 영구기록물을 생산 당시의 모습 그대로 이용할 있다. IT아카이브 전략을 실행하게 되면 IT 환경 변화에 따라 보존해야 하드웨어와 소프트웨어들이 점차 늘어나게 된다. 막대하게 불어나는 비용과 공간에 대한 부담을 감수하고서도  IT아카이브 전략을 고수한다면 가장 목적은 원본기록정보의 100% 완벽한 재현이라고 있을 것이다.

그런데 원본기록정보를 완벽하게 재현한다고 하더라도 원본기록정보의 의미를 완벽하게 전달할 있는지는 의문이다. 시간의 흐름에 따라 언어와 의미가 달라지기 때문이다. 극명한 예를 경전과 해석에서 찾아볼 있다. 사서삼경, 사서 하나인 <<대학>> 이렇게 시작한다. 大學之道 在明明德. 쉽게 풀이하면 배움의 길은 밝은 덕을 밝히는 있다는 뜻이다. 그런데 내가 뜻풀이가 원래 <<대학>> 가지고 있던 의미와 같을 수는 없다. 선현의 뜻이 경전에 있음을 믿고, 뜻을 따르는 것이 유학자의 덕목이었다. 유학자들은 경서를 올바르게 해석하기 위해 힘썼는데 다산 정약용 선생 또한 마찬가지였다. 고증학을 바탕으로 다양한 문헌들을 조사하여 <<대학>> 올바른 해석을 위해 <<대학공의>> 저술하였다. 일부가 아래와 같다.

大學之道 [ 大,音泰。 ]

大學者,國學也,居胄子以敎之。大學之道,敎胄子之道也。○議曰:舊音大,讀爲泰,今人如字讀,非也。大學之道一句,不惟此經有之。《學記》曰:“大學之道,近者悅服,遠者懷之。”又曰:“大學之敎,時敎必有正業。”又曰:“大學之法,禁於未發。”其字例、句例,與此經首句,毫髮不殊。彼讀曰泰學,此讀曰大學,其亦不公甚矣。朱子作序,雖以《大學》之書爲太學敎人之法,而其實古者太學敎人之法,敎以禮樂,敎以詩書,敎以弦誦,敎以舞蹈,敎以中和,敎以孝弟,見於《周禮》,見於《王制》,見於《祭義》,見於《文王世子》、《大戴禮ㆍ保傅》等篇。而所謂明心復性、格物窮理、致知主敬等題目,其在古經,絶無影響,竝其所謂誠意正心,亦無明文可以爲學校之條例者。…….

https://ygc.skku.edu/ygc/sub.do#key=B_fob_DHG_0010_0010_0010

 

정약용, 1814, 『대학공의 (大學公議)』  (『여유당전서(與猶堂全書)』 제2집 제1권)
정약용, 1814, 『대학공의 (大學公議)』  (『여유당전서(與猶堂全書)』 제2집 제1권)

https://jsg.aks.ac.kr/viewer/viewIMok?dataId=K4-6268%7C013#node?depth=2&upPath=001&dataId=001

대학이라는 것이 무엇인지, 대학의 어떻게 읽었는지, ‘大學之道라는 문구가 어떤 다른 문헌에서도 사용되었는지, 성리학의 대가라 불리는 주희는 어떻게 해석했는지 등을 이야기하고 있다. ‘大學之道라는 글자에 관해 A4 넘는 분량으로 해석하였다. <<대학>> <<대학공의>> 저술시기의 차이는 1,800 안팎으로 추정된다. 사이에 <<대학>> 내의 문구와 해석은 계속 변화해왔으며, 정약용 선생은 변화를 거슬러 오르며 <<대학>> 원래 의미를 <<대학공의>> 통해 찾으려 했다. 과정에서 현존하는 다른 문헌들을 통해서 <<대학>> 해석하는 공시적 방법, 과거 다른 연구자들이 해석한 내용들을 차용해서 <<대학>> 의미를 분석하는 통시적 방법을 사용하였다.

현대에 생산되는 기록정보 없는 단어 혹은 문구가 있다면 사전이나 인터넷 검색을 통해 의미를 알아낼 있다. 발달된 IT 수준 덕분에 정약용 선생의 시대보다는 쉽게 의미 해석이 기능해졌다. 그러나 아이러니하게 IT 발달에 따라 정보의 양은 기하급수적으로 늘어나고 있으며 기존 단어와 개념들이 예전보다 빠르게 변해가고 새로운 용어와 의미들이 만들어지고 있다. 만약 오늘 생산된 영구기록물 건을 100 후에 어떤 연구자가 읽어보려 한다면, IT 아카이브에서 제공하는 원도우가 설치된 2025년도 PC 영구기록물관리시스템에 접속하여 건의 기록을 2125년에 사용하려 한다면, 기록에 기재된 내용을 제대로 이해할 있을까. 200, 300 후의 연구자라면 힘들어지겠지. 그래서 정약용 선생이 했던 것처럼 시간을 넘어 원래 의미에 다가가기 위한 노력이 필요하다. 기록정보에 사용되는 단어와 문구의 의미를 시대의 변화에 따라 연결하여 당대의 이용자가 과거의 기록정보를 온전하게 이해할 있도록 돕는 도구가 필요하다. 이것은 사전과 현대의 사전을 연결시켜 만드는 통시적 사전이 수도 있고, 통시적 사전에서 단어와 의미의 다양한 관계를 연결시키는 시소러스가 수도 있겠다.  이러한 도구가 어디선가 만들어지고 있을지도 모르지만 내가 아직 접해보지 못했기 때문에 필요성에 대해서 생각해보게 되었다. 와중에 Chat GPT AI 발전을 보면서 이것이 과연 필요한 일인가 하는 생각도 든다.

Chat GPT ‘P’ Pre-trained 약자이다. 인터넷에 있는 천문학적인 분량의 텍스트 정보에서 언어 패턴과 구조를 이미 학습한 상태라는 뜻이다. 마지막 글자 ‘T’ Transformer 약자이다. 이것이 기계에게 문장 단어와 문맥을 이해하게 만든다. Chat GPT 인간과 자연어로 대화가 가능한 것은 Transformer 제대로 작동했기 때문이다. 만약 50, 100 지금보다 발전된 형식의 GPT 영구기록물관리시스템에서 돌린다면, 연구자가 가장 이해할 있는 방식으로 2025년도의 문건을 해석해주지는 않을까. 이런 생각에 조금 무기력해지기는 하지만, 그래도 지금 필요하다고 생각한다면, 그리고 있다면 그것들은 해봐야겠지.

 

다가올 뉴스레터가 궁금하신가요?

지금 구독해서 새로운 레터를 받아보세요

✉️

이번 뉴스레터 어떠셨나요?

기록과 사회 님에게 ☕️ 커피와 ✉️ 쪽지를 보내보세요!

댓글

의견을 남겨주세요

확인
의견이 있으신가요? 제일 먼저 댓글을 달아보세요 !

다른 뉴스레터

© 2025 기록과 사회

기록에 대한 모든 이야기

메일리 로고

도움말 자주 묻는 질문 오류 및 기능 관련 제보 뉴스레터 광고 문의

서비스 이용 문의admin@team.maily.so

메일리 사업자 정보

메일리 (대표자: 이한결) | 사업자번호: 717-47-00705 | 서울 서초구 강남대로53길 8, 8층 11-7호

이용약관 | 개인정보처리방침 | 정기결제 이용약관 | 라이선스