🧐 Summary
1️⃣ 최근 UX 연구에서 생성형 AI가 접근성 개선에 중요한 역할을 하며, Google I/O에서 발표된 'Be My Eyes' 사례가 주목받고 있습니다.
2️⃣ 생성형 AI는 텍스트와 이미지 설명, 모바일 접근성, 교육 접근성 등 다양한 분야에서 장애인의 정보 접근을 혁신적으로 개선하고 있습니다.
3️⃣ AI 기술의 발전과 함께 개인화된 접근성 솔루션 및 윤리적 AI 개발이 중요하며, 이러한 프로젝트들이 장애인들의 삶을 풍요롭게 할 것으로 기대됩니다.
안녕하세요 구독자님, 오늘 뉴스레터에서는 최근 UX 연구에서 주목받고 있는 생성형 AI의 접근성 개선에 대해 알아보려고 합니다. 지난주에 Google I/O에서 발표한 Gemini - Be my eyes 영상을 소개해드렸잖아요. 영상 인식을 접근성 개선에 활용한 사례가 인상적이어서 저도 그날 바로 Be my eyes 앱을 깔아보고는 자원봉사자 등록까지 했거든요. 그리고는 이 외에도 접근성 개선에 생성형 AI가 활용되고 있는 사례가 있을지 궁금해졌어요.
그럼 오늘은 생성형 AI가 접근성 향상에 미치는 영향과 추후 발전 방향에 대해 다뤄볼게요.
생성형 AI의 접근성 개선 관련 최신 연구 동향
AI 기술은 장애인들이 정보와 서비스에 접근하는 방식을 혁신적으로 변화시키고 있으며, 이러한 변화를 주도하는 연구들 역시 빠르게 이루어지고 있습니다. 주요 연구 주제들은 다음과 같습니다.
- 자연어 처리(NLP)와 텍스트 접근성: 자연어 처리 기술을 활용하여 텍스트를 쉽게 이해할 수 있도록 만드는 연구들이 활발히 진행되고 있습니다. 예를 들어, 복잡한 텍스트를 더 쉽게 읽을 수 있는 버전으로 변환하는 알고리즘이 개발되고 있습니다. [1,2]
- 컴퓨터 비전과 이미지/비디오 접근성: 컴퓨터 비전 기술은 이미지와 비디오 콘텐츠의 자동 설명 생성에 중요한 역할을 하고 있습니다. 예를 들어, Facebook과 Microsoft는 AI를 사용하여 이미지와 비디오의 내용에 대한 설명을 자동으로 생성하는 시스템을 개발하였습니다. [1]
- 모바일 접근성: 스마트폰의 보급과 함께 AI 기반 접근성 앱이 많이 개발되고 있습니다. 예를 들어, Seeing AI와 같은 앱은 시각장애인들이 주변 환경을 이해할 수 있도록 도와줍니다. 이 앱은 텍스트 읽기, 얼굴 인식, 장면 설명 등의 기능을 제공합니다. [1]
- 교육 접근성: AI 기술은 교육 분야에서도 중요한 역할을 하고 있습니다. 학습 장애를 가진 학생들을 위한 맞춤형 학습 도구와 교재가 개발되고 있으며, 이러한 도구들은 학생들의 학습 능력을 크게 향상시키고 있습니다. [3,4]
생성형 AI와 접근성 개선의 실제 사례
1. Microsoft Copilot
먼저 마이크로소프트의 Copilot은 Azure AI를 기반으로, 모든 사람을 위한 보조 도구로 설계되었습니다. 시각장애인을 위해 문서나 회의 내용을 요약해서 읽어줄 수 있고, 난독증이 있는 사람들을 위해 메일을 대신 써 줄수도 있습니다. 또한 손이 자유롭지 않은 사람들을 위해 음성으로 문서를 작성할 수도 있죠.
Copilot을 활용한 사례는 아래 유튜브 영상을 참고해주세요.
또한 Azure AI Vision은 시각 보조 통합 서비스라고 보실 수 있어요. 앱에 사전 구축된 이미지 태깅, 광학 문자 인식(OCR)을 통한 텍스트 추출, 얼굴 인식 등의 기능을 제공하기 때문에 Azure AI Vision을 활용한다면 타 프로덕트에 손쉽게 시각 보조 기능을 추가할 수 있습니다. [5]
2. Google의 Chrome 및 Lookout
저시력자 혹은 시각 장애인은 스크린 리더를 통해 화면을 이해하게 되는데요, 이미지 설명이 없는 수많은 온라인 이미지 때문에 스크린 리더가 쓸모없는 경우도 많죠. 이를 개선하기 위해 Google은 Chrome에서 '이미지 설명 가져오기' 기능을 도입했습니다. 이 기능은 설명이 없는 이미지를 머신 러닝을 통해 자동으로 설명해주는데요, 식당 메뉴를 읽거나 소셜 미디어 게시물을 이해하는 데 도움이 될 수 있습니다. [6]
또한 Google의 Lookout앱을 통해서 시각 장애인과 저시력자가 주변의 물체를 쉽게 찾고 이미지를 캡처할 수 있습니다. 지난 5월 베타 버전으로 출시된 '찾기 모드'는 특정 물체를 찾는 새로운 방법을 제공하는데요, 예를 들어 좌석과 테이블, 화장실 등 일곱 개 카테고리 중 하나를 선택한 후, 카메라를 방 안에서 이동시키면 Lookout이 해당 물체의 방향과 거리를 알려줍니다. 또한 올해 초, AI가 생성한 이미지 캡션이 영어로 Lookout에서 제공되기 시작했어요. 이제 앱 내에서 사진을 직접 캡처하면 AI가 생성한 이미지 설명을 받아 촬영한 이미지에 대해 설명을 들을 수 있습니다. [7]
3. Microsoft와 Rijksmuseum의 작품 오디오 설명
Microsoft는 네덜란드 암스테르담의 국립미술관 Rijksmuseum과의 협업을 통해 AI를 사용해 회화에 대한 상세한 설명을 제공하는 프로젝트를 시작해, 시각 장애인들도 예술을 경험할 수 있게 했습니다. 국립미술관측은 저시력자 및 시각 장애인을 위한 음성 가이드를 개발하고 싶었지만 사람이 직접 이 음성 가이드를 만들기 위해서는 아주 많은 시간이 필요했습니다. 하지만 AI의 도움으로 아주 빠르게 음성 가이드를 생성할 수 있었고, 이 음성 가이드는 회화작품을 아주 상세하게 설명해주어 보지 않아도 그 느낌을 전달할 수 있습니다. 아래 유튜브 영상을 한 번 봐주세요.
추후 발전 방향
- 개인화 된 접근성 솔루션: AI는 사용자 개개인의 필요와 선호에 맞춘 접근성 솔루션을 제공할 수 있는 잠재력을 가지고 있습니다. 사용자 맞춤형 음성 비서나 학습 도구는 장애인들의 일상 생활을 더욱 편리하게 만들어 줄 것입니다.
- 윤리적 AI 개발: 접근성 개선을 위한 AI 기술 개발에는 윤리적 고려가 반드시 필요하죠. 데이터 편향성과 프라이버시 문제를 해결하기 위한 연구가 지속적으로 이루어져야 할 것입니다.
- 정책과 표준화: AI 기반 접근성 기술의 효과적인 구현을 위해서는 정책적 지원 및 표준화가 필요합니다. 정부와 비영리 단체의 적극적인 참여가 중요하며, 이를 통해 더 많은 사람들이 기술의 혜택을 누릴 수 있도록 해야 합니다.
오늘 보신 것처럼 생성형 AI는 접근성 개선에 혁신적인 변화를 가져오고 있습니다. 사실 저는 AI를 생산성을 높이는 데에만 활용해보면서 생성형 AI의 Hallucination에 대한 불만만 늘어가고 있었어요. 그런데 이번 Google I/O에서 Be my eyes 사례를 보고 AI가 활용될 수 있는 긍정적인 사례에 대해 다시 한 번 생각해보게 되었습니다.
특히 저는 오늘 설명드린 사례 중 네덜란드 국립미술관의 오디오 가이드 프로젝트가 정말 인상적이었습니다. 우리에게 큰 영감을 주는 예술에 접근할 수 없는 사람들이 존재하고, 이들을 위해 조금이라도 도움이 될 수 있다면 얼마나 큰 의미가 있을까요? 기존에 다양한 방식으로 제공되던 기본적인 접근성 기능을 넘어서서 보다 장애인들의 삶을 풍요롭게 해줄 수 있는 다양한 프로젝트들이 시작되기를 기대해봅니다.
Reference
[1] https://www.w3.org/WAI/research/ai2023/
[2] https://www.nature.com/articles/d41586-024-01003-w
[3] https://educationaltechnologyjournal.springeropen.com/articles/10.1186/s41239-023-00392-8
[4] https://unf.pressbooks.pub/chatgptinhighereducation/chapter/improving-accessibility-and-inclusivity/
[5] https://azure.microsoft.com/en-us/products/ai-services/ai-vision/
[6] https://blog.google/outreach-initiatives/accessibility/get-image-descriptions/
[7] https://blog.google/outreach-initiatives/accessibility/ai-accessibility-update-gaad-2024/#android
댓글
의견을 남겨주세요