안녕하세요 구독자님. 이번에 다룰 데이터는 "사망율(Death Ratio)" 입니다.
# 지표정의
데이터를 좀 더 이해하기 위해 주석을 읽어 보았습니다.
해당 자료의 목적은 "우리국민의 정확한 사망원인 구조를 파악하여 국민복지 및 보건의료 정책 수립을 위한 기초자료 제공" 로 되어있습니다.
# 통계자료
사용한 데이터는 다음과 같습니다.
사망률 데이터는 몇가지 특징들을 갖고 있습니다.
1/ 지난 출산율 데이터와 다르게 아래 차원들을 분기로 연도별 집계 되어있습니다.
"사망원인" x "연령그룹(5세 단위)(0세 ~ 80세 이상)" X "성별(남,여)"
이는 어떤 관점에 보느냐에 따라 다양한 해석을 할 수 있습니다. 사망원인을 기준으로 본다면 어떤 원인자체로 사망하는지를 보는 것이고, 연령그룹으로 보면 각 연령대별 사망원인을 알 수 있습니다. 남자와 여자의 사망 비율을 비교해볼 수 있지만 임신&출산으로 인한 사망은 여성에게만 발생합니다.
2/ 사망원인이 104개 항목으로 구반되어 있다고 하지만 실제로는 대략 20개의 대분류로만 집계되어 있습니다.
104개 각각의 항목의 사망수는 확인은 안되어서 다른 방법이 없는지 찾아봤지만 공개되어있는 데이터로서는 아쉽게도 확인이 어려웠습니다.
104개 항목은 질병분류기호에서 확인할 수 있었습니다. [대분류 22개, 중분류 267개, 소분류 2,093개, 세분류 12,603개, 세세분류 6,335개] 이렇게 보면 사람은 정말 다양한 이유로 병에 걸리고 죽는다는 것이 새삼 놀랬습니다.
흔히 자연사라고 알고 있는 노환도 [R54] 노쇠 로 구분하고 있습니다. 다만, 이 부분에 대한 논란은 논문으로도 존재합니다만 자세한 내용은 다루지 않겠습니다.
참고로 알코올 사망만 해도 분류코드가 이렇게 분류되어 있는데 한 사람의 죽음을 파악하는 것이 얼마나 어려운 지 코드만 보더라도 어렵다고 느껴졌습니다.
추가로 발견한 것 중 2022.10 수치가 다른 월에 비해서 높은 것을 확인할 수 있는 데 이는 지난 "이태원 압사 사고"로 인한 것임을 유추할 수 있었습니다. 이제 그들의 죽음 데이터로 남아있다는 사실이 씁쓸하게 느껴집니다.
좀 더 자세한 분석은 "2022년 사망원인통계 리포트"에서 확인가능합니다. 리포트를 보면 흥미로운 사실들을 많이 발견해볼 수 있습니다. 코로나19 바이러스의 등장은 기존 감염병의 범위에서 벗어난 케이스여서 신설코드(J09)로 등록되어 별도로 관리하고 있었습니다.
또 기억에 남는 데이터는 타살에 인한 비중이 유독 0세에서 높게 나오는데 부모에 의한 유기로 인한 것으로 통계치로 보여집니다.
# 끝맺음 (출력)
자, 이제 출력을 해보겠습니다. 제가 사실 이 주제를 선택하게 된 계기가 "이태원 압사 사고"를 보면서 큰 충격을 받아서 제작하게 되었습니다. 앞서 막대그래프에 비해 좀 더 월별 차이를 느낄 수 있게 방사형 차트 혹은 레이더 차트로 그려봤습니다.
아래는 결과물 입니다.
죄송합니다. 사실 고백을 하자면 블렌더 툴이 아직 익숙하지 않아서 원하는 형태로 출력이 너무 어려웠습니다. 뉴스레터를 발행하면서 계속해서 나아지는 모습을 보여드리려고 합니다.
다음에는 어떤 데이터들을 출력해볼까요? 출력해봤으면 하는 데이터들을 댓글로 남겨주세요 :) 메일 구독하시면 재미있는 데이터들의 출력을 확인해 볼 수 있으십니다.
잠깐만요! 아직 뉴스레터를 종료하기 전에 제가 진행하는 메멘토모리3D를 소개해드립니다.
여러분들의 오늘 하루는 충만하셨나요?
- 우리의 인생은 어떻게 끝날지 아무도 모릅니다. 우리는 모두 죽으며 죽고 난 이후에는 모든 것을 내려놓아야 합니다. 오늘 만약 당신이 죽는다면 당신은 오늘 하루를 후회없이 살았다고 말할 수 있나요?
- 오늘 하루도 후회없이 충만한 하루를 살기를 바라는 의미에서 내 죽음을 형상화한 메멘토모리3D 제품을 소개합니다.
지금 memento.mori.3d 를 통해 사전 오픈을 신청하시면 추후 오픈 시 혜택을 드립니다.
의견을 남겨주세요