구독자님, 안녕하세요! 머신러닝과 딥러닝에 대한 간단한 퀴즈를 내볼게요. 정답을 모두 알 것 같으면 이 글을 읽지 않으셔도 되지만, 헷갈리는 문제가 있으시다면 글을 끝까지 읽으시고 다시 도전해 보세요!
머신러닝의 정의
머신러닝의 정의는 영문 위키피디아의 내용을 인용하여 의역했습니다. 여기서 중요한 개념들이 5가지 정도가 나오는데요. 같이 차근차근 살펴보시죠.
1) 주어진 데이터를 학습한다.
• 데이터를 학습한다는 것은 데이터 속 숨겨진 패턴을 찾아내어, 이를 수학적 모델(함수)로 표현하는 것입니다.
• 모델은 X를 입력하면 Y가 출력되는 특징을 가지고 있습니다.
• 모델을 만드는 데 사용되는 데이터를 학습 데이터라고 부릅니다.
2) 새로운 데이터에 대해서도 일반화가 가능하다.
• 모델에 새로운 데이터를 입력하면 특정 값이 나옵니다. 이 값은 무작위 값이 아니라 학습 데이터를 통해 발견한 패턴에 따라 도출된 값입니다.
• 따라서 학습 데이터에서 패턴을 잘 잡아냈다면, 즉 학습이 잘 되었다면 어떠한 새로운 데이터에 대해서도 패턴을 잘 찾아낼 수 있습니다. 이를 일반화(Generalization)라고 합니다.
• 모델에 대입하는 새로운 데이터를 시험 데이터라고 부릅니다.
3) 명시적 지시가 없다.
• 명시적 지시는 사람이 직접 데이터의 패턴을 발견하고 이를 컴퓨터(기계)에 입력하는 것을 말합니다. 따라서 명시적 지시가 없다는 것은 데이터의 패턴을 발견하는 것은 오로지 컴퓨터(기계)의 몫이라는 뜻입니다.
• 물론 코드를 입력하거나 모델을 선택하는 것은 사람이 진행합니다. 다만 사람이 데이터의 학습에는 직접 개입하지 않는다는 뜻에 가깝습니다.
4) 주어진 일을 수행한다.
• 머신러닝은 특정 문제를 해결하기 위해 사용됩니다. 대표적으로 예측, 분류, 군집이라는 범주로 나뉩니다.
• 구체적으로 예를 들어보면, 미래의 제품 수요를 예측하거나 이탈 고객과 이탈하지 않을 고객을 분류하는 일 등을 수행할 수 있습니다.
5) 통계적 알고리즘
• 통계학 이론들을 컴퓨터와 코드를 통해서 구현하는 것으로 이해하시면 됩니다.
• 머신러닝은 통계학, 수학, 컴퓨터 공학이 결합한 학문입니다.
위 내용들을 요약해 보면 머신러닝은 통계학, 수학, 컴퓨터 공학을 바탕으로 기계 스스로 데이터 속의 패턴을 발견하여 예측, 분류, 군집 등의 일을 수행하는 알고리즘에 대한 연구라고 말할 수 있습니다.
딥러닝의 정의
딥러닝의 정의도 마찬가지로 영문 위키피디아의 내용을 인용하여 의역했습니다. 여기서 중요한 개념들이 2가지 정도가 나오는데요. 같이 차근차근 살펴보시죠.
1) 딥러닝은 머신러닝의 부분 집합이다.
• 딥러닝은 머신러닝에서 발전된 연구 분야로, 머신러닝의 한 종류입니다.
2) 인공 신경망을 활용한다.
• 딥러닝은 뇌의 신경망 구조를 모방한 인공 신경망을 기반으로 작동합니다.
• 뇌는 뉴런이라는 세포들로 이루어져 있고 각각의 뉴런들은 시냅스를 통해 연결됩니다. 딥러닝은 뉴런을 모방한 노드와 시냅스를 모방한 가중치로 인공 신경망을 구현합니다.
위 내용들을 요약해 보면 딥러닝은 머신러닝 연구 분야 중 하나로 뇌의 신경망 구조를 인공적으로 모방하여 데이터를 학습하고 문제를 해결하는 것이라고 말할 수 있습니다.
머신러닝과 딥러닝의 차이점과 예시
머신러닝과 딥러닝의 관계를 위 그림으로 설명할 수 있습니다.
"딥러닝 ⊂ 머신러닝 ⊂ 인공지능"
즉, 딥러닝은 머신러닝의 부분 집합이며, 머신러닝은 더 큰 범주인 인공지능에 속합니다.
그러면 머신러닝과 딥러닝의 예시 프로젝트들을 살펴보고 마무리 짓겠습니다.
1) 머신러닝 프로젝트 예시
• 지난 3년 간의 매출 데이터를 분석해서 다음 분기 매출을 예측하는 프로젝트가 주어졌습니다.
• 매출 데이터는 판매량, 계절, 광고비 등의 변수들로 구성되어 있습니다.
• 회귀 모델을 통해서 각 변수들을 조합하여 매출의 패턴 또는 공식을 예측할 수 있고 이를 다른 사람들에게 설명할 수도 있습니다.
2) 딥러닝 프로젝트 예시
• 고양이와 개 이미지를 분류하는 프로젝트가 주어졌습니다.
• 사람은 고양이와 개를 분류할 때, 수식을 사용하는 것이 아니라 이미지의 특징을 포착하고 이를 이용합니다.
• 그렇다면 우리의 뇌를 모방한 인공 신경망을 구현하고 고양이와 개의 이미지를 학습시켜 각각의 특징을 잘 포착하는 모델을 만들 수 있습니다. 하지만, 이 모델이 어떤 방식으로 고양이와 개를 구분하는지는 해석하기도 어려우며 다른 사람에게 설명하기도 힘듭니다.
의견을 남겨주세요