딥러닝 개론, 기본 개념
학습이란?
- 예측에 대한 답을 채점하고, 오답노트(정답과 예측 답을 비교)를 만들어가면서 발전해 나가는 것.
기계학습(머신러닝)이란?
- 기계가 데이터에 대해 예측을 진행하고, 레이블(정답)로 채점한 뒤 틀린 문제에 대해 스스로에게 피드백을 진행하는 것.
기계가 스스로 학습하지 못한다면,
문제에 대한 모든 경우의 수를 만족시킬 수 있는 조건을 일일이 지정해주어야 한다.
이를 규칙 기반(rule-based) 방법이라고 한다.
머신러닝의 진행 과정
- 학습
- 학습
- 시험(test): 학습이 잘되었는지 테스트하는 것.
- 추론: 학습된 모델을 가지고 새로운 데이터를 예측하는 것.
데이터셋(레이블링된 데이터)
- 학습을 위한 데이터셋(traning data)과
- 시험을 위한 데이터셋(test data)으로 구분해서 사용한다.
에포크(epoch)
- 주어진 훈련 데이터를 한 바퀴 돌았다는 것. (학습 1회)
훈련 정확도
- 예측한 가설 = 정답인 개수 / 총 훈련 데이터의 개수
- 훈련 정확도가 회차를 거듭할수록 증가한다면, 훈련이 잘되고 있는 첫 번째 증거라고 할 수 있다.
시험 정확도
- 학습이 종료되면, 시험 데이터셋으로 시험을 본다.
- 시험 정확도를 통해서 객관적으로 모델의 성능을 파악할 수 있다.
인공지능
- 인간의 지능을 모방한 인공적인 지능(artificial intelligence)
- 지능을 이해하는 것 자체보다는 지능적인 모델을 활용해 산업적으로 어떻게 이용할 것인지에 더 초점이 맞춰져 있다.
- 아이폰의 시리나 구글 번역기 같은 자연어처리(natural language processing)
- 전문 지식과 노하우를 축적해 자동차 고장을 진단하는 전문가 시스템(expert system)
- 자율주행 자동차와 같이 카메라로 사물을 인식하고 분류하는 컴퓨터 비전(computer vision) 등
- 다양한 산업 분야에서 활용되고 있다.
머신러닝은 아닌데 인공지능에 포함되는 분야.
- 전문가 시스템: 전문가의 지식에 기반해 '~일 때는 ~하라'는 규칙들에 기반하는 규칙기반 모델(rule-based model)
머신러닝
- 인공지능에 포함되는 개념.
- 학습을 통해 예측을 수행하는 모든 기계.
- 회귀(regression)모델, 신경망, 군집화(clustering), 서포트벡터 머신(SVM) 등.
- 개발자나 연구자가 직접 데이터의 특성을 엔지니어링 한 후 모델에 입력시키는 경우가 많다.
딥러닝
- 머신러닝의 일종.
- 뇌의 신경망(netural network)에서 착안한 인공신경망을 의미.
- 신경망 구조로 학습하는 머신러닝.
- 수많은 뉴런을 층층이 쌓은 모델에 데이터를 전파시키고(순전파), 그 예측과 정답의 차이를 역전파(backpropagation)시켜 피드백하고 수정하는 과정을 통해 학습한다.
- 각각의 흰 원들을 신경망의 노드(node)라고 하고, 노드들이 세로로 묶인 집합을 하나의 층(layer)라고 한다.
- 입력층과 출력층 사이의 층들을 은닉층(hidden layer)라고 하는데, 이 은닉층의 수가 적을 때 '얕다'라고 표현하고 많을 때 '깊다'라고 표현한다.
- 대표적인 모델의 예로는 CNN이 있다.
회귀(regression)와 분류(classification)
- 예측하려는 값의 종류에 따라 구분 가능.
- 예측하려는 값이 연속값 (끝없이 연속될 수 있다. 0.31, 0.301, 0.3001) 이면 회귀 문제.
- 예측하려는 값이 이산값(네/아니오, 10대/20대/30대, 그렇다/보통이다/그렇지 않다)이면 분류 문제.
지도 학습과 비지도 학습
- 나누는 기준은 레이블의 유무.
- 데이터에 레이블이 있다면 지도 학습. 없다면 비지도 학습.
'AI > 딥러닝기초' 카테고리의 다른 글
[딥러닝개론] 순전파와 역전파 (1) | 2023.12.12 |
---|---|
[딥러닝개론] 신경망 학습 - 경사하강법(gradient descent) (2) | 2023.12.05 |
[딥러닝개론] 신경망 기초 (2) | 2023.12.05 |
[딥러닝개론] 선형회귀 (0) | 2023.12.04 |