본문 바로가기

AI/머신러닝&딥러닝

feature

Feature

- 샘플을 잘 설명하는 특징

- 특징을 통해 특정 샘플을 수치화 할 수 있음

 

사람을 설명할 때 좋은 특징
좋은 특징 - 나이, 키, 몸무게, 소득
- 성별, 직업, 거주지, 전공, 취미 
나쁜 특징 - 생명체(모두 살아있으므로 사람과 사람을 구분하기 어려움)
- 주민등록번호(주민등록번호에는 성별과 나이, 출신 지역 등의 정보가 있으나
  사람과 사람을 구분하기 위한 특징으로 활용하기엔 유의미한 정보가 부족함)

 

 

머신 러닝에서의 특징

 

MNIST Classification

- 특정 위치에 곧은(휘어진) 선이 얼마나 있는가?

- 특정 위치에 선이 얼마나 굵은가?

- 특정 위치에 선이 얼마나 기울어져 있는가?

- 샘플과 샘플의 차이를 설명할 수 있는가?

 

 

딥러닝에서의 특징

: 딥러닝 에서는 Hand-crafted Feature가 필요없다.

 

Traditional Machine Learning Current Deep Learning
- 사람이 데이터를 분석 후 가정을 세움
- 가정에 따라 전처리 후 feature 추출
- 추출된 feature를 모델에 넣어 학습

장점: 사람이 해석하기 쉬움
단점: 사람이 미처 생각하지 못한 특징의 존재 가능성이 있음
- Raw 데이터에 최소한의 전처리(e.g.scale) 수행
- 데이터를 model에 넣어 학습

장점: 구현이 용이, 미처 발견하지 못한 특징 활용 가능
단점: 사람이 해석하기 어려움

 

 

Feature Vector

- 각 특징들을 모아서 하나의 vector로 만든 것

- 각 차원(dimention)은 어떤 속성에 대한 level을 나타냄(각 속성에 대한 level이 비슷할 수록 비슷한 샘플로 볼 수 있음)

- feature vector를 통해 샘플 사이의 거리(유사도)를 계산할 수 있음

 

 

 

 


김기현 님의 딥러닝 강의를 수강하며 정리한 내용입니다.

출처: fastcampus

반응형