Feature
- 샘플을 잘 설명하는 특징
- 특징을 통해 특정 샘플을 수치화 할 수 있음
사람을 설명할 때 좋은 특징 | |
좋은 특징 | - 나이, 키, 몸무게, 소득 - 성별, 직업, 거주지, 전공, 취미 |
나쁜 특징 | - 생명체(모두 살아있으므로 사람과 사람을 구분하기 어려움) - 주민등록번호(주민등록번호에는 성별과 나이, 출신 지역 등의 정보가 있으나 사람과 사람을 구분하기 위한 특징으로 활용하기엔 유의미한 정보가 부족함) |
머신 러닝에서의 특징
MNIST Classification
- 특정 위치에 곧은(휘어진) 선이 얼마나 있는가?
- 특정 위치에 선이 얼마나 굵은가?
- 특정 위치에 선이 얼마나 기울어져 있는가?
- 샘플과 샘플의 차이를 설명할 수 있는가?
딥러닝에서의 특징
: 딥러닝 에서는 Hand-crafted Feature가 필요없다.
Traditional Machine Learning | Current Deep Learning |
- 사람이 데이터를 분석 후 가정을 세움 - 가정에 따라 전처리 후 feature 추출 - 추출된 feature를 모델에 넣어 학습 장점: 사람이 해석하기 쉬움 단점: 사람이 미처 생각하지 못한 특징의 존재 가능성이 있음 |
- Raw 데이터에 최소한의 전처리(e.g.scale) 수행 - 데이터를 model에 넣어 학습 장점: 구현이 용이, 미처 발견하지 못한 특징 활용 가능 단점: 사람이 해석하기 어려움 |
Feature Vector
- 각 특징들을 모아서 하나의 vector로 만든 것
- 각 차원(dimention)은 어떤 속성에 대한 level을 나타냄(각 속성에 대한 level이 비슷할 수록 비슷한 샘플로 볼 수 있음)
- feature vector를 통해 샘플 사이의 거리(유사도)를 계산할 수 있음
김기현 님의 딥러닝 강의를 수강하며 정리한 내용입니다.
출처: fastcampus
반응형
'AI > 머신러닝&딥러닝' 카테고리의 다른 글
AutoEncoder (0) | 2022.06.20 |
---|---|
One-hot Encoding (0) | 2022.06.20 |
EDA: Exploratory Data Analysis (0) | 2022.05.31 |
진짜 나를 위한 딥러닝 #순차 데이터 #순환 신경망 (0) | 2022.02.09 |
진짜 나를 위한 딥러닝 #합성곱 신경망 (0) | 2022.02.07 |