AI/머신러닝&딥러닝 (24) 썸네일형 리스트형 진짜 나를 위한 딥러닝 #신경망 모델 훈련 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 드롭아웃(dropout) - 은닉층에 있는 뉴런의 출력을 랜덤하게 꺼서 과대적합을 막는 기법 - 드롭아웃은 훈련 중에 적용되며 평가나 예측에서는 적용하지 않음. 텐서플로에선 자동으로 이를 처리 나의 이해: 하던 것만 계속 하면 그것만 잘 하게 될 수 있는데 가끔 다른 걸 시켜서 정신 바짝 차리게 만들어 주는 기법 콜백(callback) - 케라스 모델을 훈련하는 도중에 어떤 작업을 수행 할 수 있도록 도와주는 도구 - 최상의 모델을 자동으로 저장해 주거나 검증 점수가 더 이상 향상되지 않으면 일찍 훈련을 종료할 수 있음 나의 이해: 모델 훈련을 .. 진짜 나를 위한 딥러닝 #심층 신경망 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 심층 신경망(deep neural network, DNN) - 2개 이상의 층을 포함한 신경망, 딥러닝 이라고 부르기도 함 나의 이해: 입력층과 출력층으로 신경망이 구성되는게 기본인데 입력층과 출력층 사이에 은닉층(히든레이어)이 하나 이상이 붙을 경우 심층 신경망으로 부름. 은닉층이 있다?! -DNN 은닉층(hidden layer) - 신경망의 입력층과 출력층 사이에 있는 모든 층을 은닉층이라 부름 - 은닉층에는 활성화 함수가 적용 * 활성화 함수는 신경망 층의 선형 방정식의 계산 값에 적용하는 함수. (소프트맥스, 시그모이드 등) 나의 이해: .. 진짜 나를 위한 딥러닝 #인공 신경망 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 인공 신경망(artificial neural network, ANN) - 생물학적 뉴런에서 영감을 받아 만든 머신러닝 알고리즘 - 이미지, 음성, 텍스트 분야에서 뛰어난 성능을 발휘 - 인공 신경망 알고리즘은 딥러닝이라고도 부름 - 신경망의 처음 값(입력층, input layer), 입력층에서 출력층 값을 계산하는 단위(뉴런 neuron or 유닛 unit), 신경망의 최종 값(출력층, output layer)라고 함 - 기본적으로 로지스틱 회귀(SGDClassifier)와 아주 비슷 나의 이해: 뉴런 개수(몇개로 분류할 것인지), 출력층에 적용.. 진짜 나를 위한 머신러닝 #군집 알고리즘 #k-평균 #주성분 분석 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 비지도 학습(unsupervised learning) - 머신러닝의 한 종류로 훈련 데이터에 타깃이 없음 - 가르쳐주지 않아도 데이터에 있는 무엇인가를 학습하는 것. - 대표적으로 군집, 차원 축소 등이 있다. 나의 이해: 스타크래프트를 할 때 누가 가르쳐주지 않아도 저글링과 히드라, 뮤탈리스크가 하나의 종족이란 것을 알 수 있다. axis - 배열의 '축'을 의미한다. - 2차원 배열에서 axis= 1일 때는 열 방향으로 계산하고, axis = 0일 때는 행 방향으로 계산한다. 나의 이해: x = np.array([ [ 1, 2, 3, 4], .. 진짜 나를 위한 머신러닝 #트리의 앙상블 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 정형 데이터(structured data) - 행과 열 같은 어떤 구조로 이루어진 데이터 - 데이터베이스에 저장되는 대부분의 데이터 - csv, database, excel 등 나의 이해: 단위나 수치 등을 행과 열로 구분해서 저장할 수 있는 데이터. 질럿들의 손가락 길이, 질럿들이 한 달 동안 먹은 식사 메뉴, 마린한테 죽은 저글링의 수 등 비정형 데이터(unstructured data) - 데이터베이스나 엑셀 등으로 표현하기 어려운 것 - 텍스트 데이터, 음악, 사진 등 나의 이해: 메딕한테 채인 마린의 일기 내용, 그날 들은 노래 가사, 침.. 진짜 나를 위한 머신러닝 #교차검증과 그리드 서치 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 검증 세트(validation set) - 훈련 세트로 머신러닝 모델을 훈련하고 테스트 세트로 하이퍼파라미터를 튜닝하면 결국 테스트 세트에 맞춰 훈련하게 된다. 테스트 세트는 최종 모델을 선택할 때까지 사용하지 말아야 하는데 이를 위해 훈련 세트에서 검증 세트를 다시 나눠 하이퍼파라미터를 조정한다. - 검증 세트 또는 개발 세트(dev set)이라고도 부른다. 나의 이해: 마린 징집관은 징집을 자동으로 수행하기 위해 면접AI를 도입했다. 문제는 수많은 지원자들 중 마린으로 위장한 저글링이 있다는 것이다. 그래서 저글링을 구별해내기 위해 면접 AI.. 진짜 나를 위한 머신러닝 #결정 트리 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 결정 트리(Decision Tree) - 스무고개처럼 예/아니오 에 대한 질문을 이어나가면서 정답을 찾아 학습하는 알고리즘 - 예측과정을 이해하기 쉽고 성능도 뛰어남 - 특성값의 스케일은 결정 트리 알고리즘에 영향을 미치지 않음(표준화 전처리 불필요) 나의 이해: 아주 간단히 정리하자면, 저글링(눈: 3, 팔: 0, 다리: 2, 속도: 20km/s), 마린(눈: 2, 팔: 2, 다리: 2, 속도: 4km/s)의 데이터가 있음. 결정 트리는 스무고개처럼 아래 예로 특성들을 잘 나눌 수 있는 질문들을 추가해 분류 정확도를 높임. 다리가 2개니? ->.. 진짜 나를 위한 머신러닝 #확율적 경사 하강법 나의 이해는 주관적인 저의 이해를 적어놓은 글입니다. 개념을 쉽게 이해해보고자 서술해본 글이지만 알고리즘이나 용어의 개념과 100% 일치하지 못할 수 있습니다. 점진적 학습 or 온라인 학습 - 훈련 데이터에 새로운 데이터를 추가하여 모델을 매일매일 다시 훈련해야 할 필요가 있을 때 단점은 시간이 지날수록 데이터가 늘어나기 때문에 사용하기 어렵다. 그래서 기존에 훈련한 데이터를 버리지 않고 새로운 데이터에서만 조금씩 더 훈련하는 방식 확률적 경사 하강법(Stochastic Gradient Descent) - 점진적 학습의 대표적 알고리즘 - 훈련 세트에서 샘플 하나씩 꺼내(랜덤) 손실 함수의 경사를 따라 최적의 모델을 찾는 알고리즘 나의 이해: 마린이 질럿을 저격하려고 하는데 조준경을 위에서 한단계씩 내.. 이전 1 2 3 다음