NLP 학습을 위한 기본 지식 #한국어의 단위
음운 < 음절 < 형태소 < 단어 < 어절 < 문장 음운 - 말의 뜻을 구별해 주는 소리의 자강 작은 단위 - '음소'와 '운소'로 이루어짐 - '음소'는 자음(ㄱ,ㄴ,ㄷ,ㄹ,..)과 모음(ㅏ,ㅑ,ㅓ,ㅕ...)를 말함 - '운소'는 자음, 모음을 제외하고 말의 듯을 달라지게 해주는 요소 - 소리의 길이(장단), 소리의 세기(강세), 높낮이(성조)등 음절 - 한번에 발음할 수 있는 말소리의 가장 작은 단위 - 우리가 한 글자라고 부르는 것과 음절 단위가 같다. - 예로 저녁먹었니? 는 다섯 글자로 이루어져있고, 다섯 개의 음절로 이루어져 있다. 형태소 - 뜻을 가지고 있는 말 중 가장 작은 단위, 더 나눌 수 없는 단위 - '풋사과'를 형태소 단위로 나눈다면 '풋' 과 '사과' 로 나눌 수 있음 - '잘 ..