본문 바로가기

AI/Python

NLP 학습을 위한 기본 지식 #한국어의 단위

음운 < 음절 < 형태소 < 단어 < 어절 < 문장

 

음운

- 말의 뜻을 구별해 주는 소리의 자강 작은 단위

- '음소'와 '운소'로 이루어짐

- '음소'는 자음(ㄱ,ㄴ,ㄷ,ㄹ,..)과 모음(ㅏ,ㅑ,ㅓ,ㅕ...)를 말함

- '운소'는 자음, 모음을 제외하고 말의 듯을 달라지게 해주는 요소

- 소리의 길이(장단), 소리의 세기(강세), 높낮이(성조)등

 

음절

- 한번에 발음할 수 있는 말소리의 가장 작은 단위

- 우리가 한 글자라고 부르는 것과 음절 단위가 같다.

- 예로 저녁먹었니? 는 다섯 글자로 이루어져있고, 다섯 개의 음절로 이루어져 있다.

 

형태소

- 뜻을 가지고 있는 말 중 가장 작은 단위, 더 나눌 수 없는 단위

- '풋사과'를 형태소 단위로 나눈다면 '풋' 과 '사과' 로 나눌 수 있음

- '잘 먹었습니다.' 를 나눈다면 '잘', '먹', '었', '습니다' 4개로 나눌 수 있음

 

단어

- 문장에서 혼자 쓸 수 있는 가장 작은 단위이며, 말하고자 하는 의미가 파괴되서는 안됌

- 형태소와 비슷하지만 단어인지 형태소인지 체크할 수 있는 간단한 방법은 그 단어만 읽엇을 때 말이 되면 단어, 아니면 형태소라 볼 수 있음.

- 단어 뒤에 오는 '은, 는, 이, 가, 을, 를, 에, 에서, 는, 도, 만, 이다' 등의 조사는 혼자 말할 수 없지만 단어로 인정됌

예)

'잘 먹었습니다' 를 형태소대로 나눈다면 '잘', '먹', '었', '습니다' 로 나눌 수 있는데

'잘' 은 혼자 쓰일 수 있음. 집까지 어떻게 가니? 잘~! -> 그러므로 '잘'은 형태소 이면서 단어

'먹'은 혼자 쓰일 수 없음. 와이프~ 저녁 먹! -> 말이 안됌, 그러므로 형태소 이지만 단어는 아님

'먹었습니다' 는 혼자 쓰일 수 있으니 단어가 될 수 있음. 

 

어절

- 띄어쓰기 단위는 어절 단위와 같다. 

- 문장 성분의 가장 작은 단위이며 예를 들면 '주어, 목적어, 서술어' 같이 ~어 로 끝나면 어절이라 볼 수 있음

 

문장

- 하나의 문장에는 하나의 마치는 문장부호(./!/?)가 쓰임

- 한국어의 문장 기본구조는 3가지

   가) 주어 + 명사 -> 나는 + 학생이다

   나) 주어 + 형용사 -> 나는 + 멋있다

   다) 주어 + 동사 -> 나는 + 삽질한다

 

 


참조

https://brgrammar.tistory.com/8

 

[중고등공통] 국어문법 2 : 말의 단위 (음운, 음절, 형태소, 단어, 어절, 문장)

'cm, m, km'의 단위를 잘 알고 있나요? 100cm는 1m이고, 1,000m는 1km이지요. 이것처럼 말을 구별하는 단위가 있습니다. 가장 작은 단위부터 음운<음절≦형태소≦단어≦어절<문장 순서입니다. 학교 교과

brgrammar.tistory.com

 

반응형

'AI > Python' 카테고리의 다른 글

NoneType check  (0) 2022.08.10
Anaconda 가상환경  (0) 2022.01.25
Python #데이터 전처리  (0) 2021.09.29
Python #정규식 #정규 표현식  (0) 2021.09.25
Python #파이썬의 대모험 02  (0) 2021.09.01