SeouliteLab

파이썬 한글 자연어 처리를 위한 Konlpy 모듈 활용법 본문

카테고리 없음

파이썬 한글 자연어 처리를 위한 Konlpy 모듈 활용법

Seoulite Lab 2024. 4. 17. 08:50

Konlpy는 한글 자연어 처리를 위한 파이썬 라이브러리로, 형태소 분석, 품사 태깅, 명사 추출 등 다양한 기능을 제공합니다. 이를 통해 한글 텍스트 데이터를 효과적으로 처리하고 분석할 수 있습니다. 이제 몇 가지 예제를 통해 Konlpy 모듈의 활용법을 살펴보겠습니다.

예제 1: 한글 토큰화(Tokenization)

from konlpy.tag import Komoran

# 형태소 분석기 초기화
komoran = Komoran()

# 문장 토큰화
sentence = "자연어 처리는 파이썬으로 쉽게 할 수 있습니다."
tokens = komoran.morphs(sentence)

# 결과 출력
print(tokens)

이 예제에서는 Konlpy를 사용하여 한글 문장을 토큰화하는 방법을 보여줍니다. Komoran 형태소 분석기를 사용하여 주어진 문장을 형태소 단위로 분리하고 결과를 출력합니다.

예제 2: 품사 태깅(Pos Tagging)

from konlpy.tag import Okt

# 형태소 분석기 초기화
okt = Okt()

# 문장 품사 태깅
sentence = "한글 자연어 처리는 즐겁습니다."
tags = okt.pos(sentence)

# 결과 출력
print(tags)

이 예제에서는 Konlpy를 사용하여 한글 문장의 품사를 태깅하는 방법을 보여줍니다. Okt 형태소 분석기를 사용하여 주어진 문장의 각 단어와 해당하는 품사를 출력합니다.

예제 3: 명사 추출(Noun Extraction)

from konlpy.tag import Kkma

# 형태소 분석기 초기화
kkma = Kkma()

# 문장에서 명사 추출
sentence = "자연어 처리를 위해 적절한 도구를 선택해야 합니다."
nouns = kkma.nouns(sentence)

# 결과 출력
print(nouns)

이 예제에서는 Konlpy를 사용하여 한글 문장에서 명사를 추출하는 방법을 보여줍니다. Kkma 형태소 분석기를 사용하여 문장에서 명사를 추출하고 결과를 출력합니다.