SeouliteLab

[Python/파이썬] 문자열에서 특수문자 제거, 숫자 제거, 숫자만 남기기 본문

프로그래밍

[Python/파이썬] 문자열에서 특수문자 제거, 숫자 제거, 숫자만 남기기

Seoulite Lab 2024. 3. 3. 23:04

문자열에서 특수문자를 제거하거나, 숫자를 제거하거나, 숫자만 남기는 방법에 대해 알아보겠습니다. 이러한 작업은 데이터 전처리나 텍스트 처리 등에서 유용하게 활용될 수 있습니다.

1. 특수문자 제거하기

정규표현식을 사용하여 문자열에서 특수문자를 제거할 수 있습니다. 정규표현식을 통해 특정 패턴의 문자를 찾아서 제거합니다.

import re

text = "Hello! How are you? This is a test string!!!"

cleaned_text = re.sub(r'[^\w\s]', '', text)

print(cleaned_text)  # 출력 결과: Hello How are you This is a test string

2. 숫자 제거하기

정규표현식을 사용하여 문자열에서 숫자를 제거할 수 있습니다. 마찬가지로 특정 패턴의 숫자를 찾아서 제거합니다.

import re

text = "There are 123 apples and 456 oranges."

cleaned_text = re.sub(r'\d+', '', text)

print(cleaned_text)  # 출력 결과: There are  apples and  oranges.

3. 숫자만 남기기

정규표현식을 사용하여 문자열에서 숫자만을 남기고 나머지를 제거할 수 있습니다. 숫자를 제외한 모든 문자를 제거하는 패턴을 사용합니다.

import re

text = "There are 123 apples and 456 oranges."

numbers_only = re.findall(r'\d+', text)
numbers_str = ''.join(numbers_only)

print(numbers_str)  # 출력 결과: 123456

위의 예제들을 통해 문자열에서 특수문자를 제거하거나, 숫자를 제거하거나, 숫자만을 남기는 방법을 알아보았습니다.