모든 숫자들을 1개의 문자열로 추출 : re.sub()
sub()는 string에서 pattern과 일치하는 문자들을 repl로 교체합니다.
re.sub(pattern, repl, string)
import re
string = 'aaa1234, ^&*2233pp'
numbers = re.sub(r'[^0-9]', '', string)
print(numbers)
output : 12342233
[^0-9] : 숫자가 아닌 것을 찾음
[0-9] : 숫자를 찾음
# 전화번호 *로 치환 예제
import re
text = '''010-1234-5678 Kim
011-1234-5678 Lee
016-1234-5678 Han'''
text_mod = re.sub('^[0-9]{3}-[0-9]{4}-[0-9]{4}', '***-****-****", text)
print(text_mod)
***-****-**** Kim
011-1234-5678 Lee
016-1234-5678 Han
# 전화번호 *로 치환 예제 - 모든 줄 치환
import re
text = '''010-1234-5678 Kim
011-1234-5678 Lee
016-1234-5678 Han'''
text_mod = re.sub('^[0-9]{3}-[0-9]{4}-[0-9]{4}', '***-****-****", text, flags = re.MULTILINE)
print(text_mod)
***-****-**** Kim
***-****-**** Lee
***-****-**** Han
flags = re.MULTILINE
'Data Science > Python' 카테고리의 다른 글
[Python] replace, 합집합/교집합/차집합, 리스트 문자열 합치기 (0) | 2022.10.20 |
---|---|
판다스 자주쓰는 명령어4 (0) | 2022.10.14 |
판다스 자주쓰는 명령어3 - 결측값 대체 (0) | 2022.10.14 |
판다스 자주쓰는 명령어2 - pd.merge(df, df2, on = " ", how= " ") (0) | 2022.10.14 |
판다스 자주쓰는 명령어 (0) | 2022.10.14 |