-
python 정규식 표현 raw string(r')알고리즘/Python 2021. 11. 14. 16:19
파이썬 알고리즘 인터뷰를 읽는 중, 금지된 단어를 제외한 가장 흔하게 등장하는 단어를 출력하는 문제에서 아래와 같은 풀이가 등장했다.
참고 : 리트코드 819(https://leetcode.com/problems/most-common-word/)
words = [word for word in re.sub(r'[^\w], ' ', paragraph) .lower().split() if word not in banned]
대소문자가 섞여 있고, 쉼표 및 구두점을 정제하는 입력값 전처리 작업으로 정규식을 쓴 코드인데
정규식의 r' 이 뭔지 모르겠는 것이다.
이것은 raw string의 표기법이라고 하며, 특수기호(예: 백슬래시)를 해석하지 않고 남겨두는 역할을 한다고 한다.
백슬래시를 두번씩 사용해서 지저분해 보일 수 있는 불편함을 해소하기 위해 보통 사용하나보다.
참고 블로그 : https://newpower.tistory.com/116
'알고리즘 > Python' 카테고리의 다른 글
sort 와 lambda의 조합식 (0) 2021.12.12