정규표현식은 R 또는 Python에서만 사용하는 표현 방법이 아니라 기본적으로 프로그래밍에서 사용하게 된다. 가령, 어떤 사람의 정보가 홍길동 010-0000-0000 email@email.co.kr 와 같이 나뉜 text라면 email 주소를 찾아내고 싶을 때 쓸 수 있는 방법으로 정규표현식을 이용한 전처리 방법이 된다. R과 Python을 사용하고 있어 두 프로그램 상에서는 테스트 완료 후 글을 작성하였으나, 다른 프로그램에선 테스트하지 않았으므로 테스트가 필요할 수 있습니다. R에서 정규표현식(regex)를 사용하려면 아래 링크를 참조한다. [비정형 데이터 전처리를 위한 함수] 이 글에서는 Python을 기반으로 정규표현식을 적용해 나타나는 결과와 해석을 작성한다. 정규표현식 적용을 위해 기본 mo..