728x90
split()
'.'을 기준으로 문자를 분리하기 위해 split()은 사용한다.
'강아지1.jpg'.split('.')
[ '강아지1', 'jpg' ]
위와 같은 출력값에서 앞에 첫번째 문자 출력을 해본다.
'강아지1.jpg'.split('.')[0]
'강아지1'
re.split()
위와 같은 방법으로 할 수 있지만 re를 사용해서 더 간편하게 문자를 분리 할 수 있다.
import re
0-9까지의 숫자를 기준으로 문자를 분리한다.
re.split('[0-9]','강아지1.jpg')
[ '강아지1', 'jpg' ]
만약 숫자가 여러개가 있다면 아래와 같은 결과값이 나온다.
re.split('[0-9]','강아지123.jpg')
[ '강아지1', ' ', ' ' ,'jpg' ]
TIP) +를 붙이게 되면 아래와 같이 깔끔하게 출력을 할 수 있다. (+ : 한개 이상의 기준문자를 기준으로 분리)
re.split('[0-9]+','강아지123.jpg')
[ '강아지1', 'jpg' ]
아래와 같은 test 문자열이 있을 때 각 문자를 기준으로 분리해보자
test='가나다 abc ABC ㄱㄴㄷ ^*,!! 12 3435'
'[a-zA-Z가-힣0-9]+'를 사용하면 아래와 같이 각 문자들을 기준으로 분리된다.
re.findall('[a-zA-Z가-힣0-9]+',test)