본문 바로가기
카테고리 없음

문자 분리하기

by ag_zero 2021. 11. 11.
728x90

 

split()

'.'을 기준으로 문자를 분리하기 위해 split()은 사용한다.

'강아지1.jpg'.split('.')

[ '강아지1', 'jpg' ]

 

위와 같은 출력값에서 앞에 첫번째 문자 출력을 해본다.

'강아지1.jpg'.split('.')[0]

'강아지1'

 

 

re.split()

위와 같은 방법으로 할 수 있지만 re를 사용해서 더 간편하게 문자를 분리 할 수 있다.

import re

 

0-9까지의 숫자를 기준으로 문자를 분리한다.

re.split('[0-9]','강아지1.jpg')

[ '강아지1', 'jpg' ]

 

 

만약 숫자가 여러개가 있다면 아래와 같은 결과값이 나온다.

re.split('[0-9]','강아지123.jpg')

[ '강아지1', ' ', ' ' ,'jpg' ]

 

 

TIP)  +를 붙이게 되면 아래와 같이 깔끔하게 출력을 할 수 있다. (+ : 한개 이상의 기준문자를 기준으로 분리)

re.split('[0-9]+','강아지123.jpg')

[ '강아지1', 'jpg' ]

 

 

 

아래와 같은 test 문자열이 있을 때 각 문자를 기준으로 분리해보자

test='가나다 abc ABC ㄱㄴㄷ ^*,!! 12 3435'

 

 

'[a-zA-Z가-힣0-9]+'를 사용하면 아래와 같이 각 문자들을 기준으로 분리된다.

re.findall('[a-zA-Z가-힣0-9]+',test)