본문 바로가기
데이터 이해하기/데이터 다루기

[Python] glob.glob() 함수 사용하기

by ag_zero 2022. 8. 23.
728x90

glob.glob() 함수는 파라미터에 명시된 저장 경로와 패턴에 해당하는 파일명을 리스트 형식으로 반환한다.   (단, 조건에 정규식을 사용할 수 없으며 *와 ? 같은 와일드카드만 지원한다.)

 

'*' 사용하기

'*'는 임의의 길이의 모든 문자열을 의미한다.

 

all_input_list = glob.glob('train_input/*.csv')

: train_input 폴더에 csv 파일들의 이름만 all_input_list에 리스트에 저장된다.

 

 

 

 

'?' 사용하기

'?'는 한자리의 문자열을 의미한다.

some_input_list = glob.glob('train_input/CASE_?.csv')

: dir폴더에 CASE_.csv 파일들의 이름만 some_input_list에 리스트에 저장된다.

 

하위 디렉토리 탐색하기

recursive=True로 설정하고 '**'를 사용하면 모든 하위 디렉토리까지 탐색한다.
기본값은 False이며, 파일이 너무 많을 경우에 사용하면 과도한 cost가 소모된다고 한다.

 

file_path = glob.glob('dir/**', recursive=True)

: dir와 하위 폴더의 모든 파일들의 이름이 file_path에 리스트에 저장된다.