728x90
glob.glob() 함수는 파라미터에 명시된 저장 경로와 패턴에 해당하는 파일명을 리스트 형식으로 반환한다. (단, 조건에 정규식을 사용할 수 없으며 *와 ? 같은 와일드카드만 지원한다.)
'*' 사용하기
'*'는 임의의 길이의 모든 문자열을 의미한다.
all_input_list = glob.glob('train_input/*.csv')
: train_input 폴더에 csv 파일들의 이름만 all_input_list에 리스트에 저장된다.
'?' 사용하기
'?'는 한자리의 문자열을 의미한다.
some_input_list = glob.glob('train_input/CASE_?.csv')
: dir폴더에 CASE_.csv 파일들의 이름만 some_input_list에 리스트에 저장된다.
하위 디렉토리 탐색하기
recursive=True로 설정하고 '**'를 사용하면 모든 하위 디렉토리까지 탐색한다.
기본값은 False이며, 파일이 너무 많을 경우에 사용하면 과도한 cost가 소모된다고 한다.
file_path = glob.glob('dir/**', recursive=True)
: dir와 하위 폴더의 모든 파일들의 이름이 file_path에 리스트에 저장된다.
'데이터 이해하기 > 데이터 다루기' 카테고리의 다른 글
파이썬 csv파일 다루기(읽기, 쓰기, 수정, 추가) (0) | 2022.07.29 |
---|---|
!mkdir(폴더 생성하기), !wget(데이터 불러오기) (0) | 2021.11.29 |
[데이터 수집] 공공데이터 API - Requests, Beautiful Soup 사용하기 (0) | 2021.11.19 |
파이썬 이미지 파일, 경로 처리하기 - os, Pillow (0) | 2021.11.11 |
집합 자료형 차집합 difference(), 합집합 union() , 교집합 intersection(() (0) | 2021.11.01 |