Kaggle API로 데이터 다운로드 하기

1. Kaggle API 설치

pip install kaggle

2. Kaggle API Token 다운로드

캐글 프로필을 눌러서 Account 탭에 들어간 후 스크롤을 아래로 조금 내리면 Create New API Token 버튼이 있음

버튼을 눌러 kaggle.json 파일을 정해진 경로에 저장

(1) 윈도우

C:\Users\윈도우사용자명\.kaggle 에 저장

(2) Mac / Linux

~/.kaggle 에 저장

3. 데이터셋 다운로드

캐글 컴피티션에서 Data 탭을 보면 API 커맨드가 나와있다.

kaggle competitions download -c ieee-fraud-detection

위의 커맨드를 실행하면 커맨드를 실행한 경로에 압축폴더로 파일이 저장되는데, 직접 압축을 풀어줘도 되고 파이썬 코드를 사용하여 풀고 싶으면 아래 코드를 참고하여 압축을 풀어주면 된다.

import os
zip_file_dir = os.path.join(os.getcwd(), 'ieee-fraud-detection.zip')
unzip_dir = os.getcwd()

import zipfile
with zipfile.ZipFile(zip_file_dir, 'r') as zip_ref:
    zip_ref.extractall(unzip_dir)