공부/Python
Python requests.get으로 파일 다운로드 시 미리 파일명 확인하는 방법
빛나는나무
2023. 12. 31. 14:34
파일을 다운로드할 때 파일명을 미리 확인하는 것은 HTTP 헤더를 통해 가능합니다. 일반적으로 웹 서버는 Content-Disposition 헤더를 사용하여 클라이언트에게 전송된 파일의 이름을 제공합니다.
다음은 requests 라이브러리를 사용하여 파일을 다운로드하고, Content-Disposition 헤더를 확인하여 파일명을 얻는 간단한 예제입니다.
import requests
from urllib.parse import unquote
url = 'http://8.8.8.8/example.zip'
response = requests.get(url)
# 파일명 확인
content_disposition = response.headers.get('Content-Disposition')
if content_disposition:
# Content-Disposition 헤더에서 파일명 추출
_, params = content_disposition.split(';')
filename_param = next((s.strip() for s in params.split(',') if s.startswith('filename=')), None)
if filename_param:
# 파일명이 URL 인코딩 되어있을 수 있으므로 디코딩
filename = unquote(filename_param.split('=')[1])
else:
# Content-Disposition 헤더에 filename 파라미터가 없는 경우, 기본 파일명 사용
filename = 'downloaded_file'
else:
# Content-Disposition 헤더가 없는 경우, 기본 파일명 사용
filename = 'downloaded_file'
# 파일 다운로드
with open(filename, 'wb') as file:
file.write(response.content)
print(f"File '{filename}' downloaded successfully.")
이 코드는 Content-Disposition 헤더를 확인하고, 해당 헤더에서 파일명을 추출합니다. 만약 헤더에 filename 파라미터가 없는 경우에는 기본적으로 “downloaded_file”로 설정합니다. 파일명이 URL 인코딩 되어있을 수 있으므로, urllib.parse.unquote 함수를 사용하여 디코딩합니다.
실제로는 서버가 Content-Disposition 헤더를 어떻게 설정했느냐에 따라 다를 수 있으므로, 상황에 맞게 코드를 수정해야 합니다.