当下载大对象时,可能出现网络波动等情况导致下载对象失败,TOS Python SDK 提供了重试机制保障下载对象的稳定性,但可能出现多次重试后仍无法完成下载的情况。针对上述情况,TOS Python SDK 提供了断点续传下载的功能,在下载大对象失败后可实现重入。断点续传下载将待下载的对象分割为多个分片,并支持并发下载,待所有分片下载完成后,合并成完整的文件。通过断点续传下载的方式将对象下载到本地文件前,您可以设置分片大小、下载分片的线程数、下载时客户端限速、事件回调函数等。同时也能在断点续传下载任务执行过程中,取消该任务。
tos:GetObject
权限,具体操作,请参见权限配置指南。tos:GetObjectVersion
权限,具体操作,请参见权限配置指南。以下代码用于断点续传下载桶 bucket-test
中对象 object-test
到本地文件中,若在下载过程中抛出 TosClientError 异常并且错误为网络超时则可以相同参数调用 download_file,实现断点续传下载重入。
import os
import tos
# 从环境变量获取 AK 和 SK 信息。
ak = os.getenv('TOS_ACCESS_KEY')
sk = os.getenv('TOS_SECRET_KEY')
# your endpoint 和 your region 填写Bucket 所在区域对应的Endpoint。# 以华北2(北京)为例,your endpoint 填写 tos-cn-beijing.volces.com,your region 填写 cn-beijing。
endpoint = "your endpoint"
region = "your region"
bucket_name = "bucket-test"
# 对象名称,例如 example_dir 下的 example_object.txt 文件,则填写为 example_dir/example_object.txt
object_key = "object-test"
# 本地文件完整路径,例如usr/local/testfile.txt
file_path = "/usr/local/testfile.txt"
try:
# 创建 TosClientV2 对象,对桶和对象的操作都通过 TosClientV2 实现
client = tos.TosClientV2(ak, sk, endpoint, region)
client.download_file(bucket_name, object_key, file_path,
# 通过可选参数part_size配置下载时分片大小,默认为20mb
part_size=1024 * 1024 * 20,
# 通过可选参数task_num配置下载分片的线程数,默认为1
task_num=3)
except tos.exceptions.TosClientError as e:
# 操作失败,捕获客户端异常,一般情况为非法请求参数或网络异常
print('fail with client error, message:{}, cause: {}'.format(e.message, e.cause))
except tos.exceptions.TosServerError as e:
# 操作失败,捕获服务端异常,可从返回信息中获取详细错误信息
print('fail with server error, code: {}'.format(e.code))
# request id 可定位具体问题,强烈建议日志中保存
print('error with request id: {}'.format(e.request_id))
print('error with message: {}'.format(e.message))
print('error with http code: {}'.format(e.status_code))
print('error with ec: {}'.format(e.ec))
print('error with request url: {}'.format(e.request_url))
except Exception as e:
print('fail with unknown error: {}'.format(e))
以下代码用于配置断点续传下载进度条功能。
import os
import tos
from tos import DataTransferType
# 从环境变量获取 AK 和 SK 信息。
ak = os.getenv('TOS_ACCESS_KEY')
sk = os.getenv('TOS_SECRET_KEY')
# your endpoint 和 your region 填写Bucket 所在区域对应的Endpoint。# 以华北2(北京)为例,your endpoint 填写 tos-cn-beijing.volces.com,your region 填写 cn-beijing。
endpoint = "your endpoint"
region = "your region"
bucket_name = "bucket-test"
# 对象名称,例如 example_dir 下的 example_object.txt 文件,则填写为 example_dir/example_object.txt
object_key = "object-test"
# 本地文件完整路径,例如usr/local/testfile.txt
file_path = "/usr/local/testfile.txt"
try:
# 创建 TosClientV2 对象,对桶和对象的操作都通过 TosClientV2 实现
client = tos.TosClientV2(ak, sk, endpoint, region)
def percentage(consumed_bytes, total_bytes, rw_once_bytes, type: DataTransferType):
if total_bytes:
rate = int(100 * float(consumed_bytes) / float(total_bytes))
print("rate:{}, consumed_bytes:{},total_bytes{}, rw_once_bytes:{}, type:{}".format(rate, consumed_bytes,
total_bytes,
rw_once_bytes, type))
client.download_file(bucket_name, object_key, file_path,
# 通过可选参数part_size配置下载时分片大小,默认为20mb
part_size=1024 * 1024 * 20,
# 通过可选参数task_num配置下载分片的线程数,默认为1
task_num=3,
# 通过可选参数data_transfer_listener配置进度条
data_transfer_listener=percentage)
except tos.exceptions.TosClientError as e:
# 操作失败,捕获客户端异常,一般情况为非法请求参数或网络异常
print('fail with client error, message:{}, cause: {}'.format(e.message, e.cause))
except tos.exceptions.TosServerError as e:
# 操作失败,捕获服务端异常,可从返回信息中获取详细错误信息
print('fail with server error, code: {}'.format(e.code))
# request id 可定位具体问题,强烈建议日志中保存
print('error with request id: {}'.format(e.request_id))
print('error with message: {}'.format(e.message))
print('error with http code: {}'.format(e.status_code))
print('error with ec: {}'.format(e.ec))
print('error with request url: {}'.format(e.request_url))
except Exception as e:
print('fail with unknown error: {}'.format(e))
以下代码用于自定义断点续传下载回调函数。
import os
import tos
from tos import DownloadEventType
# 从环境变量获取 AK 和 SK 信息。
ak = os.getenv('TOS_ACCESS_KEY')
sk = os.getenv('TOS_SECRET_KEY')
# your endpoint 和 your region 填写Bucket 所在区域对应的Endpoint。# 以华北2(北京)为例,your endpoint 填写 tos-cn-beijing.volces.com,your region 填写 cn-beijing。
endpoint = "your endpoint"
region = "your region"
bucket_name = "bucket-test"
# 对象名称,例如 example_dir 下的 example_object.txt 文件,则填写为 example_dir/example_object.txt
object_key = "object-test"
# 本地文件完整路径,例如usr/local/testfile.txt
file_path = "/usr/local/testfile.txt"
try:
# 创建 TosClientV2 对象,对桶和对象的操作都通过 TosClientV2 实现
client = tos.TosClientV2(ak, sk, endpoint, region)
# 用户自定义事件回调函数
def download_event(type: DownloadEventType, err, bucket, key, version_id, file_path, checkpint_file, tmp_file,
download_part):
print(type, err, bucket, key, version_id, file_path, checkpint_file, tmp_file, download_part)
client.download_file(bucket_name, object_key, file_path,
# 通过可选参数part_size配置下载时分片大小,默认为20mb
part_size=1024 * 1024 * 20,
# 通过可选参数task_num配置下载分片的线程数,默认为1
task_num=3,
# 通过可选参数data_transfer_listener配置进度条
download_event_listener=download_event)
except tos.exceptions.TosClientError as e:
# 操作失败,捕获客户端异常,一般情况为非法请求参数或网络异常
print('fail with client error, message:{}, cause: {}'.format(e.message, e.cause))
except tos.exceptions.TosServerError as e:
# 操作失败,捕获服务端异常,可从返回信息中获取详细错误信息
print('fail with server error, code: {}'.format(e.code))
# request id 可定位具体问题,强烈建议日志中保存
print('error with request id: {}'.format(e.request_id))
print('error with message: {}'.format(e.message))
print('error with http code: {}'.format(e.status_code))
print('error with ec: {}'.format(e.ec))
print('error with request url: {}'.format(e.request_url))
except Exception as e:
print('fail with unknown error: {}'.format(e))
以下代码用于设置断点续传下载客户端限速。
import os
import tos
from tos import DownloadEventType
# 从环境变量获取 AK 和 SK 信息。
ak = os.getenv('TOS_ACCESS_KEY')
sk = os.getenv('TOS_SECRET_KEY')
# your endpoint 和 your region 填写Bucket 所在区域对应的Endpoint。# 以华北2(北京)为例,your endpoint 填写 tos-cn-beijing.volces.com,your region 填写 cn-beijing。
endpoint = "your endpoint"
region = "your region"
bucket_name = "bucket-test"
# 对象名称,例如 example_dir 下的 example_object.txt 文件,则填写为 example_dir/example_object.txt
object_key = "object-test"
# 本地文件完整路径,例如usr/local/testfile.txt
file_path = "/usr/local/testfile.txt"
try:
# 创建 TosClientV2 对象,对桶和对象的操作都通过 TosClientV2 实现
client = tos.TosClientV2(ak, sk, endpoint, region)
# 通过可选参数rate_limiter配下载下载对象客户端限制速
# TOS Python SDK 通过最基本的令牌桶算法实现了客户端限速,其中rate为发送令牌的速率,capacity为总容量
# 以下配置的意义为5 MB/s的平均上传速率,最高支持 10 + 5 MB/s的下载速率
rate_limiter = tos.RateLimiter(rate=5 * 1024 * 1024, capacity=10 * 1024 * 1024)
client.download_file(bucket_name, object_key, file_path,
# 通过可选参数part_size配置下载时分片大小,默认为20mb
part_size=1024 * 1024 * 20,
# 通过可选参数task_num配置下载分片的线程数,默认为1
task_num=3,
# 通过可选参数rate_limiter配置客户端限速
rate_limiter=rate_limiter)
except tos.exceptions.TosClientError as e:
# 操作失败,捕获客户端异常,一般情况为非法请求参数或网络异常
print('fail with client error, message:{}, cause: {}'.format(e.message, e.cause))
except tos.exceptions.TosServerError as e:
# 操作失败,捕获服务端异常,可从返回信息中获取详细错误信息
print('fail with server error, code: {}'.format(e.code))
# request id 可定位具体问题,强烈建议日志中保存
print('error with request id: {}'.format(e.request_id))
print('error with message: {}'.format(e.message))
print('error with http code: {}'.format(e.status_code))
print('error with ec: {}'.format(e.ec))
print('error with request url: {}'.format(e.request_url))
except Exception as e:
print('fail with unknown error: {}'.format(e))
以下代码用于在运行时取消正在执行的断点续传上传任务。
import time
from threading import Thread
import os
import tos
from tos.checkpoint import CancelHook
from tos.exceptions import TosClientError
# 从环境变量获取 AK 和 SK 信息。
ak = os.getenv('TOS_ACCESS_KEY')
sk = os.getenv('TOS_SECRET_KEY')
endpoint = "your endpoint"
region = "your region"
bucket_name = "bucket-test"
# 对象名称,例如 example_dir 下的 example_object.txt 文件,则填写为 example_dir/example_object.txt
object_key = "object-test"
# 本地文件完整路径,例如usr/local/testfile.txt
file_path = "/usr/local/testfile.txt"
# 创建 TosClientV2 对象,对桶和对象的操作都通过 TosClientV2 实现
client = tos.TosClientV2(ak, sk, endpoint, region)
# 继承 CancelHook 类实现断点续传下载任务取消功能
class MyCancel(CancelHook):
def cancel(self, is_abort: bool):
# is_abort 为 true 时删除上下文信息并 abort 分段上传任务,为 false 时只是中断当前执行
# 重写 cancel 方法时必须调用 父类的 cancel 方法
# 模拟 10 秒后取消任务
time.sleep(10)
super(MyCancel, self).cancel(is_abort=is_abort)
print('some user define')
cancel = MyCancel()
t1 = Thread(target=cancel.cancel, args=(False,))
t1.start()
try:
client.download_file(bucket_name, object_key, file_path,
# 通过可选参数part_size配置下载时分片大小,默认为20mb
part_size=1024 * 1024 * 20,
# 通过可选参数task_num配置下载分片的线程数,默认为1
task_num=3,
# 通过可选参数cancel_hook实现取消机制
cancel_hook=cancel)
except TosClientError as e:
# 若取消断点续传下载任务,将抛出TosClientError,同时message='the task is canceled'
if e.message == 'the task is canceled':
print('the task is canceled')
except Exception as e:
print(e)