ts视频文件的爬取与合并

一.爬取 ts 视频文件

"""
爬取 ts 视频文件
"""
import urllib.request
import urllib.parse

# 保存到的文件夹
dir_path = "F:/ts_file/"
# ts视频流的基础路径
base_url = "https://ts_test/file_stream/"
# 文件名的通用部分
base_name = "ts_streem%s.ts"

# 分析ts视频流文件名称规律,  比如后缀是按数字排序的, 依次爬取(具体问题具体分析)
for i in range(0, 7104):
    name_num = '%06d' % i
    name = base_name % name_num
    print(name)
    urllib.request.urlretrieve(base_url + name, "%s%s" % (dir_path, name))

二.将多个ts文件合并为一个

"""
合并 ts 文件
"""
import os


base_path = "F:/"
dir_name = "ts_file"

path = '%s%s' % (base_path, dir_name)

# 目标文件夹
save_path = 'marge'

# 获取ts文件目录
file_list = os.listdir(path)
# 按后缀数字排序ts文件
file_list.sort(key=lambda x: int(x[10:len(x) - 3]))


# 保存目标目录如果不存在则创建
if not os.path.exists(save_path):
    os.mkdir(save_path)

# 以二进制打开目标文件
target = open(save_path + '/' + dir_name + '.ts', "ab+")
# 依次将数据写入目标文件
for temp in file_list:
    temp_file = open(path + '/' + temp, "rb+")
    target.write(temp_file.read())
    temp_file.close()
    print(temp)
    
target.close()

你可能感兴趣的:(python,爬虫,ts文件爬取,ts文件合并)