python 如何将视频文件的语音转换为文字

文章目录

  • :rose: python 如何提取视频/音频中的文字
    • :four_leaf_clover: 讯飞认证
    • :four_leaf_clover: 视频转换为音频
    • :four_leaf_clover: 利用讯飞接口提取音频文字
    • :four_leaf_clover:文字保存到本地

python 如何提取视频/音频中的文字

最近在观看学习视频,做笔记时遇到一个痛点,需要反复一段一段的去看视频,再手敲整理笔记 。想着有没有可以免费的转换工具或者软件,就去网上搜了一下,发现大多数软件都会限定视频时长,超出收费。

本意白嫖,收费就太见外了。几经周转,了解到讯飞语音有语音解析的功能,在 讯飞开发平台中找到了语音转文字的接口,关键免费。

python 如何将视频文件的语音转换为文字_第1张图片
梳理一下需求:

  • 讯飞认证
  • 视频转换为音频
  • 利用讯飞接口提取音频文字
  • 结果保存到本地

讯飞认证

  • 注册用户

    进入 讯飞开发平台主页,注册登录后。点击语音转写。

python 如何将视频文件的语音转换为文字_第2张图片

  • 领取时长

    领取免费时长,期限一年(企业50小时、个人5小时)
    5小时不够用的话可换个账号。

python 如何将视频文件的语音转换为文字_第3张图片

  • 创建应用

    创建应用后会得到APPID和密钥
    该 id 和密钥在接口代码中需要使用

python 如何将视频文件的语音转换为文字_第4张图片

  • 了解API使用

    • 新版本API文档(本次使用)
    • 老版本API文档

python 如何将视频文件的语音转换为文字_第5张图片
准备就绪…

视频转换为音频

采用python中moviepy.editor包中的AudioFileClip类,将视频文件转换为音频文件。

from moviepy.editor import AudioFileClip
dataMovieMp4 = AudioFileClip(r"*****.mp4")
dataMovieMp4.write_audiofile(r"*****.mp3")

在这里插入图片描述

利用讯飞接口提取音频文字

  • 下载接口 demo 代码

    语音转写(新版) demo java语言
    语音转写(新版) demo python语言 (本次采用)

  • 替换代码中的 APPID、密钥
    api = RequestApi(appid="xxxxx", secret_key="xxx", upload_file_path=r"xxxxx.mp3")
    

在这里插入图片描述

  • 自定义结果解析

    # 自定义解析函数
    data_str = api.analysis_json_lattice2(data_voice_to_str_result)
    

文字保存到本地

  • 存到本地txt

    # 数据存储到本地
    with open(r"xxxxx\CDP.txt", 'w') as f:
    	f.write(data_str)
    

python 如何将视频文件的语音转换为文字_第6张图片


目前还有免费时长,可帮忙转换哦!
需帮转换或者需要详细解析代码请关注公众号:小甘技术栈

python 如何将视频文件的语音转换为文字_第7张图片

你可能感兴趣的:(工具,语音识别,人工智能)