E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
语音播报
专业技术计算机应用能力考试ppt2007,全国专业技术人员计算机应用能力考试系列教材——PowerPoint 2003中文演示文稿...
全国专业技术人员计算机应用能力考试系列教材——PowerPoint2003中文演示文稿
语音
编辑锁定讨论上传视频全国专业技术人员计算机应用能力考试系列教材——PowerPoint2003中文演示文稿,由机械工业出版社出版
Bloodysteve
·
2025-02-01 11:33
AIGC产品数字人 –【字形绘梦】之绘声
最近貌似它们新增了一个
语音
还是视频的能力叫【绘声】,简单的试用之后觉得还行,给大家分享下先上效果:PT3-11绘文模块使用方法:打开主界面,点选角色或者自定义图片,选择默认文案或者字形输入,点击生成。
拉达曼迪斯II
·
2025-02-01 08:39
AI创业
WebRTC
AIGC学习
人工智能
音视频
AIGC
SD
数字人
微信小程序
字形绘梦
基于深度学习的大规模模型训练
基于深度学习的大规模模型训练涉及训练具有数百万甚至数十亿参数的深度神经网络,以处理复杂的任务,如自然语言处理、计算机视觉和
语音
识别。
SEU-WYL
·
2025-02-01 07:56
深度学习dnn
深度学习
人工智能
dnn
机器学习笔记 - 将音频转换为图像进行分类的机器学习模型
一、简述
语音
识别技术是将音频信号转化为文本的过程。其基本原理如下:1.音频录制:首先需要对口语发音进行录制,并将其转化为数字形式的音频文件。
坐望云起
·
2025-02-01 00:32
深度学习从入门到精通
机器学习
深度学习
语音识别
光谱图
Whisper
python 使用Whisper模型进行
语音
翻译
Whisper是由OpenAI开源的一个自动
语音
识别(AutomaticSpeechRecognition,ASR)系统。它的主要特点是:多语言支持:它本身就能识别几十种语言,包括中文。
哦里 哦里哦里给
·
2025-01-31 15:16
AI
大语言模型实战
python
whisper
讯飞智作 AI 配音技术浅析(一)
一、核心技术讯飞智作AI配音技术作为科大讯飞在人工智能领域的重要成果,融合了多项前沿技术,为用户提供了高质量的
语音
合成服务。
爱研究的小牛
·
2025-01-31 14:42
AIGC—技术综述
AIGC—概述
AIGC—音频
人工智能
AIGC
机器学习
深度学习
DeepSeek-R1:多模态AGI的实践突破与场景革命
一、DeepSeek-R1的核心定位DeepSeek-R1是深度求索(DeepSeek)研发的多模态通用人工智能模型,旨在突破单一模态的局限性,实现文本、图像、
语音
、视频等跨模态信息的深度理解、推理与生成
热爱分享的博士僧
·
2025-01-31 14:09
agi
物联网的应用——智能家居篇
以下是智能家居在物联网中应用的详细分析:远程操控:用户可以通过手机APP、
语音
助手等方式,实现对家中各种智能设备的远程操控。例如,用户可以远程打开或关闭家中的灯光、空调、窗帘等设备,无需亲自到场操作。
L5678Ling
·
2025-01-31 13:22
物联网
智能家居
人工智能
**探索阿里云百炼 —— 演绎
语音
新未来**
探索阿里云百炼——演绎
语音
新未来alibabacloud-bailian-speech-demoSampleRepositoryfortheAlibabaCloudBailianSpeechSDK项目地址
霍日江Eagle-Eyed
·
2025-01-31 06:56
AI 大模型创业:如何利用商业优势?
这些模型通常具有数十亿甚至千亿个参数,能够实现从自然语言处理到计算机视觉、
语音
识别等广泛领域的任务。
AI天才研究院
·
2025-01-30 21:46
大数据AI人工智能
ChatGPT
java
python
javascript
kotlin
golang
架构
人工智能
大厂程序员
硅基计算
碳基计算
认知计算
生物计算
深度学习
神经网络
大数据
AIGC
AGI
LLM
系统架构设计
软件哲学
Agent
程序员实现财富自由
最新版pyvideotrans3.46整合包,将视频从一种语言翻译为另一种语言,同时支持
语音
识别转录、
语音
合成、字幕翻译,AI自动视频翻译配音加字幕软件,解压即用
GitHub-jianchang512/pyvideotrans:Translatethevideofromonelanguagetoanotherandadddubbing.将视频从一种语言翻译为另一种语言,同时支持
语音
识别转录
struggle2025
·
2025-01-30 19:55
人工智能
语音识别
机器学习
自然语言处理
语言模型
OpenAI 函数调用 功能入门
Javascript版Langchain入门作者:AI小火箭的HB我是AI小火箭的HB,我探索和写作人工智能和语言交叉点的所有事物,范围从LLM,聊天机器人,
语音
机器人,开发框架,以数据为中心的潜在空间等
AI火箭
·
2025-01-30 16:57
chatgpt
openai
Synthesia技术浅析(四):自然语言处理
Synthesia的自然语言处理(NLP)模块是其核心技术之一,涵盖了文本转
语音
(TTS)、情感分析以及多语言支持等多个方面。
爱研究的小牛
·
2025-01-30 12:28
AIGC—视频
AIGC—虚拟现实
AIGC—自然语言处理
自然语言处理
人工智能
AIGC
AI学习指南Ollama篇-Ollama的多模态应用探索
AI学习指南应用篇-Ollama的多模态应用探索一、引言(一)背景介绍随着大语言模型(LLM)的发展,多模态应用(结合文本、图像、
语音
等)成为新的趋势。
俞兆鹏
·
2025-01-30 09:04
AI学习指南
ai
原生微信小程序开发踩坑
微信同声传异插件支持30s左右的音频官网的插件
语音
识别只能支持30s左右的音频,长时间不可以,建议使用循环调用该方法。
Goat恶霸詹姆斯
·
2025-01-30 09:01
原生微信小程序
机器学习Day01
机器学习学习方法基于规则的学习:程序员根据自己经验定义规则基于模型的学习:由于某些事物,问题无法可以定义明确的规则,如:图片,
语音
酒脑猫
·
2025-01-30 02:06
机器学习
人工智能
推荐开源神器:video-srt — 自动识别视频
语音
并生成字幕
推荐开源神器:video-srt—自动识别视频
语音
并生成字幕去发现同类优质开源项目:https://gitcode.com/在数字媒体制作和在线教育领域,自动字幕生成是一个巨大的需求。
赵鹰伟Meadow
·
2025-01-30 01:02
推荐开源神器:Autosub——自动字幕生成器
项目介绍Autosub是一个高效实用的工具,专门用于自动
语音
任轶眉Tracy
·
2025-01-30 01:02
微信开始测试 “用系统电话接听” 功能
功能优势便捷操作:用户在接到
语音
或视频通话时,将会看到“接听”和“挂断”两个按钮,无需进入应用内即可在锁屏状态下轻松通过弹窗
timer_017
·
2025-01-29 22:12
开源
2025 最新flutter面试总结
4.简述Dart
语音
特性5.Navigator是什么?在Flutter中Routes是什么?6、Dart是不是单线程模型?是如何运行的?7.解释StatefulWidgetLifecycle?
@福者
·
2025-01-29 09:36
Flutter
flutter
面试
职场和发展
AI如何帮助解决生活中的琐碎难题?
从
语音
助手到智能家居,从健康管理到购物推荐,AI正在帮助人们处理生活中的琐碎事务,让每一天变得更高效、更轻松。只需要动动嘴或者点一点手机,就能完成过去
HUIBUR科技
·
2025-01-29 07:53
人工智能
2025年1月27日人工智能与科技新闻:DeepSeek震撼全球科技市场
技术创新与突破全新语言处理架构:提升AI理解和生成能力超越传统模型的认知能力:实现更精准的自然语言推理多模态交互:支持文本、图像、
语音
等多维
海棠AI实验室
·
2025-01-28 15:03
AI
瞭望塔
人工智能
科技
Silero VAD 开源项目教程
SileroVAD开源项目教程项目地址:https://gitcode.com/gh_mirrors/si/silero-vad项目介绍SileroVAD是一个预训练的企业级
语音
活动检测器(VoiceActivityDetector
苏鹃咪Healthy
·
2025-01-28 14:55
FSMN-VAD与Silero-VAD
这篇文章主要介绍两种的ASR中的VAD开源模型,第一种就是FSMN-VAD,这个是达摩院
语音
团队提出的高效
语音
端点检测模型,用于检测输入音频中有效
语音
的起止时间点信息。
Wasser.
·
2025-01-28 13:23
python
语音识别
随笔十七、eth0单网卡绑定双ip的问题
在调试
语音
对讲过程中遇到过一个“奇怪”问题:泰山派作为一端,可以收到对方发来的
语音
,而对方不能收到泰山派发出的
语音
。
单片机社区
·
2025-01-28 13:22
立创泰山派随笔
智能路由器
网络协议
udp
嵌入式硬件
网络
#深度学习:从基础到实践
它通过构建由多个隐藏层组成的神经网络模型,能够从海量数据中自动学习特征和表征,在图像识别、自然语言处理、
语音
识别等领域取得了突破性进展。
single_ffish
·
2025-01-28 07:41
深度学习
gpt
神经网络
生成对抗网络
1024程序员节
Python 录音转文字
importspeech_recognitionassr#创建
语音
识别器r=sr.Recognizer()#从录音文件读取音频withsr.AudioFile('audio_file.wav')assource
@小张不嚣张
·
2025-01-27 23:43
python
开发语言
python如何实现音频转文本(使用百度
语音
转文本库)
1pipinstallBaidu-Aip2在百度开放平台上注册账号,并在控制台中创建应用,选择短
语音
转文本应用,有几万次的免费配额,超过次数需要付费(价格贵),如图是我自己的注意事项:1,音频文件不能是
xiaojiawen
·
2025-01-27 23:43
python
开发语言
python实现
语音
转文本
1.介绍本文将介绍Python调用第三方
语音
识别API实现
语音
转文本的方法,这里使用到的是百度
语音
识别API.学习到如何使用该API后,你可以在你的项目中添加
语音
转文本的功能.文章创作不易,期待你的与⭐
一只程序猿子
·
2025-01-27 23:11
Python项目
python
xcode
开发语言
Unreal Engine 4
语音
识别插件:Sphinx-UE4
UnrealEngine4
语音
识别插件:Sphinx-UE4sphinx-ue4AspeechrecognitionpluginforUnrealEngine4.ThisisessentiallyaportofPocketsphinx
林泽炯
·
2025-01-27 23:38
Sphinx-UE4
语音
识别插件使用教程
Sphinx-UE4
语音
识别插件使用教程sphinx-ue4AspeechrecognitionpluginforUnrealEngine4.ThisisessentiallyaportofPocketsphinx
嵇子高Quintessa
·
2025-01-27 23:38
【UE插件】Sphinx关键词
语音
识别
视频教程:UnrealEngine-SpeechRecognition-FreePluginhttps://www.youtube.com/watch?v=KBcXNnSdWog&t=622s官方教程:Sphinx:SpeechRecognitionPlugin|UnrealEngineCommunityWikihttps://unrealcommunity.wiki/speech-recogni
我的巨剑能轻松搅动潮汐
·
2025-01-27 22:04
UE插件
ue5
数字人+虚拟展厅:开启互动展览新篇章!
这些数字人不仅在外形上栩栩如生,还能通过自然语言处理、
语音
识别与合成等技术实现与人类的实时交互,模拟出真实的人际对话和情感表达。展厅应用的优势增强互动性:数字人作为展厅的虚
jimumeta
·
2025-01-27 08:34
3D
行业资讯
人工智能
vr
ar
虚拟展厅
3D展厅
【计算机硬件】科普五类、六类、七类网线的区别
五类线:超五类用于
语音
传输和最高传输速率为100Mbps的数据传输,主要用于100BASE-T和10BASE
AI云极
·
2025-01-27 00:39
【计算机硬件】
网络
计算机网络
本地部署,edge-tts文本转
语音
解决方案
edge-tts库:docker安装未来展望总结https://github.com/rany2/edge-ttshttps://github.com/rany2/edge-tts随着科技的进步,文本转
语音
DaGod123
·
2025-01-27 00:35
一键部署AI大模型
语音识别
人工智能
文字转语音
python
语音
识别
在python中训练一个
语音
识别系统主要需要以下几个步骤:-语料库准备-数据预处理-特征提取-训练模型第一部分:语料库的准备什么是语料库?语料库长什么样?
柚梓sir
·
2025-01-26 19:01
神经网络
语音识别
人工智能
【Python高阶篇】探索人工智能:使用Python构建一个简单的聊天机器人
它通过模拟人类思考过程和智能行为来实现对复杂任务的自主处理和学习,已经被广泛应用于许多领域,包括
语音
识别、自然语言处理、机器人技术、图像识别和推荐系统等。
码农必胜客
·
2025-01-26 08:37
python
人工智能
机器人
Java实现音频转文本(
语音
识别)
在Java中实现音频转文本(也称为
语音
识别或ASR)通常涉及使用专门的
语音
识别服务,如GoogleCloudSpeech-to-Text、IBMWatsonSpeechtoText、AmazonTranscribe
Tech Synapse
·
2025-01-26 06:20
java
音视频
语音识别
自然语言处理(NLP)-总览图学习
文章目录自然语言处理(NLP)-总览图学习1.一张总览图的学习1.
语音
学(Phonology)2.形态学(Morphology)3.句法学(Syntax)4.语义学(Semantics)5.推理(Reasoning
汤姆和佩琦
·
2025-01-25 16:24
NLP
自然语言处理
学习
人工智能
开发基于WebRTC和OpenAI实时API的AI
语音
助手框架:技术解析与最佳实践
随着人工智能(AI)和实时通信技术的发展,构建一个能够提供即时响应、多语言支持以及个性化用户体验的AI
语音
助手变得越来越重要。
花生糖@
·
2025-01-25 12:59
AIGC学习资料库
webrtc
人工智能
计算机视觉:卷积核
本文重点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种深度学习模型,广泛应用于图像识别、自然语言处理、
语音
识别等领域。在卷积神经网络中,卷积核是网络的核心组件之一。
每天五分钟玩转人工智能
·
2025-01-25 12:23
计算机视觉
计算机视觉
深度学习
人工智能
机器学习
卷积神经网络
【深度学习】常见模型-卷积神经网络(Convolutional Neural Networks, CNN)
卷积神经网络(CNN)概念简介卷积神经网络(ConvolutionalNeuralNetworks,CNN)是一种专门用于处理数据具有网格状拓扑结构(如图像、
语音
)的深度学习模型。
IT古董
·
2025-01-25 10:08
人工智能
深度学习
机器学习
深度学习
cnn
人工智能
2025年国内外AI大模型的API接口网址整理
实时聊天:用于做聊天机器人,比如AI角色扮演、社交陪伴AI,甚至
语音
助手。知识问答:像百科一样快速回答各种问题,或者为特定领域(医疗、法律等)提供专业建议。教育学习:帮助学生做题
weixin_56968280
·
2025-01-25 06:08
人工智能
语言模型
Opus编解码协议入门
126647876目录1.简介2.码率与音质、延时的关系2.1音质与码率比较2.2码率与延时对比3.Opus编解码框架4.DTX非连续传输5.FEC前向纠错1.简介Opus是一种开源免费的音频编解码器,支持音乐和
语音
弱冠少年
·
2025-01-25 02:42
嵌入式软件
嵌入式硬件
Kotlin高仿微信-第13篇-单聊-小视频
Kotlin高仿微信-项目实践58篇详细讲解了各个功能点,包括:注册、登录、主页、单聊(文本、表情、
语音
、图片、小视频、视频通话、
语音
通话、红包、转账)、群聊、个人信息、朋友圈、支付服务、扫一扫、搜索好友
六毛六66
·
2025-01-24 23:49
Kotlin高仿微信
kotlin
android
java
微信
# AI计算模式 神经网络模型 深度神经网络 多层感知机 卷积神经网络 循环神经网络 长短期记忆网络 图像识别、
语音
识别、自然语言 轻量化模型和模型压缩 大模型分布式并行
AI计算模式AI技术发展至今,主流的模型是深度神经网络模型。近20年来,神经网络模型经过多样化的发展,模型总体变得越来越复杂和庞大,对硬件设备的计算速度、存储能力、通信速度的要求越来越高。尽管学者已经提出了许多方法优化模型结构,降低模型的参数量,但是伴随着人们对AI能力的要求越来越高,模型变得更大是不可避免的。原先单CPU可进行模型的训练与推理,如今需要使用GPU、TPU等设备,并通过分布式并行的
EwenWanW
·
2025-01-24 16:59
AGI
人工智能
神经网络
dnn
xiaozhi-esp32 - 基于 ESP32 的 AI 聊天机器人
它通过WebSocket或UDP协议与LLM、TTSAPI服务连接,实现实时
语音
交互功能,无需在设备上运行LLM,支持中文在内的多国语言、
语音
识别用户身份、自定义提示词和音色等功能,兼容多款ESP32开发板
小众AI
·
2025-01-24 13:02
AI开源
开源
人工智能
AI编程
新质生产力与核心竞争力提升
从自动驾驶汽车到智能
语音
助手,从个性化推荐系统到医疗诊断辅助,AI技术的应用场景日益广泛,为人类社会带来了前所未有的机遇。然而,AI技术的应用并非一帆风顺。如何有效地利用
AI大模型应用之禅
·
2025-01-24 12:25
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
李开复:苹果发布AI应用的未来
从智能手机的
语音
助手到自动驾驶汽车,AI正在改变着我们的世界。作为科技巨头,苹果也积极布局AI领域,并将其融入到其产品和服务中。
AI大模型应用之禅
·
2025-01-24 12:25
计算机软件编程原理与应用实践
java
python
javascript
kotlin
golang
架构
人工智能
WebRTC协议学习之一(WebRTC简介)
什么WebRTCWebRTC,名称源自网页即时通信(英语:WebReal-TimeCommunication)的缩写,是一个支持网页浏览器进行实时
语音
对话或视频对话的API。
音视频开发老马
·
2025-01-24 11:51
webrtc
学习
网络
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他