E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
听觉
音频被动降噪技术
音频被动降噪技术音频被动降噪技术是一种通过物理结构和材料设计来减少或隔离外部噪声的降噪方式,其核心原理是通过物理屏障或吸声材料来阻断或吸收声波,从而降低环境噪声对
听觉
体验的影响。
悟空胆好小
·
2025-07-12 16:53
音频相关
音视频
AAAI—24—Main—paper(关于Multi—Modal的全部文章摘要)
我们生活在一个由多种模态(Multimodal)信息构成的世界,包括视觉信息、
听觉
信息、文本信息、嗅觉信息等等,当研究的问题或者数据集包含多种这样的模态信息时我们称之为多模态学习多模态机器学习旨在处理学习
·
2025-07-10 14:11
《声音的变形记:Web Audio API的实时特效法则》
用户期待更丰富、更具沉浸感的
听觉
体验时,基于WebAudioAPI实现的实时音频特效,就像是为这片森林注入了灵动的精灵,让简单的声音蜕变为震撼人心的
听觉
盛宴。
程序猿阿伟
·
2025-07-07 23:41
前端
php
开发语言
CLIP之后,多模态模型将如何进化?三大技术路径解析
传统AI系统通常专注于单一模态(如纯文本或纯图像),而人类认知的本质却是多模态的——我们通过视觉、
听觉
、触觉等多种感官协同理解世界。OpenAI于2
老周聊AI
·
2025-07-02 21:14
AI大模型
人工智能
MCP
机器学习
神经网络
深度学习
AI大模型
大模型训练框架
Brduino脑机连载(四)脑电范式软件大全(附源网页)
Psychopy(点击查看源网址)特点:是一款免费的心理学实验设计软件,可用于创建各种脑电实验范式,如视觉、
听觉
、认知等任务。
·
2025-07-02 17:16
(Note)音频向量化表示
这些特征设计依据生理
听觉
模型,在ASR、情感识别等任务中长期有效。但它们仍属浅层特征,无法自动学习更高阶的语言和语音信息,对说话人和环境的鲁棒性有限,通常需配合复杂模型来提高性能。
·
2025-07-01 20:10
基于DWT的音频水印算法
以下是该算法的核心步骤及关键技术点:1.算法基本原理DWT的作用:将音频信号分解为不同频率的子带(近似系数和细节系数),利用人耳
听觉
特性(如对低频敏感、对高频不敏感)选择嵌入位置。
gihigo1998
·
2025-06-19 12:57
音视频
算法
网络
大模型推理优化
**在人工智能的基础模型下,各种推理任务涵盖了多个领域,包括常识推理、数学推理、逻辑推理、因果推理、视觉推理、
听觉
推理、多模态推理和代理推理等等。
slient_love
·
2025-06-16 14:06
AI
人工智能
从单模态到多模态:空间智能新趋势
文章将提供数学建模、算法实现和实际应用案例,展示多模态空间智能如何通过整合视觉、语言、
听觉
等多源信息实现更接近人
AI天才研究院
·
2025-06-16 05:05
ai
AR技术下的电商:虚拟试穿/试用/试戴成新风尚
AR(增强现实),这一前沿技术巧妙地将虚拟信息与现实世界交织在一起,通过视觉、
听觉
乃至触觉等多维度感知,极大地丰富了我们对物理世界的认知。
mirrornan
·
2025-06-15 03:48
3D行业资讯
ar
3d
3D可视化
芯片测试之VIL/VIH(输入电平)Test全解析:从原理到实战
在数字芯片的“沟通体系”中,VIL(输入低电平)和VIH(输入高电平)如同芯片的“
听觉
阈值”,决定了它能否准确识别外部信号的逻辑状态。
鲁棒最小二乘支持向量机
·
2025-06-15 01:59
硅言芯语
半导体
芯片
职场和发展
芯片测试
AE工程师
测试
硬件工程师
分布式光纤传感(DAS)技术应用解析:从原理到落地场景
它将普通的通信光缆转化为一个长距离、连续分布的“
听觉
传感器”,对振动、声音等信号实现高精度、高灵敏度的监测。
上海锟联科技
·
2025-06-11 23:58
DAS解调卡
分布式光纤传感
高速数据采集卡
【仿生机器人】刀剑神域——爱丽丝苏醒计划,需求文档
仿生机器人"爱丽丝"系统架构设计需求文档一、硬件基础已完成头部和颈部硬件搭建25个舵机驱动表情系统颈部旋转功能眼部摄像头(视觉输入)麦克风阵列(
听觉
输入)颈部发声装置(语音输出)二、核心设计目标情感的真实涌现通过环境交互自然产生情感
DFminer
·
2025-06-10 18:56
机器人
人工智能
深度学习
安全
【仿生系统】qwen的仿生机器人解决方案
以下是分阶段实施方案:一、核心系统架构设计(模块化可进化架构)1.多模态感知引擎-视觉子系统:YOLOv8+SAM组合实现实时物体检测+场景语义分割-
听觉
子系统:Whisper+SpeakerEmbedding
DFminer
·
2025-06-03 04:39
机器人
【仿生机器人系统设计】涉及到的伦理与安全问题
一、伦理困境:在“像人”与“是人”之间隐私与数据黑洞:问题:为实现自然交互,仿生机器人需搭载强大的环境感知(视觉、
听觉
DFminer
·
2025-06-03 03:31
机器人
安全
探索音频信号处理技术:从时域到频域的转换
通过分析信号的时间序列数据和频率分布,我们可以提取出对人类
听觉
系统有意义的信息。
念区
·
2025-05-25 06:22
音频信号处理
离散傅里叶变换
频谱图
梅尔频谱图
Python编程
混剪视频如何高大上?底层逻辑就这几点!
听觉
节奏是声音的“节拍”:背景音乐的鼓点、台词的轻重缓急、环境音的强弱变化,每一个音符都在为视频的节奏
矩阵营销老黄
·
2025-05-22 16:33
视频
新媒体运营
音视频
VR+AI+量子计算=自寻死路?
但总体来说,提供能够替代现实的视觉和
听觉
感受、甚至触觉感受(嗅觉和味觉暂时还谈不上),在真实世界中创造出一个虚拟的世界来,方便人们的信息传递和娱乐休闲,是VR的主要功能。
煊琰
·
2025-05-20 21:17
从零到爆款:DeepSeek小说创作全流程
角色设定模板:在助手设置中加载以下参数(示例):角色定位:职业小说家,擅长悬疑与情感双线叙事核心技能:1.三幕式结构设计(开篇冲突→中期反转→高潮收束)2.五感描写强化(
听觉
细节占比≥20%)3.社会热点嫁接
摆烂大大王
·
2025-05-16 22:35
deepseek
人工智能
deepseek
语言模型
音视频开发技术总结报告
音视频开发技术总结报告一、音视频开发基础1、音频基础声音原理声波特性:频率、振幅、波长人耳
听觉
范围:20Hz-20kHz声音三要素:音调、音量、音色数字音频基础采样率:常见44.1kHz、48kHz、96kHz
DecentX
·
2025-05-05 17:04
多媒体编程
音视频
音视频
【大模型】多模态推理
听觉
模态:语音、环境声音。其他传
meisongqing
·
2025-05-02 21:37
人工智能
Android中的Audio系统框架分析(一)
是通过介质(空气或固体、液体)传播并能被人或动物
听觉
器官所感知的波动现象。最初发出振动(震动)的物体叫声源。声音以波的形式振动(震动)传播。声音有三要素:1、音量(Volume)也叫做响度(L
刘信的csdn
·
2025-04-27 05:26
android
音频降噪技巧分享:提升
听觉
体验
在当今数字化时代,音频质量对于提升用户体验至关重要,无论是在通话、视频录制还是音频文件播放中,清晰的音频都能带来更佳的
听觉
享受。
changchang_568
·
2025-04-26 18:53
经验分享
C语言-基于AT-SPI无障碍服务操作工具
基于AT-SPI的无障碍操作工具可以帮助用户使用计算机和应用程序,特别是对于那些有视觉、
听觉
或运动障碍的用户来说尤为重要。
我姓徐
·
2025-04-15 13:47
c语言
开发语言
AT-SPI
无障碍服务
UI自动化测试
智能优化算法-大白鲨优化器White Shark Optimizer(附Matlab代码)
引言大白鲨优化器(WhiteSharkOptimizer,WSO)的核心理念和基础灵感来自大白鲨的行为,包括它们在导航和觅食时非凡的
听觉
和嗅觉。
优化算法侠Swarm-Opti
·
2025-04-08 20:42
智能优化算法
算法
matlab
启发式算法
数学建模
NLP高频面试题(三十一)——多模态预训练模型的主要结构、特征对齐与融合方法及对比损失函数详解
在人类认知中,我们习惯将视觉、语言、
听觉
等多种信息共同处理,因此发展能够整合多模态数据的人工智能模型具有重要意义。
Chaos_Wang_
·
2025-04-03 02:12
NLP常见面试题
自然语言处理
人工智能
音频编码基础知识
所谓冗余信息就是人耳
听觉
范围外的音频信息以及被遮蔽掉的音频信息。频域遮蔽效应:频率相近的几个声源中,强度高的声音可能会将其它低强度声音遮蔽。无损编码(熵编码):哈夫曼编码,算法编码,香农编码。
zhou jiabo
·
2025-03-30 09:44
音视频开发
aac
计算机视觉的多模态模型:开启感知智能的新篇章
然而,人类对世界的理解从来不是基于单一感官输入——我们同时通过视觉、
听觉
、触觉等多种感官来感知环境,大脑将这些信息融合形成对世界的综合认知。
点我头像干啥
·
2025-03-27 08:08
Ai
深度学习
计算机视觉
人工智能
万字长文总结多模态大模型后训练
由于我们的世界本质上是多模态的,包括视觉、
听觉
和文本等数据,
强化学习曾小健
·
2025-03-24 21:49
人工智能
鸿蒙开发秘籍:用AvPlayer解锁录音朗读新玩法
通过有效的音频处理,应用能和用户互动得更生动、更直接,用户用的时候既能享受
听觉
上的快乐,又觉得方便,应用的吸引力和实用性一下子就提升
柳中仙
·
2025-03-22 00:04
鸿蒙HarmonyOS
harmonyos
华为
vr中的计算机知识,VR技术基本常识
除计算机图形技术所生成的视觉感知外,还有
听觉
、触觉、力觉、运动等感知,
淡庸
·
2025-03-21 11:31
vr中的计算机知识
Qwen2-Audio:通义千问音频大模型技术解读
然而,交互模态不仅仅依赖于文字,语音、语调、环境音等
听觉
信息同样承载着丰富的内容。阿里巴巴通义千问团队,推出了Qwen-Audio系列模型,这里我们一起看下最新版本Qwen2-Audio。
kakaZhui
·
2025-03-21 01:41
音视频
AIGC
人工智能
python
chatgpt
阿里云国际站代理商:怎样量化虚拟世界的QoE体验指标?
1.沉浸体验质量(QImE)沉浸体验质量主要衡量虚拟世界中视觉和
听觉
的沉浸感,包括以下几个关键指标:视频质量(QP):考虑视频的平均码率(Brv)、帧率(FR)、分辨率(Rh、Rv)、视场角(FoVh)
linglideman
·
2025-03-14 17:29
阿里云
音频的“隐形保镖”——音频数字水印
利用的是音频信号的冗余性和人类感知器官对于音频的掩蔽效应等特性,在不影响音频载体
听觉
质量的情况下,通过把额外
声光界
·
2025-03-08 09:54
音视频
DeepSeek独立部署对垂直行业影响力分析
1.教育深化应用场景场景1:个性化学习路径生成描述:根据学生的学习风格(视觉型、
听觉
型等)、薄弱科目和兴趣,生成定制化课程。
懂AI的老郑
·
2025-03-07 03:57
DeepSeek应用
DeepSeek
智能体
悦读声界·小说语音管理系统
产品介绍产品名称:悦读声界·小说语音管理系统主要功能:智能语音朗读功能描述:用户可通过语音指令或简单点击,启动系统内置的AI语音引擎,自动将小说文本转化为流畅自然的语音朗读,支持多种语言及方言选择,满足不同用户的
听觉
偏好
大霸王龙
·
2025-03-04 03:38
行业+领域+业务场景=定制
人工智能
小说转语音
python
django
管理系统
读心术思维导图
读心术思维导图把自己变成他人贴近对方的肢体行为模仿姿势延迟动作不要过于精确模仿对方的声音模仿面部表情同样的速度和节奏配合对方的精神状态注意对方的精力值,让精力充沛起来的练习言行一致,情绪状态看懂他人,语言、思维方式视觉记忆视觉记忆
听觉
记忆动觉记忆
胡西风_foxww
·
2025-02-27 00:15
#
思维导图
读心术
思维导图
模板
markdown
ffmpeg音频命令(常用篇)
一、工作时涉及到的音频名词1、声道当人听到声音时,能对声源进行定位,那么通过在不同的位置设置声源,就可以造就出更好的
听觉
感受。声道越多的话,更能获得身临其境的听音体验,声音的环绕效果也会更加的真实。
晓光尘梦
·
2025-02-19 16:49
其他知识点学习
ffmpeg
音视频
仿生机器人核心技术与大小脑
听觉
:声源定位、噪声抑制(如麦克风阵列)。环境感知:激光雷达(
天机️灵韵
·
2025-02-16 19:53
人工智能
具身智能
硬件设备
机器人
人工智能
具身智能
基于“感知–规划–行动”的闭环系统架构
听觉
:利用麦克风阵列、声学传感器,结合声纹识别、语音识别(如基于Transformer或RNN的模型)技术处理音频信息。文本与语义信息:通过文
由数入道
·
2025-02-10 22:39
人工智能
系统架构
人工智能
智能体
元宇宙相关技术研究--由AR眼镜引发的人机交互思考
随着IT新技术的发展,眼镜作为一种全新的交互方式,未来将逐渐走到人机交互的核心位置,眼镜集成了人机交互过程中的视觉(即眼睛)、
听觉
(即声音)、手势(即代替键盘鼠标触摸等)及方向位置感知等。
一望无际的大草原
·
2025-02-07 22:32
高级数据应用
数字孪生
人机交互
人机交互
VR
AR
MR
元宇宙
数字孪生
unity游戏开发毕设_毕设分享:用Unity探究2D游戏的打击感
在电子游戏中,则通过视觉和
听觉
呈现这些。实现方式市面上
幸行远
·
2025-01-26 11:31
unity游戏开发毕设
什么是多模态机器学习:跨感知融合的智能前沿
它超越了单一感官输入的限制,通过整合视觉、
听觉
、文本等多种数据类型,构建了一个更加丰富、立体的认知模型,为机器赋予了接近人类的综合感知与理解能力。
非凡暖阳
·
2025-01-20 12:01
人工智能
神经网络
微软Edge浏览器的辅助功能设置:提升用户体验的指南
这些功能可能包括屏幕阅读器支持、高对比度模式、文字放大等,以适应不同用户的视觉、
听觉
和操作需求。E
2402_85758936
·
2025-01-18 06:54
microsoft
edge
ux
329王不林【1期3班】刻意练习day15
2、开头运用
听觉
,引发联想以及比喻,并为下文写母亲摇纺车做了铺垫。3、写院子和露水,表明了地点和时间。4、描写人时,运用了很多动词,比如摇、垫、屈、压,使摇纺车这个动作更加形象。
王不林不林
·
2024-09-16 02:22
聆听马勒第六交响乐
昨晚听了一场
听觉
盛宴,感受了马勒第六乐章,这是我第二次在聆听宁波交响乐团的演出,很赞,因为我是外行,只能听到那层表面的东西,但是我还是被这个集体协作下的交响乐震撼了,想想一个半小时不停演绎,给这些音乐师们竖个大拇指
Una520
·
2024-09-13 02:47
#宇宙公民高效阅读营第13期打卡第9天
视觉:密密麻麻很多苍蝇聚集在食物上(成堆,覆盖说明数量多)
听觉
:群体发出嗡嗡嗡的响声(吃东西的声音)触觉:全身起鸡皮疙瘩,密集恐惧(因为恶心)嗅觉:闻到腥臭味(苍蝇喜欢臭的)【作业二】选:那个人,教会我事以前有那么一个人
素yan
·
2024-09-13 01:02
右脑的记忆力是左脑的100万倍,怎样激活右脑记忆回路?运用到日常生活中?
首先,右脑是图像的脑,它拥有卓越的形象能力和灵敏的
听觉
,人脑的大
记忆力分享娅娅老师
·
2024-09-12 20:53
元宇宙的重要底层技术
VR/AR是元宇宙的主要交互设备,它将人的视觉、
听觉
、触觉等感官直接映射到虚拟世界中。
区块链董叔
·
2024-09-12 15:37
MBTI八维功能定义
人类选择语言(
听觉
)作为首要工具很可能是因为1、声音传递信息的各种优势,2、人类能够发出复杂多样的声音。
风中的小屋
·
2024-09-12 10:55
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他