腾讯技术工程

腾讯优图实验室AI手语识别研究白皮书

前言

据2017年北京听力协会预估数据，我国听障人群数量约达到7200万。放眼世界，世界卫生组织发布的最新数据显示，全世界有共计约4.66亿人患有残疾性听力损失。尽管听障人群能够凭借手语进行交流，但在机场、民政等公共服务环境中仍然面临沟通障碍等一些亟待解决的问题。

秉承“科技向善”的技术价值观，腾讯一直致力于通过AI等技术手段解决人类面临的社会问题。我们相信，科技能够造福人类，人类应该善用科技，努力去解决自身发展带来的社会问题。作为国内计算机视觉人工智能领域的领先研究团队，腾讯优图实验室近日攻坚AI手语识别并取得突破性进展，自研出一套基于结构化特征学习的端到端手语识别算法，能够识别日常手语并快速运算出结果并把手语翻译成为文字，有望为听障人群正常交流提供更多便利。

目前，腾讯优图实验室已经与深圳市信息无障碍研究会达成合作，并于近日正式发布“优图AI手语翻译机”，探索在机场、高铁、民政等公共服务场所提供手语翻译服务。未来，腾讯优图希望能通过与听障者或手语使用者的深入接触，扩充数据容量，完善数据规范，根据不同的场景优化识别算法，搭建出通过手语与听障人士无障碍沟通的完整系统和平台，用AI消除障碍，做有温度的科技、无差别的科技。

一、潜在需求分析

（一）听障人士数量已达7200万

信息的接收与传递是包括人类在内的任何有机体与世界最为基本的沟通方式，而对于听障人士来说，他们失去了听力这个认识世界最为重要的感知途径。世界卫生组织最新数据显示[1]，目前全球约有4.66亿人患有残疾性听力损失，超过全世界人口的5%，估计到2050年将有9亿多人（约十分之一）出现残疾性听力损失。据北京听力协会2017年公开数据，估计中国残疾性听力障碍人士已达7200万[2]，相当于北京市常住人口（约2200万，2015年数据）的3倍多，是我国少数民族人口中最多的民族壮族（约1500万，2015年数据）的近5倍，这其中还不包括轻中度听损的人口。

（数据来源：世界卫生组织官网）

（数据来源：2017年北京听力协会预估）

（二）无障碍普及率有待提升，听障人群需求被忽视

《2017年百城无障碍设施调查体验报告》显示，我国无障碍设施整体普及率仅为40.6%[3]，除了普及率较低，还存在部分无障碍设施被占用、维护不到位、设计存在问题等情况。而与其他残障人士不同的是，在现实生活中，听障者除了使用手语交流以外，与普通人几乎没有区别，这也正是听障者容易被忽视的原因之一。目前的公共环境设施、产品设计等往往忽略了听障者的特殊需求。听障者面临的不仅仅是日常交流上的障碍，更多的是沟通障碍所衍生的诸多不便。

（听障人群痛点分析）

《光明日报》的一篇报道曾指出[4]，因为沟通障碍，绝大部分的听障者都生活在自己封闭的小世界里，社会活动参与度极低的他们往往会感到孤独。虽然受过教育的听障者也能够使用文字进行交流，但是对于他们来说，手语是更易于使用和接受的交流方式，而我国目前致力于听障者专业服务的人士只有大约一万名，大部分公共服务并没有配备专门的便利设施，这些都是听障者长久以来面临的迫切需求。

科技的进步为大众生活带来诸多便捷，而对于愈发庞大的听障人群，他们的生存状态需要得到社会的更多关注，他们迫切需要前沿科技为他们解决交流障碍带来的诸多不便。

二、手语表达与AI技术结合的行业探索

（一）各研究机构展开探索尝试，技术落地存在诸多因素限制

手语翻译的核心技术是手语识别（SLR）。这个技术就是指通过计算机算法，自动区分手语表达中的各类手势、动作以及这些手势和动作之间的切换，最后将表达的手语翻译成文字。传统的方法通常会针对特定的数据集设计合理的特征，再利用这些特征进行动作和手势的分类。受限于人工的特征设计和数据量大小，这些方法在适应性、泛化性和鲁棒性上都非常有限。

近年来，大数据和深度学习极大推动了人工智能算法的发展，尤其体现在计算机视觉、自然语言处理和音频处理等领域，这助推了AI算法在许多应用和场景中实现落地，许多研究员和工程师也开始尝试运用深度学习和数据驱动的算法来解决SLR的问题。然而不同于大部分的计算机问题，手语特有的地域性、复杂性和多样性，不仅增加了数据采集和清洗的难度和成本，也使得这门技术哪怕在深度学习的帮助下也依然存在很大的挑战，难以被实际应用。

目前，有研究机构或单位针对解决听障人群沟通问题的技术研究，但研究方向多集中在将文字转化成手语方向，而“针对听障人群的手语识别转化成文字”的方向因为技术难度极大，尚鲜有技术方案落地。

（二）腾讯优图自研手语识别算法，推出“优图AI手语翻译机”

腾讯优图结合听障人士手语表达的习惯采集了手语数据，利用前沿的图像序列分析技术自研了一套手语识别算法，推出“优图AI手语翻译机”。AI手语翻译机以普通摄像头作为手语采集装置，依托高性能计算机进行后台运算，能够实时地将手语表达翻译成文字。对于用户而言，不需要携带任何额外装置，只要面对摄像头完成正常的手语表达，就能从翻译机中得到反馈回来的识别结果。

（优图AI手语翻译机界面截图）

三、优图AI手语翻译技术解读

（一）算法优势

相比于此前的手语识别相关的产品和技术方案，我们的手语识别算法主要能够实现以下几点优势：

1. 基于纯RGB图像序列

手语表达极具复杂性，一个手势或者动作幅度的小变化就可能会造成表达意思上很大的不同。因此，之前的很多产品或方法往往需要借助于一些额外的设备，例如使用Kinect摄像机的多种传感器来提前获取手语表达者的肢体关节点信息，又例如在手上携带传感器手套、或配备EMG、IMU传感器的手环来获取手臂和手掌的活动信息。这些额外的设备无形之中增加了使用的门槛，同时也带来了一定的不便利性。

与此不同，我们的翻译机不需要任何额外设备的帮助，用户只需要一个普通的摄像头（如手机摄像头或普通网络摄像头）对手语表达者的表达过程进行拍摄，翻译机就可以完成识别翻译的过程。

2. 支持多样性表达

手语极具地域性和多样性。地域性即指不同地区（如深圳和广州）对同一个词可能存在不同的表达方式，同时由于个人习惯，即便是在同一个标准下，动作的呈现也可能不尽相同。多样性则体现在手语表达中，同一个动作在不同的语境之中可能有着非常不一样的意义，而同一个词在不同的语境中又可以使用不同的动作进行表达。尽管这些情况非常常见，多样性的问题在之前的产品或方法中是没有被考虑进去的。

我们首次将多样性的问题考虑到了算法识别的过程中，支持常见的多样性表达，用户不需要针对翻译机学习某种特定的词与动作之间的映射，根据自己平时的表达习惯进行表达即可。

3. 灵活的整句识别

听障人士进行手语表达往往以句子为单位，表达完一个完整的句子之后才会出现停顿，在一个句子的不同词之间很少会做停顿。然而之前的许多产品或算法实际上是以词为单位进行识别的，需要在词与词之间做出明显的停顿。另外为了能够将语句进行划分，还可能需要设定特定的起始动作和结束动作，在每次表达开始和结束时作为信号语句划分的信号。这限制了使用的灵活性和流畅度。

与此不同，优图AI手语翻译机能够实现整句的识别和翻译，用户表达的时候可以连贯将整个句子表达完。也不需要设定特定的结束或起始动作，而是直接对用户的动作与否进行判断。

（二）实现方法

与听障人士手语表达高度符合的数据集、先进的手语识别算法是翻译机得以实现的有力支撑。

（手语识别算法总体框架图）

1. 更大更全的手语识别数据集

我们通过与社会相关机构和听障人士的接触了解了手语表达的特点，并根据这些特点采集了自己的手语识别数据集。同时对数据进行进一步的分析和归纳，目前，AI手语翻译机的数据集覆盖了近千句日常表达，900个常用词汇，是最大的中文手语识别数据集。

不仅如此，采集数据集还考虑了手语的地域性和多样性表达，包含了不同的表达习惯和速度。这为进一步提升我们算法的泛化能力提供了很好的基础。

2. 更强大的特征提取器

为了能够在手语极具复杂性的表达中充分提起识别所需要的特征信息，我们结合了普通2D卷积网络和3D卷积网络的优势，通过2D卷积网络来提取手语中的手势和身体姿势等静态信息，同时通过3D卷积网络来提取手语中普遍存在的细微而快速的变换动作的动态信息，最后将这两个信息相结合，产生我们最后的特征表达。

静态和动态信息的结合形成了很好的互补，同时避免了信息过早的流失，在我们的实验中对我们识别效果的提升很有帮助。在充分利用了视频中的动、静两种信息之后，我们的算法也得以能够利用单纯的RGB视频图像就达到识别的目的，不需要借助额外的传感器设备。

3. 句子表达中挖掘词级信息

虽然听障人士在进行手语表达的时候是以句子为单位的，但是句子又是由不同的词语组合而成的，因此从语法上来说，词才是手语的最小表达单元。与此同时，一个词语的表达往往不是一个单一的动作和手势，而是一些手势和动作的变换，这个过程有长有短，之间也没有刻意的停顿，因此往往掩盖在了整个句子的表达之中。

为了将这些词语表达的信息挖掘出来，我们的算法在视频帧与最后的输出之间加入了词级信息提取单元，词级信息提取单元利用长短时网络充分考虑特征提取器所提取出的信息，并结合视频中相邻的信息计算出词级的特征表达。这个单元帮助我们的算法能够更好地在句子中找到词语表达的边界，并提升对各种地域性表达的总结能力。

4. 单句切分并充分考虑句中上下文信息

我们的算法在提取词级信息的基础上还会充分将整句中的上下文信息进行综合考虑，然后再输出最后的识别结果。这对识别手语中的多样性表达非常重要，因为同样的动作只有放在上下文的语境中才能最后确定它的意思。

同时，为了减少用户在使用过程中的限制，我们在手语识别之前加入了人脸检测和动作检测两个模块，用人脸检测确定手语表达者的位置，然后用动作检测判断他是否在做手语表达。三个模块协同合作，最后让翻译机能够自适应地找到用户的位置，并连贯识别用户的一系列表达。

（与其他算法在两个公开手语识别数据集上的性能对比，数据显示的是词错率（WER），越低越好）

（三）落地条件限制及应用方向

就目前来说，优图AI手语翻译机仍处于实际应用探索阶段。主要受三个问题限制，一是需要高性能计算机，二是复杂环境背景的适应性，三是语料库进一步拓展。

因此，我们将进一步探索在一些公共事务场所如机场、民政等公共服务领域等提供无障碍沟通解决方案，方便听障人日常交流提供便利。

四、意义和愿景

优图AI手语翻译机是腾讯优图基于先进的动作识别和视频分析算法对手语识别技术的一次扩展和优化。我们始终相信，作为AI技术的探索者，解决和优化技术难题是团队应肩负的责任和担当，创造和传播AI的价值和温暖是团队应秉持的使命和信仰。

我们将在未来对我们的AI手语翻译机进行持续的升级和优化，让AI手语翻译机走进听障人士的生活，在日常服务窗口、手语教育等场景中为听障人士带来实实在在的便利。我们希望以手语翻译机为媒介，深入接触听障群体，进一步了解手语和优化我们的数据和识别算法，使我们的翻译机能够覆盖更多的表达和场景。我们更希望我们的AI手语翻译机能够助力手语的普及和规范，增加社会对这个群体的关注度，帮助听障人士更好地融入社会，让他们能够和我们一样，更好地享受和体验技术创新和科技发展所带来的红利。

实际上，这并不是腾讯在AI+无障碍建设上的首次尝试，腾讯一直在坚持推动“一个都不能少”和“信息无障碍”理念的传播与落地。2018年12月3日，腾讯获得了“联合国教科文组织数字技术增强残疾人权能奖”。

腾讯自 2009 年起在信息无障碍方面率先展开探索，截至目前，旗下QQ、QQ空间、微信、腾讯网、腾讯新闻、应用宝、企鹅FM等大部分产品已针对障碍用户实现专门优化。腾讯旗下各类产品从社交、娱乐、新闻等多维度出发，共同努力，为障碍人士构建友好的信息社会。

感谢深圳市信息无障碍研究会及所有参与此次优图AI手语研究项目的团队和个人。

[1] 世界卫生组织官网最新数据

[2] 北京听力协会2017年预估数据

[3] 数据来源：《2017年百城无障碍设施调查体验报告》

[4] 报道内容来源：光明日报

http://epaper.gmw.cn/gmrb/html/2015-01/17/nw.D110000gmrb_20150117_1-10.htm

游戏跳伞卡顿？CPU Stall优化全解析你一身傲骨怎能输游戏开发技术专栏游戏开发语言
《粒子特效导致CPUStall的优化分析》摘要文章解析了"CPUStallwaitforevent"现象，指出这是CPU因等待内存/I/O/锁等事件而暂停执行的情况。在粒子特效中，主要诱因包括：多线程同步等待、内存带宽争用、资源竞争和任务分配不均。针对性地提出了五大优化方案：减少线程同步（采用无锁队列）、优化内存访问（避免伪共享）、均衡任务分配、异步处理计算与渲染，以及使用性能分析工具定位瓶颈。通
破解FPS主线程阻塞的终极方案你一身傲骨怎能输 FPS射击游戏高级技术专栏性能优化
文章摘要FPS游戏中主线程等待其他线程（如物理、AI等）会引发性能瓶颈，导致帧率下降和卡顿。常见原因包括同步点过多、任务分配不均、锁滥用和数据依赖过强。优化方法包括：1）减少硬等待，采用异步处理；2）任务分解和负载均衡；3）使用无锁同步；4）流水线分阶段处理；5）设置超时降级策略。引擎层面可利用Unity的JobSystem或Unreal的TaskGraph系统进行优化。关键是通过Profiler
深度 |AI高质量数据集交易爆发式增长数智前沿数字化转型人工智能数据集
AI产业从通用模型向行业垂直应用快速融合下沉的阶段演进，人工智能三大基本要素之一数据，面临的高质量数据不足问题却凸显。财联社记者最新从业内获悉，目前各大模型企业迫切希望获得更多更好的高质量数据集，需求集中于头部企业行业知识底座构建，人工智能高质量数据集的需求量、交易量激增，已成为数据流通最活跃的领域。不过，高质量数据集的建设、流通环节均面临诸多问题，目前数据交易所并非模型语料最主要的采购途径。需求
轻量化分布式AGI架构：基于区块链构建终端神经元节点的互联网智脑探客木木夕分布式 agi 人工智能架构区块链
在2025年的技术发展背景下，轻量化分布式AGI架构正成为人工智能领域的重要突破方向。通过将终端设备转化为神经元节点，结合区块链技术构建去中心化的互联网智脑，不仅能够突破传统AGI开发的算力瓶颈，还能实现数据安全共享与价值分配。**这一架构将重塑人工智能的发展范式，使AGI能力从中心化实验室扩散至全球终端设备网络，最终形成一个去中心化、自演进、高可用的互联网级智能系统**。研究显示，通过知识密度提
Aletheia 情感智能模型：完整实现
Aletheia情感智能模型，整合所有核心模块并解决之前指出的问题。这个实现包含完整的神经动力学系统、多模态情感融合、伦理约束场和量子意识接口。importnumpyasnpimportmatplotlib.pyplotaspltfromscipy.integrateimportodeintfromsklearn.decompositionimportPCAimporttorchimporttor
android四大组件之一——Service 闲暇部落四大组件 Service IPC AIDL Messenger Binder
目录一、Service概述二、Service分类1.前台服务2.后台服务3.绑定服务三、Service的两种启动方式1.start启动模式2.bind绑定模式四、权限五、Service生命周期六、组件与绑定Service的通信方式1.扩展Binder类2.Messenger信使3.AIDL七、总结场景使用区别八、源码下载一、Service概述Service是应用组件，代表一个应用的长时间后台运行的
60天python训练营打卡day46
学习目标：60天python训练营打卡学习内容：DAY46通道注意力(SE注意力)知识点回顾：1.不同CNN层的特征图：不同通道的特征图2.什么是注意力：注意力家族，类似于动物园，都是不同的模块，好不好试了才知道。3.通道注意力：模型的定义和插入的位置4.通道注意力后的特征图和热力图学习时间：2025.06.29@浙大疏锦行
android 音量调整盼雨落，等风起安卓 audio 音视频
1流程图2audio_policy_volumes.xml阐述了流跟device的音量范围【AndroidAudio】5、EngineBase加载音量曲线和策略【基于AndroidQ】1.按键处理1.1从输入子系统到音频子系统的处理按键会从inputReader的getEvent到inputDisptacher最后到ViewRootimpl中的ViewPostImeInputStage::proc
安卓之Service详解(三)【安卓IPC之AIDL】 AB小站 Android bindService 安卓服务 IPC和AIDL
AndroidBoundService详解1.一般实现步骤讲解在客户端(Activity中)要完成：1.客户端通过BindService()方法来绑定一个服务对象(业务对象)如绑定成功会回调ServiceConnection接口方法onServiceConnected()2.OnServiceConnection()方法的其中一个参数是在Service中OnBind()返回的Binder的实例。3
Mybatis 微风粼粼 mybatis tomcat java
1、概述什么是mybatis？MyBatis是一个基于Java的持久层框架，它支持定制化SQL、存储过程以及高级映射。MyBatis消除了几乎所有的JDBC代码和参数的手动设置以及结果集的检索。MyBatis使用简单的XML或注解用于配置和原始映射，将接口和Java的POJOs（PlainOrdinaryJavaObjects，普通的Java对象）映射成数据库中的记录。它是一款半自动的ORM持久层
基于springboot的社区生鲜团购系统优创学社2 spring boot 后端 java
目录摘要IAbstractII1绪论11.1研究背景11.2课题意义22开发技术论述22.1Springboot框架32.2Vue框架32.3Tomcat服务器42.4MySQL数据库53需求分析63.1系统的可行性分析73.2功能需求分析73.3项目设计目标83.3.1关于系统的基本要求83.3.2开发目标94系统设计104.1系统功能模块设计114.2系统功能流程设计124.3数据库设计134
面试官问我“JVM 调优工具有哪些怎么用”，我一开口他就知道是老江湖小奇JAVA面试吊打面试官 jvm
作者：小奇Java面试标签：JVM调优/面试故事/Java工具链/技术趣闻面试场景：一个调优老兵的对话局这次是“曜能科技”的面试室，装修风格是科技蓝加亚克力玻璃，桌子上还有一本《高性能Java》第三版。我穿着一件略显皱的米白色T恤，脚踩帆布鞋，背着“Javaiseverywhere”的帆布包，看上去像是刚从实验室跑出来的实习生。对面坐着的面试官，穿着笔挺西装，皮鞋锃亮，AppleWatch闪着光。
5.31.15 使用图像到图像转换和 YOLO 技术对先前的乳房 X 光检查结果中的异常进行早期检测和分类托比-马奎尔深度学习基础知识 YOLO
在本研究中，我们研究了基于You-Only-Look-Once(YOLO)架构的端到端融合模型的有效性，该模型可同时检测和分类数字乳房X光检查中的可疑乳腺病变。包括四类病例：肿块、钙化、结构扭曲和正常，这些病例来自包含413个病例的私人数字乳房X光检查数据库。对于所有病例，先前的乳房X光检查（通常是1年前扫描的）均报告为正常，而当前的乳房X光检查被诊断为癌变（经活检证实）或健康。方法：建议将基于Y
C++编程语言入门指南 jdlxx_dongfangxing c++
一、C++语言概述C++是由丹麦计算机科学家BjarneStroustrup于1979年在贝尔实验室开发的一种静态类型、编译式、通用型编程语言。最初被称为"CwithClasses"(带类的C)，1983年更名为C++。它既具有高级语言的抽象特性，又保留了底层硬件操作能力，被广泛应用于系统软件、应用软件、驱动程序、嵌入式软件、高性能服务器和客户端应用以及娱乐软件等开发领域。作为C语言的超集，C++
更换SSL证书引发的异常：`sun.security.validator.ValidatorException: PKIX path building failed` `[Nginx跳转失败：501] 猿享天开技术经验 ssl nginx 网络协议
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
宝塔下载pgsql适配spring ai 一入JAVA毁终身技术精讲 spring 数据库 java
1.宝塔安装pgvector1.先去github下载pgvectorpgvector/pgvector:Open-sourcevectorsimilaritysearchforPostgres2.把压缩包上传到系统文件的/temp下解压，重命名文件名为pgvector，之后命令操作cd/tmpcdpgvectorexportPG_CONFIG=/www/server/pgsql/bin/pg_co
VMware克隆CentOS虚拟机后网卡无法启动并无法获取到IP地址 TechABC centos tcp/ip php 服务器
在使用VMware虚拟化软件进行虚拟机克隆时，有时会遇到克隆后的CentOS虚拟机无法启动网卡并无法获取到IP地址的问题。这可能是由于克隆操作导致虚拟机的网卡配置与网络环境不匹配所致。在本文中，我们将探讨如何解决这个问题。解决这个问题的一种常见方法是更新虚拟机的网卡配置，并重新配置网络设置。以下是一些步骤，可供参考：步骤1:检查网卡设备首先，我们需要确认虚拟机中的网卡设备是否正确识别。在终端中执行
Python爬虫实战：研究chardet库相关技术 ylfhpy 爬虫项目实战 python 爬虫开发语言 chardet
1.引言1.1研究背景与意义在互联网信息爆炸的时代，网络数据采集技术已成为信息获取、数据分析和知识发现的重要手段。Python作为一种高效的编程语言，凭借其丰富的第三方库和简洁的语法，成为爬虫开发的首选语言之一。然而，在网络数据采集中，文本编码的多样性和不确定性一直是困扰开发者的主要问题之一。不同网站可能采用不同的编码方式（如UTF-8、GBK、GB2312等），甚至同一网站的不同页面也可能使用不
【产品经理修炼之道】-电信运营商的生态棋局｜To B 生态逻辑 xiaoli8748_软件开发产品经理产品经理
2022年，阿里云、腾讯云的增长放缓，三大运营商强势进击，云业务的增长均超过了100%。相比大厂，运营商具备云网、渠道、服务、数据资源。但向前一步容易，如何走好接下来的路，运营商任重而道远。大厂后退，运营商向前。2022年，国内云计算生态迎来重大变局。一方面，是阿里云、腾讯云的增长放缓；另一方面，是三大运营商的强势进击。财报数据显示，2021财年、2022财年，阿里云收入增长分别为50%、23%，
九、K8s污点和容忍退役小学生呀 K8s企业级深度研修 kubernetes docker 容器云原生 k8s linux 运维
九、K8s污点和容忍文章目录九、K8s污点和容忍1、污点（Taint）和容忍（Toleration）1.1什么是污点（Taint）？1.2什么是容忍（Toleration）？1.3污点的影响效果（Effect）1.4污点配置解析1.5常见内置污点2、污点的增删改查2.1添加污点2.2修改污点2.3查询污点2.4删除污点3、污点和容忍使用场景实战3.1K8s主节点禁止调度3.2K8s新节点禁止调度3
宽带有哪几种接入方式 weixin_30252709
转：https://zhidao.baidu.com/question/1025089.html目前的家庭接入方式主要有三种：一是普通电话线的非对称数字用户环路技术（ADSL）方式、二是基于光纤IP网的FTTB+LAN技术方式（小区宽带），三是有线电视的CableModem技术方式（有线通）。ADSL使用一种调制解调传输技术，在普通电话线上将现有电话线路的频宽经由调制解调技术处理后扩大，其中较高容
Neo4j 的向量搜索（Neo4jVector）和常见的向量数据库（比如 Milvus、Qdrant）之间的区别与联系
先说联系（共同点）点内容✅都支持向量检索都可以基于embedding（向量）做相似度搜索，比如给一段文本、找出最相似的若干条记录。✅都用于语义检索你可以把它们用在RAG（检索增强生成）、ChatwithDocs、智能问答、推荐系统等应用里。✅都支持批量插入、查询都可以批量向数据库中插入文本+向量，然后用向量做top-k检索（如search(k=8)）。✅都和LangChain集成它们都可以通过la
03每日简报20250705 Alvin_YD 每日简报人工智能娱乐社交电子媒体传媒
每日简报新闻简报：AI行业信任危机浮现标题：知名科技作者AlbertoRomero发文《我对AI行业正在失去所有信任》来源：TheAlgorithmicBridge（算法之桥）核心内容：作者立场：长期支持AI技术的作者AlbertoRomero公开表达对行业信任的崩塌，称"作为一个支持者，我本不愿有这种感受"。行业痛点：未具体说明的行业乱象导致公众信任度下降暗示AI发展过程中存在伦理或透明度问题传
flex布局原理以及各属性详解卷尾猫 css css css3 flexbox flex
1布局原理1.1flex是flexibleBox的缩写，意为“弹性布局”，用来为盒状模型提供最大的灵活性，任何一个容器都可以指定为flex布局*当我们为父盒子设为flex布局以后，子元素的float、clear和vertical-align属性将失效*伸缩布局=弹性布局=伸缩盒布局=弹性盒布局=flex布局1.2采用flex布局的元素，称为flex容器（flexcontainer），简称“容器”。
大前端日志分析的AI应用：从海量日志中提取有价值的运维信息欧阳天羲大前端与 AI 的深度融合 #AI 在大前端安全与运维篇前端人工智能运维
在大前端技术快速发展的今天，前端应用的复杂度呈指数级增长，涵盖Web、移动端H5、小程序、快应用等多端形态。随之而来的是海量日志数据的爆发式增长——从浏览器控制台输出到移动端性能埋点，从用户行为轨迹到API调用异常，这些日志分散在不同终端、格式异构，传统的人工分析或规则引擎已难以应对。本文将系统阐述AI技术如何赋能大前端日志分析，从日志采集到智能诊断的全流程解决方案，结合实际案例展示如何利用机器学
开源模型应用落地-OpenAI Agents SDK-集成MCP与Qwen3-8B模型的创新应用探索（七）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言在人工智能技术飞速发展的今天，如何将先进的模型和技术无缝结合，成为推动行业变革的关键。OpenAIAgents通过集成模型上下文协议（MCP）和阿里巴巴推出的Qwen3-8B模型，正开启一场智能应用的革命。这种创新的结合不仅提升了AI代理与外部工具之间的通信能力，还在多模态任务处理、个性化服务等领域展现出巨大潜力。本文将深入探讨这一技术组合的实际应用场景，揭示其在改善客户体验和提升运营效率
开源模型应用落地-OpenAI Agents SDK-集成Qwen3-8B-探索output_guardrail的创意应用（六）开源技术探险家开源模型-实际应用落地开源 python ai 人工智能
一、前言随着人工智能技术的迅猛发展，大语言模型（LLM）在各行各业的应用日益广泛。然而，模型生成的内容是否安全、合规、符合用户预期，成为开发者和企业不可忽视的问题。为此，OutputGuardrail应运而生，作为一种关键的安全机制，它在模型生成结果之后进行内容审核与过滤，确保输出不偏离道德、法律和业务规范。通过检测不当的内容，不仅提升了AI系统的可信度，也为构建更加稳健和负责任的人工智能应用提供
《中国电信运营商骨干网：历史、现状与未来演进》系列第一篇：中国骨干网全景图：一级运营商与专用网络的演进老马爱知通信网络 #电信运营商网络骨干网电信运营商网络架构数字基础设施互联网科普
一、引言：骨干网——国家“信息大动脉”在当今数字经济蓬勃发展的时代，信息网络已成为国家基础设施的核心组成部分。而在这张错综复杂的信息大网中，骨干网(BackboneNetwork)扮演着“
什么是深度学习框架中的计算图？杰瑞学AI Computer knowledge NLP/LLMs AI/AGI 深度学习人工智能 pytorch
在深度学习框架中，计算图是核心的数据结构和抽象概念，它用来表示和定义深度学习模型的计算过程。我们可以把它想象成一个描述数学运算如何组合和执行的有向图。以下是计算图的关键要素和作用：节点：代表操作或变量。操作：数学运算，如加法(+)、乘法(*)、矩阵乘法(matmul)、激活函数(ReLU,sigmoid)、卷积(conv2d)、损失函数(cross_entropy)等。变量：通常是张量，即存储数据
LangGraph是为了解决哪些问题？为了解决这些问题，LangGraph采用哪些方法？LangGraph适用于什么场景？LangGraph有什么局限性？杰瑞学AI AI/AGI NLP/LLMs langchain 人工智能自然语言处理深度学习神经网络
LangGraph旨在解决的问题LangGraph是LangChain生态系统中的一个高级库，它专注于解决构建复杂、有状态、多步LLM应用程序的挑战。它扩展了LangChain的链和代理概念，尤其针对以下问题：多步决策和循环工作流：传统的链通常是线性的或简单的分支，难以处理复杂的决策路径、条件跳转以及需要循环迭代才能达到最终结果的任务。状态管理：在复杂的、多轮的LLM应用中，需要维护和管理应用的状
jQuery 键盘事件keydown ,keypress ,keyup介绍 107x js jquery keydown keypress keyup
本文章总结了下些关于jQuery 键盘事件keydown ,keypress ,keyup介绍，有需要了解的朋友可参考。一、首先需要知道的是： 1、keydown() keydown事件会在键盘按下时触发. 2、keyup() 代码如下复制代码 $('input').keyup(funciton(){
AngularJS中的Promise bijian1013 JavaScript AngularJS Promise
一.Promise Promise是一个接口，它用来处理的对象具有这样的特点：在未来某一时刻（主要是异步调用）会从服务端返回或者被填充属性。其核心是，promise是一个带有then()函数的对象。为了展示它的优点，下面来看一个例子，其中需要获取用户当前的配置文件： var cu
c++ 用数组实现栈类 CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T, int SIZE = 50> class Stack{ private: T list[SIZE];//数组存放栈的元素 int top;//栈顶位置 public: Stack(
java和c语言的雷同麦田的设计者 java 递归 scaner
软件启动时的初始化代码，加载用户信息2015年5月27号从头学java二 1、语言的三种基本结构：顺序、选择、循环。废话不多说，需要指出一下几点： a、return语句的功能除了作为函数返回值以外，还起到结束本函数的功能，return后的语句不会再继续执行。 b、for循环相比于whi
LINUX环境并发服务器的三种实现模型被触发 linux
服务器设计技术有很多，按使用的协议来分有TCP服务器和UDP服务器。按处理方式来分有循环服务器和并发服务器。 1 循环服务器与并发服务器模型在网络程序里面，一般来说都是许多客户对应一个服务器，为了处理客户的请求，对服务端的程序就提出了特殊的要求。目前最常用的服务器模型有： ·循环服务器：服务器在同一时刻只能响应一个客户端的请求 ·并发服务器：服
Oracle数据库查询指令肆无忌惮_ oracle数据库
20140920 单表查询 -- 查询************************************************************************************************************ -- 使用scott用户登录 -- 查看emp表 desc emp
ext右下角浮动窗口知了ing JavaScript ext
第一种 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/
浅谈REDIS数据库的键值设计矮蛋蛋 redis
http://www.cnblogs.com/aidandan/ 原文地址：http://www.hoterran.info/redis_kv_design 丰富的数据结构使得redis的设计非常的有趣。不像关系型数据库那样，DEV和DBA需要深度沟通，review每行sql语句，也不像memcached那样，不需要DBA的参与。redis的DBA需要熟悉数据结构，并能了解使用场景。
maven编译可执行jar包 alleni123 maven
http://stackoverflow.com/questions/574594/how-can-i-create-an-executable-jar-with-dependencies-using-maven <build> <plugins> <plugin> <artifactId>maven-asse
人力资源在现代企业中的作用百合不是茶 HR 企业管理
//人力资源在在企业中的作用人力资源为什么会存在，人力资源究竟是干什么的人力资源管理是对管理模式一次大的创新，人力资源兴起的原因有以下点：工业时代的国际化竞争，现代市场的风险管控等等。所以人力资源在现代经济竞争中的优势明显的存在，人力资源在集团类公司中存在着明显的优势(鸿海集团)，有一次笔者亲自去体验过红海集团的招聘，只知道人力资源是管理企业招聘的当时我被招聘上了，当时给我们培训的人
Linux自启动设置详解 bijian1013 linux
linux有自己一套完整的启动体系，抓住了linux启动的脉络，linux的启动过程将不再神秘。阅读之前建议先看一下附图。本文中假设inittab中设置的init tree为： /etc/rc.d/rc0.d /etc/rc.d/rc1.d /etc/rc.d/rc2.d /etc/rc.d/rc3.d /etc/rc.d/rc4.d /etc/rc.d/rc5.d /etc
Spring Aop Schema实现 bijian1013 java spring AOP
本例使用的是Spring2.5 1.Aop配置文件spring-aop.xml <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmln
【Gson七】Gson预定义类型适配器 bit1129 gson
Gson提供了丰富的预定义类型适配器，在对象和JSON串之间进行序列化和反序列化时，指定对象和字符串之间的转换方式， DateTypeAdapter public final class DateTypeAdapter extends TypeAdapter<Date> { public static final TypeAdapterFacto
【Spark八十八】Spark Streaming累加器操作（updateStateByKey) bit1129 update
在实时计算的实际应用中，有时除了需要关心一个时间间隔内的数据，有时还可能会对整个实时计算的所有时间间隔内产生的相关数据进行统计。比如：对Nginx的access.log实时监控请求404时，有时除了需要统计某个时间间隔内出现的次数，有时还需要统计一整天出现了多少次404，也就是说404监控横跨多个时间间隔。 Spark Streaming的解决方案是累加器，工作原理是，定义
linux系统下通过shell脚本快速找到哪个进程在写文件 ronin47
一个文件正在被进程写我想查看这个进程文件一直在增大找不到谁在写使用lsof也没找到这个问题挺有普遍性的，解决方法应该很多，这里我给大家提个比较直观的方法。 linux下每个文件都会在某个块设备上存放，当然也都有相应的inode, 那么透过vfs.write我们就可以知道谁在不停的写入特定的设备上的inode。幸运的是systemtap的安装包里带了inodewatch.stp，位
java-两种方法求第一个最长的可重复子串 bylijinnan java 算法
import java.util.Arrays; import java.util.Collections; import java.util.List; public class MaxPrefix { public static void main(String[] args) { String str="abbdabcdabcx";
Netty源码学习-ServerBootstrap启动及事件处理过程 bylijinnan java netty
Netty是采用了Reactor模式的多线程版本，建议先看下面这篇文章了解一下Reactor模式： http://bylijinnan.iteye.com/blog/1992325 Netty的启动及事件处理的流程，基本上是按照上面这篇文章来走的文章里面提到的操作，每一步都能在Netty里面找到对应的代码其中Reactor里面的Acceptor就对应Netty的ServerBo
servelt filter listener 的生命周期 cngolon filter listener servelt 生命周期
1. servlet 当第一次请求一个servlet资源时，servlet容器创建这个servlet实例，并调用他的 init(ServletConfig config)做一些初始化的工作，然后调用它的service方法处理请求。当第二次请求这个servlet资源时，servlet容器就不在创建实例，而是直接调用它的service方法处理请求，也就是说
jmpopups获取input元素值 ctrain JavaScript
jmpopups 获取弹出层form表单首先，我有一个div，里面包含了一个表单，默认是隐藏的，使用jmpopups时，会弹出这个隐藏的div，其实jmpopups是将我们的代码生成一份拷贝。当我直接获取这个form表单中的文本框时，使用方法：$('#form input[name=test1]').val()；这样是获取不到的。我们必须到jmpopups生成的代码中去查找这个值，$(
vi查找替换命令详解 daizj linux 正则表达式替换查找 vim
一、查找查找命令 /pattern<Enter> ：向下查找pattern匹配字符串 ?pattern<Enter>：向上查找pattern匹配字符串使用了查找命令之后，使用如下两个键快速查找： n：按照同一方向继续查找 N：按照反方向查找字符串匹配 pattern是需要匹配的字符串，例如： 1: /abc<En
对网站中的js,css文件进行打包 dcj3sjt126com PHP 打包
一，为什么要用smarty进行打包 apache中也有给js,css这样的静态文件进行打包压缩的模块，但是本文所说的不是以这种方式进行的打包，而是和smarty结合的方式来把网站中的js,css文件进行打包。为什么要进行打包呢，主要目的是为了合理的管理自己的代码。现在有好多网站，你查看一下网站的源码的话，你会发现网站的头部有大量的JS文件和CSS文件，网站的尾部也有可能有大量的J
php Yii: 出现undefined offset 或者 undefined index解决方案 dcj3sjt126com undefined
在开发Yii 时，在程序中定义了如下方式： if($this->menuoption[2] === 'test')，那么在运行程序时会报：undefined offset:2，这样的错误主要是由于php.ini 里的错误等级太高了，在windows下错误等级
linux 文件格式（1） sed工具 eksliang linux linux sed工具 sed工具 linux sed详解
转载请出自出处： http://eksliang.iteye.com/blog/2106082 简介 sed 是一种在线编辑器，它一次处理一行内容。处理时，把当前处理的行存储在临时缓冲区中，称为“模式空间”（pattern space），接着用sed命令处理缓冲区中的内容，处理完成后，把缓冲区的内容送往屏幕。接着处理下一行，这样不断重复，直到文件末尾
Android应用程序获取系统权限 gqdy365 android
引用如何使Android应用程序获取系统权限第一个方法简单点，不过需要在Android系统源码的环境下用make来编译： 1. 在应用程序的AndroidManifest.xml中的manifest节点
HoverTree开发日志之验证码 hvt .net C#asp.net hovertree webform
HoverTree是一个ASP.NET的开源CMS，目前包含文章系统，图库和留言板功能。代码完全开放，文章内容页生成了静态的HTM页面，留言板提供留言审核功能，文章可以发布HTML源代码，图片上传同时生成高品质缩略图。推出之后得到许多网友的支持，再此表示感谢！留言板不断收到许多有益留言，但同时也有不少广告，因此决定在提交留言页面增加验证码功能。ASP.NET验证码在网上找，如果不是很多，就是特别多
JSON API：用 JSON 构建 API 的标准指南中文版 justjavac json
译文地址：https://github.com/justjavac/json-api-zh_CN 如果你和你的团队曾经争论过使用什么方式构建合理 JSON 响应格式，那么 JSON API 就是你的 anti-bikeshedding 武器。通过遵循共同的约定，可以提高开发效率，利用更普遍的工具，可以是你更加专注于开发重点：你的程序。基于 JSON API 的客户端还能够充分利用缓存，
数据结构随记_2 lx.asymmetric 数据结构笔记
第三章栈与队列一．简答题 1. 在一个循环队列中，队首指针指向队首元素的前一个位置。 2.在具有n个单元的循环队列中，队满时共有 n-1 个元素。 3. 向栈中压入元素的操作是先移动栈顶指针&n
Linux下的监控工具dstat 网络接口 linux
1) 工具说明dstat是一个用来替换 vmstat,iostat netstat,nfsstat和ifstat这些命令的工具, 是一个全能系统信息统计工具. 与sysstat相比, dstat拥有一个彩色的界面, 在手动观察性能状况时, 数据比较显眼容易观察; 而且dstat支持即时刷新, 譬如输入dstat 3, 即每三秒收集一次, 但最新的数据都会每秒刷新显示. 和sysstat相同的是,
C 语言初级入门--二维数组和指针 1140566087 二维数组 c/c++指针
/* 二维数组的定义和二维数组元素的引用二维数组的定义：当数组中的每个元素带有两个下标时，称这样的数组为二维数组； (逻辑上把数组看成一个具有行和列的表格或一个矩阵); 语法：类型名数组名[常量表达式1][常量表达式2] 二维数组的引用：引用二维数组元素时必须带有两个下标，引用形式如下：例如： int a[3][4]; 引用：
10点睛Spring4.1-Application Event wiselyman application
10.1 Application Event Spring使用Application Event给bean之间的消息通讯提供了手段应按照如下部分实现bean之间的消息通讯继承ApplicationEvent类实现自己的事件实现继承ApplicationListener接口实现监听事件使用ApplicationContext发布消息

腾讯优图实验室AI手语识别研究白皮书

你可能感兴趣的:(腾讯优图实验室AI手语识别研究白皮书)