阿里技术

跨越声音障碍，虚拟数字人「手语翻译官」开发落地实践

作者：吴淑明达摩院机器智能技术团队

当前手语内容覆盖有限，听障人士难以从影音内容中获取更多的信息，在交流场景下也面临着沟通障碍。如何才能提升听障人士在社会生活日常沟通中的效率？本文将为大家分享虚拟数字人「手语翻译官」的技术实现。

一、背景

1.1 用户规模

世界银行的数据显示，全球大约有11亿残障人士，全球听障人士约有7000万+，中国残疾人总残疾人人数为8500万人左右，听障人士约2780万，占全国残疾人口的约30%，每年新增20万；浙江有90万。全国范围内手语老师数量不足, 专业的手语老师就更是少之又少。

1.2 聋人生活中的困境

与健听人的简单交流，即便使用文字也不能顺畅交流，再加上部分年长受教育程度低的人群，文字交流也困难。

由于听障人群的受教育程度以及独特表达和理解方式，导致他们的文字表述和语法结构与健听人完全不同，即便通过文字也无法便捷无障碍的与健听人沟通。听障人群与健听人之间的沟通障碍，严重影响了听障人群的生活质量。听障人群与健听人的沟通需求主要集中在几下情况：

较复杂的交流，就医、纠纷、水电煤银网办事等具有一定专业性、复杂性的交流场景，需要有一个专业的手语翻译人员协助，否则就是下面这句话：

晚上熬夜半夜早晨，他老换找位置舒服他妈妈多次断睡性帮他盖好被子别着凉，他有时翻中了我体位置得痛，看我醒酒冲来抱舒服能秒入睡了，哼！等中午他父母要补睡......

听人完全看不懂，这是在说什么？

深度交流：听障人士需要与听人进行深度的交流，通常是有一定专业性、复杂性的交流场景，如就医、水电煤银网办事等；

信息获取难度大：听障人士需要从听人世界的影音内容中获取更多的信息，而当前手语内容覆盖有限。

二、产品设计

2.1 产品调研

2.1.1 调研用户画像

听障人士：

1）听力受损程度在中重度及以上，在参与社会生活方面存在中度障碍，借助我们提供的产品，能有效提升其社会生活日常沟通效率；

2）会相对标准的手语，其通过手语所表达出的信息，在听障人群中，能被大多数听障人士看懂并理解；

3）至少具备普通智能手机使用能力。

听人：

1）与听障人士密切生活的非听障人群，与听障人士有较大的日常交流沟通诉求；

2）公共服务机构（政府、银行、医院、快递、商场等）的工作人员在日常工作中，可能会遇到要为听障人群提供服务的场景。

2.1.2 痛点场景

简单交流：听障人士需要与听人进行简短的交流，对话轮次通常不超过10轮即可完成，内容为日常生活所需的交流场景，如日常购物、出行、问询、工作交办；

深度交流：听障人士需要与听人进行深度的交流，通常是有一定专业性、复杂性的交流场景，如就医、水电煤银网办事等；

信息获取：听障人士需要从听人世界的影音内容中获取更多的信息，而当前手语内容覆盖有限；

参加会议：听障人士需要从有声会议中获取会议信息，当前主要通过讯飞的语音识别技术转成文字；

2.1.3 线下调研

场景一：A开车途中遇停车时，接打视频电话。

停车期间，通过微信视频，和他人进行手语沟通。相比于常人，A接打视频几乎是秒通，上午3小时的观察过程中，约有20次左右的视频接打。在车上主要通过车载手机支架固定手机。

分析：听障人士对手机视频通话的依赖较大，视频通话功能使用极为频繁。今天见到的几乎所有的听障朋友，均随身携带充电宝。

场景二：A到达法院后，寻找联系对象。

A没有去前台寻求帮助，径直走向电梯，出电梯后观察是否自己要去的地方，经历1-4-3-2-1多楼层寻找后，才到前台寻求帮助，打字告诉对方自己要找谁。

分析：和普通人沟通存在一定的障碍，导致听障人士非必要情况下，不会主动寻求常人协助，形成天然的鸿沟。

场景三：A和法官沟通案件细节。

进入沟通室后，法官建议使用微信平台上的微法院进行图文沟通。但A坚持使用手之声APP，在排队等待后，进入真人手语翻译视频通话。用手机支架将手机放置在桌面后，通过视频里的远程手语翻译，和法官完成了需要进行的沟通。A先是表达了另一涉案人的近期信息，之后提出要求，在法官给出处理意见后，A表示认可，并结束通话。适应了加入手语翻译的节奏后，对话过程的障碍相对较小。

分析：虽然能打字进行IM对话，但对A来说，还是认为远程手语翻译介入后的沟通效率更高。在环境简单不嘈杂，参与对话人数仅为3人（A、法官、远程手语翻译）的情况下，是可以进行沟通的。对A或是其他听障人士来说，使用手语翻译的效率，比起文字沟通要高很多。输入文字给对方看，适用于日常简短的沟通。如果是一个时间较长较正式的沟通，还是需要稳定的环境和手语翻译的帮助，才能顺利完成。

2.1.4 双向手语翻译的难点

1）我们就是第一人

我们是“首个”以双向手语翻译为目标的项目，实现从0到1的过程。现阶段同类的手语合成产品，按照自然语言的语序采用逐字翻译，忽视了听障朋友的语言逻辑与健听人语言逻辑的差别，导致听障朋友理解困难。现阶段手语识别还未有成熟的商用产品，精度仍然是最大的挑战。

2）巧妇难为无米之炊

由于听障朋友对外交流有限，已有手语数据存留较少，且具备手语能力的人群数量较少，进一步减缓了数据沉淀的速度。与语音识别、语种互译相比，获取充足、高质量的手语数据难度不言而喻。

3）手语的区域特性

由于听障朋友的活动区域局限，形成大到地区、小到社区的多元化手语打法风格。这对于数据沉淀的覆盖范围，以及数据本身多样性对算法的挑战都十分巨大。

4）手语是视觉语言

手语是一门视觉语言，语言表达顺序与自然语言完全不同且没有固定语法约束。手语生成需要生成符合听障人群表达习惯，便于理解的语言；相当于学习了一门新的语言，而不是单纯的逐字翻译，例如：自然语言中“灭火”在手语中的表达是“火→灭”，因为先看到火才能灭。

5）纯视觉方案的手语识别

相对于现有基于昂贵传感器的手语识别，我们是首个采用纯视觉方案（仅依赖手机摄像头），需要实时精准的图像处理算法研发，从捕获的手语视频中提取有效的空时信息，进行手语识别。

这里涉及实时高效的处理高维度的视频数据，同时要处理手语本身的多元性、多样性表达。这对视觉算法提出了更高的要求。

手语语速快，动作精细和多变，动作间相似度高。

6）工程难度大

业务并发量大：与以往的工程架构不同（接口调用），现阶段提供流媒体服务，若高并发的时候需要大规模的集群和资源调度。

响应延时问题：流媒体本身就有几百毫秒的延时，再加上双向翻译的流程中嵌入了大量的算法模块，导致延时加长。延时翻译非常影响产品的交互体验。

2.2 双向手语翻译

本文主要讲解技术实现，产品上仅仅放了实现后的一些产品使用。大家可以在支付宝上搜索《现声》体验。

产品链路：

2.3 手语合成

可以在数字人手语播报平台进行手语内容的生产：

https://avatar.aliyun.com/#home

三、技术落地

依托云原生技术，池化数字人云渲染服务，实现数字人的不同业务模型下的快速服务，完成手语翻译单设备单工开发及手语合成实时翻译、文本转手语合成翻译、视频转手语合成翻译。

3.1 技术方案设计

1）因为涉及实时图像识别，对于网络带宽的要求非常高，所以我们当前将视觉相关算法和流媒体部署在同一个pod，从而降低网络开销及识别时延。

2）手语识别技术最大难度是“手语识别的图像数据来源，以及图像数据的标注团队”，技术上必须解决训练数据的生成效率问题。

3）由于听障和听人信息交互方式存在差异，听障朋友给出的是物理世界能形容的事物，整句话是由一堆动/名词组成，还会涉及到倒装，所以必须加一个手语词汇转自然文本的翻译模块。

4）相同与第3点，手语合成也需要一个文本转手语模块，将自然文本转换成手语词汇，同时面临第2点一样的数据问题。

专有名词解释

媒体服务：流媒体模块，负责编&解码，rtc渠道的订阅和推送，本地视频转码录制，解码后图片推送。

手语识别：算法模块，按照协定的图片格式输入图片，输出一系列手语词汇。

手语转文本：算法模块，输入手语词汇，输出自然文本。

手语合成：算法模块，输入手语词汇，情绪及等级，输出手语keypose和bs数据。
文本转手语：算法模块，输入自然文本，输出手语词汇，并且传输给BH模块。
行为交互逻辑：工程模块，统一决策调用数字人交互逻辑。
agent：工程模块，负责各个POD容器之间的消息传输。
3D渲染引擎：渲染模块，负责数字人实时渲染，生成数字人帧数据。

3.2 方案落地

初期产品上希望实现单设备双工模式，确实也实现了一个单设备双工模式，但由于环境噪音依赖终端设备的降噪，手语摄像头安放位置等等因素，最终确定使用单设备单工模式。

3.2.1 单设备单工模式-《现声》

解决ASR识别不准确问题，可实时在线进行人工干预。
解决手语识别不准确的情况下进行人工干预。
单工模式下手语翻译官支持主动打断，这需要依赖行为交互逻辑模块的实现交互逻辑的处理。

实时手语识别链路技术方案

1）手语识别帧数据要求为10FPS、360P。

2）端上通过RTC将帧数据推送上来。

3）media在数字人没有启动的前提下，会自动向手语转手语词汇模块发送空白帧数据，空白帧数据为全0图片数据，算法不会产出任何结果。

4）数字人开始工作后，流媒体解码出第一帧时候，并且发送手语转手语词汇模块，手语识别才开始工作，手语转手语词汇发送识别结束事件给行为树。

5）手语识别中间会实时返回识别结果，结果为累积数据，并且通过手语识别结果事件发送给行为树模块。

6）行为树模块将手语识别结果发送给手语词汇转自然文本模块。

7）手语词汇转自然文本模块会产生手语识别结束事件，并且进行本地redis缓存。

8）行为树决策引擎，等收到手语识别结束后，行为树向前端发送手语识别结束事件，默认回到数字人界面，等待播报内容。

9）如果需要进行语音播报，行为树会发送播报文案给媒体，并且发送文案给前端展示，流媒体合成tts后，插入到流媒体里面。

实时手语合成链路技术方案

实时手语合成算法处理方案

关于手语标注数据，可以参考《手语众包》这一章节。

算法核心会计算词汇动作与词汇动作之间的过渡帧，及词汇动作到空闲动作的过渡帧，这要求数据标注的时候，尽量标注出空间最接近于空闲动作的那一帧数据。
实时手语合成unity处理方案，通过实时渲染加媒体视频编码转RTC的方式实现。

行为树编排

核心目的：解决数字人交互过程中，工程、算法、前端等各个模块对数字人行为变化及C端GUI交互反馈。抽象数字人行为节点，降低代码开发，通过编排的方式快速实现数字人业务落地。

例如：

用户切换成手语识别时， TTS要主动打断。

用户呼叫时，要等待C端用户订阅流成功后，数字人才开始打招呼。

TTS开始播报是， TTS文案才显示在前端页面。

TTS结束播报后， TTS自动消失，或者长期维持不变。

1）行为树提供大量的流程控制方法，使得状态之间的改变更加直观；

2）整个游戏AI使用树型结构，方便查看与编辑；

3）方便调试和代码编写；

4）最重要的：行为树方便制作编辑器，可以交由策划人员使用。

3.2.2 手语合成

1）算法及协议复用单设备单工流程，修改行为树逻辑实现，仅实现行为树任务流程管理。

2）实时手语翻译、离线文本手语翻译及视频手语翻译保持同一套架构。

3）离线音视频手语合成，因为手语的速度与音频播报速度不一致，针对手语给出的时间消耗是不一样的，所以需要离线音视频手语合成专门做定制。

4）实时手语合成，由BH模块复用行为树实现，但是行为树的编排存在差异。

5）离线文本&离线视频合成由BH模块实现定时任务实现。

6）离线音视频手语合成音视频用左对齐的方案实现。

7）离线合成整体的渲染流程与实时渲染保持一致。

8）表情驱动：

文本转手语输入文本，识别用户情感类型及情感强度。
词汇转手语输入用户情感类型和强度，从而输出数字人表情和动作。(表情和动作是事先标注和制作完成的。)
情感分7个类别和3个强度来进行表情驱动。

四、数据生产

1）数据对于手语来说是最核心组成部分。

数据的产出是特殊人群。
数据的定义和拆解无法靠听人解决。

2）3D手语动作数据的采集方案、成本等都没有可参考的成功案例。

4.1 3D数据资产

4.1.1 3D资产静态生产流程

静态资产包含“原画”，“中之人3D超高精度模型5000万面”，“高/中/低灰模”，“蒙皮贴图”，“服装道具”，“头发”，“BS&骨骼绑定”，“蒙皮绑定”。静态资产做完之后，才能进入动捕阶段。
为了降低整体的生产成本，我们打算使用手语老师作为中之人，防止由于3D模型服装道具的变化，引入的动作资产的修改。
人物原型设计主要是人物原画的输出。
模型制作
蒙皮贴图
BS面部绑定
keypose绑定
衣服&道具制作

4.1.2 3D动态资产制作

动捕设备确定，最终我们确定使用光学动捕。
手套，使用数据手套进行动捕。
动捕场地和供应商由我们指定。
动捕完成后由指定供应商进行精修。
动捕资产交付上线。

4.2 手语众包

4.2.1 手语词典

难点：如何组织一批无法沟通，特殊领域的群体，生产我们需要的数据。因此我们选择支付宝作为手语众包的载体。

4.2.2 词汇定义

词根：指单一一个手语动作，最小手语颗粒度
融合词汇：由多个词根组成的手语词汇
专有名词：应用于特殊领域的专业词汇
敏感词：指不可以进行播报的词汇，比如涉黄、涉毒等等
一词多义：一个自然词汇有多种打法
相似打法：一种打法可以映射到多个自然词汇上

4.2.3 词典组成

4.2.4 数据标注

从零实现B站视频下载器：Python自动化实战教程木觞清 #编程语言自动化运维
一、项目背景与实现原理1.1B站视频分发机制Bilibili的视频采用音视频分离技术，通过以下方式提升用户体验：动态码率适配（1080P/4K/HDR）分段加载技术（基于M4S格式）内容保护机制（防盗链/签名验证）1.2技术实现路线graphTDA[模拟浏览器请求]-->B[获取加密播放信息]B-->C[解析音视频地址]C-->D[多线程下载]D-->E[FFmpeg合并]二、代码逐层解析2.1请
从基础到实践（十九）：DC/DC由来和工作原理介绍硬件进化论嵌入式硬件单片机压力测试电脑智能手机数码相机智能手表
第一章DC/DC技术的起源与演进之路1.1电力革命的早期困境（1880s-1940s）在爱迪生与特斯拉的"电流战争"时期，直流供电系统暴露出传输损耗大的致命缺陷。尽管交流电最终成为电网主流，但直流电在终端设备供电的不可替代性催生了最早的电压转换需求。1930年代真空管收音机的普及使这一问题凸显：车载6V蓄电池需升压至200V以上供电子管工作，工程师们通过笨重的机械振动子式换流器（VibratorC
PTA--- 666(递归搜索）对方正在长头发丿算法数据结构蓝桥杯 c++深度优先
题目描述：小明有一张m*n的好习惯记录卡，记录每一天的好习惯目标达成度（数字0-9表示）。某天目标完成达成，就在当天的格子里写上数字6，目标没有完全达成就写上一个小于6的数字（0-5），目标超额完成就写上一个大于6的数字（7-9）。记录卡上如果能找到一条长度为3的路径并且路径上的三个数字都大于等于6（这里的路径是指从某个格子出发，可以向左、右、上、下格子移动，并且不能重复经过一个格子），则小明就能
chatgpt赋能python：Python处理雷达基数据：从入门到实践 lvsetongdao123 ChatGpt python chatgpt 开发语言计算机
Python处理雷达基数据：从入门到实践随着气象技术的不断发展，雷达探测技术已成为当今天气预报和气象研究的主要手段之一。雷达基数据是气象雷达接收到的未经加工的原始数据，因其包含大量天气信息，不仅在天气预报、天气预警等方面得到了广泛应用，还被广泛地用于气象科研和大气环境研究。本文将介绍如何使用Python处理雷达基数据，解析其中的信息，获取有效的天气数据，以及分析和可视化这些数据。雷达基数据格式与处
PTA天梯赛PYthon7-10 树的遍历胡同Alley 算法数据结构 python
给定一棵二叉树的后序遍历和中序遍历，请你输出其层序遍历的序列。这里假设键值都是互不相等的正整数。输入格式：输入第一行给出一个正整数N（≤30），是二叉树中结点的个数。第二行给出其后序遍历序列。第三行给出其中序遍历序列。数字间以空格分隔。输出格式：在一行中输出该树的层序遍历的序列。数字间以1个空格分隔，行首尾不得有多余空格。输入样例：723157641234567输出样例：4163572代码长度限制
innovus命令每日精要 | setCheckMode：数字后端物理设计的必备神器数字后端物理设计知识库 innovus 命令每日精要后端性能优化
在数字后端物理设计的领域中，确保设计数据的完整性和正确性是至关重要的。今天，我们要深入探讨的是Innovus中的一个强大命令——setCheckMode。这个命令就像是你的设计流程中的“健康卫士”，能够在各个阶段帮你揪出潜在的数据问题，避免因小失大，让错误在流程中扩散。检查模式核心功能大揭秘1.设计数据完整性检查：全面扫描，无死角-all选项就像是给你的设计做一次“全身CT”，开启所有检查选项，确
做电池寿命预测有福了---2024最新退化数据集，来自cell子刊优化算法侠Swarm-Opti 深度学习数据集电池寿命预测深度学习人工智能
引言本期介绍2024年最新发表在cell子刊CellReportsPhysicalScience上的电池退化数据集。该数据集是世界上规模最大，最贴近实际运行场景，持续时间最长的电池退化数据集。在实验室和现实生活中对电池退化进行了为期4年的广泛实验调查，考虑了随机充放电电流、频率、深度以及多电池成组、环境温度的影响，涉及数百个电池和电池组的大约546,000次充放电循环。参考文献DongzhenLy
如何创建HTML自定义元素：使用 Web Component 的最佳实践乐闻x Web Component 学习记录前端 html web component
什么是WebComponent？WebComponent是一组允许开发者创建可复用、自定义HTML元素的技术。它们使得我们可以像原生HTML标签一样使用这些自定义元素，从而提升代码的模块化和复用性。WebComponent的核心技术有以下三部分：CustomElements（自定义元素）：允许开发者定义自己的HTML标签。ShadowDOM（影子DOM）：为元素提供封装的DOM和样式，让组件内部的
低成本入门！盘点6款适合中小企业的ERP系统
在竞争激烈的市场环境中，中小企业亟需通过数字化工具提升运营效率。ERP系统（企业资源计划）能够整合财务、库存、销售等核心业务流程，是降低成本、优化管理的关键利器。今天，我将为大家推荐6款便宜又好用的ERP系统，分别从功能、价格、适用场景等方面为大家详细介绍这些产品，希望能帮助你找到最适合自己企业的ERP系统。一、ZohoBooks：轻量级ERP，中小企业的全能助手ZohoBooks是Zoho旗下专
思途CMS高并发、高性能、高可用架构设计 php
一、整体架构概述思途CMS采用分层架构设计，整体架构分为客户层、接入层、站点层、数据存储层和缓存层。各层之间通过松耦合的方式协同工作，确保系统在高并发场景下的高性能和高可用性。通过分布式部署、负载均衡、多级缓存等技术手段，思途CMS能够有效应对大规模用户访问，保障系统的稳定性和响应速度。二、各层技术特点及实现方式客户层1.1CDN加速思途CMS支持与主流CDN服务商（如阿里云CDN、腾讯云CDN等
MMScan数据集：首个最大的多模态3D场景数据集，包含层次化的语言标注数据集
2024-10-24，由上海人工智能实验室联合多所高校创建了MMScan，这是迄今为止最大的多模态3D场景数据集，包含了层次化的语言标注。数据集的建立，不仅推动了3D场景理解的研究进展，还为训练和评估多模态3D感知模型提供了宝贵的资源。一、研究背景：随着大型语言模型（LLMs）的兴起和与其他数据模态的融合，多模态3D感知因其与物理世界的连接而受到越来越多的关注，并取得了快速进展。然而，现有的数据集
2025年从DeepSeek到Manus：AI如何重塑企业价值报告600+份汇总解读|附PDF下载
原文链接：https://tecdat.cn/?p=41172当前全球AI技术正从实验室走向产业化深水区，本报告以企业价值重构为核心，通过技术演进路径、行业竞争范式、落地实施策略三大维度，揭示AI如何从成本中心转变为价值引擎。数据显示，2025年生成式AI在中国创造的潜在经济价值达2万亿美元，其中制造业、电子行业生产力增益最为显著。本报告汇总解读基于《发布机构：华中科技大学数智管理与传播研究团队、
专门为高速连续扫描设计的TDI工业相机 51camera 工业相机线阵工业相机 TDI工业相机
TDI（TimeDelayIntegration，时间延迟积分）工业相机是一种基于特殊CCD（电荷耦合器件）技术的成像设备，主要用于高速、高灵敏度、高分辨率的图像采集场景。其核心原理是通过多级积分和同步电荷转移技术，在物体连续运动时逐行扫描并累积信号，显著提升图像质量和信噪比（SNR）。它是一种特殊的线阵工业相机。核心原理1.多级积分：TDI相机通过多行感光单元（如多级CCD）对同一运动目标进行多
工业相机的主要参数及计算 51camera 工业相机
工业相机是机器视觉系统中的关键组件，其本质是将光信号转变为有序的电信号，进而实现数字图像的获取，广泛应用于工业生产、检测、测量等领域。其成像原理与小孔成像类似，但更为复杂。当被摄物体反射的光线通过工业镜头折射后，会投射到相机的感光传感器上，这个感光传感器通常是电荷耦合器件（CCD）或互补金属氧化物半导体（CMOS）。dalsanano系列工业相机1、工作原理图像采集：通过镜头收集被拍摄物体反射或透
仓库可视化管理有哪几个点： wms系统
在现代仓库管理的广阔议题中，仓库可视化无疑是一个无法绕过的关键话题。无论是对现场管理进行深度优化，还是在数字化系统的选择上，企业都致力于实现仓库整体运营数据的直观展现与高效管理，以推动仓库管理水平的全面提升。仓库可视化的内涵丰富，主要包括以下几个方面：仓库运营可视化：通过智慧大屏的融入，仓库的动态数据得以生动呈现。这包括但不限于已处理订单数量、待处理订单数量、实时库存等核心运营指标。库存可视化：这
【AI大模型】RAG如何让生成AI更智能？最新方法与优劣深度解析健忘的派大星人工智能语言模型 ai AI大模型 agi RAG 程序员
前言近年来，人工智能技术突飞猛进，尤其是生成式AI，简直像是开了挂一样，各种惊艳的表现让人直呼“未来已来”。根据IDC的研究，生成式AI的市场规模在2022年已经达到了107亿美元，而到2026年，这个数字预计会飙升至326亿美元！不过，尽管生成式AI很强大，但它也并非完美无缺——比如生成内容的质量、准确性和可靠性，依然有提升的空间。这时候，检索增强生成（RAG）技术登场了！RAG的核心思路很简单
Java的泛型一朵忧伤的蔷薇 java windows 开发语言
Java的泛型（Generics）是一种编程技术，它允许类、接口和方法在定义时使用参数化类型。通过泛型，可以编写更加通用和类型安全的代码。以下是Java泛型的一些关键知识点：1.泛型类（GenericClass）定义泛型类时，使用尖括号{privateTt;publicvoidset(Tt){this.t=t;}publicTget(){returnt;}}这里的T是一个类型参数，可以在实例化类时
Java的正则表达式一朵忧伤的蔷薇 java 正则表达式开发语言
Java中的正则表达式(RegularExpressions,简称regex)是一种强大的工具，用于在字符串中搜索、匹配和替换特定的模式。以下是Java正则表达式的一些基础知识点：1.基本语法字符类:.匹配任意单个字符（除了换行符）。\d匹配任意数字，相当于[0-9]。\D匹配任意非数字。\w匹配任意字母、数字或下划线，相当于[a-zA-Z0-9_]。\W匹配任意非字母、数字或下划线。\s匹配任意
OpenTiny技术直播讲师招募：与开源同行，点亮技术影响力！前端组件化低代码开源
OpenTiny企业级前端开发解决方案，正在寻找热爱分享的技术达人！加入我们的直播讲师团，与众多开发者一起分享你的经验，推动技术普惠，同时打造个人技术影响力！报名链接：https://www.wjx.cn/vm/tw7FOgC.aspx#
Websoft9 开源软件实操平台：快速积累企业级软件技能，深入理解真实业务场景开源创业
引言：打破“纸上谈兵”的实训困境当前高校技术教育普遍面临一个矛盾：学生对开源工具的理论知识掌握充分，但在真实业务场景中常因环境配置复杂、工具链割裂而难以落地。例如，部署一套完整的电商系统需协调数据库、服务器、安全策略等多环节，传统虚拟机环境难以模拟企业级复杂度。Websoft9作为开源软件自动化部署工具，通过预集成200+企业级应用模板（如GitLab、Odoo、Jenkins）和全流程管理能力，
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算【超级详细版】 AI筑梦师计算机视觉算法深度学习人工智能机器学习计算机视觉 python
智能形状匹配技术全解析：从经典算法到深度学习与神经形态计算1.引言1.1研究背景在计算机视觉、模式识别、医学影像分析和自动驾驶等领域，形状匹配是核心任务之一。然而，现实世界的形状往往存在可变性（Variability），主要体现在以下几个方面：形变（Deformation）：物体可能由于柔性材料、外力作用或生物运动发生非刚性形变。尺度变化（ScaleVariation）：目标形状在不同场景下可能大
数据库 + Spring Boot + Vue 全栈交互逻辑详解代码CC Java项目-开发 spring boot vue.js mysql 数据库开发语言
目录整体架构概述技术栈说明数据库设计规范SpringBoot后端架构Vue前端架构完整交互流程关键技术实现细节安全与性能优化异常处理机制整体架构概述graphTDA[Vue前端]-->|HTTP请求|B(SpringBoot后端)B-->|JDBC/ORM|C[(数据库)]C-->|返回数据|BB-->|JSON响应|AA-->|状态管理|D[VuexStore]B-->|缓存|E[Redis]B
飞书自定义机器人消息接入指南师小师飞书机器人
操作流程第一步邀请自定义机器人入群：进入你的目标群组，打开会话设置，找到群机器人，并点击添加机器人，选择自定义机器人加入群聊。为机器人输入一个合适的名字和描述，也可以为机器人设置一个合适的头像，然后点击下一步。第二部：配置webhook获取该机器人的webhook地址，格式如下：https://open.feishu.cn/open-apis/bot/v2/hook/xxxxxxxxxxxxxxx
Vue.js + Element UI 实战：手把手教你实现评论关键词过滤功能，新手必学！》《前端开发必备技能：Vue 2 + Element UI 实现评论敏感词过滤，完整代码分享》《新手友南北极之间 vue.js ui 前端敏感词关键词敏感词过滤
效果图【定制化开发服务，让您的项目领先一步】如有需求，直接私信留下您的联系方式。谢谢。我的邮箱：[email protected]以下是基于Vue2和ElementUI的评论关键词过滤功能实现，使用CDN引入Vue和ElementUI，方便在浏览器中直接预览。在线预览：Vue2+ElementUI实现评论关键词过滤功能目录需求场景技术选型实现步骤引入Vue2和ElementUI创建评论界面实现关键
使用LangChain实现大规模语言模型自发现推理结构 VYSAHF langchain 语言模型人工智能 python
使用LangChain实现大规模语言模型自发现推理结构在现代自然语言处理(NLP)的研究中，大规模语言模型（LLMs）已经展示了强大的能力。然而，在应对复杂的推理问题时，传统的提示方法常常力不从心。这篇文章将带您了解SELF-DISCOVER，一种新兴的框架，如何通过LangChain来实现自动化、动态化的推理结构构建，以提高LLMs的性能。技术背景介绍大规模语言模型（如GPT-4和PaLM2）已
机器人触觉的意义越来越胖的GuanRunwei 触觉传感机器人触觉传感人工智能
机器人触觉的重要性触觉在机器人领域至关重要，尤其是在自主操作、精细操控、人机交互等方面。虽然视觉和语音技术已高度发展，但机器人在现实世界中的操作仍然受限，因为：视觉有局限性：仅凭视觉，机器人难以判断物体的材质、温度、表面摩擦力等信息。例如，看起来像金属的物体，可能是塑料镀层。接触与力控制是核心问题：无论是抓取、操作工具，还是进行柔性物体（如布料）操作，触觉信息比视觉更直接。例如，手术机器人需要触觉
deepseek 对于 Web 前端过去，现在，未来的看法！称未来可能不叫前端工程师... CoderBin_ 与deepseek的对话前端
一、你对于过去的web前端有什么看法？对早期的Web前端开发（大致在2000年代至2010年代初），可以总结出以下几个关键看法：1.技术原始，但充满探索精神基础技术简单：主要依赖HTML、CSS和原生JavaScript，缺乏现代框架和工具链的支持。兼容性噩梦：不同浏览器（尤其是IE6/7）的渲染差异极大，开发者需要大量Hack代码（如条件注释、CSS滤镜）来适配。创新萌芽：AJAX（2005年）
A Survey of Large Language Models大模型综述论文章节总结 WhyteHighmore 论文语言模型人工智能自然语言处理论文笔记
ASurveyofLLM人大译ASurveyofLargeLanguageModels这篇论文全面回顾了大型语言模型(LLM)的最新进展，重点关注其发展背景、关键发现和主流技术。文章主要围绕LLM的四个主要方面展开：1引言自从1950年图灵测试被提出以来，人类一直在探索机器掌握语言智能的方法。语言本质上是一种受语法规则支配的复杂、精细的人类表达系统，这使得开发能够理解和掌握语言的强大人工智能(AI
Apache Storm实时流处理的核心技术 Hello.Reader 大数据 apache storm 大数据
1.引言ApacheStorm是一个开源的、分布式的实时计算系统，专为处理流式数据而设计。它能够处理大量数据流并在极低的延迟下提供实时的结果。相比于传统的批处理系统，Storm具有处理无限数据流的能力，支持非常高的可扩展性和容错机制。Storm可以适用于多种编程语言，具有高度的灵活性。1.1什么是ApacheStorm？ApacheStorm是一个流处理引擎，它可以持续处理不断到来的数据流（str
linux下安装卸载永中office步骤,永中集成Office For Linux安装图文指南及简介 weixin_39625975
永中集成OfficeForLinux安装图文指南及简介永中集成Office在一套标准的用户界面下集成了文字处理、电子表格和简报制作三大应用，提供自选图形、艺术字、剪贴画、图表和科教编辑器等附加功能；基于创新的数据对象储藏库专利技术，有效解决了Office各应用之间的数据集成问题，构成了一套独具特色的集成办公软件。永中集成Office用户界面和使用方式与常见Office相似，易学易用；能够双向精确兼
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本