腾讯AI实验室

腾讯AI Lab副主任俞栋：语音识别领域的现状与进展

感谢阅读腾讯AI Lab微信号第27篇文章，去年9月，AI Lab推送过一篇关于深度研究的论文概述，该论文由腾讯 AI Lab 副主任兼西雅图实验室负责人俞栋博士，与微软首席应用科学家兼技术负责人李锦宇联合撰写，详情可点击这里查看。

日前，媒体「机器之心」在腾讯 AI Lab 学术论坛上对俞栋博士进行了专访，包括语音领域的研究现状如何；是否得到了业界的肯定与应用；腾讯 AI Lab 的进展如何；又有哪些新的目标。以下，是他关于这些问题的答案。

语音领域：Where are we standing?

机器之心：语音领域整体的研究处于一个什么状态？

俞栋：去年底在 NIPS 会议上南大的周志华教授还和我开玩笑说，「语音识别已经解决了，你不要做了。」相信很多人有类似的感觉。虽然很多公司已经宣称可以在标准数据集或安静的近场环境下达到「97% 识别率」、「超过人」等等水平，但是实际上市面上的产品，在很多真实应用场景下，尤其是远场、中文夹杂英文、旁边有人说话等等情况下，效果还远远达不到期望值。还有很多待研究的问题。

机器之心：从标准数据集到真实场景，待解决的问题都有哪些？

俞栋：有很多。比如，现在的系统鲁棒性都不太高，而且都还依赖增加数据（包括合成的模拟数据）来提高鲁棒性。这一点对于基于深度学习的系统来说尤为明显：数据没覆盖的情况就做不好，是这类方法的一个局限性。

这个世界的可能性是无限的，即使采集了几十万小时的数据，也不能覆盖所有的情况，还是会有很多新的、没见过的场景。而标准数据集的一个特点是，训练集和测试集之间是强相关的，换言之，它们之间的不匹配度（mismatch）不大。

很多机器学习方法都要遵循一个基本假设：训练集和测试集符合同一分布。不满足这一要求的话，学出来的模型的效果是没有理论保证的。而真实场景，恰恰是不保证训练集与测试集满足同分布假设的情况。

在语音识别研究的历史上，很早就有人意识到了这一问题，并开发出了很多自适应算法，试图根据场景和环境的变化做自适应。目前来说，自适应算法起到了一定的作用，但是还不能完全解决鲁棒性问题。

机器之心：理论上来讲，推理的数据与训练数据不满足同分布假设的话，机器学习模型会整体失效。那么自适应算法最终能够解决鲁棒性问题吗？

俞栋：真实场景和训练集之间所谓的「不满足同分布假设」大概率来讲不是「完全不满足」，而是「近似」或者「满足一些」。因此机器学习模型的识别率虽然会下降，模型仍然可用。只不过需要采用一些方法来弥补大致满足与完全满足同分布情况下的差距。

自适应算法只是其中一种方法，它有多个变种。比如可以用另外一个模型来判定分布变化与否，甚至判定如何变化，从而将变化后的特征或分布「恢复」成和训练时所见基本一样的情况再进行识别。举个例子，如果一个模型用我的声音做训练，然后去识别你的声音，效果就会很差。但是如果有一个模型，专门刻画人声的特点，并且在训练的时候，就把「说话人身份」（Speaker ID）作为一个重要的变量放进去，那么今后在识别其他人的时候，只要把说话人身份替换掉，就能获得识别率的上升了。问题在于，这种对于变化的估算也会引入误差，相对的性能还是会有损失。

四个前沿问题的进展

机器之心：端到端模型之前，语音识别模型的发展历程是什么样的？

俞栋：以前的语音识别系统基于高斯混合模型（Gaussian Mixture Model, GMM）和隐马尔可夫模型（Hidden Markov Model），合在一起，叫 GMM-HMM 模型。

在 90 年代初期，伯克利大学的研究人员就开始用多层感知机加上隐马尔可夫模型进行语音识别，由于模型由一个传统的生成模型 HMM 和一个比较时髦的判别式模型神经网络组成，他们称其为混合模型（Hybrid Model）。2010 年，我们用深层神经网络替换掉了浅层神经网络，用上下文相关音素（Phoneme）替换单音素作为建模单元，仍然沿用混合模型的基本架构但增加了建模单元的数量，取得了识别效果上的突破。

最近的端到端模型则完全不再需要隐马尔可夫模型，从头到尾都是一整个神经网络。有时候需要结合外部语言模型，如果数据比较多，连外部语言模型都不需要了。

机器之心：端到端识别模型有哪些进展呢？

俞栋：在即将召开的 ICASSP 上，谷歌会发表一些相关文章，部分预印版已经放在 arXiv 上了，文章里提到当使用大量训练数据时可以在语音搜索任务的某一个测试集上做到和混合模型一样的效果。但是在真实场景下当出现没见过的尾端（tail）搜索词的情况下，效果还有差距，这表明这些模型记忆能力很强但是举一反三的能力还比较欠缺。

但无论如何，这仍然是十分可观的进展了，因为之前的端到端系统和混合模型之间的差距还很大，现在这个差距在缩小，甚至在某一场景下端到端模型可以做到超越，这都是比较大的进展。

腾讯 AI Lab 最近几个月也做了一些类似的工作，在数据量比较少，也就是端到端系统的优势更不能得到体现的情况下，用一些新的算法和技巧大幅提高了性能。

应该看到，在端到端系统上面，大家的投入是比较多的，也确实有一些比较有意思的进展。但是端到端系统是否能替代混合模型，仍然是未知数。

只有当新模型比旧模型好很多的时候，替换才会发生。当然，这里的好是多方面的，不单单是识别率好，也可能是在其他指标不变的情况下你的运算量小了，或者是解码速度提升了。

机器之心：端到端模型在产品中有实际应用吗？

俞栋：目前的端到端系统基本上基于两个框架，一个是 CTC（Connectionist Temporal Classification）框架，一个是基于注意力机制的 seq2seq 框架。

刚才提到的谷歌的论文用的是基于注意力的框架，投入使用相对较少。CTC 模型用得相对较多。腾讯的产品上既有 CTC 模型，也有混合模型，性能没有太大区别。

CTC 的好处是可以采用更大的建模单元，坏处是存在一个随机延迟的问题，即结果出来的时间不是预先可知的。随机延迟的后果是断句困难，这会给用户造成一种「你怎么比别人慢」的感觉。

因此，做交互的系统，比如语音助手类，大部分仍然在使用混合系统。而对实时性没有要求的产品，比如 YouTube 的字幕生成器，因为可以离线，所以有延时也没有关系。

机器之心：鸡尾酒会问题的现状如何？

俞栋：大家都很重视鸡尾酒会问题，因为这是远场里必须解决的重要问题，因此也有蛮多进展。

一个当然就是我们之前提出的置换不变性训练（Permutation Invariant Training）的方法，我们在很多场景下都做了不同的尝试，也有其他的学校以及公司，在我们的工作上做了一些拓展。

此外还有其他重要的方法被提出来，比如 MERL 的深度聚类（deep clustering）方法和哥伦比亚大学的深度吸引子网络（deep attractor network）。另外 NTT 还提出了一种跟我们不同的设定，我们的设定是两人同时说话时，要将两人分开，同时识别两个人的语音。他们的设定是在两个人同时说话时，只跟踪其中一个人的声音。在这个设定下我们也有一些有趣的进展。

不过这些都还属于研究性工作，还没有放在产品中。

机器之心：持续预测与适应的模型情况如何？

俞栋：这类模型的研究已经在我们的实验室列项了，应该是一个很有「做头」的问题，但是目前还没有很多进展。值得一提的可能是预测双向 RNN 的反向状态使单向 RNN 的性能提升的工作。

机器之心：声学前后端从独立优化到联合优化的进展如何？

俞栋：相比于独立优化，现在业界的情况是前后端联合优化已经占了大多数。

前后端联合优化把前端和后端紧紧绑在了一起，好处是如果前后端系统都是自己开发的，那么效果会很好，坏处是一旦换一个前端/后端之后，会出现整体效果变差的情况。

因此，我们要针对场景进行不同的设计。在某些场景下，我们还是要分割开做优化。例如在声学前端，降低噪声和减小变形（distortion）就是一对要同时考虑的矛盾的目标，需要针对场景做特殊优化。

从语音的角度看先验

机器之心：Yann LeCun 和 Christopher Manning 之前在斯坦福进行了一场关于先验的讨论。LeCun 倾向于使用尽可能少的先验，因为作出的假设总会和一小部分数据冲突，从而限制最后能达到的最低错误率。而 Manning 倾向于认为当前的模型都还是「差劲的学习者」，学界需要对先验以及结构更有信心，尝试引入更丰富的结构，允许人们在更少的时间内、以更少的数据获得更高效的学习器。站在语音研究者的角度，您如何看待先验这一问题？

俞栋：先验的作用可以说是一个哲学问题了。这两位学者给出的答案不同，更多是因为他们的优化目标和场景不同。

LeCun 希望找到一个更通用的算法，因此当然希望假设越少越好，跟问题越不相关越好。因为如果你针对某个特定问题加入先验，那么模型虽然可以保证这个问题的效果，但肯定会在某一些场景下工作得不好。

Chris Manning 的立场则不同：他面对的问题是，给定场景、给定现有模型，在这种前提下，如何把某一任务做好。这时，把先验，尤其是网络结构类型的先验添加进去，是会提升系统性能的。

这个问题也和训练数据量有很大的关系。如果想要训练一个能区分猫和老虎的分类器，但训练数据只有 5 幅猫的图片和 5 幅老虎的图片，该如何选择模型呢？这个设定下，大部分模型都无法工作，只有一种模型可以，就是添加了非常强的先验的模型。比如说，模型设计者预先知道，老虎都在山里跑，背景是绿色的，猫都在家里，背景是灰白色的。那么把这个先验知识加进去，就可以设计一个简单的模型，测试一下背景颜色，做个分类，大部分情况下就能分对了。但这些知识不是机器学出来的，是人放入的先验知识。

如果训练数据非常多，接近无穷多，这时情况更有利于 LeCun 的观点，也就是做假设的意义不大甚至可能因假设不对起反作用。如果训练数据不足，就需要人在模型设计阶段把问题的特殊结构提取出来，添加进模型作为先验。不过在现实场景下的绝大多数问题训练数据都是不够多的，所以某种先验或者偏置是必须的。当然，最好的情况是机器自己能够发现或总结这些特殊结构并加以利用。

机器之心：现阶段的语音处理方面的数据量更接近于哪一端？

俞栋：在处理语音问题时，我们加了非常多先验在里面。如果目标是做通用的语音识别器，语音的数据量还差得远，比如一个人说话声音与两个人、三个人混合的声音就差很远，所以语音的数据量还是远远不够的。

但如果我们只关心某个特殊的应用场景比如「语音搜索」，那么在有些公司比如谷歌数据量有可能达到基本满足要求的程度，但是这个专门为语音搜索定制的识别器，一旦被用于识别其他内容，效果可能就没那么好了。

现在业界还是愿意为了产品性能去投入采集数据的，因此初始训练数据集的量不会太少。存在的问题是在产品投放出去之前，采集到的数据很可能和最终产品形态不一致，不是独立同分布，因此训练效果不够好，只能用这部分数据 bootstrap 启动一个系统。等到系统投放到市场上，采集到真实数据，再用真实数据提升模型性能，进入一个正向的循环。

数据是一个非常重要的资源，数据量不够，很多模型没办法用，即使用上了，也达不到期望的要求。这是因为现在的机器学习有三个很重要的因素，分别是数据，计算力，和算法，这三者加起来，才是最后系统的性能。三个要素中，如果缺少任何一个，系统的性能就会差很多。如果算法比别人好一点，但是数据比别人少很多，那么算法的优势很可能弥补不了数据的缺失，反之亦然。

机器之心：卷积神经网络（CNN）和循环神经网络（RNN）均可以被看做先验的一种，卷积神经网络通常被用于空间数据而循环神经网络多被用于时序数据，如何看待用卷积神经网络处理时序数据这样的搭配呢？

俞栋：如果卷积的层数足够多的话，理论上，它是可以和循环神经网络具有同等的能力的。

在信号处理学科中，有两种滤波器，分别叫做 IIR 和 FIR（Infinite Impulse Response Filter vs. Finite Impulse Response Filter），它们和两种神经网络相对应。IIR 就相当于 RNN 模型，FIR 就相当于 CNN 模型，在卷积了足够多层之后，它就能利用足够远的信息（类似 RNN）。就好像在很多场景下，FIR 滤波器是可以近似 IIR 滤波器的。

因此 CNN 和 RNN 都是「可选的」，选择时就要考虑其他因素：例如 RNN 相对于 CNN（或者是 IIR 相对于 FIR）训练难度就要更大一些。但同时 RNN 更容易对变化很大的序列建模，比如依赖关系忽大忽小的情景，可能更适用 LSTM 这样的模型来实现。

腾讯西雅图实验室：现状与目标

机器之心：能否为我们更新下西雅图实验室的现状？主要关注哪些研究方向？

俞栋：西雅图实验室成立于去年 5 月，更偏向基础研究，主攻方向是语音处理和自然语言处理。这与深圳实验室强调「研究+应用并重」侧重点稍有不同。

过去一年，腾讯 AI Lab 西雅图实验室从我 1 个员工，发展到现在有 10 余名全职语音和自然语言处理方向的员工；从没有办公场地，到办公室装修好，还在社区内举办了开放日活动。进展还不错。

目前语音识别研究人员的方向主要可以分为声学前端、声学模型和语言模型三类。

其中，声学前端主要围绕在家居和车载环境所必须的麦克风阵列、降噪、去回声、去混响、唤醒等功能；声学模型部分主要关注如何将声学信号建模；最后，语言模型则对语言文字本身建模。

语言模型技术相对稳定，不同语言之间差异也不是特别大，一般擅长声学模型的研究员也能做出不错的语言模型，但是声学前端和声学模型所需的技能是完全不同的，因此要分别找到合适的人选。

机器之心：实验室是如何选择研究方向的呢？

俞栋：我们会考虑两件事，一个是今天的问题：当下公司和客户有哪些需求，如何去解决。另一个是明天的问题：两到三年乃至更久之后，市场会有什么样的需求？

比如今天已经非常常见的远场识别，其实在几年前还是鲜为人知，或者说处于不被认可的状态。这是因为一方面大家觉得没有应用场景，另一方面远场技术还没发展到一定地步，没有太好的结果。但是，亚马逊的 Echo 问世之后，大家发现这个问题的解决虽然达不到完美，但也做得还可以了。当时 Echo 的团队进行远场研究已经有 3 、4 年了。他们就是在相关技术还不成熟的时候，更多地考虑了「明天」乃至「后天」问题，对 3 到 5 年后，我们会有何种应用、需要什么技术进行预判，然后进入这一领域，投入研究。

机器之心：未来实验室有哪些计划呢？

俞栋：在人员方面，西雅图实验室今年的人员数预计会达到 20。当然，由于人工智能火热的现状，以及我们希望维持一个较高的选人标准，这目标会有一定挑战性。

2018 年，西雅图团队会和深圳的实验室团队继续加强合作。希望能在进行前沿研究的同时，给今天的问题提供一些较好的解决方案。

此外，去年我们花了很多时间在从头建立系统上，现在，不少组件已经准备好了，我们可以更快速地进行一些更有意思的研究，希望对学术界和我们自己的产品性能提升都有一些好的影响。

贪心算法（GREEDY ALGORITHM）证明实践 m0_72431373 贪心算法算法 leetcode
基础概念贪心算法Formal的解释这里就不介绍了，有兴趣的直接去wikipedia上理解。简单地来说，贪心算法就是在某种规律下不断选取局部最优解，从而达到全局最优。《挑战程序设计竞赛》中有一个很直观的解释：一直向前！证明方法既然贪心算法是利用规律选取局部最优解，那么我们选取规律所得出的全局解就不一定是全局最优解。因此，我们需要证明，我们所选这个规律是可以得出一个全局最优解的。注意这里所谓的可以得出
【linux kernel】devtmpfs文件系统分析 iriczhao 小生聊【linux kernel】linux linux 内核文件系统 devtmpfs c
devtmpfs文件系统分析文章目录devtmpfs文件系统分析一、开篇二、devtmpfs简介三、devtmpfs内核源码分析（2-1）devtmpfs初始化（2-2）devtmpfs_init的调用一、开篇本篇文章主要从linux内核源码的角度分析devtmpfs文件系统。本篇作为分析过程的记录文章，以加深对devtmpfs文件系统的理解！（注）本篇文章所有源码出自linux内核版本：4.19
ubuntu18.04 配置 mid360并测试fast_lio hero_heart 电脑
1.在买到Mid360之后，我们可以看到mid360延伸出来了三组线。第一组线是电源线，包含了红色线正极，和黑色线负极。一般可以用来接9-27v的电源，推荐接12v的电源转换器，或者接14.4v的电源转换器。第二组线是信号线，共5根线，包含了2根pps线，秒脉冲；包含了2根GPS信号输入和GPS信号输出线，和一根地线。第三组线是数据线，是一个网线，直接连接笔记本就可以了2.IP配置2.1先把mid
动手实践OpenHands系列学习笔记17：构建自定义OpenHands应用
笔记17：构建自定义OpenHands应用一、引言OpenHands作为可扩展的AI驱动软件开发代理平台，不仅提供了丰富的内置功能，还允许开发者构建自定义应用和扩展。通过基于OpenHands的核心能力，开发者可以创建针对特定领域或工作流的专用AI代理应用。本笔记将探讨OpenHands的可扩展架构，分析自定义应用的设计模式，并通过实践构建一个专门的代码重构助手应用。二、OpenHands扩展性架
动手实践OpenHands系列学习笔记15：无头模式架构 JeffWoodNo.1 笔记架构
笔记15：无头模式架构一、引言无头模式(HeadlessMode)是现代软件系统中的重要架构模式，允许应用程序在没有图形界面的情况下运行，特别适用于自动化场景、CI/CD流水线和系统集成。OpenHands作为先进的AI驱动开发代理平台，提供了强大的无头模式支持。本笔记将探讨无头架构设计原则，分析OpenHands的无头模式实现，并通过实践构建一个使用无头模式API的自动化工作流。二、无头架构设计
动手实践OpenHands系列学习笔记8：后端服务开发 JeffWoodNo.1 笔记
笔记8：后端服务开发一、引言后端服务是AI代理系统的技术基础，负责处理业务逻辑、状态管理和外部集成。本笔记将探讨API设计与服务架构理论，分析OpenHands的后端设计特点，并通过实践构建一个模拟OpenHands核心功能的后端服务模块。二、API设计与服务架构理论2.1API设计原则RESTful设计:资源化URL设计、HTTP方法语义GraphQL:声明式数据查询、减少请求次数API版本控制
动手实践OpenHands系列学习笔记9：容器安全加固 JeffWoodNo.1 笔记安全
笔记9：容器安全加固一、引言容器技术虽然提供了环境隔离，但仍存在潜在的安全风险。本笔记将探讨容器安全的基本原则，分析OpenHands中的安全考量，并实现一套容器安全加固方案，确保在保持功能性的同时提升系统安全性。二、容器安全基础理论2.1容器安全风险分析逃逸风险:容器突破隔离边界访问宿主机特权提升:获取比预期更高的系统权限资源耗尽:DoS攻击导致系统资源枯竭镜像安全:镜像中潜在的漏洞和恶意代码供
动手实践OpenHands系列学习笔记3：LLM集成基础 JeffWoodNo.1 笔记人工智能
笔记3：LLM集成基础一、引言大型语言模型(LLM)是OpenHands代理系统的核心驱动力。本笔记将深入探讨LLMAPI调用的基本原理，以及如何在实践中实现与Claude等先进模型的基础连接模块，为构建AI代理系统奠定基础。二、LLMAPI调用基础知识2.1LLMAPI基本概念API密钥认证:访问LLM服务的身份凭证提示工程:构造有效请求以获取预期响应推理参数:控制模型输出的各种参数流式响应:增
触发器设计美国VPS：优化数据库性能的关键策略 cpsvps oracle 数据库
在当今数字化时代，美国VPS（虚拟专用服务器）因其高性能和稳定性成为众多企业和开发者的首选。本文将深入探讨触发器设计在美国VPS中的应用，分析其优势、实现方法以及最佳实践，帮助您充分利用VPS资源，提升系统效率和响应速度。触发器设计美国VPS：优化数据库性能的关键策略美国VPS与触发器设计的完美结合美国VPS作为云计算领域的重要基础设施，为触发器设计提供了理想的运行环境。触发器（数据库中的自动执行
在Ubuntu上使用Certbot申请Let’s Encrypt SSL证书
1引言要使用HTTPS就必须得有SSL证书。理论上，证书是可以通过像OpenSSL这样得工具生成的。不过这种证书只能自己测试用，浏览器上面是不认的，会提示用户不安全。也就是说，浏览器只接受一些特定的证书颁发机构（CA）发布的证书。正规的商业应用上，这些证书是需要像这些机构购买的。不过好在还是有像Let’sEncrypt这样开放的证书颁发机构，可以免费向其申请SSL证书，不过缺点是证书有效期只能有9
数据库学习笔记-触发器 T_ALH 数据库课程设计数据库存储过程
步骤创建触发器①启动SQLServer查询编辑器，选择要操作数据库，如“sc（学生选课）”数据库。②在查询命令窗口中输入以下CREATETRIGGER语句，创建触发器。为sc(学生选课)表创建一个基于UPDATE操作和DELETE操作的复合型触发器，当修改了该表中的成绩信息或者删除了成绩记录时，触发器被激活生效，显示相关的操作信息。CREATETRIGGERtri_UPDATE_DELETE_sc
1963. 使字符串平衡的最小交换次数 Joyner2018 python 算法 leetcode python 开发语言
如何使字符串变成平衡括号串？——最小交换次数问题详解题目描述给定一个字符串s，字符串长度为偶数n，且恰好由n/2个开括号'['和n/2个闭括号']'组成。我们称字符串为平衡字符串，当且仅当它满足以下条件之一：空字符串是平衡字符串；若字符串A和B是平衡字符串，则它们的拼接AB也是平衡字符串；若字符串C是平衡字符串，则用括号包裹起来的字符串[C]也是平衡字符串。你可以交换字符串中任意两个位置的括号任意
IDEA运行java博客项目halo报错笔记（一）叶卡 halo博客项目 java
1、关于JDK版本在导入项目时查看日志CHANGELOG.md，里面有关于jkd版本适用版本的描述，1.4.3及以后版本不再支持JRE1.8，只能是jdk11及以上的版本，不然导入项目会出错！除此之外，也应该看看其他更新的信息。2、‘fetchBranch(java.lang.String,java.lang.String)’isdeprecatedandmarkedforremoval问题描述：
C语言之分支语句总结
学完了分支语句就浅浅的总结一下，嘿嘿！C语言是结构化的程序设计语言，这里的结构可分为顺序结构、选择结构、循环结构。其中顺序结构是一种线性、有序的程序执行结构，按照程序代码书写的先后顺序依次执行，选择结构依据条件判断，选择执行不同分支，循环结构是满足条件时，重复执行一段代码。其中我们是运用if,switch语句实现分支结构，运用while，for，do—while来实现循环结构。接下来依次进行介绍：
《刚刚问世》系列初窥篇-Java+Playwright自动化测试-7-元素基础定位方式-下篇（详细教程）
1.简介上一篇主要是讲解我们日常工作中在使用Playwright进行元素定位的一些比较常用的基础定位方式的理论基础知识以及在什么情况下推荐使用。今天这一篇讲解和分享一下剩下部分的基础定位方式。２.过滤器定位例如以下DOM结构，我们要在其中单击第二个产品卡的购买按钮。我们有几个选项来过滤定位器以获得正确的定位器。2.1按文本过滤定位器可以使用locator.filter（）方法按文本进行过滤。它将搜
html初学者第一天祝余呀 html 前端
网页1.1什么是网页？网站是指在因特网上根据一定规则，使用HTML等制作的用于展示特定内容相关的网页集合。网页时网站中的“一页”，通常是HTML格式的文件，它要通过浏览器来阅读。网页是构成网站的基本元素，它通常由图片，链接，文字，声音，视频等元素组成。通常我们看到的网页，常见以.htm或.html后缀结尾的文件，因此将其俗称为HTML文件。1.2什么是HTML？HTML是指超文本标记语言（Htyp
Redis 的特性、工作机制与性能优化全解（含搭建实战教程）
文章目录二、Redis的核心特性三、Redis的工作机制解析单线程模型（性能为何强大？）数据结构是性能的关键持久化机制（数据如何存下来？）四、Redis性能优化实战1.优化内存使用2.提升并发性能3.使用分片/集群机制4.异步处理五、Redis搭建流程（Linux环境）1.下载与解压2.编译并安装3.修改配置文件（推荐复制一份）4.启动Redis5.客户端连接测试六、Redis运维技巧与监控命令七
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
前端技术栈 —— HTML、CSS和JavaScirpt执行环境 CS-Polaris 前端技术栈前端 html css
以下内容由GLM回答生成，不保证正确性。前端技术栈——HTML、CSS和JavaScirpt执行环境JavaScript的执行环境HTML和CSS的执行环境HTML和CSS是否可以在其他环境中执行？总结JavaScript是一种解释型语言，但它也可以被编译。JavaScript的执行方式取决于具体的运行环境。在浏览器中，JavaScript是通过解释器逐行执行的，但在某些情况下（如使用工具如Bab
Python 库包 sentence-transformers 音程机器学习人工智能 python 开发语言
sentence-transformers是一个非常流行的Python库，专门用于将文本（句子、段落、文档）转换为高质量的语义向量（嵌入）。它基于Transformer架构（如BERT、RoBERTa、DistilBERT等）的预训练模型，并在大量语义相似性数据上进行了微调，能够捕捉句子之间的深层语义关系。什么是sentence-transformers？项目地址：https://www.sber
如果你仍然在使用XP，请加固它 haierccc windows
XP系统因为过于老旧，充满漏洞，非常不安全，如果将其暴露在公网立刻就会被攻陷。但若你有老旧的服务仍需要运行于XP，就需要对XP进行加固处理以提高安全性。再次强调：XP仅作为服务器对外提供服务（打开特定的TCP或UDP端口），本身不作为客户端访问网络上的资源。1、我的电脑→管理→服务和应用程序→服务，停止以下三个服务：server、workstion、Messenger2、我的电脑→属性→远程，去掉
Windows内核并发优化
Windows内核并发优化通过多层次技术手段提升多核环境下的系统性能，以下是关键技术实现方案：一、内核锁机制优化‌精细化锁策略‌采用自旋锁（Spinlock）替代信号量处理短临界区，减少线程切换开销对共享资源实施读写锁分离，如文件系统元数据采用ERESOURCE结构实现读写并发无锁数据结构‌关键路径（如调度队列）使用Interlocked原子操作指令（如lockcmpxchg）实现无锁同步内存分配
创客匠人深度剖析：家庭教育赛道创始人 IP 打造与知识变现的破局之道创小匠 tcp/ip 网络协议网络
在知识付费领域，家庭教育赛道的竞争日益激烈，如何从0-1打造创始人IP并实现高效拓客，成为创业者的核心难题。创客匠人服务的慈航德教育创始人陈向杰老师，通过视频号运营、产品矩阵设计与社群生态构建，实现单月拓客1.6万+，其背后的IP打造逻辑为行业提供了可复用的方法论。从慈航德教育的案例来看，创始人IP的定位需要锚定赛道本质需求。陈向杰老师将“慈、航、德”的品牌理念融入IP人设，以“帮助孩子减负”的教
创客匠人视角下：创始人 IP 如何通过内容运营实现知识变现的冷启动创小匠 tcp/ip 内容运营网络协议
知识付费创业的冷启动阶段，如何快速建立IP影响力并实现用户积累，是创业者面临的首要挑战。创客匠人服务的慈航德教育从0-1入局家庭教育赛道，单月拓客1.6万+的实践，揭示了创始人IP通过内容运营驱动知识变现的底层逻辑。视频号作为IP冷启动的核心阵地，其运营本质是价值观的持续输出。陈向杰老师通过840期连续直播（日均2小时），将“慈祥之心+明确方向+立德树人”的IP理念拆解为具体的育儿干货、案例解析与
创客匠人视角下：创始人 IP 打造与知识变现的深度耦合路径创小匠 tcp/ip 大数据人工智能
在知识经济蓬勃发展的当下，创始人IP打造与知识变现的融合已成为行业破局关键。创客匠人作为深耕知识付费赛道多年的服务平台，其创始人老蒋提出的“土壤构建能力”理论，为理解这一融合逻辑提供了独特视角。从本质来看，创始人IP并非简单的个人品牌包装，而是企业价值观与专业能力的人格化投射。以创客匠人服务的众多知识创业者为例，成功的创始人IP往往具备三大特征：专业领域的深度沉淀、用户需求的精准洞察，以及价值输出
网络相关篇Linux一句话精彩问答--2006/09/08更新--20060908pdf版本下载
----------------------------网络相关篇--------------------------2001让apache的默认字符集变为中文(陈绪)vihttpd.conf，找到AddDefaultCharsetISO-8859-1一行apache版本如果是1.*，改为AddDefaultCharsetGB2312如果是2.0.1-2.0.52，改为AddDefaultChar
每天一个前端小知识 Day 23 - PWA 渐进式 Web 应用开发蓝婷儿 python 前端
PWA渐进式Web应用开发（离线缓存、桌面安装等）一、什么是PWA？PWA（ProgressiveWebApp）是一种让Web应用具有类似原生App用户体验的技术体系。PWA不是一个框架，而是由一组浏览器API组成的技术集合，包括：离线访问能力WebApp安装到桌面推送通知后台同步原生风格UIPWA的三大核心能力能力描述可安装性支持添加到桌面启动器，像原生App打开离线能力使用ServiceWor
Debian TTY环境乱码两斤半 Debian Linux debian linux
设置语言环境当前语言环境locale重新配置语言环境sudodpkg-reconfigurelocales配置控制台字体安装console-setup和kbd支持UTF-8的控制台字体sudoaptinstallconsole-setupkbd重新配置控制台字体sudodpkg-reconfigureconsole-setup内核相关没有正确加载字体或控制台相关的模块，安装或重装字体#文泉驿正黑s
LambdaQueryWrapper方法查询某个字段的list
LambdaQueryWrapperwrapper=newLambdaQueryWrapperlist=list(wrapper);ListnameList=list.stream().map(e->e.getUserName()).collect(Collectors.toList());
从零开始写一个RTSP服务器（五）RTP传输AAC
从零开始写一个RTSP服务器系列★我的开源项目-RtspServer从零开始写一个RTSP服务器（一）RTSP协议讲解从零开始写一个RTSP服务器（二）RTSP协议的实现从零开始写一个RTSP服务器（三）RTP传输H.264从零开始写一个RTSP服务器（四）一个传输H.264的RTSP服务器从零开始写一个RTSP服务器（五）RTP传输AAC从零开始写一个RTSP服务器（六）一个传输AAC的RTSP
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

腾讯AI Lab副主任俞栋：语音识别领域的现状与进展

你可能感兴趣的:(腾讯AI Lab副主任俞栋：语音识别领域的现状与进展)