量子位

AI正在往哪里去？这有一份来自腾讯AI Lab的2018答卷

雷刚发自凹非寺
量子位报道 | 公众号 QbitAI

腾讯AI Lab，如何回答2018？

最近，这个巨头内部以AI为核心的实验室，对全年重点工作和进展进行了回顾。

或许从这些进展中，不仅能窥见腾讯对前沿AI方向的探索，还能感受到AI行业正在面临的最新挑战。

于是我们转载腾讯AI Lab 2018年度回顾全文，希望对你能有启发。

行业应用

AI+公益

我们在 2018 年完成了一些很有意义的项目，如“图片语音即时描述”技术，让机器充分理解图像内容后，将其“翻译”成语句，让视障者使用QQ空间时，能听到对图片的描述，实时了解朋友动态。

通过提供这一系列信息无障碍技术，腾讯今年获得了联合国教科文组织颁发的“数字技术增强残疾人权能奖”。

AI+医疗

第二个例子是显微镜的进化，我们在这种古老而重要的医疗器械中加入了AI与AR技术，让机器自动识别、检测、定量计算和生成报告，并将检测结果实时显示到医生所看目镜中，在不打断医生阅片的同时及时提醒，提高医生的诊断效率和准确度。

今年我们还会继续通过“腾讯觅影”产品深入探索AI+医疗的应用，目前图像处理技术已用在食管癌、肺癌、糖尿病性视网膜病变等疾病的早期筛查上，语言和语音处理技术也用于智能导诊和辅诊上。

△腾讯智能显微镜

AI+农业

我们还在“AI+农业”迈出了一小步——一个很会“种”黄瓜的AI。

在荷兰举办的国际AI温室种植大赛里，我们利用传感器和摄像头自动收集温室气候、作物发育情况等环境和作物数据，再用深度学习模型计算、判断和决策，驱动温室的设备元件，远程控制黄瓜生产，最后获总比分第二、AI策略第一的成绩，还开心收获了3496公斤黄瓜。

AI+视频

在腾讯视频中，我们提供了超分辨率和视频分类的技术。此外，我们还探索了对视频内容的深度理解、编辑与生成。

比如，让机器深度分析一个视频，识别其中人物、物体、场景，并分析它们的关系，并在时间顺序识别视频中不同的动作和事件，产生能表达出视频丰富语义信息的语句。

而在视频生成上，我们研究的视频运动信息迁移技术，在给到几张人物A的静止图片后，能让A模仿人物B的舞蹈动作，从静止到“动”起来。

前沿技术难题

下一代的智能交互：3D虚拟人

我们通过多个部门的共同研究，合作推进了“多模态人机交互”这一前沿课题。

我们将计算机视觉、自然语言处理、语音技术有机结合在一起，辅以一定的情绪认知、分析决策能力，赋予虚拟人看、听、想、说的多模态输入和输出能力，以实现更自然、逼真、风格鲜明、千人千面的人机交互体验。我们已经实现了整套技术方案的打通，并有望探索新的产品形式。

游戏AI → AGI

游戏是 AI 研究的传统实验场，从2016年研发围棋AI“绝艺”起，我们不断利用这块实验沃土，探索迈向通用人工智能的道路。2018 年，我们收获颇丰，而此类探索还将继续下去。

我们与王者荣耀及王者荣耀职业联赛共同探索的前沿研究项目——策略协作型AI“绝悟”——首次亮相KPL决赛，与人类战队（超过99%玩家）进行5V5水平测试并取得胜利。

我们使用了监督学习方法，模拟人类决策方法的算法模型兼具了大局观与微操能力，并在此基础上研发多个有针对性的强化学习训练模型，有效提升了AI团队协作能力。

此外，我们的深度强化学习智能体还在《星际争霸 II》战胜了Level-10内置 AI，还与清华大学合作拿下了FPS射击类游戏AI竞赛VizDoom赛事历史上首个中国区冠军。

机器人：打通虚拟和现实

我们还成立了企业级机器人实验室“腾讯Robotics X”，构建AI+机器人双基础部门，打造虚拟世界到真实世界的载体与连接器。

比如，我们从0到1实现了机械手从虚拟到现实的迁移，通过搭建满足各种物理属性的高逼真模拟器，支持多种强化学习算法，并能和机械臂和灵巧手的实体硬件接口兼容，通过新提出的DHER算法训练抓取、搭积木、端茶倒水等虚拟任务。

我们还将其成功迁移到了现实世界中。

另外，在新建成的腾讯深圳总部展厅里，我们还完成了“绝艺”围棋机器人、桌上冰球和与浙江大学合作的机械狗等展示项目，体现了机器人的本体、控制、感知、决策方面的能力。

开源开放

除了发表论文公开研究成果，我们也通过代码和数据开源将腾讯积累的技术能力（尤其是 AI 能力）共享给整个行业，并希望以此促进行业生态的共同发展和繁荣。

2018 年 10 月，我们开源了业内最大规模的多标签图像数据集Tencent ML-Images，其中包含了 1800 万图像和11000种常见物体类别。

此外我们还提供了从图像下载和图像预处理，到基于ML-Images的预训练和基于ImageNet的迁移学习，再到基于训练所得模型的图像特征提取整个流程的代码和模型。

截至目前已在 GitHub 获 2000 星和 2000+ 次下载。

我们还在 10 月份开源了一个大规模、高质量的中文词向量数据集，其中包含 800 多万中文词汇，在覆盖率、新鲜度及准确性上都优于之前的数据集。

11 月，我们开源了一个自动化深度学习模型压缩与加速框架 PocketFlow，其中整合了多种模型压缩与加速算法，并能利用强化学习自动搜索合适的压缩参数。我们希望该框架能降低模型压缩的技术门槛，赋能移动端 AI 应用开发。

在高校合作方面，我们与麻省理工、牛津、斯坦福、港科大、清华和哈工大等全球知名高校的教授联合研究，并通过专项研究计划、访问学者计划、青年学者基金、联合实验室等多种方式，共探学术前沿领域，并迅速将研究应用到腾讯云、腾讯开放平台等多个业务中。

4大方向基础研究

我们基础研究方向主要为四个：机器学习、计算机视觉、语音处理和自然语言处理。

2018 年，我们有超过150 篇学术论文发表在各大顶级学术会议上，如NeurIPS、ICML、CVPR、ECCV、ACL、EMNLP、InterSpeech 和 ICASSP 等，位居国内企业前列。

未来，我们将继续关注前沿领域的研究课题，推进跨学科、多模态、交叉研究课题探索，以开放、合作和共赢的态度，不断探索研究的边界。

机器学习

学习能力，是区分智能机器和普通自动化机器的核心技能之一，也是迈向通用人工智能（AGI）的必备技能。

我们的研究涵盖了强化学习、迁移学习、模仿学习、优化算法、弱监督和半监督学习、对抗学习和多任务学习等。

我们探索了自动化机器学习（AutoML）的可能性，这是当前机器学习领域的前沿探索方向之一。

比如，我们提出了一种基于数据分布迁移的超参优化算法[1]。该方法利用分布相似度来迁移不同数据对应的超参优化结果，从而能对新数据的超参优化起到热启动的效果。

我们还进一步研发了FastBO算法，并发现其在医疗和游戏等多个场景上有比人工调参更好的效果。

针对多任务问题，我们提出了一种学习框架 L2MT[2] ，能自动发掘一个最优的多任务学习模型；我们还提出了一种用学习迁移实现迁移学习的方法 L2T[3]，能显著降低迁移学习的计算成本和所需的领域知识。

我们也为强化学习提出了一些改进方法，比如提出一种描述如何从环境和任务来组成强化学习策略的元规则部件神经网络，实现了自适应于不同环境、不同任务的合成策略[4]。

我们还尝试用演示来提升强化学习的探索效果（POfD）[5]及使用联网智能体的完全去中心化多智能体强化学习[6]。

在计算机安全和社会安全上，我们研发的自动特征学习、群分类和图特征增强方面的算法，能成功识别和对抗黑产用户、涉黑群体和恶意用户（标记覆盖率超90%），还能精准识别有信贷风险的用户，帮助防控金融风险。

计算机视觉

计算机视觉技术有非常广泛的应用前景，是智能医疗、自动驾驶、增强现实、移动机器人等重要应用的不可或缺的一部分。

我们不断寻找赋予机器更强大视觉能力的方法，以实时、稳健和准确地理解世界。

2018 年，我们的探索包括结合相机与其它传感器数据实现 3D 实时定位[1]、结合传统时空建模方法（MRF）与深度学习方法（CNN）来跟踪和分割视频中的物体[2]，及一些在视频描述生成任务上的新方法[3]。

我们还定义了一种名为视频重定位（Video re-localization）[4]的新任务，可在某段长视频中查找与指定视频语义相关片段。我们也为视频中的运动表征提出了一种端到端的神经网络TVNet[5]。

除了帮助机器理解世界，我们也在探索视频生成方面的技术，比如我们提出了一种自动生成延时摄影视频的解决方案[6]，可以通过预测后续的图像帧来呈现可能发生的动态变化。我们也探索了多阶段动态生成对抗网络（MD-GAN）[7]在这一任务上的应用。

语音处理

我们的语音解决方案已经在腾讯的听听音箱、极光电视盒子和叮当音箱等产品中得到应用。

2018 年，我们又提出了一些新的方法和改进，在语音增强、语音分离、语音识别、语音合成等技术方向都取得了一定进展。

语音唤醒上，我们针对误唤醒、噪声环境中唤醒、快语速唤醒和儿童唤醒等问题，提出了一种新的语音唤醒模型[1]，能显著提升关键词检测质量，在有噪声环境下表现突出，还能显著降低前端和关键词检测模块的功耗需求。

我们还提出了一种基于 Inception-ResNet 的声纹识别系统框架[2]，可学习更加鲁棒且更具有区分性的嵌入特征。

语音识别上，我们的解决方案是结合了说话人特征的个性化识别模型，能为每位用户提取并保存个性化声学信息特征。随用户数据积累，个性化特征自动更新，用户识别准确率能显著提升。

另外，我们还创新地提出了多类单元集合融合建模方案，这是一种实现了不同程度单元共享、参数共享、多任务的中英混合建模方案。这种方案能在基本不影响汉语识别准确度的情况下提升英语的识别水平。我们仍在噪声环境、多说话人场景[3]、“鸡尾酒会问题”[4]、多语言混杂等方面继续探索。

语音合成是确保机器与人类自然沟通的重要技术。腾讯在语音合成方面有深厚的技术积累，开发了可实现端到端合成和重音语调合成的新技术。腾讯AI Lab 2018 年在语调韵律变化[5]、说话风格迁移[6]等任务上取得了一些新进展。

自然语言处理

腾讯 AI Lab 在自然语言处理方面有广泛而又有针对性的研究，涉及文本理解、文本生成、人机对话、机器翻译等多个方向。

我们训练的模型在多个阅读理解类数据集上位居前列，如CMU大学的RACE、ARC (Easy/Challenge)及OpenBookQA等。

在神经网络机器翻译方面，我们通过改进当前主流翻译模型中的多层多头自注意力机制[1]和提出基于忠实度的训练框架[2]，改善其核心的译文忠实度低的问题。

我们还针对口语翻译中代词缺省的问题提出了一种联合学习方法[3]，以及探索如何将外部的翻译记忆融入神经网络翻译模型[4]。

我们还发布了一款AI辅助翻译产品TranSmart[5]，向人工翻译致敬。它采用业内领先的人机交互式机器翻译和辅助翻译输入法技术，配合亿级双语平行数据，为用户提供实时智能翻译辅助，帮助用户更好更快地完成翻译任务。作为笔译工具的未来形态，目前这个产品已经进入了很多高校翻译课堂。

我们研究了文本和对话生成，提了出一种基于强化学习框架的回复生成模型[6]，对于同一个输入能够自动生成多个不同的回复；一种跨语言神经网络置信跟踪框架XL-NBT[7]在实现跨语种对话系统方面有重要的实际应用潜力（比如多语种自动客服）。

此外，我们还为自动回复的多样性对条件变分自编码机进行了改进[8]。

值得一提的是我们将中国古典文化与现代技术的结合方面的探索。我们在 2018 年春节期间推出了腾讯 AI 春联，可根据用户提供的两个汉字生成一副春联。

我们还探索了创造机器诗人的问题，提出一种基于对抗条件变分自编码器的诗歌生成方法（CVAE-D）[9]，在主旨一致性和用词的新颖性上取得了不错的进展。

腾讯AI Lab现状

近三年时间里，腾讯AI Lab相继成立了深圳及美国西雅图实验室，目前团队有70多名顶尖AI科学家及300多位经验丰富的工程师，专注四大研究方向。

产业落地上，AI Lab将与新成立的“腾讯Robotics X”机器人实验室担当前沿技术双基础部门，深耕产业，拥抱消费及产业互联网，做好技术标配。

论文传送门：

机器学习

[1] 基于数据分布迁移的超参优化算法

https://arxiv.org/pdf/1810.06305.pdf

[2] 学习框架L2MT

https://arxiv.org/abs/1805.07541

[3] 用学习迁移实现迁移学习的方法 L2T

https://ai.tencent.com/ailab/media/publications/icml/148_Transfer_Learning_via_Learning_to_Transfer.pdf

[4] 自适应于不同环境、不同任务的合成策略

https://papers.nips.cc/paper/7393-synthesize-policies-for-transfer-and-adaptation-across-tasks-and-environments

[5] POfD

https://ai.tencent.com/ailab/media/publications/icml/152_Policy_Optimization_with_Demonstrations.pdf

[6] 完全去中心化多智能体强化学习

https://arxiv.org/abs/1802.08757

计算机视觉

[1] 3D 实时定位

https://arxiv.org/abs/1810.05456

[2] 跟踪和分割视频中的物体

https://arxiv.org/abs/1803.09453

[3] 视频描述生成任务新方法

https://arxiv.org/abs/1803.11438

[4] 视频重定位

https://arxiv.org/abs/1808.01575

[5] TVNet

https://arxiv.org/abs/1804.00413

[6] 自动生成延时摄影视频

https://arxiv.org/abs/1709.07592

[7] 多阶段动态生成对抗网络（MD-GAN）

https://arxiv.org/abs/1709.07592

语音处理

[1] 语音唤醒模型

https://www.isca-speech.org/archive/Interspeech_2018/pdfs/1668.pdf

[2] 基于 Inception-ResNet 的声纹识别系统框架

https://www.isca-speech.org/archive/Interspeech_2018/pdfs/1769.pdf

[3] 多说话人场景

https://ai.tencent.com/ailab/media/publications/MonauralMulti-TalkerSpeechRecognitionwithAttentionMechanismand_GatedConvolutionalNetworks._pdf.pdf

[4] 鸡尾酒会问题

https://link.springer.com/article/10.1631/FITEE.1700814

[5] 语调韵律变化

https://ai.tencent.com/ailab/media/publications/icassp/FEATURE_BASED_ADAPTATION_FOR_SPEAKING_STYLE_SYNTHESIS.pdf

[6] 说话风格迁移

https://www.isca-speech.org/archive/Interspeech_2018/pdfs/1991.pdf

自然语言处理

[1] 多层多头自注意力机制的改进

https://arxiv.org/abs/1810.10181

[2] 基于忠实度的训练框架

https://arxiv.org/abs/1811.08541

[3] 联合学习方法

https://arxiv.org/abs/1810.06195

[4] 翻译记忆融入

https://ai.tencent.com/ailab/nlp/papers/aaai2019_graph_translation.pdf

[5] AI辅助翻译产品TranSmart

http://transmart.qq.com/

[6] 基于强化学习框架的回复生成模型

https://ai.tencent.com/ailab/nlp/publications.html

[7] 跨语言神经网络置信跟踪框架 XL-NBT

https://arxiv.org/pdf/1808.06244.pdf

[8] 对条件变分自编码机的改进

http://aclweb.org/anthology/D18-1354

[9] 基于对抗条件变分自编码器的诗歌生成方法（CVAE-D）

http://aclweb.org/anthology/D18-1423

— 完 —

加入社群

为给AI从业者提供更好的交流平台，量子位现开放「AI+行业」社群，将会不定期邀请AI大咖、知名企业家、技术大牛进群分享，福利多多，欢迎小伙伴入群交流。

面向人群：AI相关从业者，技术、产品等人员，根据所在行业可选择相应行业社群；

入群方式：请在量子位公众号（QbitAI）对话界面回复关键字“行业群”，获取入群方式。

Ps.为保证社群价值，小助手会对申请入群的朋友进行审核，请大家理解！

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI · 头条号签约作者

վ'ᴗ' ի 追踪AI技术和产品新动态

喜欢就点「好看」吧 !

NestJS 系列教程（一）：认识 NestJS 与项目初始化 onebyte8bits nestjs 后端 javascript 前端框架 node.js
NestJS系列教程（一）：认识NestJS与项目初始化✨前言NestJS是一个用于构建高效、可扩展Node.js服务端应用程序的框架。它使用TypeScript构建，结合了面向对象编程（OOP）、函数式编程（FP）和函数响应式编程（FRP）等概念，非常适合用于构建微服务、RESTfulAPI等现代服务端应用。本系列教程将以NestJS官方中文文档为蓝本，逐章精讲配套代码，带你系统学习这一现代No
嵌入式入门学习——5了解寄存器如何控制单片机星火嵌入式嵌入式入门学习单片机
0系列文章入口嵌入式入门学习——0快速入门，Let‘sDoIt！1.内容简介武侠的内功和招式之间的关系类似于编程中的技术和计算原理之间的关系。招式是千变万化的，而内功心法则稳定而深厚。内功心法的深度决定了可以学习的招式变术的上限高度。单片机的控制最终是要落实到寄存器上的。使用库函数或者使用高级语言是招式，了解单片机的寄存器则是内功。2.引言练习武功讲究内外兼修，一味学习技巧，而忽略本质的结果就是一
提到交换机堆叠大家就害怕，其实堆叠很简单！ wljslmz 网络技术交换机堆叠
一提到“交换机堆叠”这四个字，很多网络工程师眉头就皱了起来，仿佛堆叠就等于配置复杂、故障难查、升级噩梦。其实真不是！交换机堆叠（Stacking）说白了，就是“多台交换机一起干活，还装得像一台”。如果你认真了解过堆叠背后的逻辑和原理，掌握了几个关键细节，这项技术其实相当香，无论是运维、扩展，还是冗余能力，都是妥妥加分项！今天我们就来一次不装神弄鬼、不炫术语、不堆RFC的通透解读，把“交换机堆叠”这
网卡驱动及dpdk的使用
网卡网卡把光电信号转换成数字信号网络协议栈通常指tcp/ip各层网络协议，ARP、ICMP、IP、TCP/UDP、HTTP/SFTP等dpdk使用数据传输全过程：非dpdk模式下接收数据网卡接收到数据，产生中断通知cpu，cpu使用驱动将网卡中的缓存信息读取到内存中，后续各协议栈、应用层因此解析读取此信息。其中信息，都是通过驱动采集到的sk_buff来传递的。发送数据获得目的MAC地址，根据ARP
（阳：算法霸权 / 阴：数据确权）→当GDPR类法规覆盖53%经济体量时，催生出隐私计算新范式百态老人人工智能机器学习深度学习算法
当GDPR类法规覆盖53%经济体量时，隐私计算新范式的兴起可归因于以下多维度因素的相互作用：一、算法霸权与数据确权的矛盾激化算法霸权的危害大型科技公司通过算法歧视、大数据杀熟等手段形成垄断优势，利用数据优势操控用户行为，导致消费者权益受损。这种"算法黑箱"不仅加剧市场不公平，还阻碍数据要素的自由流动。例如，算法框架的底层逻辑掌握在少数企业手中，产生"数据黑箱"问题。数据确权的立法需求数据权属不明确
Nacos从2.0.4升级到2.4.3的完整步骤及注意事项
⚙️一、升级前准备环境检查JDK版本：确保JDK≥1.8（推荐JDK11+），执行java-version验证[citation:2][citation:4]。端口开放：2.0+版本需开放9848端口（gRPC通信），而1.x仅需8848端口[citation:8]。数据库兼容性：若使用MySQL，需≥5.7版本，并备份所有Nacos相关数据[citation:2][citation:6]。关键备
SSL 终结（SSL Termination）深度解析：从原理到实践的全维度指南（:满天星:) ssl 网络协议网络 linux 运维服务器 centos
SSL终结（SSLTermination）深度解析：从原理到实践的全维度指南一、SSL终结的本质与技术背景1.定义与核心价值SSL终结是指在网络通信链路上，由前端设备（如负载均衡器、反向代理）作为加密流量的“终点”，负责完成SSL/TLS协议的解密过程，并将明文数据转发给后端服务器。其技术本质是通过计算资源的集中化管理，解决HTTPS服务中加密计算与性能扩展的矛盾。2.技术演进背景HTTPS普及的
java 静态变量声明_java静态变量怎么声明？柚酱 java 静态变量声明
展开全部个人的总结1静态变量e69da5e6ba9062616964757a686964616f31333337616564只有一份被类的所有实例共享2静态变量的声明在编译时已经明确了内存的位置3延迟初始化是改变静态变量的值引用Java静态变量的初始化(static块的本质)在网上看到了下面的一段代码：1.publicclassTest{2.static{3._i=20;4.}5.publicst
python优先队列使用_python 线程队列PriorityQueue（优先队列）（37）
在线程队列Queue/线程队列LifoQueue文章中分别介绍了先进先出队列Queue和先进后出队列LifoQueue，而今天给大家介绍的是最后一种：优先队列PriorityQueue，对队列中的数据按照优先级排序，那么具体怎么用呢？一.队列Queue分类：1.线程队列Queue—FIFO(先进先出队列)，即哪个数据先存入，取数据的时候先取哪个数据，同生活中的排队买东西；2.线程队列LifoQue
android FlutterFragment 引入 Flutter ，dartEntrypoint配置多引擎，使用MethodChannel 双向数据交互通信
androidFlutterFragment引入Flutter，dartEntrypoint配置多引擎，使用MethodChannel双向数据交互通信FlutterFragment是Flutter提供的一个组件，用于在Android原生应用中嵌入Flutter模块作为Fragment使用。FlutterFragment允许开发者将Flutter视图集成到现有的Android应用架构中，作为Frag
文娱产业数字化转型的隐秘战场数据与人工智能律师人工智能大数据网络区块链云计算
（首席数据官高鹏律师数字经济团队创作，AI辅助）当《黑神话》用虚幻引擎点燃全球玩家热情时，当《长安三万里》以数字资产重构国风美学时，中国文娱产业的数字化革命已悄然进入深水区。这场没有硝烟的战争里，有人手握流量红利高歌猛进，有人却在数据迷局中折戟沉沙。某现象级手游曾因用户协议条款引发千万索赔，某头部影视公司AI生成素材陷入版权漩涡，这些看似偶然的危机背后，藏着文娱产业数字化转型的致命暗礁——数据权属
我国在AI、元宇宙、生成式AI赛道的竞争带来的投资机会数据与人工智能律师大数据区块链人工智能网络数据库
首席数据官高鹏律师团队编著中国在AI、元宇宙、生成式AI赛道的竞争已进入技术深化与商业落地并行的关键阶段，未来投资机会可围绕以下五大方向展开：一、基础设施与算力支撑1.云计算与混合云服务生成式AI对算力和云服务需求激增，联想集团等布局混合云的企业受益于企业数字化转型需求。IDC预测，到2025年，50%的企业将与生成式AI云提供商建立战略联系，云服务商需优化数据治理和成本控制能力。2.AI芯片与算
2025数字经济新政策解码：这五个黄金赛道，正在改写财富分配规则数据与人工智能律师人工智能大数据网络算法区块链
首席数据官高鹏律师团队创作，AI辅助一、政策东风下的财富重构：当免税清单变成“造富密码”2025年的春天，数字经济领域的政策“礼包”如同春雷炸响。从跨境电商的“阳光化新政”到智慧农业的“技术普惠”，从汽车零部件的“出海红利”到工业升级的“智能改造”，再到文旅餐饮的“消费重构”，五大行业正在经历一场财富分配的底层变革。这不是普通的政策调整，而是国家战略级的资源再分配——免税+补贴的组合拳，正在为先行
从小白到进阶：解锁linux与c语言高级编程知识点嵌入式开发的任督二脉（3） small_wh1te_coder c 嵌入式 linux c语言汇编 c++嵌入式硬件面试
【硬核揭秘】Linux与C高级编程：从入门到精通，你的全栈之路！第五部分：C语言高级编程——结构体、共用体、枚举、内存管理、GDB调试、Makefile全解析嘿，各位C语言的“卷王”们！在前面的旅程中，我们深入探索了Linux的奥秘，从命令行操作到Shell脚本编程，再到网络文件服务，你的Linux技能已经突飞猛进。现在，是时候回到我们的“老本行”——C语言了！你可能已经能够编写各种简单的C程序，
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
扒开嵌入式硬件的底裤（上）！从 PCB 到 FPGA/IC 设计，小白到 CTO 的必学秘籍硬核知识点全揭秘！从c语言入门到mcu与arm架构及外设相关 small_wh1te_coder 嵌入式内核嵌入式开发嵌入式硬件算法 c 汇编面试驱动开发单片机
【硬核揭秘】嵌入式硬件工程师的“底裤”：从入门到牛逼，你必须知道的一切！第一部分：破冰与认知——嵌入式硬件工程师的“世界观”嘿，各位C语言老铁，以及所有对“让硬件听你话”充满好奇的朋友们！我是你们的老朋友，一个常年“折腾”在代码和电路板之间的码农。今天，咱们要聊一个真正能让你“硬”起来的话题——如何成为一个合格、优秀、牛逼的嵌入式硬件工程师！你可能正坐在电脑前，敲着C语言代码，刷着力扣算法题，心里
你以为的 () 只是函数调用？栈的战争：函数调用背后，编译器、链接器、CPU与黑客的四方博弈解剖CPU、内存与安全交织的底层真相了解函数调用的暗流：从C括号到CPU指令、栈帧攻防的生死时速 small_wh1te_coder c++c 算法 c语言 c++c 算法面试
作者：smallcodewhite更新：2025.6.4号下午6点13分小引子：在软件这行当里混久了，你会发现一个现象：很多人能用各种高级语言、框架写出复杂的业务，但一遇到诡异的崩溃、性能瓶颈，或者需要和底层硬件打交道时，就抓瞎了。究其原因，是对计算机体系最基础的运行模型理解得不够透。上一篇我们聊了点数据在内存里的存放问题，有兄弟说不够劲，没触及灵魂。说得好。今天，咱们就来干一件有挑战性的事：把C
ES 地理网格聚合，基于位置模糊搜索（热力图）
简介热力图需要按照一定范围聚合数据。聚合要求字段必须为geo-point类型ES中geo-point类型，包含lat、lon和geohash信息。"coordinate":{"lat":39.90894,"lon":116.82192,"geohash":"wx55435nkj9h","fragment":true}其中geohash字段是经纬度经过二进制变化、合并和Base32编码得到的编码，编
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
Python|Pyppeteer规避反自动化检测方法【最新方案】(33) 写python的鑫哥 Pyppeteer从入门到精通 python pyppeteer puppeteer 规避反自动化检测反爬虫
前言本文是该专栏的第33篇，结合优质项目案例持续分享Pyppeteer的干货知识，记得关注。相信有些同学在使用Pyppeteer框架进行某个自动化操作的时候，会触发平台的检测机制，让目标平台识别出当前是机器人在操作，而非人为操作，导致让你的程序无法继续进行下一步。对于上述这种情况，你是不是有很大的疑惑呢？别担心，本文笔者专门针对上述问题，来详细介绍在使用Pyppeteer的过程中，出现反自动化机制
深度报告：中老年AI陪伴机器人需求分析 MidJourney中文版 AI机器人人工智能机器人
银发经济新赛道：中老年陪伴聊天AI机器人需求价值与发展路径分析1老龄化社会的隐性需求全球人口结构加速老龄化背景下，老年孤独问题日益凸显为公共健康挑战。传统家庭结构变迁导致独居老人比例持续上升，情感支持缺位与社交隔离形成双重压力，而现有社会服务难以满足高频次、个性化的陪伴需求。在此现实困境中，具备自然语言交互能力的AI机器人玩具展现出独特价值——通过技术手段填补情感空缺，成为应对银发群体精神健康问题
Socket编程——TCP 兰雪簪轩 Linux tcp/ip 网络协议网络
文章目录一、TCP编程基础TCPsocketAPIsocket二、EchoServer对于服务端对于客户端server.hppServer.ccClient.ccCommandExec.hpp一、TCP编程基础TCP协议和UDP协议都属于网络通信协议，TCP协议是面向字节流的，UDP协议是面向数据报，这个特点后面会详谈的。对于现在来说UDP和TCP的区别为：UDP协议不需要连接，即报文一来就立刻进
【Unity&AssetBundle】同步加载大飞pkz Unity C#unity 游戏引擎 C#AssetBundle AssetBundle同步加载 AB包
加载包的方式包括：LoadFromFile（从文件）、LoadFromMemory（从内存）、LoadFromStream（从流）【异步同理】1.同步加载第一步.从Asset下的只读文件夹下获取AB包，下面是加载包路径为“Asset/StreamingAssets”，“cube”为包名AssetBundleab=AssetBundle.LoadFromFile(Application.stream
DPDK 网卡驱动唯独不开心 DPDK 开发语言
DPDK里的PMDs负责处理网络数据包与内存之间的数据交互。而接下来提到的UIO和VFIO是两种不同的驱动方式，允许DPDK绕过内核网络栈，直接在用户空间高效地访问硬件设备。这部分内容会围绕使用这两种驱动的PMDs展开，可能会涉及到它们的配置、使用场景、性能特点等方面。新名词IOMMU（Input-OutputMemoryManagementUnit，输入输出内存管理单元）定义：IOMMU（Inp
数据资产确权的法律路径：从原始数据到衍生产品的权利归属
首席数据官高鹏律师数字经济团队创作，AI辅助在数字经济时代，数据已成为堪比石油的战略资源。某新能源车企因驾驶数据归属争议损失数十亿，某电商平台用户画像被竞争对手“合法”窃取的案例频发，暴露出数据这座“金山银山”背后隐藏的法律暗礁。当原始数据的采集边界模糊不清，当衍生数据的价值裂变引发权属混战，如何用法律之钥打开数据资产的财富之门？这不仅是技术命题，更是数字时代的法律革命。一、原始数据：数字土壤上的
rk3128 emmc显示剩余容量为0 站在巨人肩膀上的码农 RK3128 rk 驱动开发 emmc
机器emmc容量显示异常，显示剩余容量为0，这时候做了一个让系统不检测GPP分区部分的操作，此问题才得以解决，如下：system/vold/DirectVolume.cpp@@-33,6+33,8@@#include"VolumeManager.h"#include"ResponseCode.h"#include"cryptfs.h"+#include+#include#definePARTITI
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
JMH基准测试入门：科学测量Java代码性能的艺术 zhysunny Java类库 java 开发语言
目录一、为什么需要JMH？二、快速入门：你的第一个基准测试1.添加JMH依赖2.编写测试类3.运行并查看结果三、JMH核心概念详解1.测试模式（@BenchmarkMode）2.状态管理（@State）3.预热与测量（@Warmup&@Measurement）四、进阶技巧：解决真实问题案例1：HashMap初始容量优化案例2：流(Stream)vs传统循环五、避免JMH测试的常见陷阱1.死代码消除
基于条件风险价值CVaR的微网动态定价与调度策略（Matlab代码实现） Ps.729 matlab 开发语言
‍个人主页欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录1概述一、CVaR的理论基础及其在微网中的适用性1.CVaR的定义与优势2.微网应用场景适配性二、动态定价与调度模型的联合优化框架1.目标函数设计2.动态定价机制3.不确定性处理方法三、关键算法与求解策略1.随机规划与CVaR集成2.智能优化算法对比四、实证
景联文科技完成数千万元Pre-A轮融资，布局公共数据生产运营｜36氪首发景联文科技人工智能
景联文的目标是，成为地方政府的公共数据生产、运营商，帮助挖掘公共数据的最大价值。36氪获悉，数据服务公司「景联文科技」于近期完成了数千万元Pre-A轮融资，投资方为杭州金投集团旗下基金。据悉，景联文科技本轮融资将用于公共数据生产运营的布局、智能化语料工程平台构建、以及自建垂直领域高质量标注基地，打造“平台+基地+行业”的数据链闭环生态。景联文科技成立于2012年，是一家AI数据服务运营商。据景联文
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C