ZEGO即构开发者

AI 加持实时互动｜ZegoAvatar 面部表情随动技术解析

01 AI"卷"进实时互动

2021年，元宇宙概念席卷全球，国内各大厂加速赛道布局，通过元宇宙为不同的应用场景的相关内容生态进行赋能。针对“身份”、“沉浸感”、“低延迟”、“随时随地”这四个元宇宙核心基础，ZEGO 即构科技基于互动智能的业务逻辑，提出并落地了 ZegoAvatar 解决方案，将 AI 视觉技术应用至虚拟形象，完成了业务和技术的无缝衔接。

图1：Avatar 产品 AI 能力矩阵

ZegoAvatar 基础能力包括：面部表情随动、语音驱动表情、AI 人脸特征识别（AI 捏脸）、骨骼捏脸等，涉及的 AI 技术点包括人脸检测、人脸跟踪、人脸关键点检测、头部姿态检测、3D人脸重建、AI 特征识别等。

本文重点针对 ZegoAvatar 中面部表情随动这一技术点进行解读。

02 ZegoAvatar 面部表情随动效果展示

在技术分享前首先让我们通过一组具体的数字和视频来看下 ZegoAvatar 的面部表情随动效果，我们分别在配置从低到高四种不同安卓设备上进行实际推理开销测试，取 1000 次推理结果求平均：

图2：测试数据

从上述的数据中可以看到，ZegoAvatar 在不同机型上均以极低的延迟实现了实时推理的效果，在保证表情精准稳定的同时，为用户带来了流畅极致的使用体验。可以看下下方的面部表情随动效果视频：

点击查看⬆️ ：ZegoAvatar 面部表情随动效果展示视频

03 面部表情随动技术方案解析

面部表情捕捉（Facial Expression Capture）技术被广泛应用于电影、游戏、动漫制作等领域，而目前的面部动作捕捉依托于相机或激光扫描仪将人脸转换为一系列参数数据，然后用于生成计算机图形、电影、游戏或实时化身的计算机动画。

与捕捉由关节点构成、较为稳定的人体动作相比，面部表情更为细微复杂，因此对数据精度的要求也更高。现在主流的 3D 面部表情捕捉主要有基于相机阵列和基于结构光两种方法，存在拍摄难度大，设备成本高的问题。

图3：表情捕捉示意图

图4：欧拉角示意图

ZegoAvatar 技术方案中的移动端面部表情随动是指通过移动端摄像头进行人脸检测以及跟踪，通过人脸位置、关键点信息定位出人脸在屏幕上的位置，并实时输出包含面部、舌头、眼球在内的 52 种基础面部表情维度的线性组合以及头部姿态的三个欧拉角，最后导入虚拟形象进行实时渲染驱动。

目前 ZegoAvatar 面部表情随动在不同性能的硬件设备上均实现了低延迟的落地效果，通过实时的虚实交互，为用户带来沉浸式的体验。本文将向大家详细解读 ZegoAvatar 的面部表情随动的算法整体架构以及如何在落地过程中做到面部表情随动效果的精确与自然。

ZegoAvatar 的移动端面部表情随动的技术方案分为模型训练和部署推理两部分。

在训练过程，我们设计了一个轻量化的全卷积神经网络，包括网络骨干（Backbone）和三个不同的任务分支（如图5）。其中 Backbone 是由标准卷积 + MobileNetV2 Block + MobileViT Block 组成（如图6），多个输出分支为：3D面部特征点定位、面部表情识别、头部欧拉角姿态估计，其中不同的分支负责不同的任务。我们通过多任务学习的思想和迁移学习的技巧，给模型送入人脸特征和表情以及欧拉角标签，输出稳定的相关的映射关系。

图5：网络结构示意图

图6：网络骨干（Backbone）示意图

图7：训练和推理流程示意图

1、训练模块

根据数据采集模块得到表情数据，并通过数据矫正和增强后训练得到 AI 表情模型，具体分为以下几个部分：

a、数据采集：针对业务需求，我们开发了一套可用于捕捉人脸和动作的数据采集软件，用于获取表情和欧拉角以及 3D 特征点位置数据；

b、模型训练：基于多任务学习和迁移学习的思想，我们尝试了多种轻量级的网络结构和训练策略，设计不同的任务分支如特征点定位和头部姿态估计以及面部表情检测，利用任务之间的相关性辅助目标任务学习。

c、数据增强：针对落地场景，设计了定制化的数据增强流程，丰富了训练数据的模式；

d、数据矫正：对采集的图片依次进行人脸检测，面部特征点对齐，通过仿射变换得到矫正后的图片；

对模型进行训练，模型分为三个分支，损失函数组成如下:

2、推理模块

推理模块根据输入数据进行推理，具体分为以下几个部分：

a、数据输入和矫正：用户使用时解析输入视频流，对图片中的人脸进行检测、跟踪以及面部特征点定位，然后计算出人脸位置与标准人脸之间的仿射矩阵，从而通过仿射变换得到矫正后的图像；

b、模型推理：对训练好的 AI 模型，进行剪枝和量化，在 FP16 半精度下，在移动端进行推理加速部署，最后将矫正后的图像送入模型，推理得到表情向量和欧拉角向量；

c、表情驱动和渲染：将表情向量和欧拉角向量送入驱动渲染模块解析，实时驱动虚拟人物形象。

04 “精确而自然”的效果难点攻克

本技术旨在解决互动智能领域移动端虚拟人物表情实时驱动问题，在研发过程中需要解决以下问题：

移动端推理的实时性
面部表情和头部姿态的稳定性
不同用户在不同使用场景的鲁棒性
各个表情的协调性

这四个维度层层递进，而如何做到同时兼顾，是贯穿整个项目周期的重难点。

首先，受限于移动端的计算资源，不同设备的用户要正常体验，必须要做到各种机型上的低延迟，因此落地需要做到极致的轻量化，这对模型设计和部署有较高要求。

其次，实际体验过程中，用户的使用方式、用户场景光照、用户镜头脏污或遮挡都会影响模型的表现，如何在这些因素的综合作用下，让模型又快又稳的输出面部表情和头部姿态，是 ZegoAvatar 走向商业化不可回避的难题。

最后，考虑到不同的表情之间既有独立性又互相影响，如何让虚拟形象的表情更加拟人化，让用户的使用更有沉浸感，既是一个有挑战性的技术挑战，也是一个有价值的业务问题。

基于以上想法，我们设计了以下技术方案：

1、推理的实时性

一方面设计模型时遵循轻量化的原则，比如使用深度可分离卷积（Depthwise separable convolution）以及更少的卷积层数和通道数，可以减少模型的参数量，从而降低推理的计算开销。

这里补充一下一般的卷积和深度可分离卷积的示意图，并对计算量优化进行简单分析：

图8

深度可分离卷积将一般的卷积过程分为了depthwise convolution（逐深度卷积）和 pointwise convolution（逐点卷积），略牺牲精度的情况下，计算量大幅下降，速度更快，模型更小。

由此可见，深度可分离卷积可以显著减少一般卷积的计算量。

另一方面落地时，我们基于移动端推理引擎进行模型转换和部署，主要分为算子转换和推理优化两个部分。

a、算子转换：主要通过算子融合、算子替代、模型压缩、布局调整等方式对模型中的图进行基本的优化操作；

b、优化推理：主要进行算子级的优化包括：卷积和反卷积中应用 Winograd 算法、在矩阵乘法中应用 Strassen 算法、低精度计算、手写汇编、多线程优化、内存复用等。

此外我们通过分析模型在不同网络层的的计算量分布，对模型存在计算瓶颈的卷积层进一步剪枝，在 FP16 半浮点数精度下，进行模型转换，在保证模型表现的同时，显著的降低了推理开销，并减少了模型的尺寸。

2、模型精确性和鲁棒性

首先是数据采集阶段，基于 ZEGO 自身业务，自主开发了一套数据采集软件，并通过脚本对每一批数据进行可视化检查，确保原始数据的正确性。

在模型训练阶段，尝试了多种模型结构和训练策略，包括不同的输入形式和分支组成。最后采用 3D 面部特征点分支和面部表情分支与头部欧拉角分支结合的方式，利用多任务学习思想和迁移学习的训练技巧，通过特征点信息辅助表情和欧拉角输出，得到精确的模型表现。

在最后落地时，由于用户和场景的不同，我们遇到了模型泛化性（Generalization）问题，这也是几乎所有计算机视觉任务落地时都会遇到的问题。

图9：泛化性、欠拟合（underfitting）、过拟合（overfitting）示意图

泛化性指模型经过训练后，应用到新数据并做出准确预测的能力。一个模型在训练数据上如果被训练得太好往往会导致过拟合，以致泛化性降低。

针对此问题，一方面从网络结构和训练策略出发，增加必要的组件，比如一定强度的 DropOut，损失函数正则项，设计EarlyStopping 机制，另一方面我们针对出现的场景问题，比如“眼镜反光”，“阴阳脸”，“镜头模糊脏污”等，进行多轮测试后去追溯和定位问题，然后设计了针对性的数据增强方案，通过完备性的消融实验（ablation experiment），确定了最优的流程和相应超参数，在训练过程中引入相应的数据模式，极大的提升了模型的精确性和鲁棒性，从而解决了这一难题。

3、表情的协调性

如何让虚拟形象不同的表情之间自然的联动，这是整个团队协作解决的问题。

一方面算法在网络 Backbone 的设计考量上，我们引入了 MobileViT 模块，因为尽管 CNN 网络在视觉任务上具有参数少效果好以及空间感知的优势，然而这种空间感知是局部的，全局感知可以通过注意力机制和 transformer 实现, 然而普通的 transformer 无法部署在移动端，MobileViT 可以将 ViT 与 MobileNetV2 的结合起来，兼顾全局信息和轻量化的需求，让模型的推理效果又快又准。

另一方面，开发和设计同学持续的解决虚拟形象的各种材质渲染难题，最后才有了现在 ZegoAvatar 精确而自然的随动效果。

ZEGO

ZegoAvatar 面部表情随动是 ZEGO 基于已有业务，通过 AI 结合元宇宙赛道的一次成功的尝试和突破，我们从数据采集方案到模型架构设计再到训练策略整个算法闭环，以及虚拟形象和相关组件的开发实现了完全的自研，在实际的落地效果上，我们做到了行业领先水平。

对于落地遇到的各种问题，我们从本质出发，设计针对性的方案进行解决，整个项目用较少的数据，取得了很好的效果。基于 ZegoAvatar，不同业务切入点的新的算法开发也在进行中，后续会有更多新的项目孵化，ZEGO 即构科技将进一步在互动智能领域不断实现技术革新与突破，在元宇宙浪潮中扬帆起航！

获取更多帮助

获取 SDK 开发文档、demo，可访问即构文档中心；
获取更多商务活动热门产品，可提交信息联系商务；
注册即构ZEGO开发者帐号，快速开始；

基于 KTransformers的DeepSeek-R1 本地部署方案，成本骤降32倍！爱科技Ai LLM 人工智能
随着DeepSeek-R1模型在全球范围内的流行，越来越多的用户开始在本地尝试部署该模型。然而，高昂的硬件需求和成本让许多公司望而却步。本文将深入探讨DeepSeek-R1部署中的挑战，并介绍一款创新框架KTransformers，它能够显著降低大规模模型部署的成本并提高推理效率，从而帮助更多中小企业有效部署此类高级AI模型。本地部署“成本骤降32倍”，助力R1真正落地「中小企业」中！1.Deep
懂车帝 2025.3.13 一面经凉 WispX888 java 面试
懂车帝2025.3.13一面经凉上来一道算法题：小于n的最大数（dfs）n=23121，数组{2,4,9},问利用数组中的数字组成的最大的小于n的数publicclassTest{publicstaticvoidmain(String[]args){for(inti=0;i<3;i++){dfs(1,a[i]);}System.out.println(ans);}privatestaticint[
商场促销-策略模式 WispX888 java 开发语言学习设计模式
商场促销-策略模式商场收银软件大鸟给小菜出了一个作业，让小菜做一个商场收银软件，营业员根据客户端所购买商品的单价和数量，向用户收费。核心代码如下：importjava.util.Scanner;publicclassMain{privatestaticdoubletotal=0;publicstaticvoidmain(String[]args){Scannersc=newScanner(Syst
分享vue好用的pdf 工具实测何包蛋H vue.js pdf javascript
vue3-pdf-app：带大纲，带分页，带缩放，带全屏，带打印，带下载，带旋转下载依赖：yarnaddvue3-pdf-appornpminstallvue3-pdf-app配置类：创建文件pdfConfig.ts//工具栏配置项exportconstconfig={//右侧其他区工具sidebar:{viewThumbnail:true,//启用缩略图视图viewOutline:true,//
Matlab多种算法解决未来杯B的多分类问题 Subject.625Ruben 算法分类机器学习数学建模未来杯 matlab 人工智能
1.读取数据首先，我们从Excel文件中读取训练集和测试集：2.训练集划分我们将80%的数据用于训练，20%用于验证。3.训练多个模型我们选取8种常见分类模型，并存储预测结果。fori=1:length(modelNames)switchmodelNames{i}case'MultinomialLogisticRegression'B=mnrfit(X_train,Y_train,'model',
【prompt实战】知乎问题解答专家姚瑞南 prompt实战应用案例 prompt
本文原创作者：姚瑞南AI-agent大模型运营专家，先后任职于美团、猎聘等中大厂AI训练专家和智能运营专家岗；多年人工智能行业智能产品运营及大模型落地经验，拥有AI外呼方向国家专利与PMP项目管理证书。（转载需经授权）#Role:知乎问题解答分类专家##Profile:你是一个知乎问题解答分类专家，主要帮助用户解答各类领域专业问题，包括但不限于金融领域、职场问题、互联网领域、科技领域、人工智能领域
hive sql报错进一步有进一步的欢喜大数据 Hive SQL 精进系列
1.hivesql报错FAILED:ParseExceptionline22:0cannotrecognizeinputnear''''''insubquerysource2.解决select*from(select...fromtable_1where...)table_outer嵌套的内层的表一定要有别名，也就是示例代码中的表名table_outer。
Java突击小练习--利用正则表达式来简易的校验邮箱与手机号格式 CJH~ java 正则表达式 mysql
//校验邮箱publicclassTestEmail{publicstaticvoidmain(String[]args){Scannerinput=newScanner(System.in);//*号代表任意数量，放在0-9a-zA-Z后面，代表可以写任意数量的字母和数字//@是邮箱的符号，接在刚刚那串的后面//|代表或，也就是说@后可以跟着qq或163或sina中的任意字符串，代表哪家邮箱//
Elasticsearch大文件检索性能提升20倍实践（干货）_elasticsearch 查询优化 2401_84247505 2024年程序员学习 elasticsearch jenkins 大数据
3、问题排查与定位步骤1：限定返回记录条数。不提供直接访问末页的入口。baidu，360，搜狗等搜索引擎都不提供访问末页的请求方式。都是基于如下的请求方式：通过点击上一下、下一页逐页访问。这个从用户的角度也很好理解，搜索引擎返回的前面都是相关度最高的，也是用户最关心的信息。Elasticsearch的默认支持的数据条数是10000条，可以通过post请求修改。最终，本步骤将支持ES最大返回值100
Manus 一码难求，MetaGPT、OpenManus、Camel AI 会是替代方案吗？全干程序员demo 技术热文人工智能
Manus一码难求，MetaGPT、OpenManus、CamelAI会是替代方案吗？一、Manus的现象与问题Manus作为一款号称“全球首个通用AI智能体”的产品，凭借其强大的功能和新颖的营销策略迅速走红。然而，其封闭的邀请码机制和高昂的使用门槛，让普通开发者望而却步。Manus的邀请码被炒至高价，甚至出现账号冻结等现象，这引发了用户对其技术壁垒和实际应用价值的质疑。二、MetaGPT、Ope
【大模型对话的界面搭建-Open WebUI】 y_dd 人工智能深度学习人工智能 llama 语言模型
OpenWebUI前身就是OllamaWebUI，为Ollama提供一个可视化界面，可以完全离线运行，支持Ollama和兼容OpenAI的API。github网址https://github.com/open-webui/open-webui安装第一种docker安装如果ollama安装在同一台服务器上：dockerrun-d-p3000:8080--add-host=host.docker.in
TidyBot++：用于机器人学习开源的完整移动机械手三谷秋水计算机视觉智能体人工智能机器人开源人工智能机器学习深度学习
24年12月来自普林斯顿、斯坦福和dexterity.ai的论文“TidyBot++:AnOpen-SourceHolonomicMobileManipulatorforRobotLearning”。要充分利用模仿学习在移动机械操作方面的最新进展，需要收集大量人工引导的演示。本文提出一种开源设计，用于设计一种廉价、坚固、灵活的移动机械手，该机械手可支撑任意臂，从而实现各种现实世界的家用移动机械操作
【Quarkus】通过Quarkus集成后端服务示例 Vesper63 Quarkus java 开发语言
说明：REST资源接口（AuthResource）。REST资源实现类（AuthResourceImpl）。服务接口（AuthService）。服务实现类（AuthServiceImpl）。配置文件（application.properties）。测试类（AuthResourceTest）。1.项目结构my-quarkus-app/├──src/│├──main/││├──java/│││└──c
【大模型UI\多模型回复UI】 Ai君臣 LLMS 微调 ui 大LLMS UI
文章目录1、开源大模型用户界面（UI）2、同时让多个模型回复UI1、开源大模型用户界面（UI）LobeChatOpenWebUI：这是一款功能丰富且用户友好的开源自托管AI界面，旨在完全离线运行。它支持多种大型语言模型（LLM），包括Ollama和兼容OpenAI的API。OpenWebUI提供直观的界面，支持多模型和多模态交互，具有全面的Markdown和LaTeX支持，以及本地RAG集成等功能
记一次联想ThinkBook 16P G5 IRX ，麦克风无声音问题的解决花花鱼 Windows windows 音频
1、微信语音麦克风无声音在电脑上微信电话，麦克风的功能没有，或者说你要录个屏给客户，发现讲不了话，也是比较的麻烦。2、联系客服建议升级声卡驱动，然后更新了以后，一个样没什么区别。各种设置，发现还是不行。3、声音设置当然，图片上的是静音麦克风了，按一下键就可以去掉。4、专家给了工具解决旧版驱动残留文件清除工具.zip链接:https://pan.baidu.com/s/1eVjT_QjYk_vz10
DeepSeek：全栈开发者视角下的AI革命者大富大贵7 程序员知识储备1 程序员知识储备2 程序员知识储备3 人工智能
DeepSeek：全栈开发者视角下的AI革命者写在前面随着人工智能（AI）技术的不断进步，AI已经成为各行各业创新的核心动力。从自动驾驶到智能制造，再到自然语言处理和图像识别，AI正在逐渐渗透并改变着我们的生活和工作方式。DeepSeek，作为AI领域的新兴技术，凭借其独特的技术架构和颠覆性的创新理念，成为了全栈开发者关注的焦点。本文将从全栈开发者的角度出发，详细解析DeepSeek的诞生、技术架
AtCoder Beginner Contest 370 A-E 题解 AKDreamer_HeXY AtCoder Beginner Contests 题解算法 c++数据结构贪心算法
A.RaiseBothHands题意给你L,R(0≤L,R≤1)L,R\(0\leL,R\le1)L,R(0≤L,R≤1)，分别代表举左手和右手，若只举左手输出Yes，只举右手输出No，否则输出Invalid思路若L=RL=RL=R则为invalid，其余L=1L=1L=1输出Yes，R=1R=1R=1输出NoC++代码#includeusingnamespacestd;intl,r;intmai
串排序（信息学奥赛一本通-2048） Doopny@ 信息学奥赛一本通算法
【题目描述】对给定的n(1≤n≤20)个国家名（国家名字长度不超过20），按其字母的顺序输出。【输入】第一行为国家的个数n；以下n行为国家的名字。【输出】n行，排序后的国名。【输入样例】3KoreaChinaJapan【输出样例】ChinaJapanKorea【题解代码】#includeusingnamespacestd;constintN=2e1+10;stringstr[N];intmain(
Tornado 初识 Wu_Candy Web服务器
一、什么是tornadoTornado是使用Python编写的一个强大的、可扩展的Web服务器。它在处理严峻的网络流量时表现得足够强健，但却在创建和编写时有着足够的轻量级，并能够被用在大量的应用和工具中。二、tornado有什么优势Tornado和现在的主流baiduWeb服务器框架（包括大多数Python的框架）有着明显的区别：它是非阻塞式服务器，而且速度相当快，得利于其非阻塞的方式和对epol
【AI热点】Manus技术细致洞察报告（篇2）碣石潇湘无限路人工智能
针对大家对Manus产品褒贬不一的现象，基于近期对Manus的多方实测、公开信息与开源竞品的比对分析而撰写，旨在为从业者、技术爱好者以及潜在用户提供一个较为系统、专业的视角。报告将围绕Manus的核心原理、功能特点、技术亮点、常见应用场景与不足，以及与其他Agent产品和开源方案的对比进行深入探讨。1.引言与背景1.1产品崛起与「全自主通用Agent」的概念自2023年底至2024年初，大模型及其
Exception in thread “main“ java.lang.NoSuchMethodError: Awesome Baron java java vscode
在VScode中运行代码调试力扣程序报错：Exceptioninthread“main”java.lang.NoSuchMethodError:‘intSolution.subarraySum(int[],int)’attest_560.main(test_560.java:9)原因是因为在不同的.java程序中使用了同名的Solution类，导致编译器和运行时选择的类不一致。解决方案：只保留一个
开源应用驱动企业新质生产力：Websoft9以EPP+AI+知识库助您领跑未来. 人工智能
开源应用驱动企业新质生产力：Websoft9以EPP+AI+知识库助您领跑未来在数字化转型加速的今天，企业新质生产力的核心已从传统资源投入转向技术驱动的效率革命。开源应用凭借其灵活性、成本优势和技术创新力，成为企业实现这一目标的关键引擎。作为开源技术与行业场景化落地的领航者，Websoft9通过企业应用平台（EPP）、AI智能引擎与知识库系统三位一体的解决方案，助力企业快速构建新一代生产力工具，实
ubuntu12 mysql5.6_Ubuntu 12 安装 MySQL 5.6.26 及问题汇总乔德地 ubuntu12 mysql5.6
安装过程：#安装依赖库sudoapt-getinstalllibaio-dev#移动到安装目录sudomkdir/opt/software/mysqlcd/opt/software-backup/lnmp/source2/mysqltar-xzvf./mysql-5.6.26-linux-glibc2.5-x86_64.tar.gzsudomv./mysql-5.6.26-linux-glibc2
AMIS低代码构建系统，定制界面一醉千秋 Cesium nodejs arm64 低代码
AMIS低代码构建系统界面一、基础环境1）设计环境：amis-editor，http://139.196.235.123:9988/#/源码地址：https://github.com/baidu/amis在线文档https://aisuda.bce.baidu.com/amis/2）运行环境使用amisjssdk进行运行二、构建流程1）设计需要的界面，针对控件设计Event方法，支持amis原生和
《C++ primer》第六章鱼不如渔 C++Primer第五版——读书笔记 c++开发语言
一、函数基础函数的定义包括：返回类型、函数名、形参列表、函数体/*编写函数*/intfact(intval){intret=1;while(val>1)ret*=val--;returnret;}/*调用函数*/intmain(void){intj=fact(5);cout#includeusingnamespacestd;intmain(intargc,char*argv[]){//检查是否提供
关于STM32常用的8种GPIO输入输出模式的理解 MPU技术极客笔记项目开发经验：STM32 stm32 单片机嵌入式硬件
目录GPIO共有8中输入输出模式，分别是：上拉输入、下拉输入、浮空输入、模拟输入、开漏输出、推挽输出、开漏复用输出、推挽复用输出，下面我们详细介绍以下上面的八种输入输出模式。一、输入模式（1）上拉输入：GPIO_Mode_IPU（2）下拉输入：GPIO_Mode_IPD（3）浮空输入：GPIO_Mode_IN_FLOATING（4）模拟输入：GPIO_Mode_AIN二、输出模式（1）开漏输出：G
STM32 单片机常见的 8 种输入输出模式嵌入式修炼师 STM32 单片机 stm32
STM32单片机常见的8种输入输出模式文章目录STM32单片机常见的8种输入输出模式1.浮空输入模式(GPIO_Mode_IN_FLOATING)介绍使用场景示例代码2.上拉输入模式(GPIO_Mode_IPU)介绍使用场景示例代码3.下拉输入模式(GPIO_Mode_IPD)介绍使用场景示例代码4.模拟输入模式(GPIO_Mode_AIN)介绍使用场景示例代码5.开漏输出模式(GPIO_Mode
第20篇：从零开始构建NLP项目之电商用户评论分析：模型训练阶段 Gemini技术窝自然语言处理人工智能深度学习 AIGC 机器学习 nlp langchain
大家好，今天我们继续探讨如何从零开始构建一个NLP项目，特别是电商用户评论分析中的模型训练阶段。模型训练是NLP项目的核心环节，通过合理的调参和优化，可以显著提升模型性能。本文将详细介绍模型训练的步骤，并展示如何使用LangChain库进行模型训练、调参和优化。文章目录项目的背景和目标模型训练的详细步骤安装依赖包流程图1.准备数据2.定义模型3.训练模型4.评估模型5.调参与优化常见错误和注意事项
高效快速教你deepseek如何进行本地部署并且可视化对话 chatgpt
随着最近一个新的人工智能deepseek的爆火，很多大佬都开始了在本地进行deepseek的部署操作，并且离线也可以使用，这里的话我就一步一步带你们部署本地的deepseek,说实话这个人工智能的实力不亚于openai的gpt安装ollama我们需要先安装ollama，安装地址ollama,我们直接点击下载，我们在下载的时候尽量使用我们的谷歌浏览器，有魔法的最好带上魔法，不然安装的时候可能会出问题
selenium+pyquery爬取《鱿鱼游戏》评论2000+条铁憨憨0304 python爬虫 selenium python 测试工具
IMDB网址爬取《鱿鱼游戏》的全部评论评论排名评论标题id评论时间评论内容导入所需要的包selenium:模拟浏览器，这里使用的是Edge浏览器，需要安装Edge浏览器驱动解析库：PyQuery保存数据：pandas，保存为csv文件fromseleniumimportwebdriverfromselenium.webdriver.support.uiimportWebDriverWaitfrom
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>