腾讯技术工程

微信「看一看」推荐排序技术揭秘

本文转载自：微信AI，作者 xiafengxia

在微信 AI 背后，技术究竟如何让一切发生？微信 AI 公众号推出技术专题系列“微信看一看背后的技术架构详解”，干货满满，敬请关注。以下为专题的第一篇《微信看一看推荐排序》。

一、背景

微信公众平台作为目前用户量最大的互联网原创内容平台之一，每日新发表的文章可达几百万篇。用户可以通过关注公众号、朋友圈、聊天转发等渠道阅读文章。除了前述几种方式以外，用户很难再有其他方式发现更多有趣的文章。因此，看一看个性化推荐应运而生。我们利用用户在微信内的阅读、关注、分享等信息，结合目前最新的深度学习算法，为用户推荐最符合兴趣的文章。除了文章以外，我们也接入了腾讯视频、企鹅号、竖屏小视频等内容，大大丰富了推荐的内容多样性。

二、看一看整体架构

看一看的整体架构如图所示：

和大多数的推荐系统一样，我们最底层采用了经典的召回、粗排、精排三层结构，各阶段处理的候选集数量逐层递减，主要考虑是需要在实时性能和效果之间做 tradeoff。比较特别的一点是，我们在精排之后接了一层异构内容混排，主要是考虑到不同内容源的点击率、优化目标不尽相同，难以放在一起比较。目前，混排侧引入了强化学习模型，优化长期收益，实现快速实时反馈。

三、基础数据和召回

数据是推荐系统的天花板所在。简单来讲，推荐系统就是根据用户的行为，在千万级别的候选集中挑选最适合用户的 topN 条结果。对数据判断得越准确，越细致，数据的表达能力越强，推荐也越精准。整体上看，数据可以分为用户数据和内容数据。

通过基础数据，我们可以从多个纬度去判断用户需求，包括用户的一级类目兴趣，二级类目兴趣，兴趣关键词，topic 分布等。同时，在 embedding everything 的号召下，我们通过深度网络，对画像做了多种层面的 embedding。

内容数据泛指所有文档相关的数据。从业务层面看，内容数据分为图文、视频、新闻、小视频、人工干预等几个大类，每种业务都是一个独立的池子，有单独的数据清洗、质量评估流程，前期甚至有独立的分类体系。从来源看，内容数据分为公众平台文章、企鹅号号文章、外部链接文章、短视频、小视频。从时间上看，内容数据分为实时数据、15 天全量数据、历史优质数据。

每个文档都有丰富的基础属性，包括一级分类、二级分类、tag、实体词、topic、曝光数、点击数、质量分、色情分、垃圾分。我们还创新的提出了 people rank 算法，通过每个人的社交影响力，将每个人的社交影响力反馈到文章上，形成文章的权威分、精英分等，能较好的提炼出高质文章。

召回主要负责从百万级的海量候选集中选出万级别的候选集给到粗排。召回主要分为兴趣画像、协同、公众号、社交等几个大类召回。兴趣画像召回主要有一级/二级类目、topic、地域、关键词等召回；协同召回包括 Item 协同、内容协同、用户协同等召回；公众号召回包括关注公众号、扩展公众号召回。为了增加多样性，在以上召回之外还有一些试探、冷启动召回，对用户兴趣进行探索。

四、排序

排序主要分为精排和粗排 2 个阶段，二者主要的区别在于候选集的量级不一样，粗排输入候选集在 1 万级别，精排只有 1 千级别。候选集的数量差异决定了粗排在性能上要求会更高，因此在特征上只能选取粗粒度、区分度较高的少量特征，而模型侧也只能选择线性模型，或者复杂度较低的深度模型。粗排其他部分的工作和精排比较类似，这里着重介绍精排。

精排阶段需要对粗排候选池中的 ItemList 进行打分，这个分数是针对每个用户对候选文章点击概率的预测，即 Ctr 预估。看一看业务中每天有海量活跃用户，这些海量日志可以用来进行模型训练以建模喜好。

LR/FM 大规模的 Ctr 预估系统中，Logistic Regression 因简单、易扩展、可解释的特性成为初期阶段使用最为广泛的一种模型。其 Ctr 预估模型公式为：

我们第一阶段的模型采用大规模分布式的 LR，使用自研的分布式训练平台 PanguX，通过人工特征工程提取十亿级的特征用于离线训练。但 LR 属于 Memorization 比较强的 model，主要记忆每个特征的历史点击率，在 Generalization 上有很大的缺陷，需要大量的人工特征工程来提高泛化能力。另外，这种线性模型特征与特征之间在模型中是独立的，无法学到在训练集中未出现过的交叉信息。因此第二阶段我们切换到了 FM(Factorization Machines)，该模型可以在很少特征工程的情况下通过学习特征的 embedding 表示来学习训练集中从未见过的组合特征，FM 的模型公式如下：

虽然理论上讲 FM 可以对高阶特征进行组合建模，但是我们一般在使用中受计算复杂度和参数维度的限制都是只用到了二阶特征。很自然的，对于更高阶的特征组合可以用多层神经网络去解决。

wide&deep

2016 年 Google 提出的 wide&deep 模型拉开了深度学习在 ctr 预估领域大规模应用的序幕，该模型包括两部分：线性模型

DNN 部分，wide 部分通过 Cross-product transformation 在 Memorization 上增加低阶非线性，deep 部分聚焦 Generalization，对特征的 dense embedding 进行组合，学习更深层的隐藏特征。在我们的实际应用中, wide 部分增加 cross-product transformation 的组合特征，deep 部分主要由 embedding 化的离散特征及连续特征组成，对离散特征学习了一个低纬度的 embedding 向量（dense representation），Embedding vectors 随机初始化后根据最终的 loss 来反向训练更新。我们把同一个 field 内 embedding 向量进行 sum pooling，不同 field 得到的向量 concat 在一起作为第一个隐藏层的输入。wide&deep 作为我们进入深度学习领域的第一个模型在看一看精排场景中取得了很大的收益。

DeepFM

wide&deep 模型全量之后相比 FM 这种浅层模型点击率提升明显，但 wide 部分仍需要大量的人工特征工程来引入低阶组合信息。我们参考 DeepFM 在网络结构上引入因子分解机部分,通过 FM 的特征交叉学习浅层组合，dnn 部分挖掘特征间的深层非线性关联。标准的 DeepFM 网络结构如下：

我们在引入 FM Layer 时，不同 field 间的交叉不再使用点积操作，而是通过哈达马积得到一个向量，用于上层的多模块融合。同时，引入 field-wise 的 Wide Layer 以防止共享 embedding 的训练有偏。对于 Show/Clk/Ctr 等统计特征，我们放弃了离线单独统计载入字典的模式，直接在 PanguX 训练平台框架层面引入该类型统计信息，server 针对每个特征保存一份实时的全局 show clk 信息，并且该数据随着训练的进行持续累计和随时间衰减。最后的模型框架结构如下：

目前该优化过的 DeepFM 已经全量应用于看一看精排业务中，取得了非常不错的效果。

五、多目标

除了前述 ctr 预估，在微信看一看的排序中，我们非常重视多目标的推荐效果优化。这里多目标是指包括了点击目标之外的时长、分享、点赞、评论等其他跟用户体验息息相关的推荐指标。单纯以 pctr 为目标，会带来标题党问题。站在平台的角度，我们不仅希望在打造一款大众化的阅读产品，同时希望提升产品的社交属性，因此用户阅读外的其他互动行为，也是用户体验的重要衡量准则。站在内容的角度，被用户点赞、分享、评论的内容以及停留时长长的内容，往往质量比较高，因此引入这些目标有利于推荐过程中避免标题党等低质量内容的展现。站在用户的角度，从阅读、分享、点赞、评论等多个角度提升用户综合体验，有利于增加产品对用户的使用黏性。在创作者角度，作者会希望在多元的指标上看到自己微信平台上的内容作品的反馈效果的提升。

多目标问题业界常见的有方法有两种：

1.多任务联合建模：

阿里妈妈在广告的点击率-转化率预估任务中，提出了对点击率、转化率进行联合建模，并将转化率分解为点击率乘以点击后的转化率，从而对两个任务在目标输出层进行关联。优点是多个任务之间可以互相利用信息，点击数据弥补了转化数据过度稀疏造成的预估不稳定问题，不足之处是模型强依赖于点击-转化目标在业务递进关系，不能直接扩展到其他复杂场景。

2.各任务独立建模：

业界一些信息流推荐产品，对点击、时长、点赞和评论等目标采用独立训练模型，线上进行组合的 model combination 方案。优点是各任务完全解耦，加快了模型的迭代速度，也利于对具体任务的特征独立优化，不足之处是各任务之间无法互借信息。

3.其他方法：

一些通过修改样本权重体现多目标重要性的方法，以及一些通过增加正则项在损失函数中体现多目标价值的方法，因为在迭代的灵活性和模型效果上均不具有优势，此处不再详述。

看一看的推荐场景和其他推荐产品有相似之处，也有自己独特的一面。例如，点击目标和阅读时长、分享、乃至关注公众号等目标构成业务场景上的递进关系，这一点是共通的；但在“好看”上线以后，用户的点赞和评论行为则不必须依赖于点击也可以发生，这些目标和点击目标既有递进关系，也有平行的关系。

此外，用户在阅读中的社交互动行为数据也是微信看一看的特色，共同阅读一篇文章、观看一个视频的好友上下文信息，对用户行为的引导起到了很大的作用。

看一看中多目标优化方法：

1.多目标模型的网络结构：

整体的多目标建模方法论层面，我们也采用了多任务联合建模的方案，各个任务共享底层特征 embedding 表示，独享各自的神经网络和目标输出。

在对多目标之间的联结方式上，我们在对点击目标和点击后的递进行为进行全空间建模之外，增加了对非依赖点击行为目标的独立输出。以“好看”业务为例，即对图中的点击（A+B），点击并点赞（B），点赞（B+C）做三路输出。这样做的好处是既能受益于点击目标和递进的 postclick 目标互相借用信息，又能通过独立网络将非依赖点击的行为目标完整的考虑进来。

在底层特征表示方面，我们将特征种类划分为三部分进行研究，包括用户属性和兴趣特征，内容属性特征，和社交关系上下文特征，我们目前是通过模型自动学习不同目标的预估任务下应该如何配置特征之间的交互关系的，这一部分的扩展性是可以很强的，比如可以加入人工的先验知识，或者定制化的网络结构进行特征组选择。

2.多目标在线融合方式：

多目标预估值的在线融合方式非常重要，是决定看一看产品的综合用户体验的最后一环，我们通过离线、在线两部实验获得最终的权重融合参数。在离线阶段，我们通过 grid search 设置多组融合权重方案，观察每种融合参数对各目标的离线排序 AUC 得分，选择 AUC trade off 比较平衡的一些权重组合作为候选集，上线进行 ABTEST。在线阶段，通过观察各个实验的留存率、产品使用时长、用户行为互动率、以及内容分发量和多样性等，选择和产品价值导向最一致的权重组合作为最终的融合方案。

六、重排与多样性

重排主要负责多路异构推荐结果混合排序，最终决定推荐给用户的 10 条结果。除了负责策略混排，重排还负责整体的多样性控制、规则重排、人工干预等。重排这里是业务的最终出口，我们的最终目标是提升分发量，即 pv+vv。

重排有几个难点：

数据是异构的，包含多种业务，不同业务数据包含不同的特征，并且点击率差异也很大；
不同内容的优化目标不尽相同，很难做统一的内容排序；
不同内容的点击率不同，比如视频点击率超过 20%，会挤压低点击率的业务。

我们尝试了通过 pctr 来统一排序：

看一看中，视频点击率最高，新闻最低。当我们提高视频的展现占比，整体点击数并不是持续升高，而是会有一个拐点。同样，不断降低新闻的占比，点击数也会迎来拐点。因此，提高高点击率业务，降低低点击率业务，整体的内容点击率会提高，但不会提高整体的点击数。

基于上面的考虑，我们选择使用强化学习来进行多业务混排。用户在推荐场景浏览可以建模成 ov Progress，Agent 是我们的推荐系统，Action 是我们推荐了什么内容，Reward 是用户的反馈信息，包括点击、负反馈、退出等，每次我们的推荐系统 Agent 采取某个 Action，给用户推荐了内容，用户给到我们相应的反馈，通过最优化总点击数来获得最佳效果。

未来有不确定因素，所以要对未来的收益做衰减：

DQN 梯度下降求解 MSE 的 LOSS：

初版 DQN 上线后，对比 baseline 规则，总点击数有大幅提高。为了利用 Session 内短期信息，我们将 DQN 内的 state 用 RNN 的 hidden 来描述，结构如下：

采用 RNN 结构的强化学习模型上线后效果得到了进一步提升。基于 RL 混排，我们在 reward 的设计上也进行了多轮迭代，如加入时长、负反馈、多样性。下面重点介绍一下多样性。

多样性在推荐系统中是一个重要的优化目标，但是相比于 ctr 等指标，学术界、工业界都并没有一个明确指标来指导多样性优化。为了更好的理解、分析和优化多样性策略，我们设计了 10+中多样性相关指标，如展示/点击类目数、展示类目熵，用户主兴趣覆盖率，符合用户主兴趣文章比例等。

第一版的多样性策略采用启发式的方法，限制相同类目/Topic/Tag 等个数上限，结合离线平台/abtest 数据调整参数。这里最大的问题是个性化策略是全局的，没有个性化。

通过 Submodular 的边际效应递减特性，对重复度高的类目、关键词进行打压，同时引入 pctr，体现了一定的个性化，上线取得了不错的效果，在损失较少的 ctr 的情况下大幅提升了多样性。

进一步地分析，Submodular 本质上是基于先验知识的规则，用户的及时反馈信息使用的不够高效，上述公式中仍然存在大量的超参数需要手工调节，迭代效率缓慢。基于上述考虑和之前在强化学习混排中取得的成果，我们想到了使用强化学习来优化多样性，将多样性作为 reward 加入进来，最后上线取得了 ctr 和多样性的双赢。

七、工程挑战

看一看排序工作在迭代中遇到了好几个比较大的工程挑战。

首先是算法平台。排序最初上线采用 spark mllib，快速实现了 lr 模型的上线。但是很快就遇到了算力瓶颈，我们先后尝试了一些开源的算法平台，都不能满足业务的需求，最后选择基于 ps-lite 自研了大规模分布式深度学习平台 PanguX。PanguX 平台支持百亿级稀疏特征实时训练，支持低频特征过滤、特征动态过期，支持 LR、W&D、DeepFM、RNN、MTL 等常用算法，已经稳定支持看一看、搜一搜在线业务。

其次是在线 serving 瓶颈，这里包括内存瓶颈和性能瓶颈。内存瓶颈方面，当模型特征膨胀到百亿级别，每个特征对应一个 n 维 embedding，单机无法 load 一个 model，需要对 model 进行拆分，这里就涉及到比较复杂的工程细节问题，如模型的一致性、版本控制、网络带宽等问题。我们借助微信技术架构部在 kv 方面的丰富经验，实现了一个高性能的特征 FeatureKV，用于统一存储模型，解决了 model 的在线存储问题，单机可支持超过 1kw key/s，同时运营系统支持版本控制、快速回退等功能。模型过渡到深度模型后，预测的耗时大大增加，第一版采用 tf-serving 的模型，虽然取得了不错的效果，但是耗时接近 1 秒，完全没办法全量。最后，借助于数据平台团队的 DeepX 超高性能深度算法组件和 sage 向量运算库，将耗时压缩到极致，最终达到上线要求。

最后是在线特征抽取的性能和模型可扩展性问题。通过 perf 发现，特征抽取模块中字符串拼接和 hash 计算消耗了大量的 cpu 时间，导致 ctr 预测吞吐量一直上不去。痛定思痛，我们对特征抽取模块进行了完全的重构，完完全全消除字符串 copy 和拼接，优化 hash 算法，性能得到了成倍的提升。可扩展性方面，因为业务发展太快，前期每做一个新业务，都是 copy 代码，先上线后优化。后面业务增多，排序目标增多，模型增多，问题就暴露出来。尤其是新算法在一个业务迭代取得效果想推广到另一个业务时，需要 copy 大量代码，往往需要滞后很久。因此，我们果断对 ctrsvr 进行重构，将在线预测打分逻辑抽象成特征抽取、打分算法、模型存储等几个基础组件，采用配置化的方式进行组装，大大提升了迭代效率。

八、后记

看一看上线以来，排序侧逐步从线性模型过渡到深度模型，并引入了强化学习、多目标学习等方法，对 ctr、时长、多样性等指标均带来大幅提升。在逐步迭代的过程中，一个比较大的感悟是，模型算法要发挥最大效果，一定要在算法工程架构上精耕细作，充分挖掘性能，提升算力，才能将算法的纬度和深度优势发挥到极致。

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
学点心理知识，呵护孩子健康静候花开_7090
昨天听了华中师范大学教育管理学系副教授张玲老师的《哪里才是学生心理健康的最后庇护所，超越教育与技术的思考》的讲座。今天又重新学习了一遍，收获匪浅。张玲博士也注意到了当今社会上的孩子由于心理问题导致的自残、自杀及伤害他人等恶性事件。她向我们普及了一个重要的命题，她说心理健康的一些基本命题，我们与我们通常的一些教育命题是不同的，她还举了几个例子，让我们明白我们原来以为的健康并非心理学上的健康。比如如果
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
腾讯云技术深度探索：构建高效云原生微服务架构我的运维人生云原生架构腾讯云运维开发技术共享
腾讯云技术深度探索：构建高效云原生微服务架构在当今快速发展的技术环境中，云原生技术已成为企业数字化转型的关键驱动力。腾讯云作为行业领先的云服务提供商，不断推出创新的产品和技术，助力企业构建高效、可扩展的云原生微服务架构。本文将深入探讨腾讯云在微服务领域的最新进展，并通过一个实际案例展示如何在腾讯云平台上构建云原生应用。腾讯云微服务架构概览腾讯云微服务架构基于云原生理念，旨在帮助企业快速实现应用的容
怎么起诉借钱不还的人？怎样起诉欠款不还的人？影子爱学习
怎么起诉借钱不还的人？怎样起诉欠款不还的人？如果遇到难以解决的法律问题，我们可以匹配专业律师。例如：婚姻家庭（离婚纠纷）、刑事辩护、合同纠纷、债权债务、房产（继承）纠纷、交通事故、劳动争议、人身损害、公司相关法律事务（法律顾问）等咨询推荐手机/微信:15633770876【全国案件皆可】借钱不还起诉对方需要哪些资料起诉欠钱不还的，一般需要的材料包括以下这些：借据、收据、欠条、付款凭证等证据，以及向
谁家酒器最绝唱，藏在酒厂人未知？景阳冈酒厂先秦藏品大揭秘李虓酒评论
文/王赛时中国的酒器酒具历史久远，举世闻名。从北京的故宫博物院、中国国家博物馆，到世界各国的大型博物馆，都以能够收藏中国古代酒具而夸耀。但很少有人知道，在山东阳谷景阳冈酒厂，默默地收藏了两千件中国酒器。这些酒器，就封藏在景阳冈的酒道馆里。其中有一些青铜酒器，一睡就是三、四千年，堪称无声国宝，堪作无字史书！今天，我将引领诸位首先窥视一下景阳冈酒道馆的9件先秦藏品，你自己来说震撼不震撼。提示：这只是景
DIV+CSS+JavaScript技术制作网页（旅游主题网页设计与制作）云南大理 STU学生网页设计网页设计期末网页作业 html静态网页 html5期末大作业网页设计 web大作业
️精彩专栏推荐作者主页:【进入主页—获取更多源码】web前端期末大作业：【HTML5网页期末作业(1000套)】程序员有趣的告白方式：【HTML七夕情人节表白网页制作(110套)】文章目录二、网站介绍三、网站效果▶️1.视频演示2.图片演示四、网站代码HTML结构代码CSS样式代码五、更多源码二、网站介绍网站布局方面：计划采用目前主流的、能兼容各大主流浏览器、显示效果稳定的浮动网页布局结构。网站程
特殊的拜年飘雪的天堂
文/雪儿大年初一，家家户户没有了轰响的鞭炮声，大街上没有了人流涌动的喧闹，几乎看不到人影，变得冷冷清清。天刚亮不大会儿，村里的大喇叭响了起来：由于当前正值疾病高发期，流感流行的高峰期。同时，新型冠状病毒感染的肺炎进入第二波流行的上升期。为了自己和他人的健康安全着想，请大家尽量不要串门拜年，不要在街里走动。可以通过手机微信，视频，电话，信息拜年……今年的春节真是特别。禁止燃放鞭炮，烟花爆竹，禁止出村
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
2020-04-12每天三百字之连接与替代冷眼看潮
不知道是不是好为人师，有时候还真想和别人分享一下我对某些现象的看法或者解释。人类社会不断发展进步的过程，就是不断连接与替代的过程。人类发现了火并应用火以后，告别了茹毛饮血的野兽般的原始生活（火烧、烹饪替代了生食）人类用石器代替了完全手工，工具的使用使人类进步一大步。类似这样的替代还有很多，随着科技的发展，有更多的原始的事物被替代，代之以更高效、更先进的技术。在近现代，汽车替代了马车，高速公路和铁路
探索OpenAI和LangChain的适配器集成：轻松切换模型提供商 nseejrukjhad langchain easyui 前端 python
#探索OpenAI和LangChain的适配器集成：轻松切换模型提供商##引言在人工智能和自然语言处理的世界中，OpenAI的模型提供了强大的能力。然而，随着技术的发展，许多人开始探索其他模型以满足特定需求。LangChain作为一个强大的工具，集成了多种模型提供商，通过提供适配器，简化了不同模型之间的转换。本篇文章将介绍如何使用LangChain的适配器与OpenAI集成，以便轻松切换模型提供商
使用LLaVa和Ollama实现多模态RAG示例 llzwxh888 python 人工智能开发语言
本文将详细介绍如何使用LLaVa和Ollama实现多模态RAG（检索增强生成），通过提取图像中的结构化数据、生成图像字幕等功能来展示这一技术的强大之处。安装环境首先，您需要安装以下依赖包：!pipinstallllama-index-multi-modal-llms-ollama!pipinstallllama-index-readers-file!pipinstallunstructured!p
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
人工智能时代，程序员如何保持核心竞争力？ jmoych 人工智能
随着AIGC（如chatgpt、midjourney、claude等）大语言模型接二连三的涌现，AI辅助编程工具日益普及，程序员的工作方式正在发生深刻变革。有人担心AI可能取代部分编程工作，也有人认为AI是提高效率的得力助手。面对这一趋势,程序员应该如何应对?是专注于某个领域深耕细作，还是广泛学习以适应快速变化的技术环境?又或者，我们是否应该将重点转向AI无法轻易替代的软技能？让我们一起探讨程序员
2022现在哪个打车软件比较好用又便宜实惠的打车软件合集高省APP珊珊
这是一个信息高速传播的社会。信息可以通过手机，微信，自媒体，抖音等方式进行传播。但同时这也是一个交通四通发达的社会。高省APP，是2022年推出的平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几百万篇报道，也期待你的加入。珊珊导师，高省邀请码777777，注册送2皇冠会员，送万元推广大礼包，教你如何1年做到百万团队。高
CX8903：Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片诚芯微科技社交电子
CX8903：电动Ebike自行车仪表电源方案开发,Ebike智能仪表电源芯片推荐。电动助力自行车EBIKE凭借其环保、健康、低噪、和便捷等特点，成为了越来越受欢迎的骑行便利交通工具。提供电动Ebike自行车仪表电源方案开发、E-BIKE电动助力自行车仪表供电电源解决方案。CX8903采用100V高压制造工艺（芯片最高耐压可到100V以上），SOP-8L贴片封装，CX8903内置100V/90mΩ
CX8836：小体积大功率升降压方案推荐（附Demo设计指南）诚芯微科技社交电子
CX8836是一颗同步四开关单向升降压控制器，在4.5V-40V宽输入电压范围内稳定工作，持续负载电流10A，能够在输入高于或低于输出电压时稳定调节输出电压，可适用于USBPD快充、车载充电器、HUB、汽车启停系统、工业PC电源等多种升降压应用场合，为大功率TYPE-CPD车载充电器提供最优解决方案。提供CX8836Demo测试、CX8836样品申请及CX8836方案开发技术支持。CX8836同升
冬天短期的暴利小生意有哪些？那些小生意适合新手做？一起高省
短期生意不失为创业的一个商机，不过短期生意的商机是转瞬即逝的，而且这类生意也很难作为长期的生意去做，那冬天短期暴利小生意查看更多关于短期暴利小生意的文章有哪些呢?给大家先推荐一个2023年风口项目吧，真很不错的项目，全程零投资，当做副业来做真的很稳定，不管你什么阶层的人，或多或少都网购吧？你们知道网购是可以拿提成，拿返利，拿分佣的吗？你们知道很多优惠券群里面，天天群主和管理发一些商品吗？他们其实在
穷人做什么生意最赚钱？10个适合穷人赚钱的路子？氧惠爱高省
不管在什么地方，一般都是穷人占大量数，而富人只有少数，但是它们却掌握着大量的财富。对于穷人来说，想要买车、买房等奢侈品就难如登天，因为他们只能通过打工来赚取几千元的月薪。➤推荐网购返利app“氧惠”，一个领隐藏优惠券+现金返利的平台。氧惠只提供领券返利链接，下单全程都在淘宝、京东、拼多多等原平台，更支持抖音、快手电商、外卖红包返利等。（应用市场搜“氧惠”下载，邀请码:521521，全网优惠上氧惠！
【华为OD技术面试真题 - 技术面】- python八股文真题题库（4) 算法大师华为od 面试 python
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选**1.Python中的`with`**用途和功能自动资源管理示例：文件操作上下文管理协议示例代码工作流程解析优点2.\_\_new\_\_和**\_\_init\_\_**区别__new____init__区别总结3.**切片（Slicing）操作**基本切片语法
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
似乎老是忘记什么东西灰台
S带上了耳机，眼前的一切都与她隔绝开来。虽是初春的好天气，花都开的正鲜艳，行人也都驻足欣赏，还有不少怀着好心情的年轻人在花树下打闹。不过S似乎并不在意这些，连耳机传来的rap也没有调动起她的兴致。一瞬间，心脏好像变成了黑洞，“啊，我身边还有几个人呢，似乎没有了吧”。阳光的温度覆盖到了脖子上，S抬头看了看开满花的树，“我妈好像还挺喜欢花的”，S随手拍了一张照片，微信发到自己一家三口的群里。过了一会，
直返的东西正品吗?直返APP安全吗?直返是正规平台吗? 氧惠购物达人
亲们，你们是不是经常在直返APP上买东西呀？但是，你们有没有想过，里面的东西到底是不是正品呢？这个APP安全吗？它是不是一个正规的平台呀？别着急，今天我就来给大家揭秘一下！氧惠APP（带货领导者）——是与以往完全不同的抖客+淘客app！2023全新模式，我的直推也会放到你下面。主打：带货高补贴，深受各位带货团队长喜爱（每天出单带货几十万单）。注册即可享受高补贴+0撸+捡漏等带货新体验。送万元推广大
2019-11-04复盘——飞来山上千寻塔，闻说鸡鸣见日升。那一叶秋
1、大盘篇先上老图，看习惯了，也就知道走势了图1上证指数日线图还是那张老图，自己可以在自己的相关软件上画出来，快变盘了。2、个股篇未加仓、未减仓。分析量能的时候，突然发现这么一个东西：“放量突破年线，缩量回调。”合众科技日线图其实，最近的N只个股，在技术分析上，都到了变盘的临界时候。结合这么久的走势，特别是ZJH不断放开IPO的申请，本质上说是融资难度变大，或者说是为企业的融资开创便利。但现在市场
html页面js获取参数值 0624chenhong html
1.js获取参数值js function GetQueryString(name) { var reg = new RegExp("(^|&)"+ name +"=([^&]*)(&|$)"); var r = windo
MongoDB 在多线程高并发下的问题 BigCat2013 mongodb DB 高并发重复数据
最近项目用到 MongoDB , 主要是一些读取数据及改状态位的操作. 因为是结合了最近流行的 Storm进行大数据的分析处理，并将分析结果插入Vertica数据库，所以在多线程高并发的情境下, 会发现 Vertica 数据库中有部分重复的数据. 这到底是什么原因导致的呢？笔者开始也是一筹莫展，重复去看 MongoDB 的 API , 终于有了新发现： com.mongodb.DB 这个类有
c++ 用类模版实现链表(c++语言程序设计第四版示例代码) CrazyMizzz 数据结构 C++
#include<iostream> #include<cassert> using namespace std; template<class T> class Node { private: Node<T> * next; public: T data;
最近情况麦田的设计者感慨考试生活
在五月黄梅天的岁月里，一年两次的软考又要开始了。到目前为止，我已经考了多达三次的软考，最后的结果就是通过了初级考试（程序员）。人啊，就是不满足，考了初级就希望考中级，于是，这学期我就报考了中级，明天就要考试。感觉机会不大，期待奇迹发生吧。这个学期忙于练车，写项目，反正最后是一团糟。后天还要考试科目二。这个星期真的是很艰难的一周，希望能快点度过。
linux系统中用pkill踢出在线登录用户被触发 linux
由于linux服务器允许多用户登录，公司很多人知道密码，工作造成一定的障碍所以需要有时踢出指定的用户 1/#who 查出当前有那些终端登录（用 w 命令更详细） # who root pts/0 2010-10-28 09:36 (192
仿QQ聊天第二版肆无忌惮_ qq
在第一版之上的改进内容: 第一版链接: http://479001499.iteye.com/admin/blogs/2100893 用map存起来号码对应的聊天窗口对象,解决私聊的时候所有消息发到一个窗口的问题. 增加ViewInfo类,这个是信息预览的窗口,如果是自己的信息,则可以进行编辑. 信息修改后上传至服务器再告诉所有用户,自己的窗口
java读取配置文件知了ing
1，java读取.properties配置文件 InputStream in; try { in = test.class.getClassLoader().getResourceAsStream("config/ipnetOracle.properties");//配置文件的路径 Properties p = new Properties()
__attribute__ 你知多少？矮蛋蛋 C++gcc
原文地址: http://www.cnblogs.com/astwish/p/3460618.html GNU C 的一大特色就是__attribute__ 机制。__attribute__ 可以设置函数属性（Function Attribute ）、变量属性（Variable Attribute ）和类型属性（Type Attribute ）。 __attribute__ 书写特征是：
jsoup使用笔记 alleni123 java 爬虫 JSoup
<dependency> <groupId>org.jsoup</groupId> <artifactId>jsoup</artifactId> <version>1.7.3</version> </dependency> 2014/08/28 今天遇到这种形式，
JAVA中的集合 Collectio 和Map的简单使用及方法百合不是茶 list map set
List ,set ,map的使用方法和区别 java容器类类库的用途是保存对象，并将其分为两个概念： Collection集合：一个独立的序列，这些序列都服从一条或多条规则;List必须按顺序保存元素，set不能重复元素；Queue按照排队规则来确定对象产生的顺序（通常与他们被插入的
杀LINUX的JOB进程 bijian1013 linux unix
今天发现数据库一个JOB一直在执行，都执行了好几个小时还在执行，所以想办法给删除掉系统环境： ORACLE 10G Linux操作系统操作步骤如下：第一步.查询出来那个job在运行，找个对应的SID字段 select * from dba_jobs_running--找到job对应的sid &n
Spring AOP详解 bijian1013 java spring AOP
最近项目中遇到了以下几点需求，仔细思考之后，觉得采用AOP来解决。一方面是为了以更加灵活的方式来解决问题，另一方面是借此机会深入学习Spring AOP相关的内容。例如，以下需求不用AOP肯定也能解决，至于是否牵强附会，仁者见仁智者见智。 1.对部分函数的调用进行日志记录，用于观察特定问题在运行过程中的函数调用
[Gson六]Gson类型适配器(TypeAdapter) bit1129 Adapter
TypeAdapter的使用动机 Gson在序列化和反序列化时，默认情况下，是按照POJO类的字段属性名和JSON串键进行一一映射匹配，然后把JSON串的键对应的值转换成POJO相同字段对应的值，反之亦然，在这个过程中有一个JSON串Key对应的Value和对象之间如何转换(序列化/反序列化)的问题。以Date为例，在序列化和反序列化时，Gson默认使用java.
【spark八十七】给定Driver Program，如何判断哪些代码在Driver运行，哪些代码在Worker上执行 bit1129 driver
Driver Program是用户编写的提交给Spark集群执行的application，它包含两部分作为驱动： Driver与Master、Worker协作完成application进程的启动、DAG划分、计算任务封装、计算任务分发到各个计算节点(Worker)、计算资源的分配等。计算逻辑本身，当计算任务在Worker执行时，执行计算逻辑完成application的计算任务
nginx 经验总结 ronin47 nginx 总结
　　　深感nginx的强大，只学了皮毛，把学下的记录。　　　获取Header 信息，一般是以$http_XX（ＸＸ是小写）获取body,通过接口，再展开，根据Ｋ取Ｖ　　　获取uri,以$arg_XX &n
轩辕互动-1.求三个整数中第二大的数2.整型数组的平衡点 bylijinnan 数组
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class ExoWeb { public static void main(String[] args) { ExoWeb ew=new ExoWeb(); System.out.pri
Netty源码学习-Java-NIO-Reactor bylijinnan java 多线程 netty
Netty里面采用了NIO-based Reactor Pattern 了解这个模式对学习Netty非常有帮助参考以下两篇文章： http://jeewanthad.blogspot.com/2013/02/reactor-pattern-explained-part-1.html http://gee.cs.oswego.edu/dl/cpjslides/nio.pdf
AOP通俗理解 cngolon spring AOP
1.我所知道的aop 初看aop,上来就是一大堆术语，而且还有个拉风的名字，面向切面编程，都说是OOP的一种有益补充等等。一下子让你不知所措，心想着：怪不得很多人都和我说aop多难多难。当我看进去以后，我才发现：它就是一些java基础上的朴实无华的应用，包括ioc，包括许许多多这样的名词，都是万变不离其宗而已。 2.为什么用aop&nb
cursor variable 实例 ctrain variable
create or replace procedure proc_test01 as type emp_row is record( empno emp.empno%type, ename emp.ename%type, job emp.job%type, mgr emp.mgr%type, hiberdate emp.hiredate%type, sal emp.sal%t
shell报bash: service: command not found解决方法 daizj linux shell service jps
今天在执行一个脚本时，本来是想在脚本中启动hdfs和hive等程序，可以在执行到service hive-server start等启动服务的命令时会报错，最终解决方法记录一下：脚本报错如下： ./olap_quick_intall.sh: line 57: service: command not found ./olap_quick_intall.sh: line 59
40个迹象表明你还是PHP菜鸟 dcj3sjt126com 设计模式 PHP 正则表达式 oop
你是PHP菜鸟，如果你：1. 不会利用如phpDoc 这样的工具来恰当地注释你的代码2. 对优秀的集成开发环境如Zend Studio 或Eclipse PDT 视而不见3. 从未用过任何形式的版本控制系统，如Subclipse4. 不采用某种编码与命名标准，以及通用约定，不能在项目开发周期里贯彻落实5. 不使用统一开发方式6. 不转换（或）也不验证某些输入或SQL查询串（译注：参考PHP相关函
Android逐帧动画的实现 dcj3sjt126com android
一、代码实现： private ImageView iv; private AnimationDrawable ad; @Override protected void onCreate(Bundle savedInstanceState) { super.onCreate(savedInstanceState); setContentView(R.layout
java远程调用linux的命令或者脚本 eksliang linux ganymed-ssh2
转载请出自出处： http://eksliang.iteye.com/blog/2105862 Java通过SSH2协议执行远程Shell脚本(ganymed-ssh2-build210.jar) 使用步骤如下： 1.导包官网下载: http://www.ganymed.ethz.ch/ssh2/ ma
adb端口被占用问题 gqdy365 adb
最近重新安装的电脑，配置了新环境，老是出现： adb server is out of date. killing... ADB server didn't ACK * failed to start daemon * 百度了一下，说是端口被占用，我开个eclipse，然后打开cmd，就提示这个，很烦人。一个比较彻底的解决办法就是修改
ASP.NET使用FileUpload上传文件 hvt .net C#hovertree asp.net webform
前台代码： <asp:FileUpload ID="fuKeleyi" runat="server" /> <asp:Button ID="BtnUp" runat="server" onclick="BtnUp_Click" Text="上传" />
代码之谜（四）- 浮点数（从惊讶到思考） justjavac 浮点数精度代码之谜 IEEE
在『代码之谜』系列的前几篇文章中，很多次出现了浮点数。浮点数在很多编程语言中被称为简单数据类型，其实，浮点数比起那些复杂数据类型（比如字符串）来说，一点都不简单。单单是说明 IEEE浮点数就可以写一本书了，我将用几篇博文来简单的说说我所理解的浮点数，算是抛砖引玉吧。一次面试记得多年前我招聘 Java 程序员时的一次关于浮点数、二分法、编码的面试，多年以后，他已经称为了一名很出色的
数据结构随记_1 lx.asymmetric 数据结构笔记
第一章 1.数据结构包括数据的逻辑结构、数据的物理/存储结构和数据的逻辑关系这三个方面的内容。 2.数据的存储结构可用四种基本的存储方法表示，它们分别是顺序存储、链式存储、索引存储和散列存储。 3.数据运算最常用的有五种，分别是查找/检索、排序、插入、删除、修改。 4.算法主要有以下五个特性：输入、输出、可行性、确定性和有穷性。 5.算法分析的
linux的会话和进程组网络接口 linux
会话：一个或多个进程组。起于用户登录，终止于用户退出。此期间所有进程都属于这个会话期。会话首进程：调用setsid创建会话的进程1.规定组长进程不能调用setsid，因为调用setsid后，调用进程会成为新的进程组的组长进程.如何保证？先调用fork，然后终止父进程，此时由于子进程的进程组ID为父进程的进程组ID，而子进程的ID是重新分配的，所以保证子进程不会是进程组长，从而子进程可以调用se
二维数组元素的连续求解 1140566087 二维数组 ACM
import java.util.HashMap; public class Title { public static void main(String[] args){ f(); } // 二位数组的应用 //12、二维数组中，哪一行或哪一列的连续存放的0的个数最多，是几个0。注意，是“连续”。 public static void f(){
也谈什么时候Java比C++快 windshome java C++
刚打开iteye就看到这个标题“Java什么时候比C++快”，觉得很好笑。你要比，就比同等水平的基础上的相比，笨蛋写得C代码和C++代码，去和高手写的Java代码比效率，有什么意义呢？我是写密码算法的，深刻知道算法C和C++实现和Java实现之间的效率差，甚至也比对过C代码和汇编代码的效率差，计算机是个死的东西，再怎么优化，Java也就是和C

微信「看一看」 推荐排序技术揭秘