文文学霸

深度学习在知乎信息流推荐中的应用

转载自：搜索与推荐Wiki

“

推荐系统在我们的生活中扮演者十分重要的角色，无形中改变着我们的生活，使我们的生活变得更加高效，直接。无论是电商购物，音乐娱乐，还是新闻内容，推荐系统都是不可或缺的一部分，下面来领教一下知乎feed流是如何玩转推荐系统的！

”

知乎信息流推荐系统简介

知乎的信息流推荐框架是一个基于多策略融合的多源内容推荐系统，代号“水晶球”。如图所示：

在这个系统中，首页上出现的内容经历过两次排序。第一次是从数十个推荐队列里被“召回”，第二次是在合并后经过深层神经网络（DNN）的“排序”。

“召回”的第一个步骤是，召回模块根据用户的历史行为表现（用户画像、内容标签、内容源信息），确定数十个推荐队列。这数十个推荐队列是含有特定标签的内容池，有些队列里内容性质相似，比如热点新闻队列、视频队列，还有的队列与用户行为紧密相关，比如关注关系队列、搜索关键词队列。比如说，根据用户的关注关系向外扩展更多关注关系，根据用户兴趣召回感兴趣的内容，根据搜索关键词进行相关推荐。

API的数据还会反馈到Feedback&Control的模块里面，应用这些数据进行业务控制的操作，比如我们会记录每个用户看到的内容是什么，大家都知道在Feed信息流推荐有个很重要的应用是去重，推荐内容不能是有重复的，我们会用过滤保证推出来的内容没有重复。用户在一天里面看到哪些内容点击了哪些内容，这些内容都可以为业务提供一定数据支撑。

2016年之前，知乎的Feed流是比较简单的，你关注了什么样的人，这个人产生的各种各样的动态会在你的界面进行时间倒序的排序，和朋友圈的逻辑非常相似。2016年初上线了一个叫EdgeRank的排序系统，第一代Feed流算法在这个系统支持下取得了一定收益，系统维持了一年时间。

2016年10月份知乎上线了一个基于GBDT的排序系统，对召回的内容进行一个排序。使用GBDT做排序持续了一年时间，引入GBDT后用户的Feed流使用时长的变化，是呈上升的趋势。在使用 GBDT 进行排序的过程中，逐步完善了用户画像和内容分析的系统，在用户特征和内容特征方面做了非常多工作，把用户的实时行为集成到GBDT里面，用户Feed流使用时长得到了激增。

2017年10月开始知乎先后在召回侧和排序侧引入DNN模型，在引入之后的2017年10月份到2018年7月份周期内，知乎的使用时长和阅读量也呈现出快速增长。

在这之后，又做了一些优化工作，一个是7月份在DNN做的优化，把注意力机制和LSTM模型引入到DNN的模型里面去，一个是尝试强化学习在推荐系统中的应用。经过这么长时间的优化之后知乎的信息流系统已经在知乎整体业务中占了非常大的体量，用户渗透率（即有多少用户会有效来到首页看内容）达到88%，使用时长占比（包括刷知乎的时长以及在知乎中消费内容的时长等）达到76%。

基于深度学习的推荐召回

知乎在2017年上线了基于深度学习的推荐召回1.0版本，左边这张图是第一版上线时候的深度学习召回网络框架，整个系统把用户和用户的特征表示成了网络，它和库里几万条内容做了一个多分类，在上层进行SoftMax。整个网络训练下来可以得到两个成果。首先是一个 User Representation Network，它把用户信息表示成128维的网络，我们用了画像里的所有信息，包括他的兴趣标签、各种各样的用户信息，都会放到模型的输入里面去，这个输入经过四层网络之后得到用户128维的 Embedding 表示。与此同时，使用Faiss作为向量化ANN召回的Backend，用ANN召回的方式从这几个条目里选出他最感兴趣的内容推荐给他，这是整个召回框架的工作过程。

我们在训练集里包含了几万个内容的Embedding，我们首先会在训练中生成一批Embedding，比如今天的数据来自于过去一周内分发量比较高的数据，这些内容数据会生成Embedding，我们先通过这些召回源把这些机制分发出去，还有一批内容是新产生的、未在训练集中包含的内容，这些内容通过其他的渠道分发出去之后，可以得到看到内容用户的Embedding是什么以及点击这些内容用户的Embedding是什么，我们可以利用这份数据把这些新产生内容的Embedding计算出来更新到Embedding库里面去，这个时候就可以拿到每天新产生内容的表示，并且把这些内容推荐出来。

后来我们又对召回框架进行了2.0升级。在1.0版本的召回框架里，“新内容Embedding怎么得到的”这个问题是延迟解决的。用户的表示网络和Embedding召回在效果收益非常明显，协同过滤用户矩阵分解最常用的方法就是ALS，我们拿了一个关键的指标也就是召回从这几万条里挑出的100个结果里准确度有多少，这100个结果里有没有预测到用户下次点击的数据，在这个指标上， DNN 比起ALS来讲提升了10倍的量级，我们希望一个内容产生之后马上算出Embedding放到网络里。

在2.0版本中，我们尝试了三个层面的技术升级：

使用了Content的原始特征，一个内容上打了标签，原始数据比如长度有多少，有没有图片，经过三层的网络之后会生成Feed Embedding，可以直接得到Content Embedding，解决新内容的召回机制问题。
在用户表示网络这一侧我们也做了优化，这个网络里就是一个最简单的全链接神经网络，我们做优化的时候是在User Representation Network引入FM Pooling层，学习用户高频消费行为的交叉特征，会让Top100的精确度提高8%。
用户在Feed流里有，“展示未点击的Skip数据”比线上“展示已点击数据”量级还要高，代表用户对内容并不是真正感兴趣。第一，我们把展示未点击的数据作为特征引入到User Representation Network里面，其中会用到历史搜索和历史阅读数据。第二，我们会把Skip数据作为指导采样的一种方式，训练大规模的标签Embedding时我们往往把正向数据之外的其他数据都当成负向数据使用，所有负向采样的sample都是在剩下的数据中，根据概率的方式或控制采样频率的方式提取。展示了但是跳过的内容会在采样的时候加大权重，把它成为负例的概率变得更大，让用户的行为来指导采样。

Skip这两个数据为Top100 ACC产生了比较好的效果，从召回数据里来的CTR和整体的阅读量都有比较大的提高。

基于深度学习的CTR预估模型

知乎还在排序侧采用了CTR预估的模型。1.0版本总体结构和基于DNN的召回框架类似，使用两层Relu而不是直接点积作为Embedding的预估网络。这个模型上线一段时间之后，我们刚开始没有进行任何的参数裁剪的操作，收效没有达到我们的预期。后来我们做了一个简单的尝试，按照业务的理解把特征组合成不同的Field，这些Field之间先做连接，用户先分成N个Field，比如，Field1是自己填写的资料，Field2是用户兴趣标签，Field3是历史搜索行为，先经过一个简单的子网络再全连接到上层。这个 trick能够有效的减少特征在初始输入时候的错误交叉，会减轻模型的过拟合，线上应用则达到了非常明显的收益，AUC提升了1%，CTR提升了5.8%。

使用了DNN之后，我们还试用了谷歌出品的Wide & Deep Network，Deep是图上部分，效果没有明显的提升。随后我们做了一个分析判断，发现Wide & Deep Network的 wide 部分，都会在原始特征输入交叉方面做一个比较强的特征工程，否则所有信息在Deep部分已经得到比较好的应用，Wide 部分并没有提供什么额外的输入，也不会拿到特别好的数据表现。

今年我们开始在深度学习的CTR预估模型上尝试更加激进更有意思的优化，也就是2.0版本。其中最早引入的优化还是特征之间的交叉，我们引入FM层作为这些类别之间的Sparse Input之间的交叉，AUC提升了0.2%，CTR提升了1%。引入CNN及LSTM分别作为文本Encoder/Last Action Encoder，单用户使用时长提高50秒。

第三个trick参考了阿里的一篇论文，我们引入Attention机制作为用户Embedding和CandidateEmbedding之间的交叉权重。举个例子，用户点击的十篇文章中，有九篇是关于体育的一篇是关于互联网的，等到下次体育相关内容的分数会比互联网相关内容的分数高得特别离谱，平均之后互联网信息淹没在体育信息里，但互联网内容也是用户喜欢的，权重却很难发挥出来。我们引入Attention机制，把用户的阅读历史跟当前候选集里相关的数据和权重学习之后，收到了良好效果，单用户使用时长增加了40秒左右。

知乎是一个社区化的平台，常常需要平衡很多指标的收益，预估阅读时长、点赞、收藏、分享、创作等行为。为了解决多目标预估中训练和预测效率问题，我们使用了CTR预估模型预训练网络，利用Parameter Hard Sharing，点击和点赞这两层共享之前的权重，会有一个独立的隐藏层model task自己的目标，这样能降低前向/反向传播中的计算量。

我们常常预估到一些非离散的目标，对于非离散目标如阅读时长，很多同行的做法是线性预估的方式预估，你阅读了60秒，我尽量把预测的值逼近。知乎的做法是，把一篇文章的阅读时长做一个Normalize操作。我们观察了一下阅读时长的分布，这个分布与正态分布比较类似。所以我们使用了 z-value 来对阅读市场进行离散化，离散化之后会把阅读时长分为五等——没点击、点击了阅读时长低、点击了阅读时长中等、点击了阅读时长偏高、点击了阅读时长非常高——将连续值预测转化成离散值预测。

在训练过程中，我们也修改了 Softmax 函数，如果预测出的档数和实际用户阅读时长档数差太多，我们加一个比较大的修改函数，让这种样本的 loss 加大。阅读时长这个模型上线之后，对知乎的使用时长和单篇文章的阅读时长都有提升。

推荐系统中的实际问题

模型训练问题

样本组织方面，大家可以看到刚才我们用了很多实时特征，这些实时特征对用户和样本来讲都是不断变化的，最初知乎组织这些样本的时候都是使用从离线库里Join数据的方式做特征的梳理，后来我们发现线上往往会出现特征穿越的状况，你在线下记录的日志毕竟不是实时的，日志都是流失的放到数据库里，处理数据流的过程中也会出现顺序上的错误，所以我们会在线上进行实施打点避免穿越。
对于CTR预估的正向样本和负向样本，后者与前者相比存在几倍的量级差异。通常我们会对正负样本进行不同采样率的实验，不同的业务指标下采样率不一样，最终回有一个最佳的采样率。但采样率多少跟数据的分布和业务需要预估的指标特性相关，1比1不一定是最好的采样比例。
特征工程方面，我们在实际应用场景里发现对于分布范围比较大的特征，有一万个赞也有几万个赞的，做CTR预估的过程中赞量的影响会变得非常不平均，所以通常会进行特征的归一化和boxing，分成不同的段输入到CTR预估模型里达到比较好的效果。
模型评估方面，AUC是基础指标，我们发现AUC是一个特别基础的指标，对于两份离线文件之间的评估确实有比较大的意义，尤其AUC在现在状态下大家都训练到0.7或0.8的水平，上线之后各种数据指标并不一定能提升那么多，我们做了一个DCG Gain收益的指标，它具有更高的参考意义。

业务问题

多样性问题如何解决？大家都知道Feed流里很多时候最精准不一定是用户最想要的，重复太多对于各种线上业务数据的改进也不一定是正向的结果，我们会引入各种框架进行业务导向的调权、打散、隔离和禁闭，一个内容出现几次之后你没有点击，之后都不会推荐相似的内容。
如何避免「信息茧房」的产生？以各种行为表现预估的方式去排序和推荐的推荐系统，最后会让用户传递一个信息茧房，推荐列表里翻来覆去就是这么几个内容。我们的解决方案是，采用一个Explore & Exploit机制，针对老用户及兴趣比较均匀的用户，适当减少兴趣探测手段，在探测过程中也会尽量使用Tag之间的关联信息增强探测效率。

在这浮躁的社会沉静，用心记录，用心学习！

指针 Day 03 朝十晚五算法 c语言
1.二级指针使用场景：①函数体内部想修改函数体外部指针变量的值，需要传递指针变量的地址即二级指针②指针数组的数组是二级指针2.const指针（只读）constint*p;intconst*p;int*constp;constint*constp;intconst*constp;1和2是等价的,const修饰*p,p可以改变指向,不能利用p修改指向空间中的值3,const修饰p，p不能变，可以利用p
uniapp 开发 h5 授权微信登录（静默和非静默）陈龙龙的陈龙龙 uni-app uni-app 微信前端 html javascript
具体流程：进入h5➡️静默登录➡️请求登录接口➡️必要时候调起登录组件➡️点击按钮进行非静默登录➡️再次请求登录接口➡️获取到所有用户数据一、封装登录functionauthLogin:(callback)=>{constthat=this;//判断是否是在微信环境下运行if(utils.isWechat()){consttoken=window.localStorage.getItem('__t
数据传输中遇到问题要怎么解决 sanx18 网络数据库
在数据传输过程中遇到问题时，可以采取以下几种解决方案：1.**使用可靠的传输协议**：选择稳定性和可靠性高的传输协议，如HTTPS、SFTP、FTPS等，它们提供了加密和安全的数据传输机制。2.**创建冗余备份**：在不同的存储设备中保存数据的多个副本，即使在传输过程中发生故障或错误，也可以从备份中恢复数据。云存储服务和网络存储设备是实现冗余备份的常见选择。3.**数据压缩和加密**：通过压缩减少
uniapp vite+vue3+ts微信小程序项目组合式Api自动导入懒人的烦恼 uniapp微信小程序 uni-app vue 前端框架微信小程序
相信很多新手(博主也是菜鸡,不喜勿喷!),在公司都喜欢自己创建新的项目,搭建自己项目框架。都会遇到vue3组合式Api导入的问题而感到烦恼！这里教大家怎么简单的配置1.安装需要的插件unplugin-auto-import在项目根目录运行：如下代码npminstall-Dunplugin-auto-import2.安装成功后，修改项目的tsconfig.json文件主要时在inclue里面末尾添加
微信小程序的登录流程-登录与静默登录 Allen_vv 微信小程序小程序微信
1.首先通过uni.getProvider获取到服务的供应商，调用API接口时需要指定service的参数为'weixin'，在success的回调函数中对登录的流程做处理。2.通过调用uni.login获取到所需要的参数code，再通过uni.getUserProfile获取微信用户的基本信息，这个API需要指定一个参数为desc：这个参数是需要通知给微信服务器的，在success的回调函数中获
什么是开放-封闭原则，也就是我们常说的开闭原则不二周！设计模式开闭原则设计模式
1、开闭原则：对扩展开放，对修改关闭2、如何做：猜测出最有可能发生的变化种类，然后构造抽象来隔离那些变化3、如何理解：可以用一国两制来理解，主体制度不能修改，但是可以在局部地区扩展制度无论模块是多么的‘封闭’，都会存在一些无法对之封闭的变化。既然不可能完全封闭，我们就必须对于设计的模块应该对哪种变化封闭做出选择。我们必须先猜测出最有可能发生的变化种类，然后构造抽象来隔离那些变化也就是说在我们最初编
如何完美的实现一个线程安全的单例模式？ coding_-_半生设计模式单例模式 java
单例模式文章目录单例模式一、介绍二、单例的几种实现方式三、细分实现方式1、饿汉模式2、懒汉模式四、总结优缺点一、介绍一个类只有一个实例，旨在确保类只有一个实例，并提供全局访问点以访问该实例。唯一实例:类只能有一个实例存在。全局访问点:提供一个访问该实例的全局接口，以便其他类可以轻松地访问它。二、单例的几种实现方式饿汉模式、懒汉模式懒汉式:在需要时才创建实例。这种方法在多线程环境下需要考虑线程安全性
Redis性能优化小马不敲代码数据库 redis 缓存数据库
性能优化避免慢查询命令当发现redis性能变慢的时候，可以通过redis日志，或者是latencymonitor工具，查询变慢的请求，根据请求对应的具体命令以及官方文档，确认下是否采用了复杂度高的查询，如果确实存在大量的慢查询命令则优化用其他高效的命令替代eg：当需要返回一个set中的所有成员时，使用sscan多次迭代返回代替smembers（避免一次返回大量数据，造成线程阻塞）当需要执行排序、并
深入探索C#中Newtonsoft.Json库的高级进阶之路步、步、为营 c#json php
引言在C#开发的广袤天地中，数据的序列化与反序列化是构建高效、灵活应用程序的关键环节。而Newtonsoft.Json库，作为这一领域的璀璨明星，以其强大的功能和出色的性能，成为了众多开发者的首选工具。它不仅仅是一个简单的JSON处理库，更是一把能够解锁复杂数据处理场景的万能钥匙。无论是在构建WebAPI时，需要将服务器端的对象快速转换为JSON格式，以便在网络中传输；还是在处理复杂的配置文件，需
VIM安装YCM插件的详细步骤万能的小叮当
文章目录前言VIM版本安装YCM依赖的软件和库安装Vundle安装YCM下一步配置效果图参考博客前言据说youcompleteme是最难安装的插件，我在想网上找到一篇博客就能够安装了，为什么会最难呢?等到安装的时候才发现真的难！！！！！！我觉得难就难在网上的博客安装步骤可能适用一小部分人，剩下的一部分人会遇到很多问题。所以如果安装YCM插件博客，推荐一定要找最近几年的。最后终于耗时两天安装成功了V
月之暗面今日发布k1.5多模态思考模型百态老人笔记人工智能
月之暗面k1.5多模态思考模型的问世一、月之暗面k1.5多模态思考模型介绍2025年1月20日，月之暗面发布了k1.5多模态思考模型。这一模型在基准测试成绩方面展现出了非凡的性能，它实现了SOTA（state-of-the-art）级别的多模态推理和通用推理能力。多模态推理即模型能够对多种类型的数据（如文本、图像等）进行整合分析推理，通用推理能力则表明它可以广泛应用于多种任务场景进行有效的逻辑推理
如何进行cad地理配准_如何对扫描图片进行ArcGIS配准？ weixin_39604276 如何进行cad地理配准
就这么个简单的问题啊昨天搞了一晚上肥肥搞了大半天百度上找愣是看见一帮智障在瞎扯工具书上又没有想要的信息水文章水得一点用没有实在是服气索性请教师兄操作今天就直接记录详细教程以供他日使用！首先，插入底图可以各种格式尽量要求清晰度高吉林莫莫格国家级保护区功能区划图下面进行地理配准，配准时确定地图图例，右键工具栏选出地理配准去掉自动校正左键点一下后右键我这个图是1：100000的比例尺所以以米为单位应该这
python selenium安装步骤_Python：Selenium+Webdriver安装 weixin_39619893 python selenium安装步骤
本人小白一枚，今天在使用selenium+webdriver的时候遇到了一个小问题：WebDriverException:'chromedriver'executableneedstobeinPATH.Pleaseseehttps://sites.google.com/a/chromium.org/chromedriver/home在debug过程中，也去baidu上查询了，很多说法，但是有些是行
n8n 全面实战指南：从零开始构建强大的自动化工作流 ivwdcwso 运维开发自动化运维开发
1.引言在当今快节奏的数字世界中,自动化已成为提高效率和减少重复工作的关键。n8n作为一款强大的开源工作流自动化工具,为开发者和业务用户alike提供了一个灵活的平台,用于连接各种应用和服务,创建复杂的自动化流程。本文将带您深入了解n8n,从基础安装到高级应用,全面掌握这个强大工具的使用方法。©ivwdcwso(ID:u012172506)2.n8n基础n8n(发音为“n-eight-n”)是一个
Kafka系列5-Kafka 常见面试题只是甲大数据和数据仓库 #Kafka Kafka面试题 Kafka分区 Kafka性能
文章目录一.常见面试题1.1Kafka中的ISR(InSyncRepli)、OSR(OutSyncRepli)、AR(AllRepli)代表什么？1.2Kafka中的HW、LEO等分别代表什么？1.3Kafka中是怎么体现消息顺序性的？1.4Kafka中的分区器、序列化器、拦截器是否了解？它们之间的处理顺序是什么？1.5Kafka生产者客户端的整体结构是什么样子的？使用了几个线程来处理？分别是什么
【转】ASP.NET Core 实战：基于 Jwt Token 的权限控制全揭露 GoToDinner core
【转】https://www.cnblogs.com/danvic712/p/10331976.html?tdsourcetag=s_pcqq_aiomsgASP.NETCore实战：基于JwtToken的权限控制全揭露一、前言#在涉及到后端项目的开发中，如何实现对于用户权限的管控是需要我们首先考虑的，在实际开发过程中，我们可能会运用一些已经成熟的解决方案帮助我们实现这一功能，而在Grapefru
【Spring】Spring DI(依赖注入)详解——注入参数的细节处理-内部Bean的注入 AI人H哥会Java JAVA java 开发语言 spring 后端
引言在现代Java开发中，Spring框架已经成为了构建企业级应用的标准工具之一。Spring的核心特性之一就是依赖注入（DependencyInjection，DI），它通过将对象的依赖关系从代码中解耦出来，提升了代码的可维护性和可测试性。特别是在大型项目中，良好的依赖管理能够显著降低代码的复杂度，提高开发效率。依赖注入的基本概念依赖注入是一种设计模式，用于实现控制反转（InversionofC
Grape-RAG disgare AI ai
Grape-RAG传统RAG的局限性图的优点用知识图谱来呈现数据关系GraphRAG传统RAG的局限性经典的RAG架构以向量数据库（VectorDB）为核心来检索语义相似性上下文，让大语言模型（LLM）不需要重新训练就能够获取最新的知识，其工作流如下图所示：这一架构目前广泛应用于各类AI业务场景中，例如问答机器人、智能客服、私域知识库检索等等。虽然RAG通过知识增强一定程度上缓解了LLM幻觉问题，
创建conda虚拟环境过慢问题 Rose'sPrince conda chrome 前端
创建虚拟环境网速过慢，要等太久怎么办？1.创建conda环境压缩包安装conda-pack包：condainstall-cconda-forgeconda-pack或者pipinstallconda-pack。-使用condapack命令开始打包环境（尽量在待打包的环境之外的环境运行）：condapack-n这个命令会将my_env环境打包生成一个my_env.tar.gz的压缩文件，保存在当前路
arcgis for JavaScript入门篇五彩斑斓黑123 arcgis for javascript arcgis javascript 开发语言
介绍ArcGISforJavaScript是一种基于Web的地图开发解决方案，由ESRI公司开发。它允许开发人员在Web应用程序中嵌入交互式地图，并使用JavaScript编写地图应用程序。ArcGISforJavaScript提供了许多功能强大的API和工具，使开发人员能够创建高度定制的地图应用程序。它支持各种地图数据源，包括ESRI的ArcGISOnline服务、第三方地图服务、以及开发人员自
1052. 爱生气的书店老板 xiaolin0333 #滑动窗口算法滑动窗口
【题目】：1052.爱生气的书店老板classSolution{public:intmaxSatisfied(vector&customers,vector&grumpy,intminutes){intmaxAddCount=0;//在minutes长度内，还能增加的最大顾客满意人数intcurAddCount=0;//当前窗口内还能增加的顾客满意数intcurCount=0;//原本有的顾客满意
深度学习理论基础（七）Transformer编码器和解码器小仇学长深度学习深度学习 transformer 人工智能编码器解码器
学习目录：深度学习理论基础（一）Python及Torch基础篇深度学习理论基础（二）深度神经网络DNN深度学习理论基础（三）封装数据集及手写数字识别深度学习理论基础（四）Parser命令行参数模块深度学习理论基础（五）卷积神经网络CNN深度学习理论基础（六）Transformer多头自注意力机制深度学习理论基础（七）Transformer编码器和解码器本文目录学习目录：前述：Transformer
JSONObject解析数据库Date类型报错问题知忆_IS 数据库 java database postgresql
JSONObject解析数据库Date类型报错问题最近项目在写服务器后端查询空间数据的接口时，由于表结构不一致，直接写了一个通用函数用json储存数据库中查询的结果，然而今天前端查询一个表的时候无法查到相应的结果，查了一下代码发现爆了如下错误。报错：Causedby:java.lang.IllegalArgumentExceptionatjava.sql.Date.getHours原因是该表中存在
使用VUE的axios解决调用百度地图api的跨域访问问题知忆_IS vue html npm javascript chrome
在构建一个vue前后端分离的项目时候，需要用到百度地图提供的web服务，但是在使用axios方式发送get请求的时候，web页面不显示相应结果，在Google中按F12进入开发者模式之后，发现提示如下：XMLHttpRequestcannotloadOriginhttp://localhost:8080isnotallowedbyAccess-Control-Allow-Origin.根据网上的搜
一行代码搞定加载glove预训练词向量 peanutwang python 机器学习人工智能
加载glove预训练词向量再也不用glove2word2vec转换啦！以前加载glove预训练词向量的方法fromgensim.scripts.glove2word2vecimportglove2word2vecglove2word2vec('glove.6B.50d.txt','word2vec50d.txt')其实就是在原来的txt文件前面加上了一行信息，行和列。word10.1230.134
embed版Python如何安装第三方包 peanutwang python 开发语言
embed版本相当于一个纯Python运行环境，解压之后在命令行就可以Python.exexxx.py。但是涉及到使用第三方包的情况，还是需要安装的。以下是安装方法（整个过程无需配置环境变量）：1.解压python-3.8.10-embed-amd642.配置包导入搜索路径默认的包导入搜索路径由根目录内pythonXX._pth，打开它把它前面的#注释去掉#importsite3.配置pip国内源
用Python实现概率语言模型（2-元语法模型） peanutwang python 语言模型
首先构造一个语料库，由6句话组成，每句话3个字。corpus='她很香她很菜她很好他很菜他很好菜很好'.split()构造一个字典，存储一元的字数Count1={}遍历语料库，把每个字出现的次数存储在字典中。forsentenceincorpus:forwordinsentence:ifwordinCount1:Count1[word]+=1#如果word在字典中存在else:Count1[wor
基于 Colyseus 的实时消息处理与广播机制 maply Colyseus 前端 colyseus 消息队列 node.js
基于Colyseus的实时消息处理与广播机制Colyseus是一个用于构建实时多人游戏和协作应用的开源框架，基于Node.js运行，并使用WebSocket进行高效的消息传输。它提供了一套结构化的API来管理房间（Rooms）、客户端（Clients）和游戏状态（State），从而支持高效的实时消息处理与广播机制。1.Colyseus消息处理与广播的基本概念Colyseus主要通过以下组件来管理实
轻松检测麦克风功能：使用Python的sounddevice和soundfile库 dongab_9 #脚本工具 1024程序员节 python
轻松检测麦克风功能在进行音频处理或开发需要使用麦克风的应用程序时，确保麦克风功能正常是非常重要的。本文将介绍一个简单的Python脚本，它能够帮助我们检测本地麦克风的功能，确保我们的设备能够正常录音。文章目录轻松检测麦克风功能脚本介绍一、Python环境准备二、代码解析三、使用方法脚本介绍下面是一个名为sound_check.py的Python脚本，它使用sounddevice库来检测和测试麦克风
Git 规范化管理指南九情丶前端 gitee
Git规范化管理指南：打造优雅的协作流程本文将详细介绍如何在团队中规范化Git的使用，包括分支管理、提交规范、CodeReview流程等最佳实践。通过本文，您将学习到如何建立一个清晰、高效的Git工作流程。为什么需要Git规范化？在团队协作中，规范化的Git使用流程能带来以下好处：提高协作效率统一的分支命名便于理解和管理规范的提交信息方便追踪变更清晰的Review流程保证代码质量减少沟通成本标准化
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

深度学习在知乎信息流推荐中的应用

你可能感兴趣的:(深度学习在知乎信息流推荐中的应用)