冰露可乐

一文看懂推荐系统：物品冷启02：简单的召回通道

提示：最近系统性地学习推荐系统的课程。我们以小红书的场景为例，讲工业界的推荐系统。
我只讲工业界实际有用的技术。说实话，工业界的技术远远领先学术界，在公开渠道看到的书、论文跟工业界的实践有很大的gap，
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。
看书学不到推荐系统的关键技术。

王树森娓娓道来**《小红书的推荐系统》**
GitHub资料连接：http://wangshusen.github.io/
B站视频合集：https://space.bilibili.com/1369507485/channel/seriesdetail?sid=2249610

基础知识：
【1】一文看懂推荐系统：概要01：推荐系统的基本概念
【2】一文看懂推荐系统：概要02：推荐系统的链路，从召回粗排，到精排，到重排，最终推荐展示给用户
【3】一文看懂推荐系统：召回01：基于物品的协同过滤（ItemCF），item-based Collaboration Filter的核心思想与推荐过程
【4】一文看懂推荐系统：召回02：Swing 模型，和itemCF很相似，区别在于计算相似度的方法不一样
【5】一文看懂推荐系统：召回03：基于用户的协同过滤（UserCF）,要计算用户之间的相似度
【6】一文看懂推荐系统：召回04：离散特征处理，one-hot编码和embedding特征嵌入
【7】一文看懂推荐系统：召回05：矩阵补充、最近邻查找，工业界基本不用了，但是有助于理解双塔模型
【8】一文看懂推荐系统：召回06：双塔模型——模型结构、训练方法，召回模型是后期融合特征，排序模型是前期融合特征
【9】一文看懂推荐系统：召回07：双塔模型——正负样本的选择，召回的目的是区分感兴趣和不感兴趣的，精排是区分感兴趣和非常感兴趣的
【10】一文看懂推荐系统：召回08：双塔模型——线上服务需要离线存物品向量、模型更新分为全量更新和增量更新
【11】一文看懂推荐系统：召回09：地理位置召回、作者召回、缓存召回
【12】一文看懂推荐系统：排序01：多目标模型
【13】一文看懂推荐系统：排序02：Multi-gate Mixture-of-Experts (MMoE)
【14】一文看懂推荐系统：排序03：预估分数融合
【15】一文看懂推荐系统：排序04：视频播放建模
【16】一文看懂推荐系统：排序05：排序模型的特征
【17】一文看懂推荐系统：排序06：粗排三塔模型，性能介于双塔模型和精排模型之间
【18】一文看懂推荐系统：特征交叉01：Factorized Machine (FM) 因式分解机
【19】一文看懂推荐系统：物品冷启01：优化目标 & 评价指标

提示：文章目录

文章目录

一文看懂推荐系统：物品冷启02：简单的召回通道
物品冷启动：简单的召回通道
- 召回的难点
改造双塔模型应对冷启动
- defaulting embedding
- 利用相似物品的embedding向量
类目召回通道
基于关键词的召回
总结

物品冷启动：简单的召回通道

大家好，上节介绍了物品冷启动的基本概念和评价指标，

从这节开始，我们研究冷启动的具体技术，我从召回开始讲起，
有很多种适用于冷启动的召回通道。

我先讲几类最简单的召回通道，我们先分析一下召回有哪些难点

召回的难点

在小红书，我们做召回要依据哪些信息？
我们来分析一下新笔记有哪些信息，而又缺少哪些信息，

笔记都有图片、文字之类的内容。有的笔记还标注了地点、新笔记，
还有算法或者人工打的标签，比如笔记的内幕、
笔记的内容和标签都是做召回的依据。

但是新笔记缺少一些非常重要的信息，给推荐系统造成了很大的困难。

用户对笔记的点击、点赞的统计数据可以反映出笔记本身的质量，以及什么样的用户喜欢这篇笔记。

这为精准推荐的帮助很大，可惜新笔记没有这些信息，
而且item cf user cf之类的召回通道需要知道笔记跟哪些用户有过交互，
如果一篇笔记还没有跟用户交互，就走不了iphone cf这种召回通道

冷启动缺少的另一个关键信息是，笔记的ID in bedding
召回和排序模型都有embedding层，把每个笔记ID映射到一个向量，
这个向量是从用户跟笔记交互的行为中学习出来的
可新发布的笔记的这个向量是刚刚初始化的，还没有用反向传播更新，
也就是说新笔记的ID in beating啥都不是。

大家应该都知道，笔记的ID embedding是召回和排序中最重要的特征之一，
缺少这个特征会让召回和排序变得很不准。

概括一下冷启给召回带来的困难，由于缺少用户交互，双卡模型还没有学好，笔记ID embedding。

这会导致双塔模型的效果不好，

双塔模型是推荐系统中最重要的召回通道，没有之一
离开双塔模型很难做好新笔记的推荐，

缺少笔记ID embedding不只会影响召回，其实还会影响排序，让排序模型的预估做不准。

item cf 也是很重要的召回通道，想要用item cf，就需要知道有哪些用户跟这个物品有过交互，
跟新物品交互过的用户非常少，所以item cf对新物品不适用。

我详细解释一下为什么item cf不适用于物品能启动？？？这是两篇笔记。

item cf做召回的原理是判断两篇笔记的相似度有多高
要根据与笔记交互过的用户来判定两篇笔记的相似度。

上面这些用户跟两篇笔记中至少一篇交互过，红框这部分用户是重合的，他们同时喜欢两篇笔记。
重合度有多大，可以反映出两篇笔记的相似度有多高。

假设右边绿色的物品是新笔记，新笔记还没有跟用户发生交互，
或者只跟很少几个用户发生交互，
那么Item cf就没有办法根据重合的用户来计算两篇笔记的相似度，所以我说item self不适用于冷启动。

item cf是推荐系统中最重要的召回通道之一，
但是它对冷启动不适用，

双塔模型比item cf更重要,这种深度学习的模型需要用笔记的ID embedding，
所以直接用于冷启效果不好，想要用双塔模型的话，需要做特殊的处理，

类目、关键词是两种弱个性化的召回通道。
在笔记刚刚发布的时候，这两种召回通道是最有用的，
但是在笔记发布一段时间之后，这两种召回通道会失效，

聚类召回和look like也是专门针对新物品的召回通道，

这节详细讲解蓝框中这2类召回通道，他们都很简单，很容易理解。

后面两节再详细讲解聚类召回和look like召回。

改造双塔模型应对冷启动

我们首先讨论如何改造双塔模型，让它适用于冷启动。

这就是常见的双塔模型，左边是用户塔，输入是用户特征，

右边是物品塔，输入是笔记ID和其他笔记特征，
两个塔各自输出一个向量，
两个向量的余弦相似度表示用户对物品的兴趣，

物品ID，也就是笔记ID是物品塔中最重要的特征。
神经网络有一个embedding层，把笔记ID映射成向量，
每篇笔记都有一个ID embedding，需要从用户和笔记的交互中学习。

可是新笔记还没有跟几个用户交互过，所以他的embedding向量还没有学好。
如果直接用双塔模型做新笔记的召回效果会不太好。

我介绍两种改进ID in bedding的方案。

defaulting embedding

第一种方案是让新笔记使用defaulting embedding，

也就是说，让所有新笔记共享一个ID embedding，而不是用新笔记自己真正的ID，

那么，所有新笔记的ID embedding向量都是相同的，这个向量就叫做defaulding belling

使用defaulting bedding在实践中是可以拿到收益的，为什么？
新笔记自己的ID embedding向量还没有学到
不如大家先共享一个默认的向量，这个向量是学出来的，而不是随机初始化或者全0初始化学出来的。
比随机初始化的全0初始化更好。

新笔记发布之后，逐渐会有点击和交互这些信号可以用来学习笔记的ID embedding，
当我下次模型训练的时候，新笔记的ID embedding向量才被学到。

利用相似物品的embedding向量

另一种初始化新笔记ID embedding的方法是利用相似物品的embedding向量，

当新笔记发布之后，查找top k内容最相似的高曝光笔记

在小红书的应用中相似，可以用图片文字类目来定义。

用多模态神经网络把一篇笔记的图文内容表征为一个向量。

每当一篇新笔记发布的时候，寻找最相似的K的向量就行，
把找到的K篇高曝光笔记的embedding向量取平均作为新笔记的embedding，
之所以用高曝光笔记，是因为他们的ID embedding通常学的比较好，

在实践中通常会用多个向量召回池，比如一小时新笔记，六小时新笔记，24小时新笔记，还有30天老笔记。

用多个召回池可以让新笔记有更多的机会曝光。
假如只有一个30天笔记的召回池，那么新笔记被召回的几率很小。很难得到曝光，

所有这些召回使用的是同一个双塔模型，所以不会增加训练模型的代价。

类目召回通道

刚才讨论了双塔模型，下面我要讲类目召回通道，

还有一些相似的召回通道，比如关键词召回我就不细说了，
只在后面简单提一下，凡是做信息流社交电商的互联网公司都会维护每一位用户的画像，
画像中记录了用户的兴趣点，比如感兴趣的类目感兴趣的关键词，有的是用户自己填写的。
有的是算法自动推断出来的，

我经常刷小红书，所以算法能够推断出我感兴趣的类目，包括美食、科技、数码、电影，
我感兴趣的关键词包括纽约、职场、搞笑、程序员、大学这些类目的关键词可以用于召回。

下面我要讲基于类目的召回通道，在小红书，我们的系统维护一份从类目到笔记的索引。

所以上的T是类目，比如美食、旅游、美妆这样比较大的类目，
也可以是更细腻度的类目，比如日本料理、国内旅游护肤品这样的类目，

每个类目后面是一个笔记的列表，按照发布时间倒排，最新发布的笔记排在最前面。

刚才讲了系统维护一个从类目到笔记的索引，要用这个索引召回新笔记，
一个用户刷新小红书的时候，系统要给他做推荐。
系统根据这位用户的画像，知道他对哪些类目感兴趣，取回这些类目，
比如他对美食和旅游感兴趣，然后到类目索引上找到美食和旅游对应的两个笔记列表，

取回笔记列表上美食的前k个可以填笔记，旅游的前k个可以填笔记，
这样就得到2K篇笔记作为召回的结果。

刚才介绍了基于类目的召回，还有几种很相似的召回通道。

基于关键词的召回

比如基于关键词的召回原理跟类目召回是完全一样的，
索引上的key是关键词，每个关键词后面有一个笔记列表，
按照时间倒排，给用户做推荐的时候，根据用户画像上用户感兴趣的关键词做召回。

跟类目召回唯一的区别就是这里用关键词代替类目。

刚才讲了，基于类目的召回和基于关键词的召回，
这两种召回通道都有很明显的缺点，
第一个缺点是只对刚刚发布的新笔记有效。
类目索引和关键词索引都是按照笔记发布的时间倒排，
刚刚发布的新笔记排在最前面，做召回的时候，每次取回某类目或者某关键词下面最新的K篇笔记，
如果笔记已经发布了几小时，那么大概率会被排在几百甚至几千的位置上。
也就是说，这篇笔记再也没有机会被召回了。
类目召回有关键词召回留给每篇笔记的窗口，留给每篇笔记的窗口期很短，

两种召回通道的另一个缺点是，若个性化不够精准，
按照用户感兴趣的类目关键词做召回，其实是比较宽泛的。

假如我喜欢观赏鱼，它属于宠物的类目，但是最新发布的100篇宠物笔记可能都是猫猫狗狗的，
大概率没有我感兴趣的观赏鱼，于是召回的100篇都是我不感兴趣的。

虽然类目召回和关键词召回的缺点很明显，但他们仍然对冷起很重要。
他能让刚刚发布的新笔记立刻获得曝光，有助于提升作者的发布积极性。

最后总结一下这节内容，新笔记的召回是比较困难的，有的召回通道不适用，

有的召回通道需要改造后才使用。
为了做好冷启动，工业界有一些专门的新物品召回通道。

这节我们重点有了双塔模型召回和类目关键词召回，
后面两节介绍聚类召回和look like召回。

总结

提示：如何系统地学习推荐系统，本系列文章可以帮到你

（1）找工作投简历的话，你要将招聘单位的岗位需求和你的研究方向和工作内容对应起来，这样才能契合公司招聘需求，否则它直接把简历给你挂了
（2）你到底是要进公司做推荐系统方向？还是纯cv方向？还是NLP方向？还是语音方向？还是深度学习机器学习技术中台？还是硬件？还是前端开发？后端开发？测试开发？产品？人力？行政？这些你不可能啥都会，你需要找准一个方向，自己有积累，才能去投递，否则面试官跟你聊什么呢？
（3）今日推荐系统学习经验：双塔模型召回和类目关键词召回

Vmware-RabbitMQ安装菜逼の世界 VMware Vmware RabbitMQ
RabbitMQ操作系统：CentOS7.9更新系统更新你的系统包列表和已安装的包。yumupdate安装EPEL仓库（若需要）RabbitMQ的某些依赖包可能不在默认的CentOS/RHELYUM仓库中，因此你可能需要安装EPEL(ExtraPackagesforEnterpriseLinux)仓库。[root@test-2~]#yuminstallepel-release已加载插件：faste
API，异常 qq_42822008
API:应用程序编程接口，即jdk文档手册，里面以类的形式提供了很多常用的功能。常用的包与类：java.lang包：因为常用，所以不需要导包字符串，线程java.util包:数组工具类，日期，集合等java.net包:网络相关的类型java.io包:输入输出类型java.math包：数学应用的相关类型打包工具:javadoc(1)使用命令提示符界面：类信息中没有声明包，即使用默认包javadoc-
边缘人工智能与医疗AI融合发展路径：技术融合与应用前景（下） Allen_Lyb 数智化医院2025 人工智能健康医疗数据库矩阵
医疗边缘AI的市场趋势医疗边缘AI市场正经历着显著的增长，根据市场研究公司的数据，2024年的边缘AI市场价值为125亿美元，估计在2025至2034年之间，由于各部门越来越多地采用边缘装置，CAGR为24.8%。保健、制造业、零售业和汽车业的企业拥有综合边缘计算解决方案[36]。这一增长趋势表明，边缘AI技术正在各行各业得到广泛应用，其中医疗保健是一个重要的应用领域。2023年全球边缘人工智能市
AI 编程对决：Gemini CLI vs Claude Code，谁是最佳 AI 编码工具？ charieli-fh 人工智能大模型
1.引言：AI编码工具的崛起在软件开发的快节奏世界中，人工智能（AI）工具正迅速从辅助角色转变为不可或缺的伙伴。它们不再仅仅是提供代码补全，而是能够理解复杂上下文、执行多步骤任务，甚至自动化整个工作流的智能代理。这种转变正在重塑开发者的日常工作，提高生产力，并加速创新。在众多涌现的AI编码工具中，Google的GeminiCLI和Anthropic的ClaudeCode脱颖而出，各自代表了AI辅助
RAG技术栈详解：构建智能问答系统的核心组件认知超载 AI 人工智能
本文深度剖析RAG（Retrieval-AugmentedGeneration）技术栈的核心构成，助你快速搭建企业级知识增强系统一、RAG技术架构全景图二、核心组件技术选型1.检索模块（Retriever）向量数据库主流选择：Pinecone、Milvus、Qdrant、Weaviate新兴势力：ChromaDB（开源轻量级）、腾讯云向量数据库嵌入模型（Embedding）OpenAItext-e
百度颠覆了自己，飞算JavaAI造福了中国程序员！飞算JavaAI开发助手百度
在当今这个科技日新月异的时代，企业纷纷寻求技术突破，以期在激烈的市场竞争中脱颖而出。百度，作为中国互联网行业的领军企业之一，凭借其强大的科技实力和创新能力，在人工智能等多个领域取得了显著成就，并正在逐步颠覆自身的传统形象。百度自成立之初，就将技术创新视为企业的生命线。从最初的搜索引擎技术，到如今的深度学习、自然语言处理、计算机视觉等前沿领域，百度始终走在技术革新的前沿。其自主研发的飞桨深度学习平台
Java AI 开发智能体：从入门到实践培风图南以星河揽胜 java java 人工智能开发语言
在人工智能（AI）技术蓬勃发展的今天，智能体作为AI领域的核心概念之一，正逐渐渗透到各个行业与应用场景。而Java凭借其跨平台性、丰富的类库和强大的生态系统，成为开发智能体的热门选择。本文将深入探讨如何使用Java进行AI开发智能体，从基础概念到实践应用，解答常见问题，为你揭开JavaAI开发智能体的神秘面纱。一、Java在AI开发中的优势1.跨平台性Java的“一次编写，到处运行”特性，使得基于
C#学习日志 future1412 c#学习 java
构造函数和析构函数知识点一构造函数基本概念在实例化对象时会调用的用于初始化的函数如果不写默认存在一个无参构造函数构造函数的写法1.没有返回值2.函数名和类名必须相同3.没有特殊需求时一般都是public的classPerson{publicstringname;publicintage;类中是允许自己申明无参构造函数的结构体是不允许publicPerson(){name="怪盗基德";age=18
ollama v0.9.4 详解：联网功能、模型目录自定义及macOS性能优化全面升级
近年来，随着人工智能技术的快速发展，模型管理与调用变得尤为重要。作为一款备受关注的本地AI模型管理工具，Ollama在最新发布的v0.9.4版本中带来了多项重磅改进和全新功能，提升了用户体验和应用场景的灵活性。本文将深入解析Ollamav0.9.4版本的功能亮点、技术改进以及实用操作指南，帮助广大开发者和AI爱好者全面掌握这款工具的最新动态。一、版本概述Ollamav0.9.4版本于2025年7月
用鸿蒙打造真正的跨设备数据库：从零实现分布式存储网罗开发 HarmonyOS 实战源码实战 harmonyos 数据库分布式
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
Swift中常见的面试题 ~废弃回忆 �༄ swift Swift面试题 Swift常见面试题 Swift面试题总结
1.Swift与OC相比有什么优势?Swift是强类型语言，注重值类型，有类型推断，安全性高Swift的语法更简洁，使用起来方便，支持函数式编程Swift拥有更强大的特性，它有元组类型、支持可选类型（optional）、支持运算符重载、支持泛型、支持静态/动态派发，协议不仅可以被类实现还可以被struct和enum实现Swift支持命名空间、函数支持默认参数Swift的错误处理机制更完善oc的优点
Docker容器中安装 ROS2-Humble 并使用 rviz ZPC8210 docker 容器运维
默认电脑已经安装了docker，没安装看这篇文章Docker安装(完整详细版)ROS和docker各种结合看官方文档dockerTutorials在OSRF中拉取想要的ROS版本docker镜像网址为拉取命令在这里dockerpullosrf/ros:humble-desktop-full拉取完后创建容器，但是为了能在docker中能打开窗口，将使用以下参数，只需要修改名字即可，your_name
Java中Spring框架的`@Transactional`注解失效的常见情况，包括失效原因、底层原理以及解决方法 Chen-Edward SpringBoot java spring 数据库
主要解答@Transactional注解失效的常见情况包括：非public方法：SpringAOP默认只代理public方法。内部调用：同一类中方法直接调用，绕过代理。异常类型不匹配：默认只回滚RuntimeException。传播行为不当：如嵌套事务被挂起。多线程调用：事务与线程绑定，异步调用失效。未启用事务管理：未配置@EnableTransactionManagement或数据源未绑定事务管
The valid characters are defined in RFC 7230 and RFC 3986错误解决方案 Chen-Edward SpringBoot firefox 服务器前端 java ide intellij-idea 运维
问题情况ThevalidcharactersaredefinedinRFC7230andRFC3986这个错误提示来自Tomcat，表示请求的URI中包含了不符合RFC7230和RFC3986标准的字符，导致服务器返回了400BadRequest。，我发现问题出在路径参数（pathparameter）中：它包含了方括号[]，而这些字符在Tomcat的默认配置下被视为非法字符。问题根源Tomcat对
【LangChain编程：从入门到实践】使用LangServe提供服务 AI天才研究院计算 AI大模型企业级应用开发实战 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
【LangChain编程：从入门到实践】使用LangServe提供服务作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming关键词：LangChain,LangServe,微服务架构,API设计,端到端解决方案1.背景介绍1.1问题的由来随着云计算和互联网技术的发展，企业级应用越来越倾向于采用微服务架构。微服务架构允许将大型应用拆分为一组小的服务，每项服务
微信SDK 最全实用指南（含代码示例）栗子味清清微信 API ai AI作画微信小程序
现在的App开发，早就不是关起门来自己造轮子了。想要用户登录顺畅、分享转发方便、支付一步到位，基本都离不开微信生态的支持。这时候，“微信SDK”就显得格外重要了。它不是多高级的黑科技，但却是打通微信用户体系的关键工具，能帮你省下大量开发时间。尤其是对中小开发者来说，学会如何合理使用微信SDK，往往意味着产品功能体验上能跟大厂看齐。别把它想得太复杂，其实微信SDK的接入流程已经非常成熟了，搞懂基本逻
比斯特自动点焊机批发厂商概览
自动点焊机批发厂商主要集中于珠三角、长三角等制造业发达地区，如广东东莞、深圳及江苏无锡等地。这些厂商通过直销或供应链合作模式，为电子、汽车、电池等行业提供高性价比的自动化焊接设备，满足大规模生产需求。产品与技术特点批发厂商的产品涵盖多类点焊设备：精密电子点焊机：适用于微电子元件、漆包线、线路板焊接，强调高精度与无损伤加工。动力电池专用设备：如锂电池双面点焊机，支持18650/21700等电芯的高速
FAISS 简介及其与 GPT 的对接（RAG）言之。 AI faiss gpt easyui
什么是FAISS？FAISS(FacebookAISimilaritySearch)是FacebookAI团队开发的一个高效的相似性搜索和密集向量聚类的库。它主要用于：大规模向量相似性搜索高维向量最近邻检索向量聚类https://github.com/facebookresearch/faissFAISS特别适合处理高维向量数据，能够快速找到与查询向量最相似的向量，广泛应用于推荐系统、图像检索、自
06_项目集成 Spring Actuator 并实现可视化页面耀耀_很无聊【后端开发】Java 碎碎念 spring java 后端
06_项目集成SpringActuator并实现可视化页面一、引入SpringActuator依赖在pom.xml文件中添加以下依赖：org.springframework.bootspring-boot-starter-actuator⚙️二、SpringActuator配置2.1配置端点访问前缀SpringBoot默认的Actuator端点访问地址是：http://localhost:8080
python线程同步锁_python的Lock锁，线程同步 weixin_39649660 python线程同步锁
一、Lock锁凡是存在共享资源争抢的地方都可以使用锁，从而保证只有一个使用者可以完全使用这个资源一旦线程获得锁，其他试图获取锁的线程将被阻塞acquire(blocking=True,timeout=-1):默认阻塞，阻塞可以设置超时时间，非阻塞时，timeout禁止设置，成功获取锁，返回True，否则返回Falsereleas():释放锁，可以从任何线程调用释放，已上锁的锁，会被重置为unloc
产品背景知识——在线推理和离线推理爱吃芝麻汤圆 #产品背景知识推理
产品背景知识——在线推理和离线推理一、核心区别：从4个维度对比1.数据处理方式与时效性在线推理（实时推理）数据特点：处理实时流入的单条或小批量数据（如用户点击、交易请求）。时效性要求：需在毫秒级到秒级内返回结果，延迟直接影响用户体验或业务决策。典型场景：电商推荐系统（用户浏览商品时实时推荐）、金融风控（交易时实时欺诈检测）。离线推理（批量推理）数据特点：处理历史累积的大规模数据集（如TB级日志、数
嵌入式AI模型压缩技术：让大模型变小 AI智能探索者 AI Agent 智能体开发实战人工智能 ai
嵌入式AI模型压缩技术：让大模型变小关键词：嵌入式AI、模型压缩、剪枝、量化、知识蒸馏、轻量化网络、端侧部署摘要：当我们用手机拍照时，AI能瞬间识别出“这是一只猫”；智能摄像头能在0.1秒内检测到“有人闯入”。这些“快如闪电”的AI功能背后，藏着一项关键技术——嵌入式AI模型压缩。本文将用“给盆栽修剪枝叶”“用简笔画代替油画”等生活类比，带您一步步理解模型压缩的核心技术（剪枝、量化、知识蒸馏、轻量
成为高级Python开发人员的完整学习路线与核心知识体系
引言Python已成为全球最受欢迎的编程语言之一，其简洁的语法和强大的生态系统使其在数据科学、Web开发、自动化、人工智能等领域占据重要地位。然而，从初级Python程序员到真正的高级开发人员，需要掌握一系列深入的知识点和实践经验。本文将详细介绍成为高级Python开发人员必备的核心知识体系，并提供系统化的学习资源，帮助你规划专业发展路径。第一部分：Python语言基础进阶1.Python语言特性
【AI】闭环反馈：构建从用户处学习的人工智能秋说 AI广延人工智能 AI
文章目录前言AI产品性能的双重视角：模型指标vs用户信号模型指标：AI系统的“内部视角”用户信号：AI产品的“外部视角”用户信号类型用户信号的价值模型指标为何难以独立支撑产品成功如何设计AI产品的全面反馈闭环一、统一成功标准：模型指标+用户价值二、用户信号的数据采集策略三、整合多源数据流四、分析与洞察从反馈到改进：迭代驱动的闭环循环一、识别并优先解决核心问题二、将用户信号转化为模型改进方向三、产品
Y-Combinator推导的Golang描述武昌库里写JAVA 面试题汇总与解析 spring boot vue.js 宠物管理课程设计 java
缘起在做计算的本质指称语义的时候，遇到了需要在Python匿名递归调用。Python的lambda表达式本身不支持，需要借助Y-Combinator技术实现。于是研究了下Y-Combinator。中文世界了很多Blog介绍和推导Y-Combinator的文章。然而大部分的文章都省略了推导的关键步骤和推导的依据。仿佛读者都默认已经懂得Y-Combinator了。最后我在Youtube上找到了Ruby
掌握Android Jetpack，优化移动开发体验移动开发前沿移动端开发宝典 android jetpack android ai
掌握AndroidJetpack，优化移动开发体验关键词：AndroidJetpack、组件化开发、ViewModel、LiveData、Room、Navigation、Compose摘要：本文深入探讨AndroidJetpack组件库的核心架构和使用方法，通过系统化的讲解和实战演示，帮助开发者理解如何利用Jetpack系列组件提升开发效率、构建健壮的Android应用。文章将从基础概念入手，逐步
【数据标注师】关键词标注试着数据标注师数据标注师关键词标注
目录一、**理解关键词标注的核心逻辑**1.**三大标注原则**2.**关键词类型体系**二、**四阶训练体系**▶**阶段1：基础规则内化**▶**阶段2：语义浓缩训练**▶**阶段3：场景化标注策略**▶**阶段4：工具效率提升**三、**五大高频错误防御指南**四、**复杂场景突破策略**1.**隐喻处理方案**2.**多义词消歧流程**3.**跨语言混合标注**五、**持续进阶体系**1.
uniapp+vue写小程序页面，实现一张图片默认放大后，可以在容器内上下左右拖动查看
1.组件chargingimageViewerimport{ref,onMounted,computed}from'vue';constprops=defineProps({imageUrl:{type:String,required:true,},});//视图容器尺寸constVIEW_WIDTH=750;//微信小程序设计稿宽度constVIEW_HEIGHT=1800;//缩放限制cons
推荐文章：探索深度学习的不确定性边界 —— SDE-Net 开源项目解析史多苹Thomas
推荐文章：探索深度学习的不确定性边界——SDE-Net开源项目解析SDE-NetCodeforpaper:SDE-Net:EquippingDeepNeuralnetworkwithUncertaintyEstimates项目地址:https://gitcode.com/gh_mirrors/sd/SDE-Net在当今的人工智能领域，深度神经网络(DNN)已经成为推动技术创新的基石。然而，其预测的
【Java】已解决java.sql.SQLRecoverableException异常屿小夏 java 开发语言
个人简介：某不知名博主，致力于全栈领域的优质博客分享|用最优质的内容带来最舒适的阅读体验！文末获取免费IT学习资料！文末获取更多信息精彩专栏推荐订阅收藏专栏系列直达链接相关介绍书籍分享点我跳转书籍作为获取知识的重要途径，对于IT从业者来说更是不可或缺的资源。不定期更新IT图书，并在评论区抽取随机粉丝，书籍免费包邮到家AI前沿点我跳转探讨人工智能技术领域的最新发展和创新，涵盖机器学习、深度学习、自然
apache ftpserver-CentOS config gengzg apache
<server xmlns="http://mina.apache.org/ftpserver/spring/v1" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation=" http://mina.apache.o
优化MySQL数据库性能的八种方法 AILIKES sql mysql
1、选取最适用的字段属性　　MySQL可以很好的支持大数据量的存取，但是一般说来，数据库中的表越小，在它上面执行的查询也就会越快。因此，在创建表的时候，为了获得更好的性能，我们可以将表中字段的宽度设得尽可能小。例如，在定义邮政编码这个字段时，如果将其设置为CHAR(255),显然给数据库增加了不必要的空间，甚至使用VARCHAR这种类型也是多余的，因为CHAR(6)就可以很
JeeSite 企业信息化快速开发平台 Kai_Ge JeeSite
JeeSite 企业信息化快速开发平台平台简介 JeeSite是基于多个优秀的开源项目，高度整合封装而成的高效，高性能，强安全性的开源Java EE快速开发平台。 JeeSite本身是以Spring Framework为核心容器，Spring MVC为模型视图控制器，MyBatis为数据访问层， Apache Shiro为权限授权层，Ehcahe对常用数据进行缓存，Activit为工作流
通过Spring Mail Api发送邮件 120153216 邮件 main
原文地址：http://www.open-open.com/lib/view/open1346857871615.html 使用Java Mail API来发送邮件也很容易实现，但是最近公司一个同事封装的邮件API实在让我无法接受，于是便打算改用Spring Mail API来发送邮件，顺便记录下这篇文章。【Spring Mail API】 Spring Mail API都在org.spri
Pysvn 程序员使用指南 2002wmj SVN
源文件:http://ju.outofmemory.cn/entry/35762 这是一篇关于pysvn模块的指南. 完整和详细的API请参考 http://pysvn.tigris.org/docs/pysvn_prog_ref.html. pysvn是操作Subversion版本控制的Python接口模块. 这个API接口可以管理一个工作副本, 查询档案库, 和同步两个. 该
在SQLSERVER中查找被阻塞和正在被阻塞的SQL 357029540 SQL Server
SELECT R.session_id AS BlockedSessionID , S.session_id AS BlockingSessionID , Q1.text AS Block
Intent 常用的用法备忘 7454103 .net android Google Blog F#
Intent 应该算是Android中特有的东西。你可以在Intent中指定程序要执行的动作（比如：view,edit,dial），以及程序执行到该动作时所需要的资料。都指定好后，只要调用startActivity()，Android系统会自动寻找最符合你指定要求的应用程序，并执行该程序。下面列出几种Intent 的用法显示网页:
Spring定时器时间配置 adminjun spring 时间配置定时器
红圈中的值由6个数字组成，中间用空格分隔。第一个数字表示定时任务执行时间的秒，第二个数字表示分钟，第三个数字表示小时，后面三个数字表示日，月，年，< xmlnamespace prefix ="o" ns ="urn:schemas-microsoft-com:office:office" /> 测试的时候，由于是每天定时执行，所以后面三个数
POJ 2421 Constructing Roads 最小生成树 aijuans 最小生成树
来源：http://poj.org/problem?id=2421 题意：还是给你n个点，然后求最小生成树。特殊之处在于有一些点之间已经连上了边。思路：对于已经有边的点，特殊标记一下，加边的时候把这些边的权值赋值为0即可。这样就可以既保证这些边一定存在，又保证了所求的结果正确。代码： #include <iostream> #include <cstdio>
重构笔记——提取方法（Extract Method） ayaoxinchao java 重构提炼函数局部变量提取方法
提取方法（Extract Method）是最常用的重构手法之一。当看到一个方法过长或者方法很难让人理解其意图的时候，这时候就可以用提取方法这种重构手法。下面是我学习这个重构手法的笔记：提取方法看起来好像仅仅是将被提取方法中的一段代码，放到目标方法中。其实，当方法足够复杂的时候，提取方法也会变得复杂。当然，如果提取方法这种重构手法无法进行时，就可能需要选择其他
为UILabel添加点击事件 bewithme UILabel
默认情况下UILabel是不支持点击事件的，网上查了查居然没有一个是完整的答案，现在我提供一个完整的代码。 UILabel *l = [[UILabel alloc] initWithFrame:CGRectMake(60, 0, listV.frame.size.width - 60, listV.frame.size.height)]
NoSQL数据库之Redis数据库管理(PHP-REDIS实例) bijian1013 redis 数据库 NoSQL
一.redis.php <?php //实例化 $redis = new Redis(); //连接服务器 $redis->connect("localhost"); //授权 $redis->auth("lamplijie"); //相关操
SecureCRT使用备注 bingyingao secureCRT 每页行数
SecureCRT日志和卷屏行数设置一、使用securecrt时，设置自动日志记录功能。 1、在C:\Program Files\SecureCRT\下新建一个文件夹(也就是你的CRT可执行文件的路径），命名为Logs； 2、点击Options -> Global Options -> Default Session -> Edite Default Sett
【Scala九】Scala核心三：泛型 bit1129 scala
泛型类 package spark.examples.scala.generics class GenericClass[K, V](val k: K, val v: V) { def print() { println(k + "," + v) } } object GenericClass { def main(args: Arr
素数与音乐 bookjovi 素数数学 haskell
由于一直在看haskell，不可避免的接触到了很多数学知识，其中数论最多，如素数，斐波那契数列等，很多在学生时代无法理解的数学现在似乎也能领悟到那么一点。闲暇之余，从图书馆找了<<The music of primes>>和<<世界数学通史>>读了几遍。其中素数的音乐这本书与软件界熟知的&l
Java-Collections Framework学习与总结-IdentityHashMap BrokenDreams Collections
这篇总结一下java.util.IdentityHashMap。从类名上可以猜到，这个类本质应该还是一个散列表，只是前面有Identity修饰，是一种特殊的HashMap。简单的说，IdentityHashMap和HashM
读《研磨设计模式》-代码笔记-享元模式-Flyweight bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.Collection; import java.util.HashMap; import java.util.List; import java
PS人像润饰&调色教程集锦 cherishLC PS
1、仿制图章沿轮廓润饰——柔化图像，凸显轮廓 http://www.howzhi.com/course/retouching/ 新建一个透明图层，使用仿制图章不断Alt+鼠标左键选点，设置透明度为21%，大小为修饰区域的1/3左右（比如胳膊宽度的1/3），再沿纹理方向（比如胳膊方向）进行修饰。所有修饰完成后，对该润饰图层添加噪声，噪声大小应该和
更新多个字段的UPDATE语句 crabdave update
更新多个字段的UPDATE语句 update tableA a set (a.v1, a.v2, a.v3, a.v4) = --使用括号确定更新的字段范围
hive实例讲解实现in和not in子句 daizj hive not in in
本文转自：http://www.cnblogs.com/ggjucheng/archive/2013/01/03/2842855.html 当前hive不支持 in或not in 中包含查询子句的语法，所以只能通过left join实现。假设有一个登陆表login(当天登陆记录,只有一个uid),和一个用户注册表regusers(当天注册用户，字段只有一个uid)，这两个表都包含
一道24点的10+种非人类解法（2,3,10,10） dsjt 算法
这是人类算24点的方法？！！！事件缘由：今天晚上突然看到一条24点状态，当时惊为天人，这NM叫人啊？以下是那条状态朱明西 : 24点，算2 3 10 10，我LX炮狗等面对四张牌痛不欲生，结果跑跑同学扫了一眼说，算出来了，2的10次方减10的3次方。。我草这是人类的算24点啊。。然后么。。。我就在深夜很得瑟的问室友求室友算刚出完题，文哥的暴走之旅开始了 5秒后
关于YII的菜单插件 CMenu和面包末breadcrumbs路径管理插件的一些使用问题 dcj3sjt126com yii framework
在使用 YIi的路径管理工具时，发现了一个问题。 <?php
对象与关系之间的矛盾：“阻抗失配”效应[转] come_for_dream 对象
概述 “阻抗失配”这一词组通常用来描述面向对象应用向传统的关系数据库（RDBMS）存放数据时所遇到的数据表述不一致问题。C++程序员已经被这个问题困扰了好多年，而现在的Java程序员和其它面向对象开发人员也对这个问题深感头痛。 “阻抗失配”产生的原因是因为对象模型与关系模型之间缺乏固有的亲合力。“阻抗失配”所带来的问题包括：类的层次关系必须绑定为关系模式（将对象
学习编程那点事 gcq511120594 编程互联网
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
Reverse Linked List II hcx2013 list
Reverse a linked list from position m to n. Do it in-place and in one-pass. For example:Given 1->2->3->4->5->NULL, m = 2 and n = 4, return
Spring4.1新特性——页面自动化测试框架Spring MVC Test HtmlUnit简介 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
Hadoop集群工具distcp liyonghui160com
1. 环境描述两个集群：rock 和 stone rock无kerberos权限认证，stone有要求认证。 1. 从rock复制到stone，采用hdfs Hadoop distcp -i hdfs://rock-nn:8020/user/cxz/input hdfs://stone-nn:8020/user/cxz/运行在rock端，即源端问题：报版本
一个备份MySQL数据库的简单Shell脚本 pda158 mysql 脚本
　　主脚本（用于备份mysql数据库）：　　该Shell脚本可以自动备份数据库。只要复制粘贴本脚本到文本编辑器中，输入数据库用户名、密码以及数据库名即可。我备份数据库使用的是mysqlump 命令。后面会对每行脚本命令进行说明。　　 1. 分别建立目录“backup”和“oldbackup” 　　#mkdir /backup 　　#mkdir /oldbackup 　
300个涵盖IT各方面的免费资源（中）——设计与编码篇 shoothao IT资源图标库图片库色彩板字体
A. 免费的设计资源 Freebbble:来自于Dribbble的免费的高质量作品。 Dribbble:Dribbble上“免费”的搜索结果——这是巨大的宝藏。 Graphic Burger:每个像素点都做得很细的绝佳的设计资源。 Pixel Buddha:免费和优质资源的专业社区。 Premium Pixels:为那些有创意的人提供免费的素材。
thrift总结 - 跨语言服务开发 uule thrift
官网官网JAVA例子 thrift入门介绍 IBM-Apache Thrift - 可伸缩的跨语言服务开发框架 Thrift入门及Java实例演示 thrift的使用介绍 RPC POM： <dependency> <groupId>org.apache.thrift</groupId>

一文看懂推荐系统：物品冷启02：简单的召回通道

一文看懂推荐系统：物品冷启02：简单的召回通道

文章目录

物品冷启动：简单的召回通道

召回的难点

改造双塔模型应对冷启动

defaulting embedding

利用相似物品的embedding向量

类目召回通道

基于关键词的召回

总结

你可能感兴趣的:(大厂人工智能技术概览,个性化推荐系统,人工智能,推荐系统冷启动,默认embedding,相似物品embedding,类目关键词召回)