dby_freedom

CTR预估论文精读(十二)--Deep Session Interest Network(DSIN)

We observe that user behaviors are highly homogeneous in each session, and heterogeneous cross sessions. Based on this observation, we propose a novel CTR model named Deep Session Interest Network (DSIN) that leverages users’ multiple historical sessions in their behavior sequences. We first use self-attention mechanism with bias encoding to extract users’ interests in each session. Then we apply Bi-LSTM to model how users’ interests evolve and interact among sessions. Finally, we employ the local activation unit to adaptively learn the influences of various session interests on the target item.

1. 创新点

提出 session 概念，将用户点击 sequence 按照时间间隔分割成一段段 session，认为同一段 session 中的用户行为 item 高度相似（论文中取行为 item 点击时间间隔超过30分钟作为划分 session 的判定）——对应 Session Division Layer；
使用 Transformer 中的 multi-head self-attention 模块，结合了 bias encoding 抽取 session 内部的行为之间关系，来进一步提取 session interest；——对应Session Interest Extractor Layer；
使用 Bi-LSTM 捕获不同 session 之间的序列关系（interaction and evolution of users’ varying historical session interests）；——对应 Session Interest Interacting Layer；
使用 Target Attention （对应 Local Activation Unit ）分别从 Session Interest Extractor Layer 和 Session Interest Interacting Layer 中取出与当前候选推荐（论文中使用 target item + user profile + item profile 做为 Target，不同于以往只使用 target item 或者 target item + context feature）相关的兴趣特征；

阿里目前的主流序列模型中：self-attention + target attention 已经是标配；

Session: A session is a list of interactions (user behaviors) that occur within a given time frame.

Self-attention: Self-attention can capture the inner interaction/correlation of session behaviors and then extract users’ interests of each session.

2. 理论细节

2.1 Session Division Layer

2.1.1session 划分原因：

从sequence的角度我们虽然能看到 interest 的变化过程，但是却忽视了这样两个事实：

同一个 session 内的用户行为高度同构
不同 sessions 间的用户行为异构

CTR预估论文精读(十二)--Deep Session Interest Network(DSIN)_第2张图片

用户行为中，相同 session 内 item 高度相似，不同 session 间 item 多种多样。基于此，将用户 sequence 划分为不同的 session 段；

2.1.2 session的划分规则

根据用户的点击时间：前一个 session 最后一个 behavior 到后一个 session 第一个 behavior 的时间差大于等于30min。

将用户 Sequence 划分为 Sessions，其中其 k 个 session 如下：
$\mathbf{Q}_{k}=\left[\mathbf{b}_{1} ; \ldots ; \mathbf{b}_{i} ; \ldots ; \mathbf{b}_{T}\right] \in \mathbb{R}^{T \times \tilde{d}_{\text {model}}}$
T 是每个 session 中 behaviors 数目； $\tilde{d}_{\text {model}}$ 是 embedding 后每个 behavior 的 size； $b_i$ 是 session 中第 $i$ 个behavior.

2.2 Session Interest Extractor Layer

就像之前提到的那样，即使同个 session 中的行为是高度同构的，但是还是会有一些随意的一些行为会使得 session 的兴趣表示变得不准确：比如我想买衣服，看着看着衣服，但不小心误触到其他推送内容，但那和我的真实想去点击的东西无关。
所以为了对同一 session 中多个行为的关系进行建模和减轻那些不相关行为的影响。 DSIN 对每个 session 都使用 Transformer 中的 multi-head self-attention 模块来抽取用户session的兴趣特征。

Bias Encoding:

将 session 依据时间排序，得到 session 之间的序列关系，使用 bias encoding

利用 self-attention 建模同一 session 内的 item 相关关系，利用 Bi-LSTM 建模 session 之间的序列关系；

使用 self-attention 需要进行位置编码（positional encoding），同时，进一步扩展到session 之间的序列关系，作者提出 bias encoding 来整合 session 内 item 位置编码和 session 间位置编码；

提出 Bias Encoding：
$\mathbf{B E}_{(k, t, c)}=\mathbf{w}_{k}^{K}+\mathbf{w}_{t}^{T}+\mathbf{w}_{c}^{C}$
其中 $\mathbf{w}^{K}_{k} \in \mathbb{R}^{K}$ 为 session 的 bias vector，第二项 $\mathbf{w}^{T}_{t} \in \mathbb{R}^{T}$ 为 behavior 的 bias vector，第三项 $\mathbf{w}^{C}_{c} \in \mathbb{R}^{d_{model}}$ 为用户行为 embedding 中 unit 的 bias vector；

加上用户 bias encoding 之后，用户的行为 session Q 更新如下：
$Q = Q + B E$

然后我们将经过 Bias Encoding 处理的输入传入 Multi-head Self Attention 结构里来提取 session 内部 interest；

Multi-head Self Attention:

这里面 Multi-head Self Attention 其实就是多个 self-attention 结构的结合，每个 head 学习到在不同表示空间中的特征，如下图所示，两个 head 学习到的 Attention 侧重点可能略有不同，这样给了模型更大的容量。

因为用户的点击行为会受各种因素影响，比如颜色、款式和价格，那么这些因素就是作为所谓的 head。所以第一步就是将 session Q 根据 H 个 head 划分为 H 份。

即： $\mathbf{Q}_{k}=\left[\mathbf{Q}_{k 1} ; \ldots ; \mathbf{Q}_{k h} ; \ldots ; \mathbf{Q}_{k H}\right]$

其中 $\mathbf{Q}_{k h} \in \mathbb{R}^{T \times d_{h}}$ 为 $Q_k$ 的第 $h$ 个头， $H$ 是头的数量， $d_h = \frac{1}{h}d_{model}$ ；

在对 $Q$ 划分完后就要对每个 head 去计算，计算如下：

$\begin{aligned} \text { head }_{h} &=\text { Attention }\left(\mathbf{Q}_{k h} \mathbf{W}^{Q}, \mathbf{Q}_{k h} \mathbf{W}^{K}, \mathbf{Q}_{k h} \mathbf{W}^{V}\right) \\ &=\operatorname{softmax}\left(\frac{\mathbf{Q}_{k h} \mathbf{W}^{Q} \mathbf{W}^{K^{T}} \mathbf{Q}_{k h}^{T}}{\sqrt{d_{\text {model}}}}\right) \mathbf{Q}_{k h} \mathbf{W}^{V} \end{aligned}$

其中 $W^{Q}, W^{K}, W^{V}$ 进行矩阵线性变换；

上图为原始 self-attention 编码器结构，其中，在 multi-head 下面有三个箭头其实是比较细节的，因为对于 self-attention 来讲, 这三个输入量分别为： $Q (Q u e r y), K (K e y), V (V a l u e)$ 三个矩阵。

他们均来自同一输入，首先我们要计算 Q 与 K 之间的点乘, 然后为了防止其结果过大, 会除以一个尺度标度 $\sqrt{d_{k}},$ 其中 $d_{k}$ 为一个 query 和 key 向量的维度。
再利用Softmax操作将其结果归一化为概率分布，然后再乘以矩阵V就得到权重求和的表示。该操作可以表示为 Attention $V)=\operatorname{softmax}\left(\frac{Q K^{T}}{\sqrt{d_{k}}}\right) V$
现在再看DSIN的公式是不是会简单些？稍有不同的是加入了 $W^{Q}, W^{K}, W^{V}$ 进行矩阵线性变换；

将各个 head 结果进行 concat，同之前的输入一起放入 add&norm 后放入 FFN，然后再做 add&norm, 最后得到 session 内部各个 item 对应 interest embedding。

这里的 add&norm 作用应该也和前一个一样， $W^{o}$ 同样是线性变换矩阵；
$\mathbf{I}_{k}^{Q}=\text { FFN }\left(\text { Concat }\left(\text { head }_{1}, \ldots, \text { head }_{H}\right) \mathbf{W}^{O}\right)$

将 session 中各 item embedding 进行 average pooling，得到 session 对应的 embedding 表征，如下；
$\mathbf{I}_{k}=\operatorname{Avg}\left(\mathbf{I}_{k}^{Q}\right)$
得到用户第 k 个 session 的 embedding 表征；

注：Note that weights are shared in the self-attention mechanism of different sessions.

2.3 Session Interest Interacting Layer

建模用户的 session 动态变化可以丰富 session 的表征，利用 Bi-LSTM 提取 session 间的序列关系；

Bi-LSTM 计算公式如下：

$\begin{aligned} \mathbf{i}_{t} &=\sigma\left(\mathbf{W}_{x i} \mathbf{I}_{t}+\mathbf{W}_{h i} \mathbf{h}_{t-1}+\mathbf{W}_{c i} \mathbf{c}_{t-1}+\mathbf{b}_{i}\right) \\ \mathbf{f}_{t} &=\sigma\left(\mathbf{W}_{x f} \mathbf{I}_{t}+\mathbf{W}_{h f} \mathbf{h}_{t-1}+\mathbf{W}_{c f} \mathbf{c}_{t-1}+\mathbf{b}_{f}\right) \\ \mathbf{c}_{t} &=\mathbf{f}_{t} \mathbf{c}_{t-1}+\mathbf{i}_{t} \tanh \left(\mathbf{W}_{x c} \mathbf{I}_{t}+\mathbf{W}_{h c} \mathbf{h}_{t-1}+\mathbf{b}_{c}\right) \\ \mathbf{o}_{t} &=\sigma\left(\mathbf{W}_{x o} \mathbf{I}_{t}+\mathbf{W}_{h o} \mathbf{h}_{t-1}+\mathbf{W}_{c o} \mathbf{c}_{t}+\mathbf{b}_{o}\right) \\ \mathbf{h}_{t} &=\mathbf{o}_{t} \tanh \left(\mathbf{c}_{t}\right) \end{aligned}$

其中 $i_t, f_t, o_t$ 分别表示更新门、遗忘门、输出门；其中 cell vectors 具有与 $i_t$ 相同的 size；

因为是 Bi-LSTM，所以存在前向、后向 RNN 结构，下式两项 $\overrightarrow{\mathbf{h}_{f t}}, \overleftarrow{\mathbf{h}_{b t}}$ 分别是前向传播和反向传播对应的 $t$ 时刻的hidden state，一共有 $k$ 个 $H_t$ ，分别代表了前后memory的某个 session 的 interest 序列特征。
$\mathbf{H}_{t}=\overrightarrow{\mathbf{h}_{f t}} \oplus \overleftarrow{\mathbf{h}_{b t}}$
式中 $\oplus$ 表示 concatenation；

那么，到这为止，模型已经同时捕获到了session 内部和 session 之间的顺序关系。

2.4 Local Activation Unit

采用了 DIN 的 Target Attention 思路，很主流的一种做法，结合序列特征，与 DIEN(AIGRU) 的差别主要是多了 sequence 中 session 的划分；

左边是带推荐的 item embedding，右边是输入的是被 embedding 的商品信息，右边两个都是用户的 interest 信息，然后给出一个输出。
它的作用类似一个开关，控制了这类特征是否放入特征向量以及放入时权重的大小。
那这个开关由谁控制呢？它是由被预测 item 跟 session interest 的关系决定的。也就是说，在预测用户 $u$ 是否喜欢商品 $i$ 这件事上，我们只把跟商品 $i$ 有关的特征考虑进来，其他特征会完全不考虑或者权重很小。
这是比较好理解的，用户的 session interest 与 target item 关系越密切，对用户会去点击 target item 的影响越大，因此这样的 session interest 应该赋予更大的权重。

对 Session Interest 内部特征依据 Target item 做相关性提取；

比较好理解的，用户的 session interest 与 target item 关系越密切，对用户会去点击 target item 的影响越大，因此这样的 session interest 应该赋予更大的权重。

$\begin{aligned} a_{k}^{I} &=\frac{\left.\exp \left(\mathbf{I}_{k} \mathbf{W}^{I} \mathbf{X}^{I}\right)\right)}{\sum_{k}^{K} \exp \left(\mathbf{I}_{k} \mathbf{W}^{I} \mathbf{X}^{I}\right)} \\ \mathbf{U}^{I} &=\sum_{k} a_{k}^{I} \mathbf{I}_{k} \end{aligned}$

对 Session Interest 序列特征依据 Target item 做相关性提取；
$\begin{aligned} a_{k}^{H} &=\frac{\left.\exp \left(\mathbf{H}_{k} \mathbf{W}^{H} \mathbf{X}^{I}\right)\right)}{\sum_{k}^{K} \exp \left(\mathbf{H}_{k} \mathbf{W}^{H} \mathbf{X}^{I}\right)} \\ \mathbf{U}^{H} &=\sum_{k} a_{k}^{H} \mathbf{H}_{k} \end{aligned}$
最后，把用户特征向量、待推荐物品向量、会话兴趣加权向量 $U^I$ 、带上下文信息的会话兴趣加权向量 $U^H$ 进行横向拼接，输入到全连接层中，得到输出；

3. 总结

总体来讲，DSIN 在 DIEN 和 DIN 的基础上，将序列特征进一步做了细化处理，将 sequence 切割成 session 段，一种很好的业务同理论相结合的技巧。

使用 self-attention 提取 session 特征，使用 Bi-LSTM 提取 session 之间的序列特征，使用 Target Attention 分别从 session 特征和 session 序列特征中提取与候选 item 相关的有用信息；同时，在提取 session 特征过程中用到的 BE(Bias Encoding) 也是一种很实用的技巧。

综合来看，个人感觉本文相较于 DIN 略工于技，相较于 DIEN 更偏业务考量，是一篇非常不错的CTR精排论文！

值得注意的是，Self Attention + Target Attention 目前已经是处理序列特征的标配，其效果在阿里得到广泛验证；

参考文献

[1] Deep Session Interest Network(DSIN)

[2] Deep Session Interest Network(DSIN) 源码

[3] DSIN（Deep Session Interest Network ）分享

【web安全】远程命令执行(RCE)漏洞深度解析与攻防实践 KPX web安全安全 web安全 windows linux 漏洞
目录摘要1.RCE漏洞概述1.1基本概念1.2漏洞危害等级2.RCE漏洞原理深度分析2.1漏洞产生条件2.2常见危险函数2.2.1PHP环境2.2.2Java环境2.2.3Python环境3.RCE利用技术进阶3.1基础注入技术扩展3.1.1命令分隔技术3.1.2参数注入技术3.2高级绕过技术3.2.1编码混淆3.2.2字符串拼接3.3盲注技术3.3.1时间延迟检测3.3.2DNS外带数据3.3.
学习笔记(28):随机噪声的原理、作用及代码实现详解宁儿数据安全 #机器学习学习笔记 python
学习笔记(28):随机噪声的原理、作用及代码实现详解一、什么是随机噪声？为什么需要添加？在机器学习中，随机噪声是指数据中无法用特征解释的随机波动，通常符合某种概率分布（如正态分布）。在房价模拟中添加噪声的核心原因如下：1.模拟真实世界的不确定性真实房价除了受面积、房龄影响，还受装修情况、学区、交通、政策等未被建模的特征影响，这些因素的综合效应可抽象为“噪声”。示例：两套面积和房龄相同的房子，房价可
学习笔记(29):训练集与测试集划分详解：train_test_split 函数深度解析宁儿数据安全 #机器学习学习笔记深度学习
学习笔记(29):训练集与测试集划分详解：train_test_split函数深度解析一、为什么需要划分训练集和测试集？在机器学习中，模型需要经历两个核心阶段：训练阶段：用训练集数据学习特征与目标值的映射关系（如线性回归的权重）。测试阶段：用测试集评估模型在未见过的数据上的表现，避免“过拟合”（模型只记住训练数据的噪声，无法泛化到新数据）。类比场景：学生通过“练习题”（训练集）学习知识，再通过“考
[2219]基于JAVA的物流车智慧管理系统的设计与实现阿鑫学长【毕设工场】 java 人工智能开发语言课程设计毕业设计
毕业设计（论文）开题报告表姓名学院专业班级题目基于JAVA的物流车智慧管理系统的设计与实现指导老师（一）选题的背景和意义选题背景与意义：随着我国物流行业的快速发展和互联网技术的深度融合，高效、精准、智能的物流管理已经成为企业提升竞争力的关键要素。在当前信息化、智能化的大背景下，基于Java的物流车智慧管理系统的设计与实现具有重要的理论研究价值和广阔的应用前景。首先，从行业背景看，传统的物流管理模式
论文检索相关网站
在B站或是别的地方搜索到查阅论文，检索资料的网站，方便自己下次查找论文1.中国知网检索-中国知网(cnki.net)2.Scopus.Scopuspreview-Scopus-欢迎使用Scopus3.谷歌学术evtol多旋翼-Google学术搜索4.WebofScienceDocumentSearch-AllDatabases(webofscience.com)5.IEEE工程IEEE-搜索结果6
《dlib库中的聚类》算法详解：从原理到实践 A小庞算法算法聚类数据挖掘机器学习 c++
一、dlib库与聚类算法的关联1.1dlib库的核心功能dlib是一个基于C++的机器学习和计算机视觉工具库，其聚类算法模块提供了多种高效的无监督学习工具。聚类算法在dlib中主要用于：数据分组：将相似的数据点划分为同一簇。特征分析：通过聚类结果发现数据潜在的结构。降维辅助：结合聚类结果进行特征选择或数据压缩。dlib支持的经典聚类算法包括K-Means和ChineseWhispers，适用于图像
机器学习：集成算法的装袋法（Bagging）：随机森林（Random Forest） rubyw #概念及理论机器学习算法随机森林
随机森林（RandomForest）是一种集成学习方法，通过构建多个决策树并结合其预测结果来提升模型的性能和稳定性。它由LeoBreiman于2001年提出，广泛应用于分类和回归任务。以下是随机森林的详细介绍，包括其基本概念、构建过程、优缺点及应用场景。基本概念随机森林是一种基于决策树的集成算法，通过生成多棵决策树，并将这些树的预测结果结合起来，以提高整体模型的预测准确性和稳定性。每棵决策树都是在
计算机毕业设计Node.js+Vue新海图书商城网页设计论文（程序+源码+LW+部署) Node.js橙子毕设程序 vue.js 课程设计 node.js
该项目含有源码、文档、程序、数据库、配套开发软件、软件安装教程。欢迎交流项目运行环境配置：Node.js+Vscode+Mysql5.7+HBuilderX+Navicat11+Vue+Express。项目技术：Express框架+Node.js+Vue等等组成，B/S模式+Vscode管理+前后端分离等等。环境需要1.运行环境：最好是Nodejs最新版，我们在这个版本上开发的。其他版本理论上也可
大语言模型技术系列讲解：大模型应用了哪些技术知世不是芝士语言模型人工智能自然语言处理 chatgpt 大模型
为了弄懂大语言模型原理和技术细节，笔者计划展开系列学习，并将所学内容从简单到复杂的过程给大家做分享，希望能够体系化的认识大模型技术的内涵。本篇文章作为第一讲，先列出大模型使用到了哪些技术，目的在于对大模型使用的技术有个整体认知。后续我们讲一一详细讲解这些技术概念并解剖其背后原理。正文开始大语言模型（LLMs）在人工智能领域通常指的是参数量巨大、能够处理复杂任务的深度学习模型。这些模型使用的技术主要
森林的智慧：随机森林与集成学习的民主之道田园Coder 人工智能科普人工智能科普
当约阿夫·弗罗因德和罗伯特·沙皮尔提出的AdaBoost算法在90年代末期以其强大的预测精度震惊机器学习界，展示了“团结弱者为强者”的集成魅力时，另一种集成思想也在悄然孕育。这种思想同样信奉“众人拾柴火焰高”，但走的是一条与AdaBoost截然不同的路径：它不执着于反复调整数据权重去“关注”被前序模型分错的困难样本，而是致力于创造尽可能多样化的模型，然后让这些模型平等地投票。它的核心哲学是：如果每
论文调研_物联网漏洞检测综述 kitsch0x97 论文调研学习物联网
AReviewofIoTFirmwareVulnerabilitiesandAuditingTechniques研究背景：物联网设备在工业、消费类等各个领域得到了广泛应用，实现了更高的自动化和生产率。然而，这些连网设备的高度依赖也带来了一系列网络安全威胁，特别是IoT设备固件漏洞问题，往往在开发和部署过程中被忽视。针对这一问题，亟需制定全面的安全策略，包括对IoT设备固件环境(软件组件、存储、配置
机器学习：集成学习方法之随机森林(Random Forest) 慕婉0307 机器学习集成学习机器学习随机森林
一、集成学习与随机森林概述1.1什么是集成学习集成学习(EnsembleLearning)是机器学习中一种强大的范式，它通过构建并结合多个基学习器(baselearner)来完成学习任务。集成学习的主要思想是"三个臭皮匠，顶个诸葛亮"，即通过组合多个弱学习器来获得一个强学习器。集成学习方法主要分为两大类：Bagging(BootstrapAggregating)：并行训练多个基学习器，然后通过投票
机器学习在智能金融风险评估中的应用：信用评分与欺诈检测 Blossom.118 机器学习与人工智能机器人机器学习人工智能 python 深度学习 sklearn 计算机视觉
在金融行业，风险评估是确保金融机构稳健运营的关键环节。随着大数据和机器学习技术的快速发展，金融机构开始探索如何利用机器学习算法来提高风险评估的准确性和效率。本文将探讨机器学习在智能金融风险评估中的应用，特别是信用评分和欺诈检测方面的最新进展，并分析其带来的机遇和挑战。一、智能金融风险评估中的信用评分（一）传统信用评分方法的局限性传统的信用评分主要依赖于人工规则和简单的统计模型，如逻辑回归。这些方法
机器学习在智能制造业中的应用：质量检测与设备故障预测 Blossom.118 机器学习与人工智能机器学习人工智能深度学习神经网络机器人 sklearn tensorflow
随着工业4.0和智能制造的推进，制造业正经历着一场深刻的数字化转型。智能制造业通过整合物联网（IoT）、大数据和机器学习等先进技术，实现从生产计划到质量控制的全流程优化。机器学习技术在智能制造业中的应用尤为突出，尤其是在质量检测和设备故障预测方面。本文将探讨机器学习在智能制造业中的应用，并分析其带来的机遇和挑战。一、智能制造业中的质量检测（一）传统质量检测方法的局限性传统的质量检测主要依赖于人工检
面了字节跳动的数据挖掘岗，感觉真的很难。。。大模型爱好者社区机器学习深度学习面试宝典数据挖掘人工智能数据分析算法面试
节前，我们社群组织了一场技术&面试讨论会，邀请了一些互联网大厂同学、参加社招和校招面试的同学，针对新手如何入门机器学习算法、该如何备战、面试常考点分享等热门话题进行了深入的讨论。基于社群的讨论，今天我整理了一个同学的面试题，分享给大家，希望对后续找工作的有所帮助。喜欢记得点赞、收藏、关注。更多技术交流&面经学习，可以文末加入我们交流群。一面40min【编程题】有两种数据，分别是被转发的用户和转发的
全流程文献计量学可视化分析技术及SCI论文高效写作方法青春不败 177-3266-0520 生态环境人工智能 python 文献可视化 SCI论文生态学环境科学遥感
文献计量学是指用数学和统计学的方法，定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体，注重量化的综合性知识体系。特别是，信息可视化技术手段和方法的运用，可直观的展示主题的研究发展历程、研究现状、研究热点和发展态势。一：文献计量学方法与应用1.文献计量学方法基本2.与其他综述方法区别联系3.各学科领域应用趋势近况4.主流分析软件优缺点对比二：主题确定、检索与数据采集1.热点主题高效
Midjourney提示词(Prompt)编写秘籍：让AI画出你想要的作品 AIGC应用创新大全 AI大模型与大数据技术 AI人工智能与大数据应用开发 MCP&Agent 云算力网络 midjourney prompt 人工智能 ai
Midjourney提示词(Prompt)编写秘籍：让AI画出你想要的作品关键词：Midjourney、提示词(Prompt)、AI绘画、关键词权重、图像生成摘要：想让AI画出你脑海中完美的画面？关键就藏在“提示词(Prompt)”里！本文将用“给小学生讲故事”的方式，从基础到进阶，拆解Midjourney提示词的编写逻辑。你将学会如何用“主体+风格+细节”的黄金公式，像给画家写“绘画说明书”一样
提示词工程推荐阅读论文司南锤 LLM prompt 人工智能自然语言处理
论文目录提示工程少样本提示思维链提示自洽性生成知识提示自动提示工程多模态提示提示技巧对抗提示提示工程PromptEngineeringforText-BasedGenerativeModels论文链接:https://arxiv.org/abs/2107.13586简介:本文概述了提示工程，并讨论了它在各种基于文本的生成模型中的应用。少样本提示Few-shotLearningwithRetriev
【深度学习-Day 33】从零到一：亲手构建你的第一个卷积神经网络（CNN）吴师兄大模型深度学习入门到精通深度学习 cnn 人工智能 python 大模型卷积神经网络（CNN）机器学习
Langchain系列文章目录01-玩转LangChain：从模型调用到Prompt模板与输出解析的完整指南02-玩转LangChainMemory模块：四种记忆类型详解及应用场景全覆盖03-全面掌握LangChain：从核心链条构建到动态任务分配的实战指南04-玩转LangChain：从文档加载到高效问答系统构建的全程实战05-玩转LangChain：深度评估问答系统的三种高效方法（示例生成、手
圈子系统公众号app小程序系统源码公众号+圈子小程序：如何用“内容+社交”打造用户闭环生态？前端
圈子系统：构建"交流→共鸣→成长"的进阶生态一、系统设计理念演进1.0基础交流层话题发布/回复功能基础点赞评论互动简单分类标签系统2.0情感共鸣层情绪标签识别（AI分析内容情感倾向）共鸣指数算法（根据互动深度计算）志同道合推荐系统3.0成长体系层多维能力评估模型个性化成长路径成就勋章系统二、核心技术实现方案1.共鸣引擎#共鸣度计算算法示例defcalculate_resonance(topic):
【学习】《算法图解》第十二章学习笔记：K近邻算法程序员
前言《算法图解》第十二章介绍了一种简单而强大的机器学习算法——K近邻算法（K-NearestNeighbors，简称KNN）。这是一种基于实例的学习方法，也是机器学习领域中最基础、最直观的算法之一。本章不仅讲解了KNN的基本原理和实现方式，还探讨了特征提取、归一化等重要概念，为读者打开了机器学习的大门。本笔记将梳理KNN算法的核心思想、实现步骤以及应用场景。一、K近邻算法概述（一）基本思想K近邻算
小白学习Python的系统化路径 python观点资讯
学好Python需要系统化的学习和持续的实践，尤其对于小白来说，从基础到进阶需要循序渐进。以下是一份清晰的学习路径和建议，帮助你高效掌握Python：1.打好基础核心语法变量与数据类型：整数、浮点数、字符串、布尔值等。运算符：算术、比较、逻辑运算符。流程控制：if-else条件判断、for/while循环。函数：定义函数、参数传递、返回值、作用域。数据结构：列表、元组、字典、集合的常用操作。推荐资
AttributeError: module ‘openai‘ has no attribute ‘ChatCompletion‘解决方案爱编程的喵喵 Python基础课程 python AttributeError openai ChatCompletion 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了AttributeError:mod
基于深度学习的草莓成熟度检测系统：YOLOv5 + UI界面 + 数据集 YOLO实战营深度学习YOLO实战项目深度学习 YOLO ui 人工智能目标跟踪
引言随着农业科技的发展，智能化的农业生产方式正逐步替代传统农业。果实的成熟度检测对于农业生产的管理至关重要，尤其是在果蔬的采摘、分拣和运输过程中。草莓作为一种广泛种植且受消费者喜爱的水果，其成熟度检测一直是农业智能化的重要研究方向。传统的草莓成熟度检测方法大多依赖人工经验，劳动强度大且容易出现误差，因此，基于计算机视觉和深度学习的草莓成熟度自动检测系统成为了一种理想选择。深度学习技术，尤其是卷积神
数字人矩阵源码--基于深度学习的数字人面部表情合成我~18339948121 数字人源码数字人矩阵源码 123数字人源码矩阵深度学习线性代数人工智能 flask tornado python
AI正在席卷全球，数字人市场需求增长，用AI数字分身一天就能生产出几十条高质量短视频，你只需要上传一段视频，甚至都不用开口说话，直接复制粘贴文案，就能得到一个属于你的数字分身。深度学习数字人面部表情合成的关键技术3D面部建模与参数化建立高精度3D面部模型是表情合成的基础，常用Blendshape或面部动作编码系统（FACS）作为参数化控制方法。Blendshape通过线性组合基础表情形状生成新表情
数字人视频剪辑与数字人分身源码开发的的核心技术解析微~18339948121 数字人分身源码数字人剪辑源码数字人源码 django pygame virtualenv plotly scikit-learn flask tornado
数字人视频剪辑与分身的核心技术解析数字人视频剪辑和分身技术是近年来人工智能与计算机视觉领域的热点，涉及虚拟形象生成、动作驱动、语音合成等多项技术。以下从技术实现、应用场景和工具选择三个方面展开分析。数字人视频剪辑的关键技术视频剪辑中数字人的核心在于动态形象的生成与编辑。基于深度学习的生成对抗网络（GAN）和3D建模技术可实现高保真虚拟形象构建。典型流程包括：人物建模：通过多视角图像或视频数据重建3
嵌套列表与二维列表的遍历方法
在Python的世界中，列表（list）是最为基础而强大的数据结构之一。而当一个列表的元素本身又是列表时，我们便进入了嵌套列表（NestedList）或更通用的二维列表（2DList）的语境中。无论是在软件开发、测试数据构造、数据分析、机器学习、自动化运维还是教育教学场景中，嵌套结构的遍历与处理都是工程能力的一项基本功。本文将系统剖析Python中处理嵌套列表和二维列表的常用遍历方式，从基础语法到
两个Adobe高效技巧与设计师创意思维的进阶指南 reddingtons adobe illustrator photoshop 人工智能 AfterEffects 设计师设计规范
作为一名在全球多个城市旅居十年的职业设计师，我依托英国ParvisSchoolofEconomicsandMusic提供的Adobe正版教育订阅，积累了丰富的设计经验。今天，我想以更贴近你的视角，分享两个Adobe系列软件的实用技巧，以及一个激发创意的工作方法。这些技巧和方法不仅来自我的实践，还融入了全球顶尖设计师和多媒体创作者的智慧，希望能为你的设计之路点亮一盏灯。主体：高效技巧与职场故事技巧一
【高频考点精讲】React Hooks使用指南：useEffect的依赖数组你真的用对了吗？全栈老李技术面试前端高频考点精讲前端 javascript html css 面试题 react vue
ReactHooks使用指南：useEffect的依赖数组你真的用对了吗？‍作者：全栈老李更新时间：2025年5月‍适合人群：前端初学者、进阶开发者版权：本文由全栈老李原创，转载请注明出处。大家好，我是全栈老李。今天咱们来聊聊ReactHooks中那个让人又爱又恨的useEffect，特别是它的依赖数组——这个看似简单实则暗藏玄机的部分。依赖数组是什么鬼？useEffect的第二个参数是个数组，R
大神之路-起始篇 | 第13章.计算机科学导论之【文件结构】学习笔记全栈工程师修炼指南从业必看书籍专栏学习笔记
欢迎关注「WeiyiGeek」公众号点击下方卡片即可关注我哟!设为「星标⭐」每天带你基础入门到进阶实践再到放弃学习！涉及网络安全运维、应用开发、物联网IOT、学习路径、个人感悟等知识“花开堪折直须折，莫待无花空折枝。”作者主页：[https://www.weiyigeek.top]作者博客：[https://blog.weiyigeek.top]作者答疑学习交流群：
Algorithm 香水浓 java Algorithm
冒泡排序 public static void sort(Integer[] param) { for (int i = param.length - 1; i > 0; i--) { for (int j = 0; j < i; j++) { int current = param[j]; int next = param[j + 1];
mongoDB 复杂查询表达式开窍的石头 mongodb
1:count Pg: db.user.find().count(); 统计多少条数据 2:不等于$ne Pg: db.user.find({_id:{$ne:3}},{name:1,sex:1,_id:0}); 查询id不等于3的数据。 3：大于$gt $gte(大于等于) &n
Jboss Java heap space异常解决方法, jboss OutOfMemoryError : PermGen space 0624chenhong jvm jboss
转自 http://blog.csdn.net/zou274/article/details/5552630 解决办法： window->preferences->java->installed jres->edit jre 把default vm arguments 的参数设为-Xms64m -Xmx512m ----------------
文件上传下载解析相对路径不懂事的小屁孩文件上传
有点坑吧，弄这么一个简单的东西弄了一天多，身边还有大神指导着，网上各种百度着。下面总结一下遇到的问题：文件上传，在页面上传的时候，不要想着去操作绝对路径，浏览器会对客户端的信息进行保护，避免用户信息收到攻击。在上传图片，或者文件时，使用form表单来操作。前台通过form表单传输一个流到后台，而不是ajax传递参数到后台，代码如下: <form action=&
怎么实现qq空间批量点赞换个号韩国红果果 qq
纯粹为了好玩！！逻辑很简单 1 打开浏览器console；输入以下代码。先上添加赞的代码 var tools={}; //添加所有赞 function init(){ document.body.scrollTop=10000; setTimeout(function(){document.body.scrollTop=0;},2000);//加
判断是否为中文灵静志远中文
方法一： public class Zhidao { public static void main(String args[]) { String s = "sdf灭礌 kjl d{';\fdsjlk是"; int n=0; for(int i=0; i<s.length(); i++) { n = (int)s.charAt(i); if((
一个电话面试后总结 a-john 面试
今天，接了一个电话面试，对于还是初学者的我来说，紧张了半天。面试的问题分了层次，对于一类问题，由简到难。自己觉得回答不好的地方作了一下总结：在谈到集合类的时候，举几个常用的集合类，想都没想，直接说了list,map。然后对list和map分别举几个类型： list方面：ArrayList,LinkedList。在谈到他们的区别时，愣住了
MSSQL中Escape转义的使用 aijuans MSSQL
IF OBJECT_ID('tempdb..#ABC') is not null drop table tempdb..#ABC create table #ABC ( PATHNAME NVARCHAR(50) ) insert into #ABC SELECT N'/ABCDEFGHI' UNION ALL SELECT N'/ABCDGAFGASASSDFA' UNION ALL
一个简单的存储过程 asialee mysql 存储过程构造数据批量插入
今天要批量的生成一批测试数据，其中中间有部分数据是变化的，本来想写个程序来生成的，后来想到存储过程就可以搞定，所以随手写了一个，记录在此： DELIMITER $$ DROP PROCEDURE IF EXISTS inse
annot convert from HomeFragment_1 to Fragment 百合不是茶 android 导包错误
创建了几个类继承Fragment, 需要将创建的类存储在ArrayList<Fragment>中; 出现不能将new 出来的对象放到队列中,原因很简单; 创建类时引入包是:import android.app.Fragment; 创建队列和对象时使用的包是:import android.support.v4.ap
Weblogic10两种修改端口的方法 bijian1013 weblogic 端口号配置管理 config.xml
一.进入控制台进行修改 1.进入控制台: http://127.0.0.1:7001/console 2.展开左边树菜单域结构->环境->服务器-->点击AdminServer(管理) &
mysql 操作指令征客丶 mysql
一、连接mysql 进入 mysql 的安装目录； $ bin/mysql -p [host IP 如果是登录本地的mysql 可以不写 -p 直接 -u] -u [userName] -p 输入密码，回车，接连；二、权限操作［如果你很了解mysql数据库后，你可以直接去修改系统表，然后用 mysql> flush privileges; 指令让权限生效］ 1、赋权 mys
【Hive一】Hive入门 bit1129 hive
Hive安装与配置 Hive的运行需要依赖于Hadoop，因此需要首先安装Hadoop2.5.2，并且Hive的启动前需要首先启动Hadoop。 Hive安装和配置的步骤 1. 从如下地址下载Hive0.14.0 http://mirror.bit.edu.cn/apache/hive/ 2.解压hive，在系统变
ajax 三种提交请求的方法 BlueSkator Ajax jqery
1、ajax 提交请求 $.ajax({ type:"post", url : "${ctx}/front/Hotel/getAllHotelByAjax.do", dataType : "json", success : function(result) { try { for(v
mongodb开发环境下的搭建入门 braveCS 运维
linux下安装mongodb 1）官网下载mongodb-linux-x86_64-rhel62-3.0.4.gz 2）linux 解压 gzip -d mongodb-linux-x86_64-rhel62-3.0.4.gz; mv mongodb-linux-x86_64-rhel62-3.0.4 mongodb-linux-x86_64-rhel62-
编程之美-最短摘要的生成 bylijinnan java 数据结构算法编程之美
import java.util.HashMap; import java.util.Map; import java.util.Map.Entry; public class ShortestAbstract { /** * 编程之美最短摘要的生成 * 扫描过程始终保持一个[pBegin,pEnd]的range,初始化确保[pBegin,pEnd]的ran
json数据解析及typeof chengxuyuancsdn js typeof json解析
// json格式 var people='{"authors": [{"firstName": "AAA","lastName": "BBB"},' +' {"firstName": "CCC&
流程系统设计的层次和目标 comsci 设计模式数据结构 sql 框架脚本
流程系统设计的层次和目标
RMAN List和report 命令 daizj oracle list report rman
LIST 命令使用RMAN LIST 命令显示有关资料档案库中记录的备份集、代理副本和映像副本的信息。使用此命令可列出： • RMAN 资料档案库中状态不是AVAILABLE 的备份和副本 • 可用的且可以用于还原操作的数据文件备份和副本 • 备份集和副本，其中包含指定数据文件列表或指定表空间的备份 • 包含指定名称或范围的所有归档日志备份的备份集和副本 • 由标记、完成时间、可
二叉树:红黑树 dieslrae 二叉树
红黑树是一种自平衡的二叉树,它的查找,插入,删除操作时间复杂度皆为O(logN),不会出现普通二叉搜索树在最差情况时时间复杂度会变为O(N)的问题. 红黑树必须遵循红黑规则,规则如下 1、每个节点不是红就是黑。 2、根总是黑的 &
C语言homework3，7个小题目的代码 dcj3sjt126com c
1、打印100以内的所有奇数。 # include <stdio.h> int main(void) { int i; for (i=1; i<=100; i++) { if (i%2 != 0) printf("%d ", i); } return 0; } 2、从键盘上输入10个整数，
自定义按钮, 图片在上, 文字在下, 居中显示 dcj3sjt126com 自定义
#import <UIKit/UIKit.h> @interface MyButton : UIButton -(void)setFrame:(CGRect)frame ImageName:(NSString*)imageName Target:(id)target Action:(SEL)action Title:(NSString*)title Font:(CGFloa
MySQL查询语句练习题，测试足够用了 flyvszhb sql mysql
http://blog.sina.com.cn/s/blog_767d65530101861c.html 1.创建student和score表 CREATE TABLE student ( id INT(10) NOT NULL UNIQUE PRIMARY KEY , name VARCHAR
转：MyBatis Generator 详解 happyqing mybatis
MyBatis Generator 详解 http://blog.csdn.net/isea533/article/details/42102297 MyBatis Generator详解 http://git.oschina.net/free/Mybatis_Utils/blob/master/MybatisGeneator/MybatisGeneator.
让程序员少走弯路的14个忠告 jingjing0907 工作计划学习
无论是谁，在刚进入某个领域之时，有再大的雄心壮志也敌不过眼前的迷茫：不知道应该怎么做，不知道应该做什么。下面是一名软件开发人员所学到的经验，希望能对大家有所帮助 1.不要害怕在工作中学习。只要有电脑，就可以通过电子阅读器阅读报纸和大多数书籍。如果你只是做好自己的本职工作以及分配的任务，那是学不到很多东西的。如果你盲目地要求更多的工作，也是不可能提升自己的。放
nginx和NetScaler区别流浪鱼 nginx
NetScaler是一个完整的包含操作系统和应用交付功能的产品，Nginx并不包含操作系统，在处理连接方面，需要依赖于操作系统，所以在并发连接数方面和防DoS攻击方面，Nginx不具备优势。 2.易用性方面差别也比较大。Nginx对管理员的水平要求比较高，参数比较多，不确定性给运营带来隐患。在NetScaler常见的配置如健康检查，HA等，在Nginx上的配置的实现相对复杂。 3.策略灵活度方
第11章动画效果（下） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
FAQ - SAP BW BO roadmap blueoxygen BO BW
http://www.sdn.sap.com/irj/boc/business-objects-for-sap-faq Besides, I care that how to integrate tightly. By the way, for BW consultants, please just focus on Query Designer which i
关于java堆内存溢出的几种情况 tomcat_oracle java jvm jdk thread
【情况一】：　　 java.lang.OutOfMemoryError: Java heap space：这种是java堆内存不够，一个原因是真不够，另一个原因是程序中有死循环；　　如果是java堆内存不够的话，可以通过调整JVM下面的配置来解决：　　<jvm-arg>-Xms3062m</jvm-arg> 　　<jvm-arg>-Xmx
Manifest.permission_group权限组阿尔萨斯 Permission
结构继承关系 public static final class Manifest.permission_group extends Object java.lang.Object android. Manifest.permission_group 常量 ACCOUNTS 直接通过统计管理器访问管理的统计 COST_MONEY可以用来让用户花钱但不需要通过与他们直接牵涉的权限 D

CTR预估 论文精读(十二)--Deep Session Interest Network(DSIN)