LZN51

Mahout(二)：相似性度量

User CF 和 Item CF 都依赖于相似度的计算，因为只有通过衡量用户之间或物品之间的相似度，才能找到用户的“邻居”，才能完成推荐。上文简单的介绍了相似度的计算，但不完全，下面就对常用的相似度计算方法进行详细的介绍：

1. 基于皮尔森相关性的相似度 —— Pearson correlation-based similarity
皮尔森相关系数反应了两个变量之间的线性相关程度，它的取值在[-1, 1]之间。当两个变量的线性关系增强时，相关系数趋于1或-1；当一个变量增大，另一个变量也增大时，表明它们之间是正相关的，相关系数大于0；如果一个变量增大，另一个变量却减小，表明它们之间是负相关的，相关系数小于0；如果相关系数等于0，表明它们之间不存在线性相关关系。

用数学公式表示，皮尔森相关系数等于两个变量的协方差除于两个变量的标准差。

Pearson correlation-based similarity

协方差（Covariance）：在概率论和统计学中用于衡量两个变量的总体误差。如果两个变量的变化趋于一致，也就是说如果其中一个大于自身的期望值，另一个也大于自身的期望值，那么两个变量之间的协方差就是正值；如果两个变量的变化趋势相反，则协方差为负值。

Covariance

其中u表示X的期望E(X), v表示Y的期望E(Y)

标准差（Standard Deviation）：标准差是方差的平方根

Standard Deviation

方差(Variance)：在概率论和统计学中，一个随机变量的方差表述的是它的离散程度，也就是该变量与期望值的距离。

Variance

即方差等于误差的平方和的期望

基于皮尔森相关系数的相似度有两个缺点：
(1) 没有考虑（take into account）用户间重叠的评分项数量对相似度的影响；
(2) 如果两个用户之间只有一个共同的评分项，相似度也不能被计算

Table1

上表中，行表示用户（1～5）对项目（101～103）的一些评分值。直观来看，User1和User5用3个共同的评分项，并且给出的评分走差也不大，按理他们之间的相似度应该比User1和User4之间的相似度要高，可是User1和User4有一个更高的相似度1。

同样的场景在现实生活中也经常发生，比如两个用户共同观看了200部电影，虽然不一定给出相同或完全相近的评分，他们之间的相似度也应该比另一位只观看了2部相同电影的相似度高吧！但事实并不如此，如果对这两部电影，两个用户给出的相似度相同或很相近，通过皮尔森相关性计算出的相似度会明显大于观看了相同的200部电影的用户之间的相似度。

Mahout对基于皮尔森相关系数的相似度给出了实现，它依赖一个DataModel作为输入。

PearsonCorrelationSimilarity

同时，Mahout还针对缺点(1)进行了优化，只需要在构造PearsonCorrelationSimilarity时多传入一个Weighting.WEIGHTED参数，就能使有更多相同评分项目的用户之间的相似度更趋近于1或-1。

UserSimilarity similarity1 = new PearsonCorrelationSimilarity(model);
double value1 = similarity1.userSimilarity(1, 5);

UserSimilarity similarity2 = new PearsonCorrelationSimilarity(model, Weighting.WEIGHTED);
double value2 = similarity2.userSimilarity(1, 5);

结果：

Similarity of User1 and User5: 0.944911182523068
Similarity of User1 and User5 with weighting: 0.9655694890769175

2. 基于欧几里德距离的相似度 —— Euclidean Distance-based Similarity

欧几里德距离计算相似度是所有相似度计算里面最简单、最易理解的方法。它以经过人们一致评价的物品为坐标轴，然后将参与评价的人绘制到坐标系上，并计算他们彼此之间的直线距离。

Euclidean Distance 2-Coordinate

Table2

图中用户A和用户B分别对项目X、Y进行了评分。用户A对项目X的评分为2，对项目Y的评分为4，表示到坐标系中为坐标点A(1.8, 4)；同样用户B对项目X、Y的评分表示为坐标点B(4.5, 2.5)，因此他们之间的欧几里德距离（直线距离）为：sqrt((B.x - A.x)^2 + (A.y - B.y)^2)

Euclidean Distance

计算出来的欧几里德距离是一个大于0的数，为了使其更能体现用户之间的相似度，可以把它规约到(0, 1]之间，具体做法为：1 / (1 + d)。参见Table2

Euclidean Distance-based Similarity

只要至少有一个共同评分项，就能用欧几里德距离计算相似度；如果没有共同评分项，那么欧几里德距离也就失去了作用。其实照常理理解，如果没有共同评分项，那么意味着这两个用户或物品根本不相似。

3. 余弦相似度 —— Cosine Similarity
余弦相似度用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。相比距离度量，余弦相似度更加注重两个向量在方向上的差异，而非距离或长度上。

Cosine Similarity

与欧几里德距离类似，基于余弦相似度的计算方法也是把用户的喜好作为n-维坐标系中的一个点，通过连接这个点与坐标系的原点构成一条直线（向量），两个用户之间的相似度值就是两条直线（向量）间夹角的余弦值。因为连接代表用户评分的点与原点的直线都会相交于原点，夹角越小代表两个用户越相似，夹角越大代表两个用户的相似度越小。同时在三角系数中，角的余弦值是在[-1, 1]之间的，0度角的余弦值是1，180角的余弦值是-1。

借助三维坐标系来看下欧氏距离和余弦相似度的区别：

Distance and Cosine 3-Coordinates

从图上可以看出距离度量衡量的是空间各点间的绝对距离，跟各个点所在的位置坐标（即个体特征维度的数值）直接相关；而余弦相似度衡量的是空间向量的夹角，更加的是体现在方向上的差异，而不是位置。如果保持A点的位置不变，B点朝原方向远离坐标轴原点，那么这个时候余弦相似度cosθ是保持不变的，因为夹角不变，而A、B两点的距离显然在发生改变，这就是欧氏距离和余弦相似度的不同之处。

根据欧氏距离和余弦相似度各自的计算方式和衡量特征，分别适用于不同的数据分析模型：欧氏距离能够体现个体数值特征的绝对差异，所以更多的用于需要从维度的数值大小中体现差异的分析，如使用用户行为指标分析用户价值的相似度或差异；而余弦相似度更多的是从方向上区分差异，而对绝对的数值不敏感，更多的用于使用用户对内容评分来区分用户兴趣的相似度和差异，同时修正了用户间可能存在的度量标准不统一的问题（因为余弦相似度对绝对数值不敏感）。

Mahout没有专门给出基于余弦相似度的实现。

4. 调整余弦相似度 —— Adjusted Cosine Similarity
在余弦相似度的介绍中说到：余弦相似度更多的是从方向上区分差异，而对绝对的数值不敏感。因此没法衡量每个维数值的差异，会导致这样一个情况：比如用户对内容评分，5分制，X和Y两个用户对两个内容的评分分别为(1,2)和(4,5)，使用余弦相似度得出的结果是0.98，两者极为相似，但从评分上看X似乎不喜欢这2个内容，而Y比较喜欢，余弦相似度对数值的不敏感导致了结果的误差，需要修正这种不合理性，就出现了调整余弦相似度，即所有维度上的数值都减去一个均值，比如X和Y的评分均值都是3，那么调整后为(-2,-1)和(1,2)，再用余弦相似度计算，得到-0.8，相似度为负值并且差异不小，但显然更加符合现实。

5. 斯皮尔曼相关 —— Spearman Correlation
斯皮尔曼相关性可以理解为是排列后（Rank）用户喜好值之间的Pearson相关度。《Mahout in Action》中有这样的解释：假设对于每个用户，我们找到他最不喜欢的物品，重写他的评分值为“1”；然后找到下一个最不喜欢的物品，重写评分值为“2”，以此类推。然后我们对这些转换后的值求Pearson相关系数，这就是Spearman相关系数。

斯皮尔曼相关度的计算舍弃了一些重要信息，即真实的评分值。但它保留了用户喜好值的本质特性——排序（ordering），它是建立在排序（或等级，Rank）的基础上计算的。
回顾前面表中User1～5对Item101～103的喜好（评分）值，通过斯皮尔曼相关系数计算出的相似度为：

Table3

我们发现，计算出来的相似度值要么是1，要么是-1，因为这依赖于用户的喜好值和User1的喜好值是否趋于“一致变化”还是呈“相反趋势变化"。

Mahout对斯皮尔曼相关系数给出了实现，具体可参考SpearmanCorrelationSimilarity，它的执行效率不是非常高，因为斯皮尔曼相关性的计算需要花时间计算并存储喜好值的一个排序（Ranks），具体时间取决于数据的数量级大小。正因为这样，斯皮尔曼相关系数一般用于学术研究或者是小规模的计算。

UserSimilarity similarity1 = new SpearmanCorrelationSimilarity(model); // construct a Spearman Correlation-based Similarity
User1 to User1 : 1.0
User2 to User1 : -1.0
User3 to User1 : NaN
User4 to User1 : 1.0
User4 to User1 : 1.0

考虑到Spearman Correlation的效率，可以把SpearmanCorrelationSimilarity包装一层Cache，具体做法为：
UserSimilarity similarity2 = new CachingUserSimilarity(new SpearmanCorrelationSimilarity(model), model);
这样，每次计算的结果会直接放入Cache，下一次计算的时候可以立即得到结果，而不是重新再计算一次。

6. 基于谷本系数的相似性度量 —— Tanimoto Coefficient-based Similarity
Tanimoto Coefficient和前面的5中相关度计算方式有很大的不同，它不关心用户对物品的具体评分值是多少，它在关心用户与物品之间是否存在关联关系。还记得上一篇文章《Mahout学习笔记——数据承载》里面提到的布尔喜好值（Boolean Preference）吧！Tanimoto Coefficient依赖于用户和物品之间的这种Boolean关系作为输入。

更准确的说法为：Tanimoto Coefficient主要用于计算符号度量或布尔值度量的个体间的相似度，因为个体的特征属性都是由符号度量或者布尔值标识，因此无法衡量差异具体值的大小，只能获得“是否相同”这个结果，所以Tanimoto Coefficient只关心个体间共同具有的特征是否一致这个问题。Tanimoto Coefficient又被叫做Jaccard Coefficient，其值等于两个用户共同关联（不管喜欢还是不喜欢）的物品数量除于两个用户分别关联的所有物品数量。

Intersection/Union

也就是关联的交集除于关联的并集，用公式表示为：

Tanimoto/Jaccard Coefficient

其值介于[0, 1]之间，如果两个用户关联的物品完全相同，交集等于并集，值为1；如果没有任何关联，交集为空，值为0。

注：本块中提及的关联指用户对物品有评分值

ES6（4） Map 集合详解 Theodore_1022 ES6 es6 前端 ecmascript javascript 开发语言
1.Map集合简介Map是ES6提供的一种新的键值对数据结构，与普通对象（Object）不同，Map的键可以是任意类型（包括对象、函数等）。2.创建Map集合可以使用newMap()创建一个Map，并在括号内传入一个二维数组来初始化键值对。letauthor=newMap([['name','theodore'],['age','21'],['web','https://blog.csdn.net
用Python开发一个简单的“记忆翻牌”小游戏风亦辰739 Python小游戏 python pygame 开发语言
“记忆翻牌”是一款经典的益智小游戏，玩家需要通过记忆卡片的位置配对相同的图案。今天我们将使用pygame库实现一个简单版本的记忆翻牌游戏。一、游戏规则游戏开始时，卡片会随机排列并翻面。玩家一次可以翻两张卡片：如果图案相同，卡片保持翻开状态。如果图案不同，卡片会短暂显示后翻回去。游戏目标是用最少的步数找到所有配对。二、开发环境开发工具：任意Python编辑器（如PyCharm、VSCode）。依赖库
蓝桥杯常见算法模板（Python组） -777. 蓝桥杯算法
目录1.二分1.整数二分（二分答案）：2.浮点数二分（考不到）2.前缀和、差分1.前缀和一维：二维：2.差分一维：二维：3.贪心4.线性DP1.最长上升子序列（子序列问题一般下标从一开始）2.最长公共子序列3.常见背包模型1.0-1背包2.完全背包3.多重背包4.混合背包5.二维费用背包6.分组背包5.搜索1.DFS模板：1.子集问题2.全排列问题2.BFS6.数据结构1.并查集2.树状数组3.树
Unity中WolrdSpace下的UI展示在上层程序员也有头发 Unity开发 unity ui 游戏引擎
一、问题描述Unity中Canvas使用WorldSpace布局的UI，想让它不被3d物体遮挡，始终显示在上层。二、解决方案使用shader解决在UI的材质中禁用深度测试（ZTest），强制UI始终渲染在最上层。Shader"Custom/UI_NoDepthTest"{Properties{...}SubShader{Tags{"Queue"="Transparent+1000"//设置高优先级
彻底卸载Visual Studio的工具（官方推荐）中二的小北 visual studio ide
方法一：使用TotalUninstaller工具下载地址：https://github.com/Microsoft/VisualStudioUninstaller/releases1.点击下载地址，选择TotalUninstaller进行下载2.下载后进行解压，选择压缩包中的Setup.ForcedUninstall.exe，双击进入，选择“Y”，进行卸载方法二：官网的卸载方法方法地址：卸载或移除
书法绘画类毕业论文文献都有哪些？六维论文推荐人工智能机器学习大数据数据挖掘编程语言
本文是为大家整理的书法绘画主题相关的10篇毕业论文文献，包括5篇期刊论文和5篇学位论文，为书法绘画选题相关人员撰写毕业论文提供参考。1.[期刊论文]中国唐代书法与西方现代派绘画的异同——以欧阳询和马蒂斯为例期刊：《美与时代（中旬刊）·美术学刊》|2021年第003期摘要：元代赵孟頫提出"书画同源"一词,意为书法和绘画关系密切,二者的产生和发展相辅相成.书法的源头本来就是极简的图像,并且发展成为真正
深入理解信息检索之BM25算法 Lunar* 算法与优化自然语言处理人工智能
1.BM25算法简介BM25算法，全称为"BestMatching25"，是由StephenRobertson和KarenSpärckJones在1990年代初基于早期的概率排名模型（如二元独立检索模型）发展而来。它通过一种概率论的方法来衡量文档与用户查询之间的相关性。2.BM25的核心原理BM25算法的核心在于两个主要的概念：逆文档频率（IDF）和词频（TF）调整。逆文档频率（IDF):IDF用
线路板打样中的PCB拼版技术如何为中小企业节省30%以上成本？捷配科技制造 pcb工艺捷配
线路板打样和批量生产的成本控制对中小企业来说非常关键，本文将解析PCB拼版的五大核心价值，揭示中小企业在SMT贴片环节的降本秘诀。一、破解线路板打样的成本困局中小企业在小批量生产时常面临两难选择：单独加工导致设备利用率低下，而传统拼版方案又存在设计缺陷。二、PCB拼版技术的五大降本优势1.设备利用效率倍增通过二合一或四合一拼版设计，SMT产线单次印刷可完成多板加工。实测数据显示，采用V-CUT拼版
nacos集成网关 hubertbb3 gateway spring cloud
前言，之前写的微服务中，并没有网关来进行控制，任何请求都可以访问到服务，所以，我们通过集成网关的方式，来对发送到我们服务的路由进行管理和控制。第一步，创建一个springboot应用第二步，引入相关依赖org.springframework.cloudspring-cloud-starter-gateway
验证码识别：使用OCR技术识别图形验证码详解数据知道 2025年爬虫和逆向教程 ocr python 爬虫 OCR识别验证码识别图片验证码
文章目录一、基本原理二、所需工具2.1Python环境2.2图像处理库2.3OCR引擎2.4Python接口三、实现步骤3.1获取验证码图像3.2图像预处理3.3使用OCR进行字符识别3.4基本OCR识别样例四、提高识别准确率的方法4.1字符分割4.2使用深度学习模型4.3数据增强4.4集成多个OCR引擎五、实际应用中的注意事项六、总结验证码（CAPTCHA）是一种用于区分人类用户和自动化程序的安
『FFmpeg学习笔记』MAC系统电脑安装FFmpeg以及使用 AI大模型前沿研究大模型笔记 macos ffmpeg M1
MAC系统电脑安装FFmpeg文章目录一.安装FFmpeg1.1.MACbrew安装FFmpeg1.2.MAC官网下载FFmpeg压缩包1.3.Windows安装1.4.Linux安装二.FFmpeg的使用2.1.音频操作2.1.1.如果不转换，直接输出aac2.1.2.将音频输出为wav2.1.3.将aac转换为wav2.1.4.双声道分离2.1.5.使用FFmpeg将音频和视频合并2.2.字幕
「手把手教学」Monorepo项目搭建与管理——实战案例 lifire_H Monorepo 实战前端
Monorepo项目搭建与管理文章目录Monorepo项目搭建与管理@[TOC]实战案例第一部分：Vue组件库搭建1.1创建Vue组件库子包1.2安装Vue相关依赖1.3创建组件示例1.4配置Vite构建实战案例第二部分：创建NestJS后端服务2.1创建NestJS子包2.2安装NestJS核心依赖2.3生成NestJS项目骨架2.4基础服务代码示例2.5配置跨域支持（为前端联调准备）实战案例第
MongoDB在Spring商城用户行为记录中的应用小小初霁 mongodb spring 数据库
一、MongoDB的优势灵活Schema用户行为数据结构多变（如点击、搜索、下单），MongoDB的文档模型无需固定字段，适应快速迭代。高吞吐写入支持批量插入，适合高并发场景（如秒杀活动的用户操作记录）。复杂查询优化支持聚合管道、地理空间查询、全文索引，便于多维分析。水平扩展通过分片（Sharding）应对海量数据存储。二、用户行为数据建模1.基础行为记录集合（如user_actions）{"us
DeepSeek 与其他 AI 模型的对比：优势与特色分析 CarlowZJ 人工智能 DeepSeek
一、引言在众多AI模型中，DeepSeek凭借其独特的功能和优势脱颖而出。本文将对比DeepSeek与其他流行的AI模型，分析它的优势与特色。二、与GPT系列的对比功能多样性：DeepSeek不仅支持文本生成，还支持代码生成和对话交互。多模态能力：DeepSeek支持多种输入和输出形式，如图像和语音。行业适配性：DeepSeek提供了针对不同行业的优化方案。三、与BERT系列的对比生成能力：Dee
DeepSeek选择方向的优势 AIWritePaper官方账号 DeepSeek AIWritePaper ChatGPT 人工智能 deepseek AIWritePaper 机器学习大数据
DeepSeek选择方向的优势在学术研究与论文发表的征程中，DeepSeek凭借其独特的优势，正逐渐成为研究者们不可或缺的得力助手。以下将从多个维度深入剖析DeepSeek选择方向的卓越之处。一、高效的数据处理能力DeepSeek能够迅速处理海量数据，自动识别数据模式，精准定位关键趋势与关联。这一能力使研究者无需耗费大量时间在数据的海洋中苦苦搜寻，从而为论文研究节省宝贵时间，显著提升研究效率。二、
RabbitMQ实战（二）-消息持久化策略、事务以及Confirm消息确认方式 Java思享汇 RabbitMQ学习 RabbitMQ 消息持久化事务 confirm ack
「扫码关注我，面试、各种技术（mysql、zookeeper、微服务、redis、jvm）持续更新中～」RabbitMQ学习列表：RabbitMQ实战（一）-消息通信基本概念·在上一篇学习完RabbitMQ通信的基本概念后，我们来继续学习消息的持久化以及代码实现RabbitMQ通信。在正常生产环境运维过程中无法避免RabbitMQ服务器重启，那么，如果RabbitMQ重启之后，那些队列和交换器就会
用Acceldata数据可观测性方案管理云数据平台Snowflake 茵赛飞3D CAD数据转换软件 Acceldata 大数据云计算大数据数据库数据挖掘
一、云数据平台Snowflake简介在现代数据堆栈的所有部分中，没有一个像云数据平台Snowflake一样迅速崛起。虽然作为Databricks、AmazonRedshift和GoogleBigQuery等云数据库的一部分，云数据平台Snowflake短短十年间凭借易于启动、低运营成本、即时和近乎于无限的可扩展性等优点赢得了6500多家企业客户的信赖并获得了12亿美元的年收入。二、Snowflak
超详细Python教程——SQL详解之DDL 月流霜 python sql 数据库
SQL详解之DDL我们通常可以将SQL分为四类，分别是DDL（数据定义语言）、DML（数据操作语言）、DCL（数据控制语言）和TCL（事务控制语言）。DDL主要用于创建、删除、修改数据库中的对象，比如创建、删除和修改二维表，核心的关键字包括create、drop和alter；DML主要负责数据的插入、删除、更新和查询，关键词包括insert、delete、update和select；DCL用于授予
MySQL索引最左原则：从原理到实战的深度解析
MySQL索引最左原则：从原理到实战的深度解析一、什么是索引最左原则？索引最左原则是MySQL复合索引使用的核心规则，简单来说："当使用复合索引（多列索引）时，查询条件必须从索引的最左列开始，且不能跳过中间的列，否则索引将无法完全生效"为什么会有这个原则？这与B+树索引的存储结构密切相关：复合索引按照定义时的列顺序构建数据先按第一列排序第一列相同的情况下按第二列排序依此类推形成层级结构二、3种典型
南京大学×百度“星河杯”AI大模型创意校园赛正式起航
3月9日，教育部长怀进鹏在十四届全国人大二次会议民生主题记者会上，谈到了人工智能+教育的重要性。他强调，要把人工智能技术深入到教育教学和管理的全过程和全环节，研究其有效性和适应性，让青年一代更加主动地学习，让教师更加创造性地教学。南京大学早在年初就已经敏锐地洞察到了人工智能的重要性，在新学期工作布置会上，发布了一个前瞻性决策：24年9月面向全体本科新生开设“人工智能通识核心课程体系”，南京大学党委
【MySQL】MVCC详解与MVCC实现原理（MySQL专栏启动） 2401_89317296 mysql android 数据库
如果此文还不错的话，还请关注、点赞、收藏三连支持一下博主~本文目录本文导读一、什么是MVCC二、MVCC的实现原理1、MVCC多版本实现2、MVCC实现原理3、什么是ReadView3.1、ReadView解析3.2、ReadView含义3.3、ReadView如何判断版本链可用三、当前读，快照读与MVCC1、什么是当前读和快照读
李彦宏官宣第二届“文心杯”创业大赛，最高投资奖励翻5倍达5000万
4月16日，百度创始人、董事长兼首席执行官李彦宏在Create2024百度AI开发者大会上宣布，第二届“文心杯”创业大赛正式启动，参赛选手有机会获得最高5000万人民币投资。李彦宏在Create2024百度AI开发者大会的演讲主题是“人人都是开发者”，他指出，“AI正在掀起一场创造力革命，未来开发应用就像拍个短视频一样简单，人人都是开发者，人人都是创造者。”李彦宏表示：“去年5月份，百度启动了‘文
ASP.NET CORE MVC EF框架 sanzk ASP.NET CORE EF
1.一个视图中的多个表单Form中的变量。方式一：视图中跨Form变量不能用，得各自定义变量否则编译不能通过。变量名还不能相同。或者方式二：在Form之外定义变量@{ViewData["Title"]="ExpenseForm";}@{Layout=null;}ExpenseFormdiv,table,tr,td{margin:0px;padding:0px;}.myTable{width:60
Android数据存储:SQLite、Room -风になる- Android基础 android
在Android平台上，集成了一个嵌入式关系型数据库—SQLite，SQLite3支持NULL、INTEGER、REAL（浮点数字）、TEXT(字符串文本)和BLOB(二进制对象)数据类型，虽然它支持的类型只有五种，但实际上sqlite3也接受varchar(n)、char(n)、decimal(p,s)等数据类型，只不过在运算或保存时会转成对应的五种数据类型。SQLite最大的特点是你可以把各种
图片加载框架Glide与Picasso原理剖析 Ya-Jun glide android
图片加载框架Glide与Picasso原理剖析一、前言图片加载是Android应用开发中的一个重要环节，良好的图片加载机制可以提升应用性能和用户体验。Glide和Picasso是目前最流行的两个图片加载框架，本文将深入分析这两个框架的核心原理和实现机制。二、图片加载基础2.1图片加载的挑战内存管理OOM（OutOfMemory）问题内存缓存策略图片复用性能优化异步加载图片压缩缓存机制用户体验加载占
LINUX 磁盘和文件系统管理（二）好多知识都想学 linux
LVM管理命令常用的LVM管理命令PV（物理卷）、VG（卷组）、LV（逻辑卷）格式：pvcreate(pvdisplay、pvremove)[分区或磁盘位置]vgcreate[卷组名][物理卷位置][物理卷位置]vgremove[卷组名]vgextend[需要扩展卷组名][物理卷位置]lvcreate-L[容量大小]-n[逻辑卷名][卷组名]lvextend-L[+扩展大小]/dev/卷组名/逻辑
【后端】【django drf】django自动导出优雅的api文档的写法患得患失949 后端系统功能面试考题专栏（前后端）django知识 django sqlite python
DjangoDRFAPI编写规范（包含OpenAPI生成规则）为了确保DjangoDRFAPI代码的可维护性、可扩展性，同时生成清晰、规范、结构层次分明的OpenAPI文档，必须遵循以下规则。一、使用drf-spectacular生成OpenAPI文档（一）安装drf-spectacularpipinstalldrf-spectacular（二）配置settings.pyINSTALLED_APP
【大模型学习】第十五章 Transformer技术看这一篇就足够了好多渔鱼好多 AI大模型 transformer 深度学习 AI 人工智能大模型
目录一、引言二、Transformer起源背景1.从"健忘症"到"过目不忘"的进化之路三、一个简单的例子让你理解什么是Transformer四、技术要点与底层原理1.自注意力机制（Self-Attention）1.1什么是自注意力？1.1.1如何计算查询（Query）、键（Key）和值（Value）：1.1.2缩放点积注意力（ScaledDot-ProductAttention）1.1.3两个生活
Linux C++ 编程死锁详解 PM简读馆 Linux嵌入式驱动开发开发语言 c++linux
作者简介：程序员转项目管理领域优质创作者个人邮箱：[[email protected]]PMP资料导航：PM菜鸟（查阅PMP大纲考点）座右铭：上善若水，水善利万物而不争。绿泡泡：PM简读馆（包含更多PM常用免费资料）目录概要一、死锁的四个必要条件二、常见死锁场景三、代码解释1、资源申请顺序不一致问题描述解决方案2.优先级倒置问题描述解决方案3.线程间循环等待问题描述解决方案4.锁嵌套（LockNe
全球首款通用 AI 智能体 Manus 发布的分析报告 PM简读馆技术杂谈人工智能
一、引言在人工智能领域持续蓬勃发展的进程中，新的技术成果与产品不断涌现，推动着行业的快速变革。全球首款通用AI智能体Manus的发布成为近期备受瞩目的事件，尤其其宣称性能超越OpenAI，更是引发了行业内外的广泛关注与讨论。本报告将围绕Manus展开深入探讨，分析其特点、性能优势、可能带来的影响以及面临的挑战等方面内容。链接：https://manus.im/二、Manus的基本概述（一）发布背景
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

Mahout(二)：相似性度量

你可能感兴趣的:(Mahout(二)：相似性度量)