witsmakemen

FM算法解析及Python实现

转自：https://www.cnblogs.com/wkang/p/9588360.html

什么是FM？
FM即Factor Machine，因子分解机。
为什么需要FM？
1、特征组合是许多机器学习建模过程中遇到的问题，如果对特征直接建模，很有可能会忽略掉特征与特征之间的关联信息，因此，可以通过构建新的交叉特征这一特征组合方式提高模型的效果。

2、高维的稀疏矩阵是实际工程中常见的问题，并直接会导致计算量过大，特征权值更新缓慢。试想一个10000100的表，每一列都有8种元素，经过one-hot独热编码之后，会产生一个10000800的表。因此表中每行元素只有100个值为1，700个值为0。

而FM的优势就在于对这两方面问题的处理。首先是特征组合，通过对两两特征组合，引入交叉项特征，提高模型得分；其次是高维灾难，通过引入隐向量（对参数矩阵进行矩阵分解），完成对特征的参数估计。

FM用在哪？
我们已经知道了FM可以解决特征组合以及高维稀疏矩阵问题，而实际业务场景中，电商、豆瓣等推荐系统的场景是使用最广的领域，打个比方，小王只在豆瓣上浏览过20部电影，而豆瓣上面有20000部电影，如果构建一个基于小王的电影矩阵，毫无疑问，里面将有199980个元素全为0。而类似于这样的问题就可以通过FM来解决。
FM长什么样？
在展示FM算法前，我们先回顾一下最常见的线性表达式：

其中w0 为初始权值，或者理解为偏置项，wi 为每个特征xi 对应的权值。可以看到，这种线性表达式只描述了每个特征与输出的关系。

FM的表达式如下，可观察到，只是在线性表达式后面加入了新的交叉项特征及对应的权值。

FM交叉项的展开
5.1 寻找交叉项
FM表达式的求解核心在于对交叉项的求解。下面是很多人用来求解交叉项的展开式，对于第一次接触FM算法的人来说可能会有疑惑，不知道公式怎么展开的，接下来笔者会手动推导一遍。

设有3个变量（特征）x1 x2 x3，每一个特征的隐变量分别为v1=(1 2 3)、v2=(4 5 6)、v3=(1 2 1)，即：

设交叉项所组成的权矩阵W为对称矩阵，之所以设为对称矩阵是因为对称矩阵有可以用向量乘以向量转置替代的性质。
那么W=VVT，即

所以：

实际上，我们应该考虑的交叉项应该是排除自身组合的项，即对于x1x1、x2x2、x3x3不认为是交叉项，那么真正的交叉项为x1x2、x1x3、x2x1、x2x3、x3x1、x3x2。
去重后，交叉项即x1x2、x1x3、x2x3。这也是公式中1/2出现的原因。

5.2 交叉项权值转换
对交叉项有了基本了解后，下面将进行公式的分解，还是以n=3为例，

所以：

wij可记作，这取决于vi是13 还是31 向量。

5.3 交叉项展开式
上面的例子是对3个特征做的交叉项推导，因此对具有n个特征，FM的交叉项公式就可推广为：

我们还可以进一步分解：

所以FM算法的交叉项最终可展开为：

5.4 隐向量v就是embedding vector?
假设训练数据集dataMatrix的shape为（20000，9)，取其中一行数据作为一条样本i，那么样本i 的shape为（1，9），同时假设隐向量vi的shape为（9，8）（注：8为自定义值，代表embedding vector的长度）

所以5.3小节中的交叉项可以表示为：

sum((inter_1)^2 - (inter_2)^2)/2

其中：

inter_1 = i*v shape为（1，8）

inter_2 = np.multiply(i)*np.multiply(v) shape为（1，8）

可以看到，样本i 经过交叉项中的计算后，得到向量shape为（1，8）的inter_1和 inter_2。

由于维度变低，所以此计算过程可以近似认为在交叉项中对样本i 进行了embedding vector转换。

故，我们需要对之前的理解进行修正：

我们口中的隐向量vi实际上是一个向量组，其形状为（输入特征One-hot后的长度，自定义长度）；
隐向量vi代表的并不是embedding vector，而是在对输入进行embedding vector的向量组，也可理解为是一个权矩阵；
由输入i*vi得到的向量才是真正的embedding vector。
具体可以结合第7节点的代码实现进行理解。

权值求解
利用梯度下降法，通过求损失函数对特征（输入项）的导数计算出梯度，从而更新权值。设m为样本个数，θ为权值。

如果是回归问题，损失函数一般是均方误差（MSE）:

所以回归问题的损失函数对权值的梯度（导数）为：

如果是二分类问题，损失函数一般是logit loss：

其中，表示的是阶跃函数Sigmoid。

所以分类问题的损失函数对权值的梯度（导数）为：

相应的，对于常数项、一次项、交叉项的导数分别为:

FM算法的Python实现
FM算法的Python实现流程图如下：

我们需要注意以下四点：

初始化参数，包括对偏置项权值w0、一次项权值w以及交叉项辅助向量的初始化；
定义FM算法；
损失函数梯度的定义；
利用梯度下降更新参数。

下面的代码片段是以上四点的描述，其中的loss并不是二分类的损失loss，而是分类loss的梯度中的一部分：

loss = self.sigmoid(classLabels[x] * p[0, 0]) -1

实际上，二分类的损失loss的梯度可以表示为：

gradient = (self.sigmoid(classLabels[x] * p[0, 0]) -1)*classLabels[x]*p_derivative

其中 p_derivative 代表常数项、一次项、交叉项的导数（详见本文第6小节）。

FM算法代码片段

复制代码
1 # 初始化参数
2 w = zeros((n, 1)) # 其中n是特征的个数
3 w_0 = 0.
4 v = normalvariate(0, 0.2) * ones((n, k))
5 for it in range(self.iter): # 迭代次数
6 # 对每一个样本，优化
7 for x in range(m):
8 # 这边注意一个数学知识：对应点积的地方通常会有sum，对应位置积的地方通常都没有，详细参见矩阵运算规则，本处计算逻辑在：http://blog.csdn.net/google19890102/article/details/45532745
9 # xi·vi,xi与vi的矩阵点积
10 inter_1 = dataMatrix[x] * v
11 # xi与xi的对应位置乘积与 xi^2与vi2对应位置的乘积的点积
12 inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v) # multiply对应元素相乘
13 # 完成交叉项,xivixivi - xi^2*vi2
14 interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
15 # 计算预测的输出
16 p = w_0 + dataMatrix[x] * w + interaction
17 print(‘classLabels[x]:’,classLabels[x])
18 print(‘预测的输出p:’, p)
19 # 计算sigmoid(ypred_y)-1准确的说不是loss，原作者这边理解的有问题，只是作为更新w的中间参数，这边算出来的是越大越好，而下面却用了梯度下降而不是梯度上升的算法在
20 loss = self.sigmoid(classLabels[x] * p[0, 0]) - 1
21 if loss >= -1:
22 loss_res = '正方向 ’
23 else:
24 loss_res = ‘反方向’
25 # 更新参数
26 w_0 = w_0 - self.alpha * loss * classLabels[x]
27 for i in range(n):
28 if dataMatrix[x, i] != 0:
29 w[i, 0] = w[i, 0] - self.alpha * loss * classLabels[x] * dataMatrix[x, i]
30 for j in range(k):
31 v[i, j] = v[i, j] - self.alpha * loss * classLabels[x] * (
32 dataMatrix[x, i] * inter_1[0, j] - v[i, j] * dataMatrix[x, i] * dataMatrix[x, i])
复制代码

FM算法完整实现

复制代码
1 # -- coding: utf-8 --
2
3 from future import division
4 from math import exp
5 from numpy import *
6 from random import normalvariate # 正态分布
7 from sklearn import preprocessing
8 import numpy as np
9
10 ‘’’
11 data : 数据的路径
12 feature_potenital : 潜在分解维度数
13 alpha ：学习速率
14 iter ：迭代次数
15 _w,_w_0,_v ：拆分子矩阵的weight
16 with_col : 是否带有columns_name
17 first_col : 首列有价值的feature的index
18 ‘’’
19
20
21 class fm(object):
22 def init(self):
23 self.data = None
24 self.feature_potential = None
25 self.alpha = None
26 self.iter = None
27 self._w = None
28 self._w_0 = None
29 self.v = None
30 self.with_col = None
31 self.first_col = None
32
33 def min_max(self, data):
34 self.data = data
35 min_max_scaler = preprocessing.MinMaxScaler()
36 return min_max_scaler.fit_transform(self.data)
37
38 def loadDataSet(self, data, with_col=True, first_col=2):
39 # 我就是闲的蛋疼，明明pd.read_table()可以直接度，非要搞这样的，显得代码很长，小数据下完全可以直接读嘛，唉～
40 self.first_col = first_col
41 dataMat = []
42 labelMat = []
43 fr = open(data)
44 self.with_col = with_col
45 if self.with_col:
46 N = 0
47 for line in fr.readlines():
48 # N=1时干掉列表名
49 if N > 0:
50 currLine = line.strip().split()
51 lineArr = []
52 featureNum = len(currLine)
53 for i in range(self.first_col, featureNum):
54 lineArr.append(float(currLine[i]))
55 dataMat.append(lineArr)
56 labelMat.append(float(currLine[1]) * 2 - 1)
57 N = N + 1
58 else:
59 for line in fr.readlines():
60 currLine = line.strip().split()
61 lineArr = []
62 featureNum = len(currLine)
63 for i in range(2, featureNum):
64 lineArr.append(float(currLine[i]))
65 dataMat.append(lineArr)
66 labelMat.append(float(currLine[1]) * 2 - 1)
67 return mat(self.min_max(dataMat)), labelMat
68
69 def sigmoid(self, inx):
70 # return 1.0/(1+exp(min(max(-inx,-10),10)))
71 return 1.0 / (1 + exp(-inx))
72
73 # 得到对应的特征weight的矩阵
74 def fit(self, data, feature_potential=8, alpha=0.01, iter=100):
75 # alpha是学习速率
76 self.alpha = alpha
77 self.feature_potential = feature_potential
78 self.iter = iter
79 # dataMatrix用的是mat, classLabels是列表
80 dataMatrix, classLabels = self.loadDataSet(data)
81 print(‘dataMatrix:’,dataMatrix.shape)
82 print(‘classLabels:’,classLabels)
83 k = self.feature_potential
84 m, n = shape(dataMatrix)
85 # 初始化参数
86 w = zeros((n, 1)) # 其中n是特征的个数
87 w_0 = 0.
88 v = normalvariate(0, 0.2) * ones((n, k))
89 for it in range(self.iter): # 迭代次数
90 # 对每一个样本，优化
91 for x in range(m):
92 # 这边注意一个数学知识：对应点积的地方通常会有sum，对应位置积的地方通常都没有，详细参见矩阵运算规则，本处计算逻辑在：http://blog.csdn.net/google19890102/article/details/45532745
93 # xi·vi,xi与vi的矩阵点积
94 inter_1 = dataMatrix[x] * v
95 # xi与xi的对应位置乘积与 xi^2与vi2对应位置的乘积的点积
96 inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v) # multiply对应元素相乘
97 # 完成交叉项,xivixivi - xi^2*vi2
98 interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
99 # 计算预测的输出
100 p = w_0 + dataMatrix[x] * w + interaction
101 print(‘classLabels[x]:’,classLabels[x])
102 print(‘预测的输出p:’, p)
103 # 计算sigmoid(ypred_y)-1
104 loss = self.sigmoid(classLabels[x] * p[0, 0]) - 1
105 if loss >= -1:
106 loss_res = '正方向 ’
107 else:
108 loss_res = ‘反方向’
109 # 更新参数
110 w_0 = w_0 - self.alpha * loss * classLabels[x]
111 for i in range(n):
112 if dataMatrix[x, i] != 0:
113 w[i, 0] = w[i, 0] - self.alpha * loss * classLabels[x] * dataMatrix[x, i]
114 for j in range(k):
115 v[i, j] = v[i, j] - self.alpha * loss * classLabels[x] * (
116 dataMatrix[x, i] * inter_1[0, j] - v[i, j] * dataMatrix[x, i] * dataMatrix[x, i])
117 print(‘the no %s times, the loss arrach %s’ % (it, loss_res))
118 self._w_0, self._w, self._v = w_0, w, v
119
120 def predict(self, X):
121 if (self._w_0 == None) or (self._w == None).any() or (self._v == None).any():
122 raise NotFittedError(“Estimator not fitted, call fit first”)
123 # 类型检查
124 if isinstance(X, np.ndarray):
125 pass
126 else:
127 try:
128 X = np.array(X)
129 except:
130 raise TypeError(“numpy.ndarray required for X”)
131 w_0 = self._w_0
132 w = self._w
133 v = self._v
134 m, n = shape(X)
135 result = []
136 for x in range(m):
137 inter_1 = mat(X[x]) * v
138 inter_2 = mat(multiply(X[x], X[x])) * multiply(v, v) # multiply对应元素相乘
139 # 完成交叉项
140 interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
141 p = w_0 + X[x] * w + interaction # 计算预测的输出
142 pre = self.sigmoid(p[0, 0])
143 result.append(pre)
144 return result
145
146 def getAccuracy(self, data):
147 dataMatrix, classLabels = self.loadDataSet(data)
148 w_0 = self._w_0
149 w = self._w
150 v = self._v
151 m, n = shape(dataMatrix)
152 allItem = 0
153 error = 0
154 result = []
155 for x in range(m):
156 allItem += 1
157 inter_1 = dataMatrix[x] * v
158 inter_2 = multiply(dataMatrix[x], dataMatrix[x]) * multiply(v, v) # multiply对应元素相乘
159 # 完成交叉项
160 interaction = sum(multiply(inter_1, inter_1) - inter_2) / 2.
161 p = w_0 + dataMatrix[x] * w + interaction # 计算预测的输出
162 pre = self.sigmoid(p[0, 0])
163 result.append(pre)
164 if pre < 0.5 and classLabels[x] == 1.0:
165 error += 1
166 elif pre >= 0.5 and classLabels[x] == -1.0:
167 error += 1
168 else:
169 continue
170 # print(result)
171 value = 1 - float(error) / allItem
172 return value
173
174
175 class NotFittedError(Exception):
176 “”"
177 Exception class to raise if estimator is used before fitting
178 “”"
179 pass
180
181
182 if name == ‘main’:
183 fm()
复制代码

Day_1 数据结构与算法&LeetCode入门及攻略 Finger-Von-Frings c++leetcode
数据结构与算法学习目的：我们学习算法和数据结构，是为了学会在编程中从时间复杂度、空间复杂度方面考虑解决方案，训练自己的逻辑思维，从而写出高质量的代码，以此提升自己的编程技能，获取更高的工作回报。数据结构定义：数据结构(DataStructure)指的是带有结构特性的数据元素的集合。学习的目的：为了帮助我们了解和掌握计算机中的数据是以何种方式进行组织、存储的。Q1：何为结构特性？所谓结构特性，指的是
LeetCode 热题 HOT 100 Dong雨力扣hot100 leetcode 算法
点个关注，不迷路！(╯▽╰)好香~~在学习过程中，借助一些优秀的工具可以极大地提升我们的学习效率。例如，使用LeetCode插件，它能够帮助你显示力扣周赛难度分数，让你更好地了解题目的难度，从而合理安排学习计划。算法学习路线推荐基础夯实：先过B站“灵茶山艾府”的“基础算法精讲”专栏，完成每一栏简介里的习题。每日精进：坚持每日一题，保持对算法的敏感度。系统提升：依次完成力扣Hot100、力扣150、
java搜索DFS BFS 剪枝记忆化搜索相关例题算法学习笔记（持续更新中） ddb酱 java 学习笔记
目录DFSP1706全排列问题P1596连接水池的数量P1036[NOIP2002普及组]选数P1219[USACO1.5]八皇后CheckerChallengeP2392kkksc03考前临时抱佛脚P2036[COCI2008-2009#2]PERKETP1605迷宫P1101单词方阵，以后再做，看别人的题解做的P2404自然数的拆分问题，以后在做BFSP1443马的遍历P1596连接水池的数量
好用的算法推荐工具全解析 CodeJourney. 算法
一、引言在当今数字化时代，算法广泛应用于各个领域，从搜索引擎优化到金融风险预测，从图像识别到自然语言处理。对于算法学习者、研究者以及开发者而言，合适的算法推荐工具至关重要。它们不仅能帮助理解算法原理，还能在实际应用中提供高效的解决方案。接下来，我们将详细介绍多种好用的算法推荐工具。二、算法可视化工具（一）VisuAlgo功能特点-动态演示：VisuAlgo能够以动态的方式展示各类算法的执行过程。例
c语言输入两个字符串按字典数序比较大小,算法学习笔记（一）C++排序函数、映射技巧与字典树... Nature自然科研 c语言输入两个字符串按字典数序比较大小
1.头文件algorithm中有函数sort()用于排序，参数为：排序起始地址，排序结束地址，排序规则(返回bool型)例如，要将array[]={5,7,1,2,9}升序排列，则使用：boolcmp(inta,intb);intmain(){intarray[]={5,7,1,2,9};sort(array,array+5,cmp);for(inti=0;icoutb)returnfalse;e
推荐算法学习记录2.2——kaggle数据集的动漫电影数据集推荐算法实践——基于内容的推荐算法、协同过滤推荐萱仔学习自我记录推荐算法学习 python matplotlib 开发语言
1、基于内容的推荐：这种方法根据项的相关信息（如描述信息、标签等）和用户对项的操作行为（如评论、收藏、点赞等）来构建推荐算法模型。它可以直接利用物品的内容特征进行推荐，适用于内容较为丰富的场景。‌#1.基于内容的推荐算法fromsklearn.feature_extraction.textimportTfidfVectorizerfromsklearn.metrics.pairwiseimport
邓俊辉数据结构与算法学习笔记-第五章 xiaodidadada 数据结构与算法
文章目录树aa1树a2应用a3有根树a4有序树a5路径a6连通图无环图a7深度层次b在计算机中表示b1树的表示b2父节点b3孩子节点b4父亲孩子表示法b5长子兄弟表示法c二叉树c1二叉树概述c2真二叉树c3描述多叉树d二叉树d1BinNode类d2BinNode接口d3BinTree类d4高度更新d5节点插入e相关算法e1-1先序遍历转化策略e1-2遍历规则e1-3递归实现e1-4迭代实现e1-5
2024.8.14-算法学习（原创+转载）蓝纹绿茶算法学习人工智能
一、投机采样图源自投机采样推理原理-66Ring'sBlog投机采样（SpeculativeDecoding）是Google和DeepMind在2022年同时发现的大模型推理加速方法。它可以在不损失生成效果前提下，获得3x以上的加速比。大型语言模型（LLM）的推理通常需要使用自回归采样。它们的推理过程相当缓慢，需要逐个token地进行串行解码。生成每个标记都需要将所有参数从存储单元传输到计算单元，
算法学习-2024.8.16 蓝纹绿茶学习
一、Tensorrt学习补充TensorRT支持INT8和FP16的计算。深度学习网络在训练时，通常使用32位或16位数据。TensorRT则在网络的推理时选用不这么高的精度，达到加速推断的目的。TensorRT对于网络结构进行了重构，把一些能够合并的运算合并在了一起，针对GPU的特性做了优化。一个深度学习模型，在没有优化的情况下，比如一个卷积层、一个偏置层和一个reload层，这三层是需要调用三
算法学习每日一题数位不同的组合故里算法学习
Problem:3153.所有数对中数位不同之和思路本题关键在于如何处理数位不同的个数，其实就是组合问题，两个不同数字的不同数位只能算一对，所以我们不妨把后方元素与前方元素数位不同算作一对，保持单调性避免重复计数。那么后方元素不同的数位应该如何统计呢，我们不妨使用哈希表，一维表示统计的数位位数，二维表示数位0~9。某一数位位数下数位与前方元素不同的个数，就是当前遍历到的所有元素数目-该数位相同的元
算法学习笔记-复杂度分析上胖琪的升级之路
如何分析、统计算法的执行效率和资源消耗为什么需要复杂度分析首先我们很多程序都可以通过统计，监控等方式帮助我们得到程序执行的时间与占用的内存大小。但是这些统计方法有很大的局限性。测试结果非常依赖测试环境。不同的测试机器，同样的代码执行效率就不同。测试结果数受数据规模的影响很大。数据规模大，我们的代码执行效率低。测试结果不能真正的反应我们的内容大O复杂度表示法我们假设一行代码执行一次的时间是unit_
粒子群优化算法和强化算法的优缺点对比，以表格方式进行展示。详细解释资源存储库笔记笔记
粒子群优化算法（PSO）和强化学习算法（RL）是两种常用的优化和学习方法。以下是它们的优缺点对比，以表格的形式展示：特性粒子群优化算法（PSO）强化学习算法（RL）算法类型优化算法学习算法主要用途全局优化问题，寻找最优解学习和决策问题，优化策略以最大化长期奖励计算复杂度较低，通常不需要梯度信息；计算复杂度与粒子数量和迭代次数有关较高，涉及到策略网络的训练和环境交互；复杂度取决于状态空间、动作空间以
算法学习6——贪心算法零度° 算法学习算法学习贪心算法
什么是贪心算法？贪心算法是一种在每一步选择中都采取当前状态下最优或最有利的选择的算法。其核心思想是通过一系列局部最优选择来达到全局最优解。贪心算法广泛应用于各种优化问题，如最短路径、最小生成树、背包问题等。贪心算法的特点局部最优选择：每一步都做出在当前情况下最优的选择。无后效性：一旦某个状态被确定，就不会再被改变或回溯。逐步构造解决方案：通过一系列的选择逐步构建出最终的解决方案。经典例子及其Pyt
代码随想录算法训练营第三十五天| 121. 买卖股票的最佳时机，122.买卖股票的最佳时机II，123.买卖股票的最佳时机III 无敌的平衡步兵算法打卡算法数据结构动态规划贪心算法 leetcode
今天是动态规划算法学习的第八天，也是买卖股票的一天。涉及到了使用多维数组来表示不同的状态，然后进行状态转移。121.买卖股票的最佳时机题目链接：121.买卖股票的最佳时机-力扣（LeetCode）这个题目是给出一个数组表示股票每天的价格，只能进行一次股票的买卖。求解所能获得的最大利润。我自己的做法是用前缀和，求每个数右边最大的数，然后求最大的差值。具体代码如下所示：classSolution{pu
代码随想录算法训练营第二十一天| 39. 组合总和, 40.组合总和II, 131.分割回文串无敌的平衡步兵算法打卡算法数据结构 leetcode 职场和发展剪枝
今天是回溯算法学习的第二天，主要的学习内容包括：1.组合问题的重复使用2.组合问题的去重3.分割问题的处理方法。39.组合总和题目链接：39.组合总和-力扣（LeetCode）这个组合问题的特点是，集合内的元素可以重复使用。与前面组合问题的区别在于，在每一次回溯中，不是从i+1的位置开始穷举，而是从i开始穷举。这样就满足元素重复使用的要求。对于剪枝操作，这个题的做法是如果求和的结果已经大于目标值，
算法学习07：KMP算法 Lhz326568 学习打卡算法学习笔记 c++开发语言
算法学习07：KMP算法文章目录算法学习07：KMP算法前言一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码总结前言提示：以下是本篇文章正文内容：一、KMP算法1.kmp匹配过程：2.求解next数组（kmp算法重点）3.代码#includeusingnamespacestd;constintN=10000+10,m=100000+10;intn,m;intp[N]
c++算法学习，力扣刷题笔记黒№ c++算法
c++算法学习，力扣刷题笔记目录c++算法学习，力扣刷题笔记新手村1480.一维数组的动态和1480.一维数组的动态和C++中的位运算符例子更多位运算用法具体示例1672.最富有客户的资产总量新手村力扣新手村题目及解析，我的疑问和解答1480.一维数组的动态和题目给你一个数组nums。数组「动态和」的计算公式为：runningSum[i]=sum(nums[0]…nums[i])。请返回nums的
不错链接整理 xushuanglu_csdn 提升学习开源
不错链接整理算法https://github.com/MisterBooo/LeetCodeAnimation手把手撕LeetCode题目，扒各种算法套路的裤子https://github.com/labuladong/fucking-algorithm算法学习笔记https://github.com/nonstriater/Learn-Algorithms常用数据结构及其算法的Java实现，包括
【Java】零基础蓝桥杯算法学习——二分查找 xioaobai_huan 蓝桥杯算法入门学习算法 java 蓝桥杯
算法模板一://数组arr的区间[0,left-1]满足arr[i]=k;Scannerscan=newScanner(System.in);int[]arr={1,2,3,4,5};intleft=0,right=arr.length-1;intk=scan.nextInt();while(left=k)right=mid;elseleft=mid+1;}算法模板二：//数组arr的区间[0,l
【Java】零基础蓝桥杯算法学习——动态规划例题 xioaobai_huan 蓝桥杯算法入门学习算法 java 蓝桥杯
例题：2023年第十四届蓝桥杯Java软件开发B组E题蜗牛参考解答：参考代码示例：importjava.util.Scanner;publicclassMain{staticintN=100010;staticint[]arr=newint[N];staticint[]a=newint[N];//传送带的起始坐标staticint[]b=newint[N];//第i-1根杆子的传送带的坐标stat
【Java】零基础蓝桥杯算法学习——线性动态规划（一维dp） xioaobai_huan 蓝桥杯算法入门学习算法蓝桥杯学习 java
线性dp——一维动态规划1、考虑最后一步可以由哪些状态得到，推出转移方程2、考虑当前状态与哪些参数有关系，定义几维数组来表示当前状态3、计算时间复杂度，判断是否需要进行优化。一维动态规划例题：最大上升子序列问题Java参考代码：importjava.util.Scanner;publicclassMain{publicstaticvoidmain(String[]args){Scannerscan
算法学习|Day17-二叉树|Leetcode110.平衡二叉树，Leetcode257. 二叉树的所有路径，Leetcode404.左叶子之和 ambitious_Rgr 算法 python 数据结构 leetcode 广度优先深度优先学习
目录一、Leetcode110.平衡二叉树题目描述解题思路方法:递归总结二、Leetcode257.二叉树的所有路径题目描述解题思路方法:递归总结三、Leetcode404.左叶子之和题目描述解题思路方法一:递归方法二:层序遍历总结一、Leetcode110.平衡二叉树题目描述给定一个二叉树，判断它是否是高度平衡的二叉树。本题中，一棵高度平衡二叉树定义为：一个二叉树每个节点的左右两个子树的高度差的
数据结构与算法学习笔记（训练营三）-经典面试四剑侠李逍遥
给你一个字符串类型的数组arr，譬如:String[]arr={"b\st","d\","a\d\e","a\b\c"};把这些路径中蕴含的目录结构给打印出来，子目录直接列在父目录下面，并比父目录向右进两格，就像这样:abcdebcstd同一级的需要按字母顺序排列不能乱。利用前缀树，让后深度优先遍历/***给你一个字符串类型的数组arr，譬如:*String[]arr={"b\st","d\","
机器学习-近邻KNN算法学习笔记不会敲代码的陈序员机器学习算法人工智能
目录一、算法定义KNN算法性能：欠拟合和过拟合KNN算法优缺点二、算法原理算法通俗解释算法的公式欧氏距离曼哈顿距离三、算法实现与应用模型搭建思路KNN算法模型源码代码运行效果图四、总结一、算法定义K最近邻（K-NearestNeighbors，KNN）算法是一种用于分类和回归的监督学习算法。KNN算法的主要思想可以简单概括如下：训练阶段：在训练阶段，KNN算法将所有的训练样本和它们对应的标签存储在
算法学习笔记 4-3 深搜（DFS）与广搜（BFS）：初识问题状态空间与 LeetCode真题（Java）小成同学_ 数据结构与算法算法 leetcode dfs bfs java
喜欢该类型文章可以给博主点个关注，博主会持续输出此类型的文章，知识点很全面，再加上LeetCode的真题练习，每一个LeetCode题解我都写了详细注释，比较适合新手入门数据结构与算法，后续也会更新进阶的文章。课件参考—开课吧《门徒计划》4-3深搜（DFS）与广搜（BFS）：初识问题状态空间搜索的核心概念首先给大家拓展一个概念，这个概念就是我们学习搜索算法中非常重要的一环：这个问题求解树是一个抽象
算法学习：双指针进阶之滑动窗口算法 2301_76884895 算法 leetcode 数据结构
文章目录一、认识滑动窗口算法二、算法运用1.最小覆盖子串2.字符串排列3.找所有字母异位词4.最长无重复字串总结一、认识滑动窗口算法本文讲的滑动窗口算法基于前面的基本的双指针技巧。在滑动窗口算法中，可以使用左右指针来记录窗口的左右边界，以及使用快慢指针来同时从两端向中间遍历数据流，从而加速算法的执行效率。滑动窗口算法的核心在于通过维护一个窗口来记录满足条件的数据，并在窗口移动的过程中更新窗口记录的
算法学习——LeetCode力扣贪心篇1 拉依达不拉胯算法学习 leetcode c++c语言
算法学习——LeetCode力扣贪心篇1455.分发饼干455.分发饼干-力扣（LeetCode）描述假设你是一位很棒的家长，想要给你的孩子们一些小饼干。但是，每个孩子最多只能给一块饼干。对每个孩子i，都有一个胃口值g[i]，这是能让孩子们满足胃口的饼干的最小尺寸；并且每块饼干j，都有一个尺寸s[j]。如果s[j]>=g[i]，我们可以将这个饼干j分配给孩子i，这个孩子会得到满足。你的目标是尽可能
2.7数据结构与算法学习日记（动态规划01背包和并查集）祺580 学习动态规划算法
题目描述辰辰是个天资聪颖的孩子，他的梦想是成为世界上最伟大的医师。为此，他想拜附近最有威望的医师为师。医师为了判断他的资质，给他出了一个难题。医师把他带到一个到处都是草药的山洞里对他说：“孩子，这个山洞里有一些不同的草药，采每一株都需要一些时间，每一株也有它自身的价值。我会给你一段时间，在这段时间里，你可以采到一些草药。如果你是一个聪明的孩子，你应该可以让采到的草药的总价值最大。”如果你是辰辰，你
2.8数据结构与算法学习日记（bfs和01背包和完全背包）祺580 学习
P8673[蓝桥杯2018国C]迷宫与陷阱题目描述小明在玩一款迷宫游戏，在游戏中他要控制自己的角色离开一间由N×N个格子组成的二维迷宫。小明的起始位置在左上角，他需要到达右下角的格子才能离开迷宫。每一步，他可以移动到上下左右相邻的格子中（前提是目标格子可以经过）。迷宫中有些格子小明可以经过，我们用.表示；有些格子是墙壁，小明不能经过，我们用#表示。此外，有些格子上有陷阱，我们用X表示。除非小明处于
2.14数据结构与算法学习日记祺580 学习算法
洛谷P1934封印题目背景很久以前，魔界大旱，水井全部干涸，温度也越来越高。为了拯救居民，夜叉族国王龙溟希望能打破神魔之井，进入人界“窃取”水灵珠，以修复大地水脉。可是六界之间皆有封印，神魔之井的封印由蜀山控制，并施有封印。龙溟作为魔界王族，习有穿行之术，可任意穿行至任何留有空隙的位置。然而封印不留有任何空隙！龙溟无奈之下只能强行破除封印。破除封印必然消耗一定的元气。为了寻找水灵珠，龙溟必须减少体
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少

FM算法解析及Python实现

你可能感兴趣的:(算法学习)