Coding~Man

推荐系统_各种方法的损失计算过程

如何构造一个更好的语义特征向量是各个推荐算法的核心。

除了用户购买商品的记录文件，我们还有两类文件，即用户属性文件（性别，年龄，职业等），商品属性文件（发行日期，种类等），一个商品属性中的种类可以有多个值，即商品及属于这一种类也属于另一种类。

1:BPR
最基本的推荐算法是基于朴素贝叶斯思想（BPR）的协同过滤算法，在这个算法里面用到两种数据，即用户和购买商品矩阵。根据每个用户及其购买的商品，我们可以构造正样本，即用户购买过的商品为正样本，用户未购买的样本为负样本。
首先将用户（944维）和商品（1683维）（都为整型）用nn.embeddind()模块表示成向量（94464，168364）。只有通过转换成高维的向量，这样才能更好的拥有语义信息，通过计算损失，反向传播，不断更新其中的语义信息。
如何构建负样本？在这里我们为每一个正样本构建一个负样本，即每一个用户和其购买的一个商品构成正样本，那么这个用户和其未购买的商品就构成了负样本。在这里，我们首先将每个用户购买的所有的商品聚集到一起，这样我们就得到了944个集合，每个集合代表的是用户所购买的所有商品。之后我们采用批量采样的模型，每次采样2048个。在这2048个样本中包括用户ID以及其对应的正样本，之后我们根据用户ID集合拷贝一份，对每个ID进行负采样，首先随机生成2048个从1到1683之间的数字，然后打乱顺序。这些生成的数字暂时假定为“负样本”，我们根据数组ID以此判断所生成的“负样本”是否合法，对于每个用户ID我们判断生成的“负样本”是否在正样本集合中，如果在正样本集合中，我们保存用户ID所对应的数组ID，统计数量，对于这些在正样本集合的“负样本”，我们在随机生成一批次。重复上面过程，只到统计数量为0。表明所有生成的负样本符合条件。
通过上面的操作我们就得到了2048条数据，每条数据包括用户ID,正商品ID,负商品ID。我们将用户ID正商品ID,就得到了正样本评分，我们将用户ID负商品ID,就得到了负样本评分。我们将正样本评分和负样本评分放入BPRLoss()函数中，BPRLoss()函数工作原理，正样本评分-负样本评分，然后取sigmoid，之后取log，然后再取均值，然后再去负号。这样就得到了损失，之后我们将损失方向传播，利用优化器，就完成了一次参数的更新。这样我们经过N次批次操作将所有训练数据训练完成，参数也更新完成。

2:XdeepFM
根据用到的数据类别不同，我们可以将用到用户购买商品的记录文件，用户属性文件，商品属性文件的推荐算法记为XdeepFM, 此算法也是因子分解机算法。

对于上面的三个文件，数据分为三类，整型，浮点型，和序列型。
对于整型数据可以直接利用nn.embedding()变成64维度,可以对应行号索引，对于序列型，比如电影种类，如何进行embedding(), 首先我们获取每个商品的种类，取最大种类为每个商品种类的长度，将种类长度不足的商品padding成最大种类的商品长度，以方便下面的计算。之后我们我们创造一个masking矩阵，矩阵的长为最大商品种类数量，宽为商品数。之后我们将总的商品种类embedding（）成64维。根据每个商品所对应的种类，获取embedding()后的向量，然后将这个向量和masking向量相乘。之后在对相乘之后的向量相加求均值，最大值，最小值，总和。这样我们就表示出了序列型所对应的embedding()。对于浮点型数据，比如时间戳，一个批次2048个，我们先同时初始化相同的64位矩阵，即这2048个时间戳表示的一样，我们拿初始化后的时间戳乘上原始的时间戳即可得到表征后的时间戳。

xDeepFM的数据输入：
xdeepfm_input = torch.Size([2048, 8, 10])
8代表着种属性，10表示每种属性表示成10维度。

框架介绍：

对于XDeepFM系统
主要分为3个部分
1:Linear层
将经过变换的input数据经过线性层输出，
Linear(in_features=200, out_features=1, bias=False)
线性层的结构：y= W*x + b;
输出为（2048，1）
2:DNN层
[80, 128, 128, 128, 1]
输入是80维度，经过三层MPL输出1维。
首先对80的输入进行dropout，然后输入变为128维度的输出进行relu().relu()函数表达式为Y(x) = Max(0,x)。使得输出的128维度的值都大于等于0。之后对128维的输入进行dropout，然后输入变为128维度的输出进行relu().relu()函数表达式为Y(x) = Max(0,x)。使得输出的128维度的值都大于等于0。之后对128维的输入进行dropout，然后输入变为128维度的输出进行relu().relu()函数表达式为Y(x) = Max(0,x)。使得输出的128维度的值都大于等于0。之后对128维的输入进行dropout，然后输入变为1维度的输出。输出为（2048，1）
3:CIN层
CIN层是压缩交互网络，是结合了RNN和CNN思想。
首先CIN网络是self.cin_layer_size =[100, 100, 100]三层。
数据的输入是xdeepfm_input=[2048, 8, 10]即：2048批次数据，每一个数据[8,10]维度。

输出特征的通道数等于卷积核的个数，卷积核的通道数等于输入数据的通道数，即卷积核的通道数等于10。
第一个Conv1d，输入是88=64通道，输出100通道。即我们用100个卷积核每个卷积核的通道数为64的卷积。输出的100通道被spilt()成resualt=50通道，nextinput = 50通道，
第二个Conv1d，输入通道是850通道（上一次的输入），输出是100通道，即我们用100个卷积核每个卷积核的通道数为400的卷积。输出的100通道被spilt()成resualt=50通道，nextinput = 50通道，
第二个Conv1d，输入通道是8*100/2，输出是100通道，即我们用100个卷积核每个卷积核的通道数为400的卷积。输出的100通道成resualt=100通道。
之后将三次的输出50，50，100通道cat()起来变成200通道。
对整个批次的输出（2048，200）接一个线性层输入是2048通道，输出是1。结果变成（2048，1）

之后将3次的输出结果（2048，1），（2048，1），（2048，1）对应相加。变成（2048，1），之后对值取sigmord()使得取值变为（0～1）之间。现在求出来2048批次数据所对应的得分。

损失计算
首先我们对三部分模型参数值进行L2正则，算出所有的模型参数的损失即为L2Loss。之后根据2048批次得分和2048批次标签值算出BCELoss()损失。BCELoss()+W*L2Loss()即为总的损失。

3:LightGCN
根据用户购买商品的记录文件，以及轻量级的图卷积神经网络(GCN)，该推荐算法记录为LightGCN，根据图卷积网络知识将用户和商品信息嵌入到语义特征向量中。
LightGCN用到的数据如下所示：

用torch.nn.Embedding(num_embeddings=self.n_users, embedding_dim=self.latent_dim)方式随机初始化user和item 矩阵（944,64）和（1683，64）。之后用cat函数将数据cat到一起结果为all_embeddings。之后利用torch.sparse.mm(self.norm_adj_matrix, all_embeddings)方式将带图关系的embedding的self.norm_adj_matrix（[2627, 2627]）和all_embeddings向结合，以使得all_embeddings带有图的更好的语义向量信息。设置n_layer为2即我们需要将self.norm_adj_matrix和all_embeddings乘三次，每次获取乘操作后的all_embeddings，将all_embeddings进行append()到list中，然后用这次的all_embeddings再进行和self.norm_adj_matrix相乘的操作，重复3次，使得list的长度为3,之后对这个list进行torch.stack(embeddings_list, dim=1)操作，使得结果为torch.Size([2627, 3, 64])的形式。之后对其进行下面的操作，在1维度上进行求均值。结果输出为：[2627, 64]。即我们最后获取了嵌入了图语义信息的向量。

之后我们对其求BPRloss()即将正样本和负样本分别成商品，然后将得分放入到BPR损失函数中，求出损失。求reg_loss()损失，self.reg_loss(u_ego_embeddings, pos_ego_embeddings, neg_ego_embeddings) 对参数求regularation 损失。之后将上面两种损失加权求和即为kg_calculate_loss。

4:RippleNet
根据用户购买商品的记录文件，知识图谱文件，以及链接文件，该算法记录为RippleNet。
RippleNet用到的数据如下所示：

每次传入2048个用户，我们根据self.ripple_set()分别获取用户所对应的两级关系，关系包括第一层（头memories_h[0]，关系memories_r[0]，尾memories_t[0]）和第二层（头memories_h[1]，关系memories_r[1]，尾memories_t[1]）。之后分别将这两层进行embedding。结果为：h_emb_list为2*[32768, 64]。r_emb_list为2*[32768, 64]，t_emb_list为2*[32768, 64]。

5:KGAT
根据用户购买商品的记录文件，知识图谱文件，链接文件，以及图卷积神经网络，该算法记录为KGAT。

用ego_embeddings = nn.Embedding(self.n_users, self.embedding_size)方式获取随机初始化的矩阵，将获取的矩阵ego_embeddings传入aggregator(self.A_in, ego_embeddings)，获取输出 ego_embeddings1，然后将获取的输出进行normalize，传入F.normalize(ego_embeddings, p=2, dim=1)。将进行完正则化的数据进行输出user_all_embeddings, entity_all_embeddings。这个过程相当于对数据加上了可以学习的W。

数据主要用到知识图谱文件，购买商品的记录文件。
对于calculate_loss 用到购买商品的记录文件，但是嵌入embedding的时候用到了kg。

之后我们根据user_id,item_id,neg_item_id以及含有知识图谱信息的user_all_embeddings, entity_all_embeddings获取对应的语义向量。
之后根据u_embeddings，pos_embeddings，neg_embeddings进行lose计算。一个损失是BPR()损失，另一个为regularization正则化损失。之后将两者损失加权相加。便得到了calculate_loss。

对于kg_calculate_loss 用到知识图谱文件,并且用到了attention机制。

如何获取更好的特征向量。
首先我们将 h_e，pos_t_e，neg_t_e添加一个维度unsqueeze(1)。利用self.trans_w®.view(r.size(0), self.embedding_size, self.kg_embedding_size)获取r_e的特征向量torch.Size([2048, 64, 64])。这一步有点attention的意思，及在r_e特征维度中中加入了attention机制。之后用torch.bmm(h_e, r_trans_w).squeeze() 方式分别获取嵌入了关系特征的语义特征向量。即h_e，pos_t_e，neg_t_e，r_e。之后计算正负样本的得分，即pos_tail_score= (h_e + r_e - pos_t_e) ** 2，neg_tail_score = (h_e + r_e - neg_t_e) ** 2。之后对正负样本得分求softpuls()损失。softpuls()函数为：

之后再对参数求regularation 损失。之后将上面两种损失加权求和即为kg_calculate_loss。

6:GRU
根据用户购买商品的记录文件，加入序列模型RNN,即（GRU），该算法记录为GRU。序列模型还有一个好处，不需要用户的信息，即不需要用户属性文件，以及用户ID。之与用户的行为有关，比如用户浏览，收藏，某个文章，我们可以在规定的时间内收藏用户的相关的文件。根据相同的行为推荐相关的产品。
GRU模型用到用户购买商品的记录文件。

item_seq_len=50，即在一定的时间内每一个用户购买了50个商品，对于用户数不足的padding成50个，对于用户购买超过50个的取出前50个。这样我们便得到item_seq，形式为（2048，50）。利用self.item_embedding(item_seq)函数将item_seq随机初始化为64维的数据（2048，50，64）即名字为item_seq_emb 。数据的形式为torch.Size([2048, 50, 64])。
将数据torch.Size([2048, 50, 64])分别用两个类型的GRU进行特征的抽取。
第一个GRU提取item之间的特征信息。然后我们对item_seq_emb进行dropout处理，即将item_seq_emb中的数据以概率随机将输入张量的一些元素归nn.Dropout(self.dropout_prob)。输出的数据为：torch.Size([2048, 50, 64])。之后将传入的数据放入GRU中提取信息，item_gru_output = self.item_gru_layers(item_seq_emb_dropout) 。item_gru_output为[2048, 50, 128]。
第二个GRU提取item内部之间属性的特征信息，而属性中含有序列信息的为class。也就是说，我们的第二个GRU是提取每个商品的class的序列信息。将torch.Size([2048, 50])输入放入self.feature_embed_layer(None, item_seq)函数中，提取出来class属性的序列信息，输出为torch.Size([2048, 50, 1, 64]),将数据传入feature_table.view(table_shape[:-2] + (feat_num * embedding_size,))函数得到feature_emb输出，格式为[2048, 50, 64]。之后将输出传入self.feature_gru_layers(feature_emb) 类型的GRU特征提取函数，提取特征内部关于class的序列特征向量，输出为feature_gru_output,输出的形状为[2048, 50, 128]。

然后按照输出将上面两个GRU的输出cat起来。torch.cat((item_gru_output, feature_gru_output), -1)，output_concat的形状为[2048, 50, 256]。将输出output_concat接一个线性层input为256输出为64。经过线性输出的形状变为[2048, 50, 64]。输出GRU的最后一层作为整个批次的输出seq_output，格式为[2048, 64]。将seq_output[2048, 64]和all_item_emb[64,1683]相乘得出来logits为[2048, 1683]。即我们可以得到这一次数据中每一个输出的数字和1683商品中那个最相似。最后算损失logits[2048, 1683]和pos_items[2048]交叉熵相乘计算损失。loss = tensor(7.4245, grad_fn=)。

7:Bert
根据用户购买商品的记录文件，利用另外一个特征抽取工具Transformer中的Encoder方式，即我们所熟知的序列模型（Bert），该算法记录为Bert4Rec。

Encoding阶段：
训练数据是item。sequence=50,也就是说我们每批次数据要选择下面形式的数据[2048,50]
因为MASK率是20%，因此每批次数据遮蔽了下面形式的数据[2048,10]的数据，我们需要计算的就是[2048,10]数据所对应的损失，我们取出对应遮蔽模型数据计算损失。首先我我们将item 序列对传入reconstruct_train_data函数，获取重构后的数据，添加遮蔽模型后的masked_item_seq [2048, 50]。被遮蔽的模型的序列数据pos_items[2048, 10]，以及被遮蔽的模型的序列在长度50的数组中的索引masked_index[2048, 10]。将遮蔽模型数据masked_item_seq [2048, 50]传入bert模型中输出为seq_output [2048, 50, 64]。将遮蔽索引masked_index[2048, 10]和遮蔽序列masked_item_seq [2048, 50]传入multi_hot_embed函数获取遮蔽模型的0,1索引pred_index_map[20480, 50]，采用one-hot方式实现。在进行变换获取索引pred_index_map[2048, 10, 50]。将seq_output[2048, 50, 64]和pred_index_map[2048, 10, 50]相乘获得最后的seq_output[2048, 10, 64]输出。这个seq_output[2048, 10, 64]表示经过bert模型和遮蔽模型后的输出。

接下来就是损失的计算，损失计算还是采用交叉熵损失。获取item 的embedding test_item_emb[1683, 64]。将seq_output[2048, 10, 64]和经过变换后的embedding test_item_emb[64,1683]相乘torch.matmul。输出结果为logits[2048, 10, 1683] 。将logits经过变换[20480,1683],和pos_items经过变换[20480]传入交叉熵函数中计算损失，在计算完损失后反向传播。更新参数。

对于masked_item_seq [2048, 50]数据传入bert模型中的数据流通过程。获取数据的position_embedding[2048, 50, 64]。获取数据item_seq的item_emb[2048, 50, 64]。然后将position_embedding和item_emb相加这样我们便获取了嵌入位置信息的item_emb也就是input_emb。之后我们对input_emb取LayerNorm()。再去取dropout()获得最后input数据[2048, 50, 64]。之后我们根据item_seq获取padding成0的位置的数字制为-10000数组extended_attention_mask。之后将经过处理后的input_emb和extended_attention_mask传入trm_encoder（）中。输出为每次层的output我们将每一层的输出append到list中，将最后的一个输出作为bert的输出。

从模型到实际：人工智能项目落地的关键要素 IT猫仔科技人工智能语言模型自然语言处理搜索引擎服务器机器学习
引言近年来，人工智能技术从实验室走向实际应用，其潜力在各行各业得到了初步的验证。然而，AI技术的落地并非一蹴而就，许多企业在尝试部署AI项目时，却发现自己陷入了“模型很好看，应用却难做”的困境。无论是数据准备不足、算法与场景的不匹配，还是缺乏持续优化的机制，这些问题都可能导致项目停滞，甚至功亏一篑。前排提示，文末有大模型AGI-CSDN独家资料包哦！对于企业来说，人工智能的价值不仅在于模型的高精度
QT +MYSQL+PYTHON,完成一个数据库表的增删改查 laocooon523857886 QT Python 数据库 qt mysql
ui_form.py#-*-coding:utf-8-*-##################################################################################FormgeneratedfromreadingUIfile'form.ui'####Createdby:QtUserInterfaceCompilerversion6.8.1#
[C#] 对24位图像进行水平翻转(FlipX)的跨平台SIMD硬件加速向量算法（使用YShuffleX3Kernel） zyl910 VectorTraits c#算法开发语言 SIMD 图像处理
文章目录一、标量算法1.1算法实现1.2基准测试代码二、向量算法2.1算法思路2.1.1难点说明2.1.2解决办法：每次处理3个向量2.1.3用YShuffleX3Kernel对3个向量内的24位像素进行翻转2.2算法实现2.3基准测试代码2.4使用YShuffleX3Kernel_Args来做进一步的优化三、基准测试结果3.1X86架构3.1.1X86架构上`.NET6.0`程序的测试结果3.1
【上市公司文本分析】Python正则表达式从非结构化文本数据中提取结构化信息——以从上市公司高管简历中提取毕业院校信息为例 Ryo_Yuki #上市公司文本分析 Python python 正则表达式
从CSMAR中可以获取上市公司高管的简历文本信息，虽然是非结构化的，但是隐约可以从中发现一些规律，例如毕业院校很多出现在毕业于、就读于等词语之后，专业很多出现在大学名之后，但这些又不是绝对的，也会有其他一些规则。下方代码是我基于我的300多条示例数据（如果需要练习，可以评论邮箱），经过反复修改正则表达式规则去编制的，能够做到节约85%左右的人工工作量，但无法保证绝对精确。对于其他非结构化但又有规律
python中全局变量和局部变量详解_Python局部变量与全局变量区别原理解析 weixin_39998795
1、局部变量name="YangLi"defchange_name(name):print("beforechange:",name)name="你好"print("afterchange",name)change_name(name)print("在外面看看name改了么?",name)输出：beforechange:YangLiafterchange你好在外面看看name改了么?YangLi2
python中全局变量的使用 weixin_33737774 python
python中在module定义的变量可以认为是全局变量，而对于全局变量的赋值有个地方需要注意。test.py--------------------------------------------------importsysusername="muzizongheng"password="xxxx"defLogin(u,p):username=upassword=pprint("usernam
C++和Python实现SQL Server数据库导出数据到S3并导入Redshift数据仓库 weixin_30777913 c++python 数据库数据仓库 sqlserver
用C++实现高性能数据处理，Python实现操作Redshift导入数据文件。在VisualStudio2022中用C++和ODBCAPI导出SQLServer数据库中张表中的所有表的数据为CSV文件格式的数据流，用逗号作为分隔符，用双引号包裹每个数据，字符串类型的数据去掉前后的空格，数据中如果包含双引号，则将一个双引号替换为两个双引号，创建gzip压缩文件，输出数据流写入到gzip压缩文件包中的
scikit-learn基本功能和示例代码 weixin_30777913 深度学习机器学习 python scikit-learn
scikit-learn（简称sklearn）是一个广泛使用的Python机器学习库，提供了丰富的工具和算法，涵盖了数据预处理、模型训练、评估和优化等多个方面。scikit-learn是一个功能强大的机器学习库，涵盖了数据预处理、分类、回归、聚类、降维、模型选择与评估等多个方面。通过上述代码示例，您可以快速上手并使用scikit-learn进行机器学习任务。以下是对scikit-learn主要功能
python 字符串分割方法_Python字符串分割方法总结不胖的羊 python 字符串分割方法
Python中字符串分割的常用方法是直接调用字符串的str.split方法，但是其只能指定一种分隔符，如果想指定多个分隔符拆分字符串需要用到re.split方法(正则表达式的split方法)。str.split字符串的split方法函数原型如下，其中sep为指定的分隔符，maxsplit为最大分割次数：1str.split(sep=None,maxsplit=-1)默认情况下，不指定分隔符时则以空
你们要的python圣诞树坏柠 python python pycharm 开发语言
圣诞节要到了，不给对象画一颗圣诞树吗？那就用python画一颗圣诞树吧#-*-codeing=utf-8-*-#@Time:2021/12/1410:35#@Author:1#@File:圣诞树.py.py#@Softestr:PyCharmimportturtleimporttimeimportrandomturtle.screensize(700,600,"thistle3")turtle.
Python怎么使用全局变量？怎么使用全局变量字典？许墨の小蝴蝶 python
在Python中，全局变量是指在函数外部定义的变量，它们可以在整个程序中被访问。要在一个函数内部使用或修改全局变量，你需要遵循一些规则。###定义全局变量首先，在函数外部定义一个全局变量：```pythonglobal_var=10```###在函数内部读取全局变量如果只是想在函数内部读取全局变量的值，直接使用变量名即可：```pythondefread_global():print(global
Python 实现定时任务的八种方案爱摸鱼的菜鸟码农 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，一种方式是采用Linux系统自带的crond结合命令行实现。另外一种方式是直接使用Python。接下里整理的是常见的Python定时任务的实现方式。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
强化学习很多ac架构的算法比如ppo，为什么使用状态价值网络而不使用动作价值网络实现critic呢?｜状态价值网络的优势与挑战｜Actor-Critic｜状态价值｜强化学习 concisedistinct 人工智能算法人工智能架构
目录1.强化学习的基础1.1策略与价值函数2.Actor-Critic架构概述2.1Critic的作用3.为什么选择状态价值网络？3.1训练稳定性3.2计算效率3.3高维动作空间的适应性4.使用状态价值网络的挑战4.1收敛速度4.2欠拟合风险5.解决方案与未来方向5.1改进的状态价值网络5.2结合动作价值和状态价值6.结论随着强化学习技术的不断发展，其在诸如游戏、机器人控制和金融预测等领域的应用越
APS_Schedule 我养的小猫 Python python
前言大家应该都知道在编程语言中，定时任务是常用的一种调度形式，在Python中也涌现了非常多的调度模块，本文将简要介绍APScheduler的基本使用方法。一、APScheduler介绍APScheduler是基于Quartz的一个python定时任务框架，实现了Quartz的所有功能，使用起来十分方便。提供了基于日期、固定时间间隔以及crontab类型的任务，并且可以持久化任务。APSchedu
度量年报中MD&A部分的信息含量的Python代码 Xiaorui~ 文本分析会计学 python pandas 开发语言
研究需求：度量年报中管理层讨论与分析部分的信息含量的代码，环境为python3，可更改年报的选取时间。代码实现：首先，需要安装tika和pandas库，tika用于解析PDF文件，pandas用于数据处理。可以使用以下命令进行安装：!pipinstalltika!pipinstallpandas然后，需要下载年报的PDF文件，并将其放置在指定路径下。接下来，可以使用以下代码对管理层讨论与分析部分进
python 定时任务框架 assless python 自动化相关 python 定时任务 APSchedule 自动化测试
python定时任务框架如果想实现自定义定时任务框架，可以看看下面转载的文章写的很详细传送门=>APScheduler定时框架
（基础）Python实现定时任务的八种方案详解程序员-不秃头的阿焕 python 开发语言后端
在日常工作中，我们常常会用到需要周期性执行的任务，我们可以用Python直接实现这一功能。今天我们来学习一下这些基本的操作，有需要了解更多关于python相关知识的，免费领取资源的，请点击这个链接。目录利用whileTrue:+sleep()实现定时任务使用Timeloop库运行定时任务利用threading.Timer实现定时任务利用内置模块sched实现定时任务利用调度模块schedule实现
强化学习中，为什么用AC架构资源存储库算法强化学习算法
目录强化学习中，为什么用AC架构为什么用AC架构？AC架构的工作原理AC架构的优缺点优点：缺点：相关算法：基于AC架构的算法总结强化学习中，为什么用AC架构在强化学习（ReinforcementLearning,RL）中，AC架构（即Actor-Critic架构）是一种非常常用的架构，用于训练智能体（Agent）在环境中执行任务。AC架构结合了策略梯度方法和价值迭代方法，通过分离策略和价值函数的估
anaconda 安装后找不到prompt 刘凑华 prompt python 开发语言
解决方法，用cmd进入anaconda的安装目录，然后输入如下命令python .\Lib\_nsis.py mkmenus
Qutebrowser：Python程序员的浏览器利器东方佑量子变法 python
引言在日常工作中，我们常常会遇到一些重复性的操作，比如每天打开固定的几个网页，或者需要频繁地对网页进行截图。如果你是一位Python开发者，并且希望有一种更高效的方式来处理这些任务，那么今天介绍的Qutebrowser绝对会让你眼前一亮。Qutebrowser是一个基于Python和PyQt开发的键盘驱动浏览器，它不仅支持Vim风格的快捷键操作，还允许用户通过编写Python脚本来扩展其功能。接下
Python GUI编程(Tkinter框架) chunyublog python 开发语言
1.Tkinter是什么？Tkinter是Python的标准GUI（图形用户界面）库，它是Python的Tcl/TkGUI工具包的包装器。Tkinter允许Python程序员快速创建GUI应用程序，而无需深入了解底层的图形绘制细节。2.安装TkinterTkinter通常已经预装在Python中，所以不需要额外安装。你可以在Python环境中直接导入它：Importtkinterastk不过，在某
python、JAVA等多种语言演示免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档说明 Eumenides_max python java 数据库股票API接口股票数据接口
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
找不到Anaconda prompt终端 AI小白（入门版） prompt python 开发语言
想打开anacondaprompt时发现文件夹和开始菜单里都找不到问题原因因为anaconda还没有初始化，在安装anaconda的过程中，有一行是否要添加anaconda到菜单目录中，由于没有勾选，导致没有菜单部分的初始化，故找不到。问题解决打开cmd，进入anaconda的安装路径，输入命令。python.\Lib\_nsis.pymkmenus然后会发现菜单目录就有了anaconda终端。
selenium+pytest自动化脚本生成报告乱码问题 xiaobawang001 selenium pytest 自动化
在运行pytest生成报告的时候，中文会显示为？如下图尝试多种修改conftest的编码格式后，未能成功，最终直接修改python路径\Lib\site-packages\pytest_html内的html_report.py将这句head=html.head(html.meta(charset="utf-8"),html.title(self.title),html_css)修改为：head=h
MacOS系统搭建Appium自动化测试环境 xiangzhihong8 前端 macos appium
一、Appium简介1.1什么是APPiumAPPium是一个开源测试自动化框架，适用于原生、混合或移动Web应用程序的自动化测试工具。APPium使用WebDriver协议驱动iOS、Android等应用程序。APPium具有如下特点：支持多平台（Android、iOS等）。支持多语言（python、java、ruby、js、c#等)。APPium是跨平台的，可以用在OSX，Windows以及L
vscode+Python便携版简易制作可以直接复制到u盘再看我把你喝掉笔记 python vscode visual studio code 编辑器
引言对于vscode和Python的爱好者，一直被复杂的开发环境所困扰，于是迫切需要一个可以将vscode和Python放置在u盘中可以不受运行环境的影响运行在不同电脑的便携方案。通过百度初步检索发现：吾爱破解论坛提供了一种需要修改pipe.exe源文件的制作方法，csdn网提供个一种通过设置bat批处理来实现便携化的方案。上述两种方案，操作相对复杂，需要一定的计算机知识，很不方便。对此提出一种更
There was a problem confirming the ssl certificate: [SSL:CERTIFICATE_ VERIFY_ FAILED]certificate解决方案爱编程的喵喵 Python基础课程 python pip SSL certificate 解决方案
大家好，我是爱编程的喵喵。双985硕士毕业，现担任全栈工程师一职，热衷于将数据思维应用到工作与生活中。从事机器学习以及相关的前后端开发工作。曾在阿里云、科大讯飞、CCF等比赛获得多次Top名次。现为CSDN博客专家、人工智能领域优质创作者。喜欢通过博客创作的方式对所学的知识进行总结与归纳，不仅形成深入且独到的理解，而且能够帮助新手快速入门。本文主要介绍了Therewasaproblemco
用bash脚本激活python虚拟环境这个人很懒，还没有设置昵称... bash bash
bash脚本内容：#!/bin/bashcondaactivatenamefasta=$1echo$fasta$1就是接受的用户在命令行输入的变量，echo就是打印该变量激活办法：bash-irun.sh参考链接：https://zhuanlan.zhihu.com/p/422365954if语句判断路径是否存在：result=$1if[-f"$result"];thenmkdir$resultf
R 调用 python weixin_33971205 python json java
上一篇说了python使用rpy2调用R，这里介绍R如何调用python。R的强项在于统计方面，尤其是专业的统计分析，统计检验以及作图功能十分强大，但是在通用性方面，就远不如Python了，比如python可以做web，可以开发GUI，可以爬虫，甚至可以开发游戏，这些R其实也不是完全不行，但是在易用性方面实在是难以与Python相匹敌。所以如果要是能将R与Python相结合，充分发挥二者的优势，那
【大模型应用开发动手做AI Agent】LlamaIndex和基于RAG的AI开发 AI天才研究院 AI大模型企业级应用开发实战大数据AI人工智能计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
文章目录【大模型应用开发动手做AIAgent】LlamaIndex和基于RAG的AI开发1.背景介绍1.1问题的由来1.2研究现状1.3研究意义1.4本文结构2.核心概念与联系LlamaIndexRAG联系3.核心算法原理&具体操作步骤3.1算法原理概述LlamaIndexRAG3.2算法步骤详解LlamaIndexRAG3.3算法优缺点LlamaIndexRAG3.4算法应用领域4.数学模型和公
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那

推荐系统_各种方法的损失计算过程

你可能感兴趣的:(推荐系统,算法,机器学习,python)