ciecus_csdn

基于大数据个性化音乐推荐算法分析（附代码github地址）

github网址：https://github.com/ciecus/music_lgb_recommend_kkbox

欢迎fork我，和我讨论呀~

摘要：音乐推荐算法针对当今时代信息过载的问题为用户推荐音乐的算法。音乐推荐具有物品空间大、用户空间大、物品消费代价小、物品重复使用率高、物品需求量大、物品喜好变化快、社会化程度高等特点。当今音乐推荐算法主要依赖于用户对音乐的操作记录建立用户和音乐的相似性矩阵，进行基于用户的协同过滤推荐或者基于物品的协同过滤；本文在音乐维度和用户维度之外，增加了对操作维度的分析，分析用户对音乐行为的产生的操作源，借此预测用户对音乐的喜好性；对于各个维度特征的筛选采用稳定性选择（Stability Selection）中的随机逻辑回归获得各个特征的分数，并将筛选后的特征通过Light Gradient Boosting Tree（LightGBM）建立模型进行分析。此外本文创新使用数值特征地理进行预测，经验证，使用数值特征进行建模在有效性和鲁棒性上都有稳定的提升，并且该分析方法适用于所有有监督学习的分类学习，具有广泛的应用意义。

关键词：音乐推荐；数值特征；随机逻辑回归模型；LightGBM

Abstract: The music recommendation algorithm recommends the music algorithm for the user in view of the problem of information overload in the modern era. The music recommendation has features such as large item space, large user space, low product cost, high reusability of items, large demand for items, rapid change in item preferences, and high degree of socialization. Today's music recommendation algorithm mainly relies on the user's operation record of music to establish a similarity matrix between user and music, and performs user-based collaborative filtering recommendation or collaborative filtering based on items; this article adds operations to the music dimensions and user dimensions. Dimensional analysis, analysis of the user's operation source for the generation of music behavior, to predict the user's preference for music; for the screening of each dimension feature, the stochastic logistic regression in stability selection (Stability Selection) is used to obtain the score of each feature. The selected features were analyzed using the Light Gradient Boosting Tree (LightGBM) model. In addition, this paper innovatively uses numerical feature geography for forecasting. It is verified that the use of numerical features for modeling has a steady improvement in both effectiveness and robustness, and this analysis method is applicable to all classed learning with supervised learning, with a wide range of Application .

Keywords: Music recommendation; numerical characteristics; stochastic logistic regression model; LightGBM

一、前言

音乐推荐算法，就是针对音乐自身的内容特征以及用户的听歌行为，为广大用户提供可能符合他们兴趣爱好的歌曲的算法。而基于大数据的个性化音乐推荐算法，能够通过历史数据，别的用户的历史数据分析出潜在的喜好相似性，为用户更准确地挖掘出潜在的喜欢的音乐。

1995年，Ringo[1]算法的开发成就了历史上第一个推荐算法，可以向用户推荐他们喜欢的音乐并预测用户对特定音乐的评分，之后一段时间内，音乐推荐都是基于音乐曲目的基本信息产生，缺乏针对性。国外著名网站Pandora和Last.fm是最早提出音乐个性化推荐的网站。Pandora的音乐推荐算法主要来源于音乐基因工程（music gene）的项目[2]，根据这些基因计算歌曲的相似度，给用户推荐基因相似度高的音乐。国内也涌现了一些优秀的音乐推荐网站如豆瓣电台、虾米音乐、网易云音乐等等，根据用户平时推荐给好友的歌曲，听歌行为以及歌曲收录信息，找到“相似的品味者”，更好的做出推荐。

本文针对传统基于用户或者基于物品的协同过滤推荐方法在复杂场景下对用户进行音乐推荐占用内存大计算速度慢等缺点，提出一种基于LightGBM决策树算法的音乐推荐算法，使用相关性分析和稳定性选择中的随机逻辑回归进行特征选择，采用数值特征取代个体特征进行用户对音乐的喜好预测，根据不同的候选集，可以形成不同推荐列表。采用kkbox音乐公司公布在Kaggle比赛平台上的用户、音乐、用户操作信息进行验证，预测准确率高达76%，训练时间9min，优于该比赛第一名用户算法的准确率68.4%。采用的算法模型可拓展性强，计算效率高，占用内存小，可以迁移到其它类型的推荐系统中。

二、推荐算法介绍

2.1传统推荐算法

传统的推荐系统方法包括基于内容推荐过滤、基于规则的推荐、协同过滤推荐。

基于内容的过滤推荐根据物品的元数据，计算物品的相似性，然后基于用户的历史行为推荐给用户相似的物品；基于规则的推荐常使用于电子商务系统，大量的交易数据中获取关联规则或者按照时间购买商品的序列模型，进行物品之间的相互推荐；协同过滤包括基于用户的协同过滤和基于物品的协同过滤；基于用户的协同过滤通过分析用户历史行为，计算用户之间相似度，利用用户相似度和用户的历史行为给用户形成推荐列表。基于物品的协同过滤与之类似，分析用户行为计算物品之间的相似度，然后根据用户的历史偏好信息，将类似的物品推荐给用户。

2.2基于LightGBM决策树模型的推荐算法

决策树算法的发展过程从C3.0（基于信息增益） CART（基于基尼系数）提升树（AdaBoost）梯度提升树（GDBT） XGBosot LightGBM算法。

基于决策树模型的推荐算法具有以下优点：（1）可以并行化训练；（2）能够处理离散连续特征值和类别特征，不用对特征做归一化；（3）能够处理缺失值；（4）可以处理高维特征。

LightGBM（Light Gradient Boosting Machine）是2017年8月微软公司开源的基于决策树算法的分布式梯度提升框架，和之前的提升框架相比有更快的训练效率，更低的内存使用，更高的准确率，支持并行化学习，可以处理大规模数据等优点，可以用于排序，分类和许多其他机器学习任务。[3]

Boosting算法（提升法）指的是迭代算法，核心思想是对训练样本进行k次迭代，每次迭代形成一个弱学习器，然后根据学习误差对分类错误的样本加大训练权重，形成新的带有权重的训练集，训练形成新的弱学习器；最后将这些弱学习器根据结合策略形成一个强学习器，学习过程如图2.1所示：

图2.1 Boosting算法学习过程

此外LightGBM利用Histogram的决策树算法，先把连续的浮点特征值离散化为k个整数，构造一个宽度为k的直方图，如图2.2所示，遍历数据时，根据离散化后的值作为索引在直方图中累积统计量，然后根据直方图的离散值，遍历寻找最优的分割点。使用直方图算法因为只保存特征离散化后的值，内存消耗可以降低为原来的1/8左右；此外计算的成本也大大降低，因为预排序算法每遍历一个特征值就需要计算一次分裂的增益，而直方图算法只用计算k（k为直方的个数），时间复杂度从从O(data*feature)优化到O(k*features)。

图2.2 直方图分割算法

和Xgboost采用level-wise策略相比，LightGBM采用更高效Leaf-wise策略（如图2.3所示），每次从当前所有叶子中，找到分裂增益最大的一个叶子，然后分类，如此循环，和Level-wise相比，分裂次数相同的情况下，可以降低更多的误差，获得更高的精度。同时LightGBM可以通过最大深度的限制防止过拟合。

图2.3 按层次生长策略（左）和按叶子次生长策略（右）

并且最新的LightGBM可以自动处理缺失值，可以进一步优化类别特征（Categorical Feature），不再使用类似one-hot coding的分割方式，对于类别数量很多的类别特征采用one-vs-other的切分方式长出的不均衡的树，采用many-vs-many的切分方式，寻找最优分割。

三、数据集以及数据预处理

3.1数据集介绍

数据挖掘是在大量的、潜在有用的数据中挖掘出有用模式的过程。因此，原数据的质量直接影响到挖掘的效果，高质量的数据是进行有效挖掘的前提。

本文采用kaggle平台上kkbox举办的—KKBox's Music Recommendation Challenge比赛的公开数据集，KKbox是亚洲领先的音乐流媒体服务商，拥有全球最全面的亚洲流行音乐库，音乐曲目超过3000万首。官方声明比赛数据都来自都来自网页快照的抽样，除了对用户id进行了加密处理，其余数据都是原始数据[4]。

数据集共分为三个维度：用户维度，音乐维度，操作维度。

用户维度信息包括用户ID、居住城市、年龄、性别、注册方式、注册时间；音乐维度信息包括歌曲ID，歌曲长度，流派信息，艺人名字，作曲者，作词者，歌唱语言，歌名，ISRC码；操作维度包括用户ID，歌曲ID，首次操作功能区，首次操作界面名，首次播放类型，首次收听一个月内是否重复完整收听。

在本文中，保留使用用户首次收听一个月内是否重复完整收听一首歌为评判用户喜好的标准。

3.2数据筛选

在推荐系统中应该建立如下观点：操作次数特别少的用户和操作次数特别少的物品虽然占了绝大多数，但是这部分行为不具备统计规律，不能真实反映用户的喜好，选择这些数据进行训练，不能得到正确的结果。

本文根据实验分析得出，对于本文的数据集应该选择{播放次数大于10次的音乐的操作记录}∩{播放次数大于35次的用户操作记录}进行训练。

3.3数据预处理

用户信息表有21965名用户的城市、性别、年龄、注册方式以及注册时间等信息。经查看，性别缺失率高达47.45%，并且注册时用户填写性别也不一定真实，所以删除该特征。并且通过对年龄信息的查看，年龄0岁的10377人，缺失值也达到了50%，剩余年龄分布集中在22-30岁之间，区分度也不是很大。所以暂时也删除。注册时间的格式为%Y%M%D，全部转化为注册天数的连续变量。并且统计每个特征单个元素的播放次数和重复率，添加到用户信息表中。

音乐信息表中经筛选后的音乐只有一首歌缺失语言信息，经查验，该歌曲为JONGHYUN组合演唱的《White T-Shirt》，为韩文歌，我们进行人工填充，韩语对应的语言类别31；缺失了485首歌曲的genre_ids，缺失率为1.6%，最频繁项为465，出现频次为16735，占据50%的歌曲；因此对于缺失的少数genre_ids，用最频繁项填充。并且80%以上的歌曲只有一个genre类别，除了1首歌，其余歌曲最多两个类别，所以在本文保留两个genre_ids，对于艺人名，作词者作曲者都不做缺失值填充,只进行LabelEncoder标签化处理。统计每个特征单个元素的播放次数和重复率，以及对应歌曲数，添加到音乐信息表单中作为新的数值特征。

用户对音乐的操作信息只出现在了用户操作表中，一共有三个特征，用户操作来源，用户操作界面布局，用户第一次听这首歌的来源，本文把把这三个特征归为操作维度一类。经统计首次操作功能区（9种元素），首次操作界面名（20种元素），首次播放类型（13种元素）组成的子类别在所统计的操作共有479种组合，是9*20*13=2340的1/5左右。分别统计这479中组合的重复收听率，认为操作次数大于20的为有效统计子类别,子类别和target相关系数高，所以对操作维度分析采用子类别进行分析。

四、特征选择以及模型性能比较

4.1音乐维度特征选择

音乐信息表中包含歌曲ID，艺人ID，作曲家ID，作词者ID，语言ID，公司ID，第一第二流派ID，发布年份，以及这9个分类变量数值化的特征：播放次数和重复播放率，以及对应歌曲数目；歌曲长度，特征维度达到近50个，为了模型分析简单，而且避免过拟合，进行特征筛选。

统计这些分类特征对应歌曲数和播放次数的相关系数，绘制热力学分析图，如图4.1所示：

图4.1 分类特征对应歌曲数（左）对应播放次数（右）相关系数热力学分布图

两幅图中language和country都体现了很强的相关性，这和经验认知国家和歌唱语言是强相关有关，并且国家信息提取自ISRC码，具有缺失，language经过之前的缺失值补充没有缺失值，所以删除所有country有关的特征。

此外，lyricist和composer以及artist_name之间也有强相关系数，但是无法直接比较数据质量，故采用稳定性回归中的随机逻辑回归对特征评分，评价各个分类特征的重复收听率对target重要性，对缺失的重复率用均值补充,评分如表4.1所示：

表4.1 各分类特征重复率评分

由上表两次评分可以看出composer和是否重复播放无关，所以删除所有composer相关信息。对于second_genre因为缺失值严重，评分系数也不高，删除，company可以看出和歌曲是否重复播放没有关系,故也删除。

4.2特征性质选择

本文将使用LightGBM对全部使用数值特征进行训练预测，全部使用个体特征进行训练预测，以及使用全部特征（包括个体特征和数值特征）进行训练预测进行了详细的分析比较。

个体特征共12维，包括：用户，歌曲，操作类型，居住城市，注册方式，注册时间，歌曲长度，歌曲年份，歌曲首个流派属性，艺人，作词者，歌唱语言；数值特征共30维，包括：用户维度操作维度对应的操作次数和重复播放率，音乐维度对应的操作次数，重复播放率和对应音乐数。全部特征及上述个体特征和数值特征相加，共40维。

（1）使用同样最大树深的预测准确率比较

因为个体特征一共12维，所以将共同树深设置为12进行比较，在训练集和测试集中的训练集结果如图4.2所示，可知在训练集中使用数值特征和全部特征进行预测的性质远优于使用个体特征进行预测，并且使用全部特征进行预测略优于使用数值特征进行预测；但是在测试集中，数值特征预测准确率有2%左右的下降，使用个体特征也有1%的下降，并且预测准确率远低于使用数值特征进行预测，使用全部特征的预测随着迭代次数的增加预测准确率一直下降，说明模型出现了过拟合现象。

（2）使用特征维度对应的树深的预测准确率比较

根据特征维度的不同，使用LightGBM训练时设置的最大树深也不同，全部使用个体特征的最大树深为12，全部使用数值特征的最大树深为30，使用全部特征的最大树深为42，在训练集和测试集中的训练集结果如图4.3所示。

图4.2 树深为12的预测准确率图4.3 树深为各自维度的预测准确率

观察图4.3可知，当最大树深为各自特征维度时，总体趋势和使用最大树深为12的相同，没有模型出现明显的性能改变。

（3）所有LightGBM模型比较

图4.4 所有LightGBM模型预测准确率比较

图4.4中比较了所有LightGBM模型在训练集和测试集的预测准确率比较，可以得知在训练集中使用全部特征进行训练时，使用特征维度的最大树深42的预测准确率最高，但是和使用全部特征训练树深12和使用数值特征进行训练的两个模型相比，性能差距不大。但是在测试集中，使用数值特征进行训练的模型预测准确率最高，远优于其他LGBM模型，并且树深为30的模型略优于树深为12的模型。

使用个体特征训练的模型随着迭代次数的增加，预测准确率一直提升，但是还是远低于使用数值特征训练的模型；使用全部特征训练的模型，由于过拟合的问题，随着迭代次数的增加，预测准确率越来越低。

图4.5所有LightGBM模型训练时间比较

由图4.5可知使用个体特征进行训练的时间成本最小，使用数值特征和使用全部特征进行训练的时间成本差距不大。总体来说，使用全部特征的模型时间成本略大于全部使用数值特征的模型；最大深度大的模型的时间成本大于最大深度小的模型。

综合上述性能比较可知，使用数值特征训练模型性能远优于传统使用个体特征进行训练或者使用全部特征进行训练的模型，预测准确率在训练集和测试集差距不大，训练集中的预测准确率78%以上，测试集预测准确率76%以上，并且随着迭代次数一直增加。

本文还使用逻辑回归模型使用数值特征进行了训练，将训练后二元化结果和全部使用个体特征、全部使用数值特征、使用全部特征的LightGBM模型（最大树深为10，迭代次数150次）进行了比较，将将混淆矩阵信息列入表4.2，4.3：

表4.2 训练集不同算法混淆矩阵比较（预测值/实际值）

算法	1/1	0/1	1/0	0/0	平均正确率
逻辑回归	1432368	840961	698144	1896378	0.68382249
用数值特征的lgbm	1629416	643913	813643	1780879	0.70057506
用分类特征的lgbm	1407061	866268	817165	1777357	0.65417327
用全部特征的lgbm	1631504	641825	811447	1783075	0.70145512

表4.3 测试集不同算法混淆矩阵比较（预测值/实际值）

算法	1/1	0/1	1/0	0/0	平均正确率
逻辑回归	353976	214034	179268	469685	0.67681680
用数值特征的lgbm	403227	164783	208494	440459	0.69327169
用分类特征的lgbm	350684	217326	205062	443891	0.65291632
用全部特征的lgbm	407394	160616	255973	392980	0.65768146

运行时间比较：logitic_regression训练时间47.8s，用分类特征的lgbm训练时间1min5s，用数值特征的训练时间1min39s，用所有特征的训练之间为2min20s，对于数值特征使用简单的逻辑回归模型对结果预测，无论在训练集还是在测试集上的预测正确率都优于使用更复杂模型的使用分类特征的预测正确率，甚至在测试集上也优于使用了全部特征训练的lgbm模型。说明在有监督的模型中，对于分类特征的训练，可以使用数值特征替代，极有可能获得更优秀的训练效果。

4.3迭代次数选择

使用数值特征训练LightGBM模型在训练集和测试集中随着迭代次数的变化预测准确率的变化如图4.8所示，模型使用为最大树深为12的使用数值特征进行训练的LightGBM模型，使用二元化后的数值计算准确率：

图4.8 使用数值特征不同迭代次数下的预测准确率曲线

由图可知，由于feature_fraction和bagging_fraction的参数设置，并且使用的是数值特征，增加迭代次数也没有导致过拟合的问题，预测准确率一直提升。但是需要注意，当迭代次数大于3000次之后，在训练集中的预测准确率虽然仍在快速提升，但是在测试集中的预测准确率提升非常细微。由之前是实验可知，模型训练成本随着迭代次数的增加线性增加，所以盲目增加迭代次数换取细微的增益再实际应用中是得不偿失的，所以在实际使用中，音乐服务商应该考虑实际需求设置迭代次数，本文作者建议在3000次以下。

4.3其它模型参数设置

学习控制参数有：min_data_in_leaf，一个叶子上数据最小的数量，用来处理过拟合，默认为20；feature_fraction，默认为1.0，取值范围0~1，如果取值小于1，LightGBM将会在每次迭代中随机选择部分特征，可以加速训练，也可以用来处理过拟合，本文设置为0.8。feature_fraction_seed，feature_fraction的随机数种子，默认为2；bagging_fraction,默认为，和feature_fraction功能类似，但是在不进行重新采样的情况下随机选择部分数据，设置为0.9；bagging_freq，默认为0，但是要使用bagging_fraction必须为非零值，k意味着每k次迭代执行bagging，本文设置为2；bagging_seed，bagging随机数种子，默认为3；max_depth，用来限制树模型的最大深度，默认为-1，意味着没有限制，本文设置为10； categorical_feature用来指定分类特征。using_missing，设置为False，禁用缺失值。max_bin，默认255，LightGBM使用unit8压缩内存，所以本文设置为256，使用unit16压缩内存；verbosity默认为1，设置为0，只输出警告信息。

五、实验结果以及分析

本文对筛选后的train数据集使用Sklearn库中的split函数随机将其分割成5个不交叉子集，每次选择4个作为新训练集和1个作为新测试集，比例为80%和20%。根据新训练中的数据重新计算数据集中的数值特征,并且对播放次数进行z_score归一化，并且将计算的数值特征应用到新测试集中。

本文采用ROC曲线下的面积来衡量预测准确率，采用模型训练时间衡量模型的有效性。

5.1二元化预测结果比较

图5.1 二元化与未二元化预测准确率

因为kkbox在kaggle平台比赛要求提交结果为二元化结果进行准确率评分，所以本文将使用数值特征训练的LightGBM模型，最大树深为30层的预测结果二元化，计算预测ROC评分。如图5.1所示，和未二元化的预测结果相比，预测准确率下降。

在训练集中二元化后的测试准确率在迭代次数1000次时到达0.72，测试集中二元化测试准确率大于0.70，该比赛第一名的预测概率为0.684。并且根据之前的实验可以得知，使用该模型迭代1000次的平均耗费时间为9min15s，远小于其它模型的训练时间。

2不使用操作特征进行预测

本文将输入操作特征最大树深为30的模型和不输入操作特征最大树深为28的模型进行比较。

图5.2 有无操作特征预测准确率比较

由图5.2可知，有操作特征的预测准确率明显高于无操作特征的预测准确率。但在没有操作特征时，即对于用户未听过的音乐，预测准确率在训练集在迭代次数500次时已经达到75%，测试集上达到74%，能够满足音乐服务商的应用需求，并且平均时间成本只需要3min15s，所以可以采用该模型对用户没有听过的音乐进行预测。

3使用预测结果进行推荐

本文随机选择一次测试集和训练集结果进行推荐结果展示，给用户的推荐列表应该包括用户听过的歌曲和用户没听过的歌曲。

使用数值特征，树深30，迭代次数600的模型进行预测。选择三个用户（用户信息如表5.1所示）进行结果展示，序号分别为对应信息如下：

表5.1 用户信息表

用户序号	播放次数	喜欢艺人	喜欢流派	城市	注册方式	注册时间
6408	311	谢和弦(17)	通俗流行(169)	0	2	15525
11143	933	陈奕迅(43)	通俗流行(420)	11	3	15842
782	738	V\| Jin (35)	通俗流行(427)	0	0	16148

以11143用户举例，以陈奕迅的所有音乐为候选集，然后进行喜好预测，用没有操作类型的模型，经过筛选后的陈奕迅的歌曲有193首。经过预测之后选择喜欢概率高的形成推荐列表，如表5.2所示。

表2 用户11163由喜欢的歌手生成的推荐列表

歌名	预测重复率
讓我留在你身邊	0.811024012
淘汰(國)	0.692591114
愛情轉移(國)	0.667852494
可以了	0.655677032
陰天快樂	0.627131943

对于用户6408 、11143、782，喜欢通俗流行音乐，该流派音乐共计17544首，分别计算推荐前5名的歌曲，如表5.3所示。

表5.3 不同用户由喜欢的相同的流派的推荐列表

6408		11143		782
歌名	重复率	歌名	重复率	歌名	重复率
謝謝妳愛我	0.763	謝謝妳愛我	0.816	謝謝妳愛我	0.814
演員	0.753	演員	0.793	演員	0.813
小幸運	0.737	好愛好散	0.776	FLY OUT	0.795
FLY OUT	0.730	小幸運	0.770	犯錯	0.794
好愛好散	0.728	FLY OUT	0.763	不為誰而作的歌	0.788

由表5.2可知，对于同一个用户，设置不同的候选集，可以有不同的推荐列表，支持音乐服务商使用多种推荐方式，也可以综合多个候选集，建立混合推荐的推荐列表。

由表5.3可知，对于不同用户，因为其它用户特征的不同，对于相同的候选集，也可以生成不同的推荐列表，符合个性化推荐的要求。

六、结语

本文采用新的ligthgbm算法对用户是否会在一个月内重复收听某一首歌曲进行预测，以此作为个性化推荐的目标。通过分析数据特征，使用相关性以及稳定性选择等方法选择特征，随后通过对训练输入数值特征，分类特征和全部特征的性能比较，创新性选择用数值特征完全取代分类特征去训练模型进行预测，使得模型在有效性和准确性上都有稳定的提升，对于其余需要再分类特征上建模的实验具有参考意义。

注释：

[1] Shardanand U. Social information filtering: algorithms for automating “word of mouth”[C]// Sigchi Conference on Human Factors in Computing Systems. ACM Press/Addison-Wesley Publishing Co. 1995:210-217.

[2]Tzanetakis G, Cook P. Musical genre classification of audio signals[J]. IEEE Transactions on Speech & Audio Processing, 2002, 10(5):293-302.

[3]https://github.com/Microsoft/LightGBM

[4]Kaggle，kkox-music-recommodation-challenge数据介绍

https://www.kaggle.com/c/kkbox-music-recommendation-challenge/data

参考文献：

[1]Resnick P, Varian H R. Recommender systems[M]. ACM, 1997.

[2]Shardanand U. Social information filtering: algorithms for automating “word of mouth”[C]// Sigchi Conference on Human Factors in Computing Systems. ACM Press/Addison-Wesley Publishing Co. 1995:210-217.

[3]王中原. 面向互联网基于相关性挖掘的音乐推荐[D]. 浙江大学计算机科学与技术学院浙江大学, 2008.

[4] Tzanetakis G, Cook P. Musical genre classification of audio signals[J]. IEEE Transactions on Speech & Audio Processing, 2002, 10(5):293-302.

[5] 刘建国, 周涛, 汪秉宏. 个性化推荐算法的研究进展[J]. 自然科学进展, 2009, 19(1):1-15.

[6]许海玲, 吴潇, 李晓东,等. 互联网推荐算法比较研究[J]. 软件学报, 2009, 20(2):350-362.

[7]Igel C, Suttorp T, Hansen N. Steady-State Selection and Efficient Covariance Matrix Update in the Multi-objective CMA-ES[C]// International Conference on Evolutionary Multi-Criterion Optimization. Springer-Verlag, 2007:171-185.

[8]微软LightGBM开源项目：https://github.com/Microsoft/LightGBM

[9]Guolin Ke, Qi Meng, Thomas Finley, Taifeng Wang, Wei Chen, Weidong Ma, Qiwei Ye, and Tie-Yan Liu. "LightGBM: A Highly Efficient Gradient Boosting Decision Tree". In Advances in Neural Information Processing Systems (NIPS), pp. 3149-3157. 2017.

[10]Qi Meng, Guolin Ke, Taifeng Wang, Wei Chen, Qiwei Ye, Zhi-Ming Ma, Tieyan Liu. "A Communication-Efficient Parallel Algorithm for Decision Tree". Advances in Neural Information Processing Systems 29 (NIPS 2016).

[11] Last.fm数据集介绍:

https://labrosa.ee.columbia.edu/millionsong/lastfm

[12] 阿里流行音乐趋势预测大赛介绍:

https://tianchi.aliyun.com/competition/information.htm?spm=5176.11165320.5678.2.7bc4a0737qKl9G&raceId=231531

[13] 袁梅宇. 数控挖掘与机器学习:WEKA应用技术与实践[M]. 清华大学出版社, 2016.

[14] 项亮. 推荐算法实践[M]. 人民邮电出版社, 2012.

[15] 张良均 … [等. Python数据分析与挖掘实战[M]. 机械工业出版社, 2016.

[16] 米尔顿李芳. 深入浅出数据分析 : Head first data analysis[M]. 电子工业出版社, 2012.

你可能感兴趣的:(推荐系统)

Python爬虫教程：如何通过接口批量下载视频封面（FFmpeg技术实现） Python爬虫项目 python 爬虫开发语言数据库数据分析 scrapy selenium
引言随着在线视频平台的蓬勃发展，视频封面作为视频内容的预览图，一直以来都是观众对视频的第一印象。在爬取视频资源时，很多开发者和研究者往往只关注视频本身，而忽略了视频封面。实际上，视频封面不仅能提供重要的信息（例如视频标题、主题或情感等），而且它们也能作为数据集中的重要属性，用于视频分类、推荐系统等应用。在这篇博客中，我们将深入探讨如何使用Python通过接口批量下载视频封面，利用FFmpeg等技术
Python爬虫实战：抓取电子图书平台图书信息与下载数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言网络爬虫信息可视化
前言电子图书平台汇集了海量的图书资源和丰富的信息，抓取这些数据可用于研究图书销售趋势、阅读偏好分析，甚至为书籍推荐系统提供数据支持。本文将详细介绍如何使用Python爬虫技术抓取电子图书平台的图书信息和下载数据。我们会涵盖从需求分析到代码实现的完整流程，探讨如何应对复杂的反爬机制，并使用最新的技术工具优化抓取过程。目录前言一、需求分析与目标1.1抓取目标1.2难点与挑战二、技术选型与工具2.1使用
从零开始搭建搜索推荐系统（五十四）多路召回之万剑归宗 hanyi_ 搜索推荐 java java 搜索系统
聊的不止技术。跟着小帅写代码，还原和技术大牛一对一真实对话，剖析真实项目筑成的一砖一瓦，了解最新最及时的资讯信息，还可以学到日常撩妹小技巧哦，让我们开始探索主人公小帅的职场生涯吧！（PS：本系列文章以幽默风趣风格为主，较真侠和杠精请绕道~）一、奶茶引发的血案（会议室里，行服小姐姐把笔记本往桌上一拍，屏幕上是密密麻麻的搜索日志）行服姐姐："小帅！你自己看看！用户搜'朝阳区低糖芝士草莓冰沙'，你家系统
机器学习模型-从线性回归到神经网络 Earth explosion 机器学习线性回归神经网络
在当今的数据驱动世界中，机器学习模型是许多应用程序的核心。无论是推荐系统、图像识别，还是自动驾驶汽车，机器学习技术都在背后发挥着重要作用。在这篇文章中，我们将探索几种基础的机器学习模型，并了解它们的基本原理和应用场景。1.线性回归基本原理线性回归是最简单的机器学习模型之一。它旨在找到一个最佳拟合线来预测目标变量（通常是连续值）。线性回归假设输入变量和输出变量之间存在线性关系，其数学表达式为：[y=
机器学习入门指南：从 TensorFlow 到 PyTorch 6v6-博客机器学习 tensorflow pytorch
机器学习入门指南：从TensorFlow到PyTorch机器学习（MachineLearning）是人工智能的核心领域之一，近年来在图像识别、自然语言处理、推荐系统等领域取得了巨大进展。本文将从基础概念入手，介绍机器学习的核心知识，并带你快速上手两大主流框架：TensorFlow和PyTorch。机器学习基础什么是机器学习？机器学习是一种通过数据训练模型，使计算机能够自动学习和改进的技术。它主要分
H800实战应用深度解析endofsentence 智能计算研究中心其他
内容概要H800作为新一代计算架构的核心组件，其设计理念聚焦于高性能计算与人工智能场景的深度融合。通过模块化异构计算架构，H800实现了计算密度与能效比的突破性提升。下表展示了H800在不同场景下的性能表现对比：场景类型训练速度提升推理延迟降低能效比提升自然语言处理35%22%40%计算机视觉28%18%33%推荐系统41%29%37%资深系统架构师指出："H800的异构计算架构在模型并行处理方面
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏宇直不会放弃 GKD-Middle layer 人工智能 python chatgpt gpu算力深度学习机器学习神经网络
LWC-KD：图结构感知的推荐系统增量学习对比知识蒸馏《GraphStructureAwareContrastiveKnowledgeDistillationforIncrementalLearninginRecommenderSystems》2021作者是YueningWang、YingxueZhang和MarkCoates论文地址：https://dl.acm.org/doi/10.1145/
基于大数据架构的就业岗位推荐系统的设计与实现【java或python】—计算机毕业设计源码+LW文档 qq_375279829 大数据架构 python 课程设计算法
摘要随着互联网技术的迅猛发展和大数据时代的到来，就业市场日益复杂多变，求职者与招聘方之间的信息不对称问题愈发突出。为解决这一难题，本文设计并实现了一个基于大数据架构的就业岗位推荐系统。该系统通过收集、整合并分析大量求职者简历信息、企业招聘信息以及市场动态数据，运用先进的机器学习算法，为求职者提供个性化的岗位推荐服务，同时帮助企业快速定位到合适的候选人。本文将从系统设计的背景与意义、技术基础、需求分
向量数据库简介 openwin_top python编程示例系列 python编程示例系列二数据库
向量数据库（VectorDatabase）是一种专门用于存储和查询向量数据的数据库系统。向量数据库通常使用高效的向量索引技术，支持基于向量相似度的查询和检索，可以应用于图像搜索、自然语言处理、推荐系统、机器学习等领域。与传统的关系型数据库不同，向量数据库通常使用基于向量的数据模型，将向量作为数据的核心表示形式。向量数据库可以存储和处理大量的向量数据，支持高效的向量相似度计算和查询。常见的向量索引技
开源向量数据库介绍说明 ❀͜͡傀儡师开源数据库
开源向量数据库Milvus特点：分布式、高性能，支持亿级向量检索。支持的数据类型：文本、图像、音频、视频等。使用场景：推荐系统、语义搜索、图像搜索。数据存储后端：支持多种后端，如SQLite、MySQL、PostgreSQL。Qdrant特点：高可用性、易用性，支持实时更新和过滤。编程接口：支持REST和gRPC。使用场景：个性化推荐、自然语言搜索、商品搜索。Weaviate特点：基于GraphQ
计算机毕业设计JAVA人职匹配推荐系统mybatis+源码+调试部署+系统+数据库+lw 诺诺网络 java mybatis 开发语言
计算机毕业设计JAVA人职匹配推荐系统mybatis+源码+调试部署+系统+数据库+lw计算机毕业设计JAVA人职匹配推荐系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5
Python构建基于协同过滤的推荐系统：从理论到实践清水白石008 python Python题库 python 开发语言
构建基于协同过滤的推荐系统：从理论到实践推荐系统在现代应用中无处不在，从电商平台的商品推荐到流媒体服务的内容推荐，推荐系统极大地提升了用户体验。本文将详细介绍如何使用Python构建一个基于协同过滤算法的推荐系统，内容涵盖理论基础、数据处理、算法实现以及实际应用。一、推荐系统概述推荐系统主要分为三类：基于内容的推荐、基于协同过滤的推荐和混合推荐系统。本文重点介绍基于协同过滤的推荐系统。协同过滤（C
知识图谱与金融——基于知识图谱的风险监控与决策支持 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型自然语言处理人工智能语言模型编程实践开发语言架构设计
作者：禅与计算机程序设计艺术1.简介知识图谱(KG)是一种用来表示大量互相关联数据的多维网络结构，它通过三元组（subject-predicate-object）的方式来表述实体之间的关系。它经常被用在文本分析、数据挖掘、推荐系统等领域。而随着金融行业对海量信息数据的需求越来越高，知识图谱技术也越来越受到重视。实际上，知识图谱已经成为构建和处理金融知识的重要工具之一。本文将探讨知识图谱在金融中的应
专业英语程序员爱德华英语专业英语
文章目录一、计算机1.计算机基础(1)计算机组成原理(2)计算机网络(3)数据库(4)编译原理(5)离散数学2.软件开发(1)编程词汇(2)开发术语(3)Linux(4)软件3.就业领域(1)职场(2)芯片(3)自动驾驶(4)嵌入式硬件4.深度学习(1)论文(2)深度学习DL(3)计算机视觉CV(4)自然语言处理NLP(5)推荐系统(6)计算机图形学二、数学三、机械、材料四、医药五、英美计量单位一
跨领域算法安全优化与实践路径智能计算研究中心其他
内容概要在算法技术加速渗透金融、医疗、自动驾驶等关键领域的背景下，跨领域算法的安全性与可落地性成为核心挑战。本书从联邦学习的隐私保护架构切入，探讨如何通过可解释性算法增强模型透明度，并引入量子计算与边缘计算的协同优化框架，构建兼顾效率与安全的技术范式。值得注意的是，医疗影像分析中的对抗攻击防御机制与生成对抗网络驱动的推荐系统创新，揭示了算法动态演进中的风险控制逻辑。技术整合不应局限于单一场景优化，
Django 中的算法应用与实现岱宗夫up 教学 sqlite 数据库 python django opencv
Django中的算法应用与实现在Django开发中，算法的应用可以极大地扩展Web应用的功能和性能。从简单的数据处理到复杂的机器学习模型，Django都可以作为一个强大的后端框架来支持这些算法的实现。本文将介绍几种常见的算法及其在Django中的使用方法。1\.协同过滤算法1.1算法简介协同过滤是一种常用的推荐系统算法，通过分析用户的行为数据（如评分、浏览历史等），为用户推荐他们可能感兴趣的内容。
大模型不确定性量化与提示词校准 AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 ChatGPT java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
大模型不确定性量化与提示词校准关键词大模型不确定性量化提示词校准自然语言处理计算机视觉推荐系统摘要本文旨在探讨大模型不确定性量化与提示词校准这一前沿技术。首先，我们将介绍大模型不确定性的背景及其重要性，然后深入探讨不确定性量化的原理和方法，以及提示词校准在其中的作用。通过具体案例分析，我们将展示这些技术在自然语言处理、计算机视觉和推荐系统等领域的应用。最后，我们将讨论实现大模型不确定性量化与提示词
新闻推荐系统：Spring Boot框架详解 2402_85758936 spring boot 后端 java
2相关技术2.1MYSQL数据库MySQL是一个真正的多用户、多线程SQL数据库服务器。是基于SQL的客户/服务器模式的关系数据库管理系统，它的有点有有功能强大、使用简单、管理方便、安全可靠性高、运行速度快、多线程、跨平台性、完全网络化、稳定性等，非常适用于Web站点或者其他应用软件的数据库后端的开发工作。此外，用户可利用许多语言编写访问MySQL数据库的程序。作为开放源代码运动的产物之一，MyS
搜广推校招面经三十六 Y1nhl 搜广推面经机器学习人工智能算法 python 深度学习 pytorch 推荐算法
快手推荐算法一、有10亿个数据量如何快速做召回在推荐系统的召回阶段，面对海量数据（如10亿条记录），需要快速筛选出与目标用户相关的候选物品集合。由于数据规模巨大，直接对所有数据进行计算是不现实的，因此需要设计高效的召回策略。1.1.核心挑战数据规模大:10亿级别的数据无法直接加载到内存中。实时性要求高:召回过程通常需要在毫秒级完成。稀疏性问题:用户行为数据通常是稀疏的，导致相似性计算复杂度增加。多
图数据库Neo4j面试内容整理-图遍历和最短路径不务正业的猿面试 Neo4j 数据库 neo4j 网络面试职场和发展图数据库
图遍历和最短路径是图数据库中两个非常重要的概念，尤其是在图数据结构中，它们是解决许多问题（如社交网络分析、推荐系统、网络分析等）的核心算法。Neo4j提供了强大的图遍历和最短路径查询能力，帮助用户有效地从图中提取信息。1.图遍历（GraphTraversal）
《DataWorks：为人工智能算法筑牢高质量数据根基》人工智能深度学习
在当今数字化时代，人工智能（AI）技术的迅猛发展深刻地改变着各个行业的面貌。从智能推荐系统到医疗影像诊断，从自动驾驶到自然语言处理，AI正以前所未有的速度渗透到我们生活和工作的方方面面。而在这一系列AI应用的背后，高质量的训练数据是其能够发挥强大效能的关键所在。就如同巧妇难为无米之炊，没有优质的数据，再先进的AI算法也难以施展拳脚。阿里巴巴的DataWorks，作为一款强大的大数据开发治理平台，在
2025年具有百度特色的软件测试面试题噔噔噔噔@ 软件测试基础及工具分享程序人生软件测试面试题专栏测试工具经验分享自动化
百度业务场景如何测试一个高并发的搜索系统（如百度搜索）？如何测试一个在线地图服务（如百度地图）？如何测试一个大型推荐系统（如百度推荐）的性能？百度技术栈你对百度的PaddlePaddle框架有了解吗？如何测试基于PaddlePaddle的服务？如何测试百度云的API服务？你对百度的DevOps实践有什么了解？
《基于Django和ElasticSearch的学术论文搜索推荐系统的设计与实现》开题报告 Python数据分析与机器学习毕业论文/研究报告 elasticsearch 大数据搜索引擎课程设计 python django 开发语言
目录一、选题的背景和意义（一）选题背景（二）选题意义2.1.提升科研效率2.2促进学术创新2.3优化资源配置二、选题的国内外现状与总结（一）国内现状（二）国外现状（三）总结三、选题的主要内容和拟解决关键问题（一）主要内容1.数据库设计与实现2.搜索功能实现3.推荐功能实现4.用户管理与交互功能实现（二）拟解决关键问题1.数据质量与整合难题解决措施：2.搜索精准度与性能优化解决措施：四、选题的设计方
微信小程序毕业设计大全 QQ1305637939 小程序毕业设计小程序答辩 java idea
微信小程序程序列表:微信小程序健身房课程预约系统6638微信小程序投票系统6640微信小程序小说阅读推荐系统6641微信小程序垃圾分类识别系统（语音识别，拍照识别）qt-93982微信小程序网上书店qt-93982微信小程序在线购物系统qt-93982微信小程序课堂签到系统qtail-93982微信小程序人脸识别图书馆座位预约系统qt-93982微信小程序二手物品交易系统qt-93982微信小程序
基于Python豆瓣电影评论的数据处理与分析 AI智能涌现深度研究 DeepSeek R1 &大数据AI人工智能 Python入门实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
基于Python豆瓣电影评论的数据处理与分析作者：禅与计算机程序设计艺术1.背景介绍1.1豆瓣电影评论数据的价值1.1.1反映观众观影偏好1.1.2影响电影市场走向1.1.3为推荐系统提供数据支持1.2Python在数据处理与分析中的优势1.2.1丰富的数据处理库1.2.2强大的数据分析和可视化能力1.2.3简洁高效的语法1.3本文的研究目的和意义1.3.1探索豆瓣电影评论数据的特点1.3.2实践
融合多源高校画像数据与协同过滤算法的高考择校推荐系统[Java]—计算机毕业设计源码+LW文档 qq_375279829 高考 java spring boot javascript vue.js spring
摘要随着信息技术的飞速发展和教育数据的日益丰富，高考择校推荐系统已成为帮助学生和家长做出明智选择的重要工具。本文介绍了一种基于SpringBoot的融合多源高校画像数据与协同过滤算法的高考择校推荐系统。该系统通过整合高校的多源画像数据，如地理位置、学科实力、师资力量、就业情况等，结合协同过滤算法，为学生提供个性化的高校推荐。本文详细阐述了系统的设计与实现过程，包括技术选型、需求分析、系统设计、功能
python 推荐算法库_[译] 详解个性化推荐五大最常用算法 weixin_39612733 python 推荐算法库
允中若朴编译自Stats&Bots量子位出品|公众号QbitAI推荐系统，是当今互联网背后的无名英雄。我们在某宝首页看见的商品，某条上读到的新闻，甚至在各种地方看见的广告，都有赖于它。昨天，一个名为Stats&Bots的博客详解了构建推荐系统的五种方法。量子位编译如下：现在，许多公司都在用大数据来向用户进行相关推荐，驱动收入增长。推荐算法有很多种，数据科学家需要根据业务的限制和要求选择最好的算法。
Python智能推荐系统与个性化电商 master_chenchengg python python 办公效率 python开发 IT
Python智能推荐系统与个性化电商探索宝藏：揭开推荐系统的神秘面纱数据炼金术：挖掘用户行为背后的黄金智能导购员：为每位顾客定制专属购物体验实时响应大师：打造即时反馈的动态推荐社交网络效应：借助朋友的力量扩大影响力反馈循环艺术家：持续改进与优化用户体验未来展望：迎接智能化零售的新时代探索宝藏：揭开推荐系统的神秘面纱在电子商务的世界里，推荐系统就像是一个藏宝图，它帮助商家找到那些隐藏在海量商品中的“
Python实现个性化推荐二 Ninina1992 python 人工智能开发工具
基于内容的推荐引擎是怎么工作的基于内容的推荐系统，正如你的朋友和同事预期的那样，会考虑商品的实际属性，比如商品描述，商品名，价格等等。如果你以前从没接触过推荐系统，然后现在有人拿枪指着你的头，强迫你在三十秒之内描述出来，你可能会描述这样一个基于内容的系统：呃，呃，我可能会给你看一大堆来自同一个厂家，并且拥有类似的说明的产品。你正在利用商品本身的属性来推荐类似的商品。这样做非常合理，因为这就是我们在
计算机毕业设计 ——jspssm510springboot 的人职匹配推荐系统程序媛9688 课程设计
作者：程序媛9688开发技术：SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等。文末获取源码+数据库感兴趣的可以先收藏起来，还有大家在毕设选题（免费咨询指导选题），项目以及论文编写等相关问题都可以给我留言咨询，希望帮助更多的人计算机毕业设计——jspssm510springboot的人职匹配推荐系统人职匹配推荐系统技术说明本毕业设计项目“jsps
java线程的无限循环和退出 3213213333332132 java
最近想写一个游戏，然后碰到有关线程的问题，网上查了好多资料都没满足。突然想起了前段时间看的有关线程的视频，于是信手拈来写了一个线程的代码片段。希望帮助刚学java线程的童鞋 package thread; import java.text.SimpleDateFormat; import java.util.Calendar; import java.util.Date
tomcat 容器 BlueSkator tomcat Web servlet
Tomcat的组成部分 1、server A Server element represents the entire Catalina servlet container. (Singleton) 2、service service包括多个connector以及一个engine，其职责为处理由connector获得的客户请求。 3、connector 一个connector
php递归,静态变量,匿名函数使用 dcj3sjt126com PHP 递归函数匿名函数静态变量引用传参
<!doctype html> <html lang="en"> <head> <meta charset="utf-8"> <title>Current To-Do List</title> </head> <body>
属性颜色字体变化周华华 JavaScript
function changSize(className){ var diva=byId("fot") diva.className=className; } </script> <style type="text/css"> .max{ background: #900; color:#039;
将properties内容放置到map中 g21121 properties
代码比较简单： private static Map<Object, Object> map; private static Properties p; static { //读取properties文件 InputStream is = XXX.class.getClassLoader().getResourceAsStream("xxx.properti
[简单]拼接字符串 53873039oycg 字符串
工作中遇到需要从Map里面取值拼接字符串的情况，自己写了个，不是很好，欢迎提出更优雅的写法，代码如下： import java.util.HashMap; import java.uti
Struts2学习云端月影
最近开始关注struts2的新特性，从这个版本开始，Struts开始使用convention-plugin代替codebehind-plugin来实现struts的零配置。配置文件精简了，的确是简便了开发过程，但是，我们熟悉的配置突然disappear了，真是一下很不适应。跟着潮流走吧，看看该怎样来搞定convention-plugin。使用Convention插件，你需要将其JAR文件放
Java新手入门的30个基本概念二 aijuans java 新手 java 入门
基本概念:　　1.OOP中唯一关系的是对象的接口是什么,就像计算机的销售商她不管电源内部结构是怎样的,他只关系能否给你提供电就行了,也就是只要知道can or not而不是how and why.所有的程序是由一定的属性和行为对象组成的,不同的对象的访问通过函数调用来完成,对象间所有的交流都是通过方法调用,通过对封装对象数据,很大限度上提高复用率。　　2.OOP中最重要的思想是类,类是模板是蓝图,
jedis 简单使用 antlove java redis cache command jedis
jedis.RedisOperationCollection.java package jedis; import org.apache.log4j.Logger; import redis.clients.jedis.Jedis; import java.util.List; import java.util.Map; import java.util.Set; pub
PL/SQL的函数和包体的基础百合不是茶 PL/SQL编程函数包体显示包的具体数据包
由于明天举要上课,所以刚刚将代码敲了一遍PL/SQL的函数和包体的实现(单例模式过几天好好的总结下再发出来);以便明天能更好的学习PL/SQL的循环,今天太累了,所以早点睡觉,明天继续PL/SQL总有一天我会将你永远的记载在心里,,, 函数; 函数:PL/SQL中的函数相当于java中的方法;函数有返回值定义函数的 --输入姓名找到该姓名的年薪 create or re
Mockito(二)--实例篇 bijian1013 持续集成 mockito 单元测试
学习了基本知识后，就可以实战了，Mockito的实际使用还是比较麻烦的。因为在实际使用中，最常遇到的就是需要模拟第三方类库的行为。比如现在有一个类FTPFileTransfer，实现了向FTP传输文件的功能。这个类中使用了a
精通Oracle10编程SQL(7)编写控制结构 bijian1013 oracle 数据库 plsql
/* *编写控制结构 */ --条件分支语句 --简单条件判断 DECLARE v_sal NUMBER(6,2); BEGIN select sal into v_sal from emp where lower(ename)=lower('&name'); if v_sal<2000 then update emp set
【Log4j二】Log4j属性文件配置详解 bit1129 log4j
如下是一个log4j.properties的配置 log4j.rootCategory=INFO, stdout , R log4j.appender.stdout=org.apache.log4j.ConsoleAppender log4j.appender.stdout.layout=org.apache.log4j.PatternLayout log4j.appe
java集合排序笔记白糖_ java
public class CollectionDemo implements Serializable,Comparable<CollectionDemo>{ private static final long serialVersionUID = -2958090810811192128L; private int id; private String nam
java导致linux负载过高的定位方法 ronin47
定位java进程ID 可以使用top或ps -ef |grep java ![图片描述][1] 根据进程ID找到最消耗资源的java pid 比如第一步找到的进程ID为5431 执行 top -p 5431 -H ![图片描述][2] 打印java栈信息 $ jstack -l 5431 > 5431.log 在栈信息中定位具体问题将消耗资源的Java PID转
给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数 bylijinnan 函数
import java.util.ArrayList; import java.util.List; import java.util.Random; public class RandNFromRand5 { /** 题目：给定能随机生成整数1到5的函数，写出能随机生成整数1到7的函数。解法1： f(k) = (x0-1)*5^0+(x1-
PL/SQL Developer保存布局 Kai_Ge
近日由于项目需要，数据库从DB2迁移到ORCAL，因此数据库连接客户端选择了PL/SQL Developer。由于软件运用不熟悉，造成了很多麻烦，最主要的就是进入后，左边列表有很多选项，自己删除了一些选项卡，布局很满意了，下次进入后又恢复了以前的布局，很是苦恼。在众多PL/SQL Developer使用技巧中找到如下这段： &n
[未来战士计划]超能查派[剧透,慎入] comsci 计划
非常好看,超能查派,这部电影......为我们这些热爱人工智能的工程技术人员提供一些参考意见和思想........ 虽然电影里面的人物形象不是非常的可爱....但是非常的贴近现实生活.... &nbs
Google Map API V2 dai_lm google map
以后如果要开发包含google map的程序就更麻烦咯 http://www.cnblogs.com/mengdd/archive/2013/01/01/2841390.html 找到篇不错的文章，大家可以参考一下 http://blog.sina.com.cn/s/blog_c2839d410101jahv.html 1. 创建Android工程由于v2的key需要G
java数据计算层的几种解决方法2 datamachine java sql 集算器
2、SQL SQL/SP/JDBC在这里属于一类，这是老牌的数据计算层，性能和灵活性是它的优势。但随着新情况的不断出现，单纯用SQL已经难以满足需求，比如： JAVA开发规模的扩大，数据量的剧增，复杂计算问题的涌现。虽然SQL得高分的指标不多，但都是权重最高的。成熟度：5星。最成熟的。
Linux下Telnet的安装与运行 dcj3sjt126com linux telnet
Linux下Telnet的安装与运行 linux默认是使用SSH服务的而不安装telnet服务如果要使用telnet 就必须先安装相应的软件包即使安装了软件包默认的设置telnet 服务也是不运行的需要手工进行设置如果是redhat9，则在第三张光盘中找到 telnet-server-0.17-25.i386.rpm
PHP中钩子函数的实现与认识 dcj3sjt126com PHP
假如有这么一段程序： function fun(){ fun1(); fun2(); } 首先程序执行完fun1()之后执行fun2()然后fun()结束。但是，假如我们想对函数做一些变化。比如说，fun是一个解析函数，我们希望后期可以提供丰富的解析函数，而究竟用哪个函数解析，我们希望在配置文件中配置。这个时候就可以发挥钩子的力量了。我们可以在fu
EOS中的WorkSpace密码修改蕃薯耀修改WorkSpace密码
EOS中BPS的WorkSpace密码修改 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--SpringSecurity相关配置【SpringSecurityConfig】 hanqunfeng SpringSecurity
SpringSecurity的配置相对来说有些复杂，如果是完整的bean配置，则需要配置大量的bean，所以xml配置时使用了命名空间来简化配置，同样，spring为我们提供了一个抽象类WebSecurityConfigurerAdapter和一个注解@EnableWebMvcSecurity，达到同样减少bean配置的目的，如下： applicationContex
ie 9 kendo ui中ajax跨域的问题 jackyrong AJAX跨域
这两天遇到个问题，kendo ui的datagrid，根据json去读取数据，然后前端通过kendo ui的datagrid去渲染，但很奇怪的是，在ie 10,ie 11,chrome,firefox等浏览器中，同样的程序，浏览起来是没问题的，但把应用放到公网上的一台服务器，却发现如下情况： 1） ie 9下，不能出现任何数据，但用IE 9浏览器浏览本机的应用，却没任何问题
不要让别人笑你不能成为程序员 lampcy 编程程序员
在经历六个月的编程集训之后，我刚刚完成了我的第一次一对一的编码评估。但是事情并没有如我所想的那般顺利。说实话，我感觉我的脑细胞像被轰炸过一样。手慢慢地离开键盘，心里很压抑。不禁默默祈祷：一切都会进展顺利的，对吧？至少有些地方我的回答应该是没有遗漏的，是不是？难道我选择编程真的是一个巨大的错误吗——我真的永远也成不了程序员吗？我需要一点点安慰。在自我怀疑，不安全感和脆弱等等像龙卷风一
马皇后的贤德 nannan408
马皇后不怕朱元璋的坏脾气，并敢理直气壮地吹耳边风。众所周知，朱元璋不喜欢女人干政，他认为“后妃虽母仪天下，然不可使干政事”，因为“宠之太过，则骄恣犯分，上下失序”，因此还特地命人纂述《女诫》，以示警诫。但马皇后是个例外。　　有一次，马皇后问朱元璋道：“如今天下老百姓安居乐业了吗？”朱元璋不高兴地回答：“这不是你应该问的。”马皇后振振有词地回敬道：“陛下是天下之父，
选择某个属性值最大的那条记录（不仅仅包含指定属性，而是想要什么属性都可以） Rainbow702 sql group by 最大值 max 最大的那条记录
好久好久不写SQL了，技能退化严重啊！！！直入主题：比如我有一张表，file_info，它有两个属性（但实际不只，我这里只是作说明用）： file_code, file_version 同一个code可能对应多个version 现在，我想针对每一个code，取得它相关的记录中，version 值最大的那条记录， SQL如下： select *
VBScript脚本语言 tntxia VBScript
VBScript 是基于VB的脚本语言。主要用于Asp和Excel的编程。 VB家族语言简介 Visual Basic 6.0 源于BASIC语言。由微软公司开发的包含协助开发环境的事
java中枚举类型的使用 xiao1zhao2 java enum 枚举 1.5新特性
枚举类型是j2se在1.5引入的新的类型,通过关键字enum来定义,常用来存储一些常量. 1.定义一个简单的枚举类型 public enum Sex { MAN, WOMAN } 枚举类型本质是类,编译此段代码会生成.class文件.通过Sex.MAN来访问Sex中的成员,其返回值是Sex类型. 2.常用方法静态的values()方