*恩赐*

数据科学竞赛入门大作业之吃鸡排名预测

该课程是安徽工程大学数据科学与大数据技术大一下修的课程，要求完成百度飞桨或阿里云上面的数据科学竞赛并拟写报告和答辩。

我的成绩是优秀，以下格式仅供参考。

该课程是安徽工程大学数据科学与大数据技术大一下修的课程，要求完成百度飞桨或阿里云上面的数据科学竞赛并拟写报告和答辩。

1 赛题背景

2 赛题数据

2.1数据简介

3 数据探索性分析

3.1 检查列中是否存在缺失值

3.2 查看其中列的最大值（有用的可分析的，像 player_name之类的可以不用分析，游戏不会因为名字长短获得胜利。）

3.3 将数据可视化进行数据分析

4 数据预处理

4.1 数据缺失值处理

4.2 构建新的特征

4.3 归一化

5 模型构建

5.1 模型选择

5.1.1 基线模型

5.1.2 优化模型一

5.1.3 优化模型二

5.1.4 确定模型

5.2 模型训练

5.2.1模型训练基线代码

5.2.2 优化模型训练代码

5.3 模型优化

5.3.1 优化模型搭建

5.4 模型预测

5.4.1 测试集预测

5.4.2 预测值反归一化

5.4.3 对预测数据取整并保存

5.4.4 保存模型

6 个人小结

6.1 吃鸡比赛排名预测个人小结-数据科学221魏永雷

6.1.1 学到了很多新知识

6.1.2 提升了自己的实践能力

6.1.3 遇到了一些挑战和问题

6.1.4 要加强团队协作能力

6.1.5 要善于总结和反思

6.1.6 要坚持学习和实践

6.2吃鸡比赛排名预测个人小结-数据科学221魏宏婷

6.2.1 学习到了很多新知识

6.2.2 遇到了一些困难和挑战

6.2.3 学会合作共赢

6.2.4 增强了动手能力

6.2.5 学会总结不断学习

6.3吃鸡比赛排名预测个人小结-数据科学222卞东强

6.3.1 汲取了新的知识

6.3.2 克服遇到的困难

6.3.3 懂得团结，学会团队合作

6.3，4学会总结经验，不在同一个地方绊倒

6.3.5自身的动手能力增强

7 团队小结

8 参考文献

9 附录

9.1项目源码链接及介绍：

9.2 了解我们的课题

9.3 预测文件（95.1741分，5月榜二）

9.4 联系我们

9.5 团队成员探讨记录

1 赛题背景

《绝地求生》(PUBG) 是一款国内外很火的战术竞技型射击类沙盒游戏。在游戏中，玩家需要在游戏地图上收集各种资源，并在不断缩小的安全区域内对抗其他玩家，让自己生存到最后。主办方提供了PUBG游戏数据中玩家的行为数据，要求我们能够通过每位玩家的统计信息、队友统计信息、本局其他玩家的统计信息等，预测玩家最终的游戏排名。通过查找相关文献，文献[1]综合运用时间序列指数平滑法、一元线性回归和层次分析法等数据挖掘方法，预测第32届奥运会奖牌榜排名。文献[2]针对学生成绩排名预测的问题，采用多元线性回归对某初中初一学生月考成绩进行回归分析，得到的关于成绩排名的回归模型，能够有效的对学生的排名进行预测。文献[3]利用校园一卡通数据，结合可视化相关技术，设计一卡通数据可视化模型，有效地发现学生在校园中的行为规律和异常情况。此外，利用可视化交互方式，将学生的行为和成绩联系起来，探索引起学生成绩变化的因素，并通过多元线性回归对学生成绩排名进行预测，其相关性达到了 90%以上，证明可视化效果的有效性。了解到本赛题是一个典型的回归问题，需要建立线性回归模型进行排名的预测。

综上所述，对该问题采用多元线性回归的方法，来预测吃鸡比赛的排名。

2 赛题数据

2.1数据简介

赛题训练集案例如下：训练集5万数据，共150w行测试集共5000条数据，共50w行赛题数据文件总大小150MB，数据均为csv格式，列使用逗号分割。

表1:吃鸡比赛排名预测数据集

测试集中label字段team_placement为空，需要选手预测。完整的数据字段含义如下：

match_id：本局游戏的id

team_id：本局游戏中队伍id，表示在每局游戏中队伍信息

game_size：本局队伍数量

party_size：本局游戏中队伍人数

player_assists：玩家助攻数

player_dbno：玩家击倒数

player_dist_ride：玩家车辆行驶距离

player_dist_walk：玩家步行距离

player_dmg：输出伤害值

player_kills：玩家击杀数

player_name：玩家名称，在训练集和测试集中全局唯一

kill_distance_x_min：击杀另一位选手时最小的x坐标间隔

kill_distance_x_max：击杀另一位选手时最大的x坐标间隔

kill_distance_y_min：击杀另一位选手时最小的y坐标间隔

kill_distance_y_max：击杀另一位选手时最大的x坐标间隔

team_placement：队伍排名

3 数据探索性分析

3.1 检查列中是否存在缺失值

missing_values = train_df.isna()

统计每列缺失值的个数:

num_missing = train_df.isna().sum()

图 1-1 缺失值分析

缺失值严重缺失的：match_id team_id game_size party_size player_assists player_dbno player_dist_ride player_dist_walk player_dmg

player_kills player_name 。这些数据可以抛弃。

图 1-2 数据剖析

3.2 查看其中列的最大值（有用的可分析的，像 player_name之类的可以不用分析，游戏不会因为名字长短获得胜利。）

kill_distance_x_min：击杀另一位选手时最小的x坐标间隔

kill_distance_x_max：击杀另一位选手时最大的x坐标间隔

kill_distance_y_min：击杀另一位选手时最小的y坐标间隔

kill_distance_y_max：击杀另一位选手时最大的x坐标间隔

是可用分析数据，其最大值为

图 1-3 最大值

变量相关性分析（散点图、相关图）

3.3 将数据可视化进行数据分析

sns.heatmap(train_df.corr())

采用热点图观察数据波动变化，特征和特征之间存在一定的相关性，采用热力图采用颜色的深浅、点的疏密以及呈现比重的形式，可以清晰地观察特征和特征之间的相关程度。

图 1-4 数据关联热力图

4 数据预处理

4.1 数据缺失值处理

本次竞赛代码运用的是最常用的一种填充缺失值方法，用pandas中的fillna()指定填充指定列或者整个数据集。

先检查每个列中是否存在缺失值，返回一个包含 True 和 False 的 DataFrame，然后统计每个列中缺失值的数量，最后统计整个 DataFrame 中缺失值的数量。检查结果发现训练数据集中kill_distance_x_min、kill_distance_x_max、kill_distance_y_min、kill_distance_y_max四列的缺失值太多，检查结果如下图：

图 2-1 检查数据

图 2-2 数据缺失

为避免训练出错，填充nan值。

再次查看测试集数据缺失值，检查结果如下图：

图 2-3 检查测试集数据

图 2-4 缺失值过多

发现训练数据集中的缺失值还是很多，为了避免训练出错，继续填充nan值。

4.2 构建新的特征

在机器学习中，数据和特征决定了上限，特征越好，灵活性越强，构建的模型越简单，模型的性能也越出色。

本代码构建新的特征，包括最大死亡距离和最小丝杠距离的差值、死亡距离半径，并将新特征合并到原数据集中。具体来说，代码首先使用 Pandas 库的 sqrt() 函数计算了两个新特征 kill_distance_min 和 kill_distance_max，分别对应着最小死亡距离和最大死亡距离的欧式距离。然后将最小死亡距离和最大死亡距离的差值作为一个新的特征 kill_distance_minmax。接下来计算了一个新的特征 player_dist_all，表示玩家总移动距离。最后，使用 Pandas 的 reindex() 方法将新特征加入到原数据集中，并重新排列列的顺序。（具体代码见附录）

在测试集上也执行了相同的特征工程（除了目标变量 team_placement）。

4.3 归一化

归一化就是将需要的数据经过处理后限制在所需要的一定范围内。其是为了后面数据处理的方便，并保证程序运行时收敛加快。

本代码对标签和数据归一化。（具体代码见附录）

最后输出训练集 train_df 和测试集 test_df 的行和列数，以元组的形式返回。

5 模型构建

5.1 模型选择

5.1.1 基线模型

模型分析；

该模型是一个包含三个全连接层的简单的神经网络模型，输入大小为13，输出大小为1。其中各层的节点数依次为40、20和1。激活函数使用了ReLU，没有加入Dropout等防止过拟合的方法。

优点：

（1）模型结构简单，参数较少，容易训练和优化。

（2）适用于小型数据集，适合快速迭代模型并快速验证模型的效果。

（3）使用了ReLU激活函数，能够有效避免梯度消失问题，并且计算速度比较快。

缺点：

（1）模型复杂度较低，可能会有欠拟合的情况出现，需要调整模型结构或增加正则化等手段来解决。

（2）模型没有加入防止过拟合的方法，可能会出现过拟合的情况，需要增加正则化或者Dropout等手段来缓解。

（3）模型对于大规模数据集的效果较差，可能出现欠拟合的情况，需要加深网络结构或者使用更复杂的模型来提高拟合能力。

5.1.2 优化模型一

模型分析：

该模型是一个包含多层全连接层的深度神经网络模型，输入大小为13，输出大小为1。各层的节点数都设置为了100，其中输出层节点数设置为20。激活函数使用了ReLU，并且在输出层也使用了ReLU，加入了防止过拟合的方法

优点：

（1）模型具有较强的拟合能力，适合处理一些较为复杂的问题。

（2）使用了深度结构，可以提高模型的表达能力和学习能力，从而更好地拟合数据。

（3）输出层也使用了ReLU激活函数，并且没有出现过拟合的问题。

缺点：

（1）模型结构较为复杂，参数数量较多，训练和优化难度较大。

（2）深度结构容易出现梯度消失或梯度爆炸的问题，需要使用特殊的初始化方法或正则化等手段来解决。

（3）因为模型较为复杂，可能会出现过拟合的情况，需要采用Dropout、正则化或其他防止过拟合的方法来缓解。

5.1.3 优化模型二

模型分析：

该模型是一个包含多层全连接层的深度神经网络模型，输入大小为13，输出大小为1。各层的节点数分别是128、64、32和1。激活函数使用了PReLU，并且在每一层后都使用了20%的Dropout层来防止过拟合。

优点：

（1）模型结构相对简单，同时也避免了梯度消失或梯度爆炸的问题，训练和优化较为容易。

（2）使用了PReLU激活函数和Dropout层，可以有效地缓解过拟合问题，提高模型的泛化能力。

（3）在损失函数上加入了L2正则化项，可以进一步降低过拟合风险。

缺点：

（1）模型的层数较少，可能难以处理一些复杂的问题。

（2）节点数较少，可能会导致模型的表达能力有一定的限制。

（3）只使用了一个损失函数，可能无法充分考虑数据的特点，如可以通过尝试其他损失函数进一步提高模型的性能。

5.1.4 确定模型

根据实际运行结果和效率来看最终选择了优化模型二（模型二代码见附录）

5.2 模型训练

5.2.1模型训练基线代码

代码分析：

这段代码是一个简单的基于PaddlePaddle的线性回归模型，它的优缺点如下：

优点：

（1）代码结构清晰，易于理解。

（2）使用了飞桨动态图的特性，方便用户进行快速试错和调试。

（3）计算损失和梯度下降等过程已经封装在了PaddlePaddle的内部实现中，用户只需定义网络结构即可。

缺点：

（1）代码中只使用了L1损失函数，没有体现出适合问题特点的损失函数可能会对性能造成影响。

（2）代码中缺少学习率和其他优化器的超参数设置，这会影响模型训练效率和性能。

（3）代码只用了独立同分布（i.i.d）的数据集，没有考虑到时间序列相关的数据集。如果需要处理时间序列相关数据集，需要将数据进行合理划分才能更好利用历史数据来预测未来趋势。

5.2.2 优化模型训练代码

代码分析：

优点：

（1）代码结构清晰、注释详细，易于理解和修改。

（2）对超参数设置进行了调整和注释，方便用户进行快速试错和调参。

（3）使用了L1损失函数，适合预测问题中存在离群点的情况。

缺点：

（1）梯度下降方法使用了默认的SGD优化算法，没有对其他优化器进行尝试，可能存在更好的优化效果。

5.2.3 训练结果如图：

图 3-1 模型训练结果

5.3 模型优化

5.3.1 优化模型搭建

由于基线模型复杂度较低，可能会有欠拟合的情况出现，需要调整模型结构或增加正则化等手段来解决。而且模型没有加入防止过拟合的方法，可能会出现过拟合的情况，需要增加正则化或者Dropout等手段来缓解。另外，模型对于大规模数据集的效果较差，可能出现欠拟合的情况，需要加深网络结构或者使用更复杂的模型来提高拟合能力。

针对基线模型的问题，搭建了两个优化模型,根据实际运行结果和效率来看最终选择了优化模型二（模型二代码见附录）。

5.4 模型预测

5.4.1 测试集预测

对训练好的神经网络模型进行测试预测，首先将模型转换为评估模式，即禁用 Dropout 层等随机性的层，以确保在测试期间模型具有一致的行为，然后将测试集转换为 Tensor 格式，并将其输入到训练好的神经网络模型中，得到每个样本的预测值 test_predict。最后将 test_predict 转换为 Numpy 数组，并使用 flatten() 函数将多维数组降为一维，得到最终的测试集预测结果。

5.4.2 预测值反归一化

对PUBG游戏比赛场次中，测试集中的队伍排名（test_predict）进行反归一化处理，并计算出测试集中每个队伍的真实排名（team_placement）。首先读取PUBG游戏数据的训练集和测试集。然后删除训练集和测试集中的 match_id 和 team_id 列（即比赛ID和队伍ID），因为这些列对模型预测结果没有贡献，使用0填充训练集和测试集中的缺失值。然后将测试集数据复制一份为 test_df3，并将其 team_placement 列赋值为游戏场次数乘以归一化处理后的队伍排名（即 game_size * test_predict）。最后对 test_df3 进行反归一化处理，得到每个队伍在该场游戏中的真实排名。

5.4.3 对预测数据取整并保存

由于竞赛要求提交结果为csv文件的zip文件，所以将测试集的预测结果保存为CSV文件和zip文件。首先将 test_predict 转换为 Pandas 数据框格式，列名为 team_placement。然后使用 to_csv 函数将 Pandas 数据框写入 submission.csv 文件，并通过设置 index=None 参数来取消行索引写入，最后使用 zip 函数将生成的 submission.csv 文件压缩为 submission.zip 文件，以方便提交结果。

图 3-2 预测结果

5.4.4 保存模型

将训练好的神经网络模型在训练结束后保存下来，以便之后可以重新加载该模型并进行继续的训练或预测。首先定义一个函数 save_model，该函数有三个参数：model是要保存的模型，optimizer是模型对应的优化器，model_name是指定的模型名称。然后在 save_model 函数中，首先定义两个保存路径，一个用于保存模型参数，一个用于保存优化器信息和相关参数。然后使用 paddle.save 函数将模型参数保存到指定路径的文件中。最后使用 paddle.save 函数将优化器信息和相关参数保存到指定路径的文件中。

6 个人小结

6.1 吃鸡比赛排名预测个人小结-数据科学221魏永雷

在参加数据科学竞赛的过程中，我收获了很多知识和经验，也充分展现了自己的才智和实践能力。以下是我的个人小结：

6.1.1 学到了很多新知识

在数据科学竞赛中，我学到了很多新的知识和技能。比如，我学会了如何处理大规模的数据集，如何使用机器学习算法进行数据建模和预测等。同时，我还学会了如何用 Python 进行数据分析和数据可视化，以及如何利用 AI Studio等平台工具进行代码管理和版本控制。

6.1.2 提升了自己的实践能力

数据科学竞赛不仅考验了我理论知识的深度，更考察了我实践能力的水平。在比赛中，我不断尝试各种算法和模型，并根据实验结果进行调整和优化。通过这样的实践过程，我逐渐熟悉了机器学习的流程和方法，也明确了自己学习和提高的方向。

6.1.3 遇到了一些挑战和问题

在比赛中，我也遇到了一些挑战和问题。比如，有时候数据集过于庞大，需要用到一些分布式计算和高性能计算的工具。而这些工具对于我这样的初学者来说，可能需要更多的时间和耐心去学习和掌握。

同时，在比赛中，我也发现了我的一些短板和不足之处。比如，在数据清洗和特征工程等方面，我还需要加强自己的技能和实践经验。这些短板和不足之处也成为了我未来学习和提高的动力。

6.1.4 要加强团队协作能力

另外，在数据科学竞赛中，我也体验到了团队协作的重要性。在团队中，每个人都有自己的优势和特点，能够相互协作、相互促进，共同完成任务。通过与团队成员的交流和合作，我不仅学到了更多的知识和技能，还提高了自己的沟通和领导能力。

此外，比赛过程中我也认识到了数据科学的兴起对于行业发展所带来的影响，数据科学已成为推动产业及社会进步的核心驱动力之一。因此，在未来的学习和职业规划中，我将继续深入探索数据科学领域，并为其发展贡献自己的力量。

6.1.5 要善于总结和反思

另外，在数据科学竞赛中，我也发现了自己的一些优点和长处。比如，我具有较强的数学和编程能力，能够快速理解和掌握新的算法和模型；同时，我也拥有较好的逻辑思维和问题解决能力，能够从数据中找到规律和特点，有效分析和解决问题。这些优点和长处让我在比赛中有了一定的竞争优势，也为我的未来学习和职业发展奠定了良好的基础。

最后，通过参加数据科学竞赛，我也对自己的人生目标和价值观进行了思考和反思。我认识到，只有不断努力学习和探索，并且将所学应用于实践之中，才能不断提高自己的个人素质和技能，实现自己的人生价值和目标。我会在未来的学习和工作中保持这样的态度，坚持不懈地追求进步和改善。

6.1.6 要坚持学习和实践

总之，参加数据科学竞赛让我深刻意识到了数据科学的广阔前景和重要性。但是，要想在这个领域取得更好的成绩和表现，就需要不断坚持学习和实践，提高自己的知识水平和实践能力。我相信，只要保持热情和耐心，一定能够在数据科学的道路上越走越远。

6.2吃鸡比赛排名预测个人小结-数据科学221魏宏婷

在参加数据科学竞赛的过程中，收获了很多经验和知识，以下是我的个人小结：

6.2.1 学习到了很多新知识

在我负责的数据预处理部分中，学习到了许多新知识。例如数据预处理的步骤：数据清洗、数据抽取、数据转换、数据映射、数据标准化等。以及处理数据缺失值的方法，其中本代码运用的是最常用的一种填充缺失值方法，用pandas中的fillna()指定填充指定列或者整个数据集。也了解了一些特征工程中构建新的特征和归一化的相关知识。

6.2.2 遇到了一些困难和挑战

一开始我对数据科学竞赛是完全不了解的，不了解竞赛的过程步骤，缺乏相关理论知识，缺少参赛经验。在经过课程学习和自己在各个数据科学竞赛平台上摸索动手实践后，我逐渐感兴趣并报名参加了一些学习赛来熟悉竞赛流程。在完成大作业的前期，我们的小组也面临过分工不明等情况，但在成员们一起协商合作下，问题被逐一解决。

6.2.3 学会合作共赢

数据科学竞赛不可能只靠某一个人完成整个过程，每个人所擅长的领域不一样，有的人擅长编写代码，有的人擅长撰写文稿，有的人善于总结归纳。互相帮助，互相学习，互相进步，这才是团队合作的意义。与此同时，我们还要给予队友信任与肯定，只有这样我们才能在发挥自己优势的同时学习到新的知识与本领。

6.2.4 增强了动手能力

在参加此次数据科学竞赛之前，我很少会完整的完成一个赛题，这次的小组赛是一个很好的机会，去锻炼我各个方面的能力，提高综合素养。不进学习相关专业知识，还增进人际交往和与人沟通的能力，这是一个成长的过程。我也摆脱了只看不做，只听不练，真正自己动起手来参与实践，增强了动手能力。

6.2.5 学会总结不断学习

这次的数据科学竞赛小组模式让我学会了很多新知识，锻炼了自身的能力，同时也发现了自己的一些问题，希望自己在接下来的学习生活中，能以此次竞赛为契机，进一步深入学习，多动手实践，学好数据科学，为以后的考研以及工作之旅奠定基础。

6.3吃鸡比赛排名预测个人小结-数据科学222卞东强

6.3.1 汲取了新的知识

为了完成这次竞赛，我不停的的在网上查资料，在这个过程中，我不断地接触到新的知识，如paddle构建框架，基于Matplotlib的seaborn将数据转化为图片可视化，用热点图的颜色清晰的表示特征与特征之间的相关程度等等。

6.3.2 克服遇到的困难

当然这个过程不是一帆风顺的，总会遇到一些困难挫折，有的问题很快可以找出问题并及时的解决，但是还是会遇到一些卡脖子的问题，一些无法实现的技术，一些我无法理解的知识点，这个会困住我很长时间去了解它，去查资料，去问被别人，然后学会，掌握，最后运用到它。

6.3.3 懂得团结，学会团队合作

因为是团队合作，前期要一遍一遍的熟悉流程，有哪些步骤，需要做哪些，这个时候要对自己的能力和擅长的那一面，和自己哪一方面要有个数，对自己有一个清醒的认知，自己的水平怎么样，自己的长处在哪里，然后小组之间进行讨论分工，每个人要负责哪方面，把长处发挥最大化，不能因为个人情绪扰乱工作进度，一定要相信自己的队友，因为团队赛最需要的就是对队友的信任。多提问，多交流，众人拾柴火焰高，一块共同解决，一同寻找答案。

6.3，4学会总结经验，不在同一个地方绊倒

困难的地方很多，有时候还会一下子遇到相同的困难好几次，这个过程中我学会了总结归纳，遇到困难解决困难，再次遇到相同的问题，我能在极短的时间内用极简的方式解决，我觉得这就是我的收获，我的成功。

6.3.5自身的动手能力增强

初次动手做训练时多少有点生疏，总是忘这忘那的，有时候会钻牛角尖，这个问题用这种方法解决不了，就一直尝试用着中办法解决，不换个方向考虑，会耽误很长一段时间，这个竞赛的过程中，我极大的改正了这个毛病，学会避免钻牛角，并用极快的时间熟悉问题，采用其他方式解决。

7 团队小结

数据科学竞赛是一个很好的机会，让团队成员能够参与到数据科学实战中，挑战自己的技能和能力。在这场竞赛中，我们的团队参与了多个阶段，取得了一些成绩，现在来做一个小结。

首先，在团队中，我们非常注重团队协作，通过分工合作，充分利用每个成员的优势，最大化贡献了整个团队的效率和成果。同时，我们也注重技术学习和分享，通过经验的传递和交流，不断优化我们的算法和模型。

其次，我们在竞赛中取得了较为靠前的排名，但更重要的是我们在实践中学到了很多实际操作的经验，并对数据挖掘技术和算法进行了深入的理解和探索。我们发现，在数据科学中，不仅仅需要算法和技能，还需要对数据本身的理解和把控能力，同时也需要商业意识和风险控制能力。

除此之外，我们认为，数据科学竞赛是一个很好的锻炼机会，它不仅能够加强团队协作和技术能力，也可以帮助团队更好的理解数据本身和商业价值，同时也能够为个人创造更多的价值。我们希望在接下来的工作中，能够不断地深化我们的数据科学技能，探索更多的数据挖掘应用场景，并在竞赛中取得更好的成绩。

另外，在数据科学竞赛中，我们也遇到了一些挑战和问题。首先是数据集的质量和不完整性，需要通过数据清洗和预处理来提高数据质量。其次是算法创新和模型优化，需要不断探索新的算法和技术，同时也需要进行模型的调参和优化，以达到最佳效果。此外，还需要注重模型的可解释性和风险控制能力，以保证模型的可靠性和实用性。

此外，在数据科学竞赛中，我们还需要注重项目管理和沟通能力。在团队合作中，有效的项目管理可以保证项目的顺利进行和进度控制。同时，通过良好的沟通和协调，可以协调各个成员之间的工作，并共同解决问题。

除此之外，我们也需要注重结果的可视化和解释能力。在竞赛中，优秀的数据可视化和结果解释可以帮助我们更好地理解模型的预测结果和相应的业务场景。通过清晰的图表和解释，我们能够更好地与各方分享我们的成果，也可以为日后的分析提供有价值的参考。

综上所述，在数据科学竞赛中，需要注重多方面的能力和技能，包括团队协作、技术创新、数据理解、商业思维、项目管理、沟通能力、结果可视化和解释能力等。只有不断锤炼和提升这些能力，我们才能在竞赛中获得更好的成绩，并为实际业务带来更多的价值。

8 参考文献

[1]戴钰璁,王清华.第32届奥运会奖牌榜排名预测[J].电脑知识与技术,2017,13(26):215-219.DOI:10.14004/j.cnki.ckt.2017.2796.

[2]张晓非,王玉雯,聂佳琦等.多元线性回归在分析学生成绩排名预测中的应用[J].福建电脑,2018,34(05):154+160.DOI:10.16707/j.cnki.fjpc.2018.05.082.

[3]邢窈窈,唐丽,郭磊.基于校园一卡通数据的成绩排名预测方法研究[J].中国教育信息化,2018,No.420(09):82-86.

9 附录

9.1项目源码链接及介绍：

https://aistudio.baidu.com/bj-cpu-01/user/2690215/6011027/lab/tree/%E5%90%83%E9%B8%A1%E6%8E%92%E5%90%8D%E9%A2%84%E6%B5%8B.ipynb

9.2 了解我们的课题

课题链接：

https://aistudio.baidu.com/aistudio/competition/detail/799/0/introduction

9.3 预测文件（95.1741分，5月榜二）

9.4 联系我们

QQ群：430312727

群聊二维码

9.5 团队成员探讨记录

上面文章的图片我没有插入，结合实际情况去用，答辩好好做，不出意外也是优秀。

你可能感兴趣的:(数据科学竞赛,课程设计)

Dijkstra算法求最短路径问题
Dijkstra算法求最短路径问题——HM图论中最常见的问题就应是最短路径问题了，解决这一问题的几个基本算法有三个：Floyed、Dijkstra和SPFA了。现在我来浅谈一下Dijkstra的思想与实现。单纯的Dijkstra并不是很快，算一个点到其余各点的时间复杂度是O(n^2)级别，算每个点到其余各点的复杂度就是O(n^3)了，在提高组竞赛中不占优势，但其进行优化后便很强大了，如用堆优化Di
在二分类任务中如何处理包含中文的类别特征 Dush32 分类数据挖掘人工智能机器学习数据分析
在机器学习中，处理类别特征（CategoricalFeatures）是常见的任务，特别是在中文数据中，很多类别特征如省份、城市等都是字符串类型。如何将这些类别变量转换为模型可以理解的数值格式，是每个数据科学家都必须面对的挑战。在这篇文章中，我们将探讨两种常见的类别特征编码方法：astype('category')和LabelEncoder，并比较它们在二分类任务中的效果。我们以“省份”这一类别特征
算法竞赛备赛——【图论】求最短路径——Floyd算法 Aurora_wmroy 算法竞赛备赛算法图论 c++蓝桥杯数据结构
floyd算法基于动态规划应用：求多源最短路时间复杂度：n^3dijkstra：不能解决负边权floyd：能解决负边权不能解决负边权回路问题求最短路径：dijkstrabfsfloyd思路1.让任意两点之间的距离变短：引入中转点k通过k来中转i---->k---->jj2.找状态：n个点都可以做中转点的情况下，i到j之间的最短路径的长度是x最终状态：dp[n][i][j]=x;中间状态：dp[k]
数据分析的三大框架：底层技术、分析建模、工具选择 YHFHing 数据分析数据分析
有了世界观，我们可以开始搭建自己的知识大厦了。在搭建知识大厦之前，先需要建立知识的框架，然后才能高效的填充知识。所以今天我们先建立框架。数据分析的三大框架数据科学的框架分为三部分：底层技术框架/数据分析框架/工具选择框架，接下来依次给大家介绍：1.底层技术框架底层技术框是数据科学的基础设施，我们有所了解就好，处理框架和处理引擎负责对数据系统中的数据进行计算。流处理系统：流处理系统会对随时进入系统的
五大编程竞赛平台终极对比 2401_86601498 c++
LeetCodeLeetCode是一个流行的在线编程平台，提供大量算法和数据结构题目。题目分为简单、中等和困难三个难度级别。LeetCode的题目涵盖各种主题，包括数组、字符串、树、动态规划等。LeetCode支持多种编程语言，包括C++，并提供在线代码编辑器和即时反馈。LeetCode还提供竞赛和面试模拟功能，适合准备技术面试的用户。CodeforcesCodeforces是一个以竞赛为主的在线
2019-02-21 审应
我可以向大家保证的是，只要我会的，大家想学什么学什么。目前的计划是，利用有限的时间和精力，把我会的东西也按岗位来分，根据大家的兴趣，定向培养。现在看来呢，康对测点感兴趣，经过一些练习呢，干的也是有模有样，希望你多练，多经车型和试验。我也希望能在以后的工作中向你传授一些法规及原理性的一些知识，现在我们因为工作原因，教的还是操作性的套路居多，咱们知其然也知其所以然嘛。东升这边，电动车竞赛冠军哈，久仰大
B3872 [GESP202309 五级] 巧夺大奖晨曦（zxr_0102）洛谷题解算法 c++
题目传送门前言：怎么说呢，就是一道贪心题，发一遍就过了，然后这不马上就要考CSP-J/S了吗？祝各位OI竞赛者们（当然也包括我自己）RP++，废话不多说进入题解。题解：翻译：这道题给的题目解释有点绕，感觉很含蓄，又很笼统。题目大意：给定了n个任务，要在分钟内做完，就可以得到奖励，然后总时间是n分钟，小明可以确保在时间段内做完。分析：首先该题一看就是需要贪心，因为他想在规定的时间内拿到更多的金币，所
数据科学简讯 2023-04-07 数科每日
image.png头条SegmentAnything图像分割的重大进步图像分割是提取图像中代表特定对象（例如人或桌子）的所有像素的过程。由于几个原因，这是一项艰巨的任务，通常它要么需要大量预定义对象的数据集，要么需要一些的初级监督数据。Meta的这个全新的、完全开源的模型感觉就像是功能上的飞跃。他们收集了大量数据集，简化了注释功能，并创建了一个可以在浏览器中实时运行的模型。并提供演示、代码和论文。
【课程毕业设计】基于数字PID的电加热炉温度控制系统设计拉布拉斯也头大毕业课程设计 stm32 单片机 proteus 嵌入式硬件 pcb工艺
前言电加热炉控制系统属于一阶纯滞后环节，具有大惯性、纯滞后、非线性等特点，导致传统控制方法超调大。调节时间长、控制精度低。本设计采用PID算法进行温度控制，使整个闭环系统所期望的传递函数相当于一个延迟环节和一个惯性环节串联来实现对温度的较为精确的控制。第1章课程设计方案1.1系统组成中体结构电加热炉温度控制系统原理图如下，主要由温度检测电路、A/D转换电路、驱动执行电路、显示电路及按键电路等组成。
测绘程序设计|测绘程序设计大赛介绍|备赛建议小 y 同学测绘程序设计大赛测绘程序设计 C#测绘程序设计大赛备赛建议
**由于微信公众号改变了推送规则，为了每次新的推送可以在第一时间出现在您的订阅列表中，记得将本公众号设为星标或置顶喔~** 简单介绍测绘学科创新创业智能大赛测绘技能竞赛——测绘程序设计比赛。前言测绘程序设计比赛是测绘学科创新创业大赛分支——测绘技能竞赛的分支——测绘程序设计比赛，参赛选手需要在规定的时间内完成成果并提交到比赛系统。本文采用自问自答的方式对该比赛做了简单介绍，仅供学习参考。问答
NOIP2013提高组复赛数据详细分析与应用指南欧学东
本文还有配套的精品资源，点击获取简介：2013年的NOIP提高组复赛数据，涉及C++编程、算法设计、数据结构、问题分析、时间空间复杂度优化、调试测试、比赛策略、历年试题分析等多个知识点。这些数据对于参赛者、教练和信息技术教育研究者具有重要参考价值，有助于提升信息技术能力和竞赛准备的有效性。1.NOIP竞赛概览全国青少年信息学奥林匹克竞赛（NationalOlympiadinInformaticsi
Java图书管理系统课程设计全程实录拾光分享网
主要实现的功能用户登录，用户注册，用户修改密码图书信息添加，删除，修改，查询(多种查询方式)图书类别添加，删除，修改，查询系统退出，关于我们帮助项目亮点（下载：）全程实录，全程手动敲代码代码通俗易懂，容易上手客服QQ在线答疑适用于新手的课程设计项目常见找错误的方法，Debug模式
【2024国赛C题】【农作物的种植策略】2024 年全国大学生数学建模比赛思路、代码更新中..... 程序猿鑫数学建模
欢迎来到本博客❤️❤️博主优势：博客内容尽量做到思维缜密，逻辑清晰，为了方便读者。⛳️座右铭：行百里者，半于九十。本文目录如下：目录⛳️竞赛事件及参赛1找程序网站推荐2公式编辑器、流程图、论文排版324年国赛C题及资源下载4思路、代码分享......⛳️竞赛事件及参赛根据乡村的实际情况，充分利用有限的耕地资源，因地制宜，发展有机种植产业，对乡村经济的可持续发展具有重要的现实意义。选择适宜的农作物，
《Python Web 框架深度剖析：Django、Flask 与 FastAPI 的选择之道》清水白石008 课程教程学习笔记开发语言 python 前端 django
《PythonWeb框架深度剖析：Django、Flask与FastAPI的选择之道》开篇引入：从“胶水语言”到Web架构核心Python，自1991年由GuidovanRossum发布以来，凭借其简洁优雅的语法和强大的生态系统，逐渐成为全球最受欢迎的编程语言之一。它不仅在数据科学、人工智能、自动化脚本等领域大放异彩，更在Web开发领域构建起一套成熟的技术体系。作为一位长期从事Python开发与教
C++数据结构————二叉树 Гений.大天才 C++语言入门以及基础算法 c++数据结构开发语言
【前言】在数据结构与算法的世界里，二叉树（BinaryTree）始终占据着核心地位。它既是众多高级树形结构（B+树、红黑树、线段树、字典树……）的“基因”，又是面试、竞赛与工程实战中绕不开的考点。本文将用大约2万字的篇幅，从“零”开始，把C++二叉树的所有常见形态、常见算法、常见坑点与常见优化一次性讲透。全文配套可编译运行的C++17/20代码2000余行，所有示例均在GCC13/Clang17/
初识linux 贩卖纯净水. Linux linux
Linux从哪里来？（东土大唐）它是怎么发展的？（一个筋斗云翻身）历史沿革我是程序猿，你是运动员，我们都有缘。作为一个码农，有一些计算机界的“常识”是需要了解的。计算机是在什么时候诞生的呢？又是在一个怎样的背景下，计算机诞生了呢？计算机的发明其实早期的计算机是为了给军事提供支持才被发明出来的，被用于计算导弹弹道轨迹。在美苏冷战时期，军备竞赛转变为科技竞赛，计算机于对抗中产生，首先应用于军事。计算机
python automl_自动化的机器学习(AutoML)：将AutoML部署到云中
编辑推荐:在本文中，将介绍一种AutoML设置，使用Python、Flask在云中训练和部署管道；以及两个可自动完成特征工程和模型构建的AutoML框架。本文来自于搜狐网，由火龙果软件Alice编辑、推荐。AutoML到底是什么？AutoML是一个很宽泛的术语，理论上来说，它囊括从数据探索到模型构建这一完整的数据科学循环周期。但是，我发现这个术语更多时候是指自动的特征预处理和选择、模型算法选择和超
Python 数据分析与可视化：从基础到进阶的技术实现与优化策略女码农的重启 python 数据分析开发语言
数据分析与可视化是数据科学领域的核心技能，Python凭借其丰富的库生态和灵活的编程范式，成为该领域的首选工具。本文将系统讲解Python数据分析与可视化的技术栈实现，从基础操作到性能优化，结合实战场景提供可复用的解决方案。数据分析核心库技术解析Pandas数据处理引擎原理Pandas作为数据分析的基石，其核心优势在于基于NumPy的矢量运算和高效的内存管理。与Excel的单元格级操作不同，Pan
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1179 数字统计
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1179[NOIP2010普及组]数字
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1109 学生分组热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1109学生分组-洛谷【题目描述】有n
算法竞赛备考冲刺必刷题（C++） | 洛谷 P1449 后缀表达式热爱编程的通信人算法 c++开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】洛谷：P1449后缀表达式-洛谷【题目描述】所
Python的科学计算库NumPy（一） linlin_1998 python numpy 开发语言
NumPy(NumericalPython)是Python中最基础、最重要的科学计算库之一，提供了高性能的多维数组（ndarray）对象和大量数学函数，是许多数据科学、机器学习库（如Pandas、SciPy、TensorFlow等）的基础依赖。1.创建一个numpy里面的一维数组importnumpyasnp###通过array方法创建一个ndarrayarray1=np.array([1,2,3
Python数据分析：从入门到精通
引言在当今数据驱动的时代，数据分析已成为企业和组织做出明智决策的关键。Python作为一种强大的编程语言，因其简洁性和丰富的数据分析库而成为数据科学领域的首选工具。无论你是初学者还是有一定经验的数据分析师，本指南都将带你从入门到精通Python数据分析，掌握必备技能和最佳实践。数据分析的重要性与Python的角色数据分析涉及收集、处理和解释数据，以揭示模式、趋势和见解。它有助于解决复杂问题，优化业
专题：2025供应链数智化与效率提升报告|附100+份报告PDF、原数据表汇总下载拓端研究室 php 开发语言
全文链接：https://tecdat.cn/?p=42926在全球产业链重构与数字技术革命的双重驱动下，供应链正经历从传统经验驱动向数据智能驱动的范式变革。从快消品产能区域化布局到垂类折扣企业的效率竞赛，从人形机器人的成本优化到供应链金融对中小企业的赋能，技术创新与模式重构正在重塑行业价值网络。本报告洞察基于《灼识咨询：2025中国供应链金融科技行业蓝皮书》《中国银河证券：折扣业态供应链效率深度
详解LLMOps，将DevOps用于大语言模型开发
大家好，在机器学习领域，随着技术的不断发展，将大型语言模型（LLMs）集成到商业产品中已成为一种趋势，同时也带来了许多挑战。为了有效应对这些挑战，数据科学家们转向了一种新型的DevOps实践LLM-OPS，专为大型语言模型的开发和维护而设计。本文将介绍LLM-OPS的核心思想，并分析这一策略如何帮助数据科学家更高效地运用DevOps的优秀实践，从而在语言模型的开发和部署过程中，提升工作效率和成果的
Python 生态发展之路仓颉编程语言技术文章 python
目录#Python是如何炼成的##生态系统持续扩张##Python开发的开源社区运作#更加广义的Python社区#广泛应用##Web开发、数据科学##不得不提的人工智能#支持Python成长的商业公司#Python成功之路小结##附：Python生态发展大事记#参考Python是现今最受欢迎的编程语言之一，2021年8月的TIOBE编程语言排行榜中，Python排名第二，仅次于C[1]。2017年
Python生态全景图：8大主流框架优缺点及选型指南 Sammyyyyy python 开发语言 django fastapi flask
引言：Python的“万能”生态Python为何能成为当今最流行的编程语言之一？答案并非其语法本身，而在于其强大且多样化的框架生态。这个生态系统如同一片繁荣的大陆，覆盖了从Web后端到人工智能的几乎所有技术领域，让开发者能用一种语言胜任多种截然不同的任务。本文将化作一张“技术地图”，快速带你游览Python在Web开发、数据科学和网络爬虫三大领域的8个标志性框架。我们的目标是迅速掌握它们的精髓，让
【亲测免费】 CatBoost 教程项目使用指南
CatBoost教程项目使用指南tutorials项目地址:https://gitcode.com/gh_mirrors/tutorials1/tutorials1.项目介绍CatBoost是一个高效、灵活且易于使用的梯度提升库，特别适用于处理分类特征。它由Yandex开发，广泛应用于机器学习和数据科学领域。CatBoost提供了丰富的功能，包括自动处理分类特征、支持GPU训练、内置的交叉验证和模
Python自动化机器学习平台库之mindsdb使用详解
概要MindsDB是一个开源的自动化机器学习平台，它通过SQL接口简化了机器学习模型的创建、训练和预测过程。该库的核心理念是将机器学习功能直接集成到数据库中，让开发者无需深入了解复杂的机器学习算法，就能够快速构建和部署预测模型。MindsDB支持多种数据源连接，包括MySQL、PostgreSQL、MongoDB等主流数据库，同时提供了丰富的PythonAPI接口，使得数据科学家和开发者能够在熟悉
数据结构课程设计秋悠然深度优先算法图论
项目名称：图的遍历课程设计主要目的：1.了解并掌握数据结构与算法的设计方法。2.通过应用数据结构的基本理论和方法来解决实际问题。3.初步掌握软件开发过程中的问题分析、系统设计、程序编码、调试、数据测试等基本方法和技能。4.学习编写课程设计报告，软件开发文档。课程设计任务要求：任务：实现图的深度遍历（递归和非递归两种方法）以及实现图的广度遍历（队列）要求：1.程序能够正确运行，实现图的深度遍历和广度
linux系统服务器下jsp传参数乱码 3213213333332132 java jsp linux windows xml
在一次解决乱码问题中，发现jsp在windows下用js原生的方法进行编码没有问题，但是到了linux下就有问题， escape,encodeURI,encodeURIComponent等都解决不了问题但是我想了下既然原生的方法不行，我用el标签的方式对中文参数进行加密解密总该可以吧。于是用了java的java.net.URLDecoder,结果还是乱码，最后在绝望之际，用了下面的方法解决了
Spring 注解区别以及应用 BlueSkator spring
1. @Autowired @Autowired是根据类型进行自动装配的。如果当Spring上下文中存在不止一个UserDao类型的bean，或者不存在UserDao类型的bean，会抛出 BeanCreationException异常，这时可以通过在该属性上再加一个@Qualifier注解来声明唯一的id解决问题。 2. @Qualifier 当spring中存在至少一个匹
printf和sprintf的应用 dcj3sjt126com PHP sprintf printf
<?php printf('b: %b c: %c d: %d <bf>f: %f', 80,80, 80, 80); echo ' '; printf('%0.2f %+d %0.2f ', 8, 8, 1235.456); printf('th
config.getInitParameter 171815164 parameter
web.xml <servlet> <servlet-name>servlet1</servlet-name> <jsp-file>/index.jsp</jsp-file> <init-param> <param-name>str</param-name>
Ant标签详解--基础操作 g21121 ant
Ant的一些核心概念： build.xml：构建文件是以XML 文件来描述的，默认构建文件名为build.xml。 project：每个构建文
[简单]代码片段_数据合并 53873039oycg 代码
合并规则:删除家长phone为空的记录,若一个家长对应多个孩子,保留一条家长记录,家长id修改为phone,对应关系也要修改。代码如下:
java 通信技术云端月影 Java 远程通信技术
在分布式服务框架中，一个最基础的问题就是远程服务是怎么通讯的，在Java领域中有很多可实现远程通讯的技术，例如：RMI、MINA、ESB、Burlap、Hessian、SOAP、EJB和JMS等，这些名词之间到底是些什么关系呢，它们背后到底是基于什么原理实现的呢，了解这些是实现分布式服务框架的基础知识，而如果在性能上有高的要求的话，那深入了解这些技术背后的机制就是必须的了，在这篇blog中我们将来
string与StringBuilder 性能差距到底有多大 aijuans
之前也看过一些对string与StringBuilder的性能分析，总感觉这个应该对整体性能不会产生多大的影响，所以就一直没有关注这块！由于学程序初期最先接触的string拼接，所以就一直没改变过自己的习惯！
今天碰到 java.util.ConcurrentModificationException 异常 antonyup_2006 java 多线程工作 IBM
今天改bug，其中有个实现是要对map进行循环，然后有删除操作，代码如下： Iterator<ListItem> iter = ItemMap.keySet.iterator(); while(iter.hasNext()){ ListItem it = iter.next(); //...一些逻辑操作 ItemMap.remove(it); } 结果运行报Con
PL/SQL的类型和JDBC操作数据库百合不是茶 PL/SQL表标量类型游标 PL/SQL记录
PL/SQL的标量类型: 字符,数字,时间,布尔,%type五中类型的 --标量：数据库中预定义类型的变量 --定义一个变长字符串 v_ename varchar2(10); --定义一个小数,范围 -9999.99~9999.99 v_sal number(6,2); --定义一个小数并给一个初始值为5.4 :=是pl/sql的赋值号
Mockito：一个强大的用于 Java 开发的模拟测试框架实例 bijian1013 mockito 单元测试
Mockito框架： Mockito是一个基于MIT协议的开源java测试框架。 Mockito区别于其他模拟框架的地方主要是允许开发者在没有建立“预期”时验证被测系统的行为。对于mock对象的一个评价是测试系统的测
精通Oracle10编程SQL(10)处理例外 bijian1013 oracle 数据库 plsql
/* *处理例外 */ --例外简介 --处理例外-传递例外 declare v_ename emp.ename%TYPE; begin SELECT ename INTO v_ename FROM emp where empno=&no; dbms_output.put_line('雇员名：'||v_ename); exceptio
【Java】Java执行远程机器上Linux命令 bit1129 linux命令
Java使用ethz通过ssh2执行远程机器Linux上命令，封装定义Linux机器的环境信息 package com.tom; import java.io.File; public class Env { private String hostaddr; //Linux机器的IP地址 private Integer po
java通信之Socket通信基础白糖_ java socket 网络协议
正处于网络环境下的两个程序，它们之间通过一个交互的连接来实现数据通信。每一个连接的通信端叫做一个Socket。一个完整的Socket通信程序应该包含以下几个步骤： ①创建Socket； ②打开连接到Socket的输入输出流； ④按照一定的协议对Socket进行读写操作； ④关闭Socket。 Socket通信分两部分：服务器端和客户端。服务器端必须优先启动，然后等待soc
angular.bind boyitech AngularJS angular.bind AngularJS API bind
angular.bind 描述：上下文，函数以及参数动态绑定，返回值为绑定之后的函数. 其中args是可选的动态参数，self在fn中使用this调用。使用方法： angular.bind(se
java-13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 bylijinnan java
import java.util.ArrayList; import java.util.List; public class KickOutBadGuys { /** * 题目：13个坏人和13个好人站成一圈，数到7就从圈里面踢出一个来，要求把所有坏人都给踢出来，所有好人都留在圈里。请找出初始时坏人站的位置。 * Maybe you can find out
Redis.conf配置文件及相关项说明（自查备用） Kai_Ge redis
Redis.conf配置文件及相关项说明 # Redis configuration file example # Note on units: when memory size is needed, it is possible to specifiy # it in the usual form of 1k 5GB 4M and so forth: #
[强人工智能]实现大规模拓扑分析是实现强人工智能的前奏 comsci 人工智能
真不好意思,各位朋友...博客再次更新... 节点数量太少,网络的分析和处理能力肯定不足,在面对机器人控制的需求方面,显得力不从心.... 但是,节点数太多,对拓扑数据处理的要求又很高,设计目标也很高,实现起来难度颇大...
记录一些常用的函数 dai_lm java
public static String convertInputStreamToString(InputStream is) { StringBuilder result = new StringBuilder(); if (is != null) try { InputStreamReader inputReader = new InputStreamRead
Hadoop中小规模集群的并行计算缺陷 datamachine mapreduce hadoop 并行计算
注：写这篇文章的初衷是因为Hadoop炒得有点太热，很多用户现有数据规模并不适用于Hadoop，但迫于扩容压力和去IOE（Hadoop的廉价扩展的确非常有吸引力）而尝试。尝试永远是件正确的事儿，但有时候不用太突进，可以调优或调需求，发挥现有系统的最大效用为上策。 -----------------------------------------------------------------
小学4年级英语单词背诵第二课 dcj3sjt126com english word
egg 蛋 twenty 二十 any 任何 well 健康的，好 twelve 十二 farm 农场 every 每一个 back 向后，回 fast 快速的 whose 谁的 much 许多 flower 花 watch 手表 very 非常，很 sport 运动 Chinese 中国的
自己实践了github的webhooks, linux上面的权限需要注意 dcj3sjt126com github webhook
环境, 阿里云服务器 1. 本地创建项目, push到github服务器上面 2. 生成www用户的密钥 sudo -u www ssh-keygen -t rsa -C "[email protected]" 3. 将密钥添加到github帐号的SSH_KEYS里面 3. 用www用户执行克隆, 源使
Java冒泡排序蕃薯耀冒泡排序 Java冒泡排序 Java排序
冒泡排序 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 10:40:14 星期二 http://fanshuyao.iteye.com/
Excle读取数据转换为实体List【基于apache-poi】 hanqunfeng apache
1.依赖apache-poi 2.支持xls和xlsx 3.支持按属性名称绑定数据值 4.支持从指定行、列开始读取 5.支持同时读取多个sheet 6.具体使用方式参见org.cpframework.utils.excelreader.CP_ExcelReaderUtilTest.java 比如： Str
3个处于草稿阶段的Javascript API介绍 jackyrong JavaScript
原文： http://www.sitepoint.com/3-new-javascript-apis-may-want-follow/?utm_source=html5weekly&utm_medium=email 本文中，介绍3个仍然处于草稿阶段，但应该值得关注的Javascript API. 1) Web Alarm API &
6个创建Web应用程序的高效PHP框架 lampcy Web 框架 PHP
以下是创建Web应用程序的PHP框架，有coder bay网站整理推荐： 1. CakePHP CakePHP是一个PHP快速开发框架，它提供了一个用于开发、维护和部署应用程序的可扩展体系。CakePHP使用了众所周知的设计模式，如MVC和ORM，降低了开发成本，并减少了开发人员写代码的工作量。 2. CodeIgniter CodeIgniter是一个非常小且功能强大的PHP框架，适合需
评"救市后中国股市新乱象泛起"谣言 nannan408
首先来看百度百家一位易姓作者的新闻：三个多星期来股市持续暴跌，跌得投资者及上市公司都处于极度的恐慌和焦虑中，都要寻找自保及规避风险的方式。面对股市之危机，政府突然进入市场救市，希望以此来重建市场信心，以此来扭转股市持续暴跌的预期。而政府进入市场后，由于市场运作方式发生了巨大变化，投资者及上市公司为了自保及为了应对这种变化，中国股市新的乱象也自然产生。首先，中国股市这两天
页面全屏遮罩的实现方式 Rainbow702 html css 遮罩 mask
之前做了一个页面，在点击了某个按钮之后，要求页面出现一个全屏遮罩，一开始使用了position:absolute来实现的。当时因为画面大小是固定的，不可以resize的，所以，没有发现问题。最近用了同样的做法做了一个遮罩，但是画面是可以进行resize的，所以就发现了一个问题，当画面被reisze到浏览器出现了滚动条的时候，就发现，用absolute 的做法是有问题的。后来改成fixed定位就
关于angularjs的点滴 tntxia AngularJS
angular是一个新兴的JS框架，和以往的框架不同的事，Angularjs更注重于js的建模，管理，同时也提供大量的组件帮助用户组建商业化程序，是一种值得研究的JS框架。 Angularjs使我们可以使用MVC的模式来写JS。Angularjs现在由谷歌来维护。这里我们来简单的探讨一下它的应用。首先使用Angularjs我
Nutz--->>反复新建ioc容器的后果 xiaoxiao1992428 DAO mvc IOC nutz
问题： public class DaoZ { public static Dao dao() { // 每当需要使用dao的时候就取一次 Ioc ioc = new NutIoc(new JsonLoader("dao.js")); return ioc.get(