zhuo木鸟

2021 年“认证杯”网络挑战赛 B 题（第一阶段）

文章目录

思路
数据预处理
- 数据分析
- 机器学习模型→缺失数据
- - 机器学习方法填充数据集
  - 标准化
  - 筛选模型参数
  - 筛选机器学习模型
  - 模型训练和评价
- 神经网络模型→缺失值
DBSCAN 聚类得出星群
- 聚类参数筛选——1
- 聚类参数筛选——2
- 结果与 H-R 图
- - 毕星团 HIP：
  - 绘制 H-R 图
代码与提问

本人专挑数据挖掘、机器学习和 NLP 类型的题目做，有兴趣也可以逛逛我的数据挖掘竞赛专栏。

最后，本人不会回访，不互关，不互吹，以及谢绝诸如此类事

赛题官网：http://www.tzmcm.cn/

思路

该题若用数据分析的方法解决，可以看成一个聚类问题。但要对聚类有一个比较深的理解。比如，聚类时，量纲不同，可能导致聚类有偏向性。题目讲：毕星团的 Plx 大于在 $[20, 22]$ ，因此，在聚类过程中，应该对 Plx 有所倾向。但如何控制这个倾向？

我认为：一是数据预处理；二是聚类算法和参数筛选上。

比如，在聚类之前，首先进行标准化，消除数据的量纲。之后，分析其他特征，如 B-V 等，与 Plx 是否存在关系？是否有影响，这些都需要通过数据的统计检验，或者是统计描述，如均值、方差等，看出来或检验出来。然后，再对 Plx 以及相关特征，乘以一个系数。

在聚类上，要考虑什么样的聚类结果是满意的？这个问题带有一定的主观性，可以结合其他论文，来考虑什么样的聚类是好的。然后再进行调参，一个一个试出来（本文用的是网格寻优法，类似于自动调参了）。若没有论文，可以考虑一些通用的、主观有利的准则，如：

落在 $[20, 22]$ 的个体，分布在多少个聚类簇上？设聚类簇数为 $x$
落在 $[20, 22]$ 的个体，落在哪个聚类簇上最多，最多是多少？，设最多为 $y$

若以 $x$ 优先，则倾向于严苛的筛选。若以 $y$ 优先，则放宽筛选。

聚类之后，我们把个体数最多的那个簇，作为毕星团即可。

但在此之前，必须先对数据做严密的分析。

数据预处理

数据分析

这部分其实没什么用，就是写给老师看看的。首先看看数据长啥样，数据一共 2719 条，9 个特征：

首先来看看统计描述（行星编号不计入）：

咱们可以看看 Plx 的 KDE（核密度图），如下所示：

可以看到的是，集中在 20-22 的样本居多。

我们看看 Plx 位于 $[20, 22]$ 的数据：

肉眼看到，除了 Vmag、RA、e_Plx、B-V 之外，其他列都有显著差异。不过为了验证这一点，我们还是对每一列进行 T 检验。比如对 Vmag，我们对全部数据，和 Plx 落在 $[20, 22]$ 的数据进行两两 T 检验。

我们将原假设设置为：两个数据的均值相等，且很明显，根据 std，方差大体是不相等的。设置显著水平为 0.05，得出结论如下：

对于 Vmag 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的Vmag列没有显著差异
对于 RA 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的RA列没有显著差异
对于 DE 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的DE列没有显著差异
对于 Plx 列，原假设被拒绝，所以有95%的把握认为：全部数据和[20,22]数据的Plx列有显著差异
对于 pmRA 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的pmRA列没有显著差异
对于 pmDE 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的pmDE列没有显著差异
对于 e_Plx 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的e_Plx列没有显著差异
对于 B-V 列，原假设被拒绝，所以有95%的把握认为：全部数据和[20,22]数据的B-V列有显著差异

果然事实胜于雄辩，我们以为的 B-V 是有显著差异，但却原来却有显著性差异。不过无所谓，这只能表明，出了 Plx 和 B-V 外，全部数据和落在 $[20, 22]$ 的数据的均值相同而已。

更一般的，我们可以来分析一下，全部数据和落在 $[20, 22]$ 的数据是否具有相同的分布，为此，我们采用 Kruskal-Wallis H 检验。

原假设为：（对每一列）全部数据和落在 $[20, 22]$ 的数据，具有相同分布。取显著水平为 0.05，结果如下：

对于 Vmag 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的Vmag列分布相同
对于 RA 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的RA列分布相同
对于 DE 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的DE列分布相同
对于 Plx 列，原假设被拒绝，所以有95%的把握认为：全部数据和[20,22]数据的Plx列分布相同
对于 pmRA 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的pmRA列分布相同
对于 pmDE 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的pmDE列分布相同
对于 e_Plx 列，原假设不能被拒绝，所以大致认为：全部数据和[20,22]数据的e_Plx列分布相同
对于 B-V 列，原假设被拒绝，所以有95%的把握认为：全部数据和[20,22]数据的B-V列分布相同

好吧，我们不能拒绝这样一个事实，除了 Plx 和 B-V 列之外，全部数据和落在 $[20, 22]$ 的数据，具有相同分布。而且根据 T 检验的结果，我们还不能拒绝他们有相同均值这一个事实。

机器学习模型→缺失数据

每一列的缺失数据如下：
{‘Vmag’: 0, ‘RA’: 0, ‘DE’: 0, ‘Plx’: 0, ‘pmRA’: 0, ‘pmDE’: 0, ‘e_Plx’: 0, ‘B-V’: 41}

其实第一阶段的题还是比较容易的，大家不要太担心。你看，只有 B-V 才有缺失值，而且结合上面的分析，Plx 和 B-V 的关系肯定不一般。

机器学习方法填充数据集

为了填充缺失数据，我们可以把其他列作为特征（除了编号外），B-V 作为待预测的 y 值。于是，考虑用一个机器学习模型，将那些 B-V 不是缺失值的数据作为数据集，训练出一个机器学习模型之后，再用模型的预测值，作为缺失值的填充值即可。

标准化

为了避免数据的量纲带来影响，在训练机器学习模型之前，必须消除量纲，为此这里采用均值-方差标准化，即将每一列数据的均值转换为 0，方差转换为 1 。

标准化后的数据如下所示：

统计描述如下：

筛选模型参数

鉴于数据量比较充足，我们就不用进行特征过滤了。不过，根据 没有免费午餐定则 ，我们首先要筛选机器学习算法。要筛选算法，必须先选模型参数。为此，我们从如下几个模型中筛选最优模型：

算法	线性回归	k近邻算法	支持向量机	决策树	随机森林	AdaBoost
符号	lr	kNN	SVR	dtr	rf	ada

其中随机森林的基模型是最大深度为 5 的决策树，AdaBoost 的基模型是线性回归。

为了筛选参数，首先需要构建一个参数网格，如下所示：

算法	参数网格
lr	无
kNN	{‘n_neighbors’:[3,5,7,9,11,13,15]}
SVR	grid = { ‘C’:[0.1, 0.25, 0.5, 0.75, 1, 1.25, 1.5, 1.75, 2, 2.25, 2.5, 2.75, 3], ‘kernel’:[‘linear’,‘rbf’,‘poly’], ‘epsilon’:[0, 0.01, 0.05, 0.1] }
dtr	grid = {‘max_depth’:[4, 9, 13, 17, 21, 25], ‘ccp_alpha’:[0,0.00025,0.0005,0.001,0.00125,0.0015,0.002,0.005,0.01,0.05,0.1]}
rf	基模型个数：5, 15, 25, 35, 45, 50, 65, 75, 85, 95
ada	基模型个数：5, 15, 25, 35, 45, 50, 65, 75, 85, 95

采用 5 折交叉验证、配合网格参数，以 MSE 为目标，最后筛选出模型如下：

筛选机器学习模型

在筛选完模型的最佳参数之后，将参数带入上述的机器学习算法之中，根据 5 折交叉验证，以 MSE 为目标，最后得出各算法在五折交叉验证中，每一次验证的 MSE 和均值，如下所示：

为了提高精确度，我们可以选择 线性回归、K近邻算法 或者 随机森林。

虽然看起来 rf 模型最好，但是我们还需要用 T 检验验证一下，我们个 lr 比较就好，设原假设为两组数据的均值相同，则通过 T 检验，于是可认为 lr 和 rf 模型等价。

进行 T 检验后，得出结论：

无法拒绝原假设，两个模型等价

于是，在效果相等的情况下，我们可以选择一个较为简单的模型，于是这里选择了 lr 模型。

模型训练和评价

将数据集拆分成训练集、测试集（7：3），在训练集上训练，在测试集上测试，最后得出 MSE 如下：

得到模型之后，我们就可以用 LR 模型，对 B-V 为 NAN 的那些数据进行预测，从而得出完整数据。

数据缺失部分如下所示（标准化后）：

神经网络模型→缺失值

由于 lr 模型的 MSE 实在太低，所以我们考虑用深度学习方法，搭建一个深度学习模型，最后用深度学习模型的预测值，去代替缺失值。

我们构造一个多层感知器，结构如下所示：

参数	取值	含义
units_list	[100, 200, 100, 50, 25, 10, 1]	隐藏层的层数和对应的神经元个数
‘optimizer’	adam	寻优算法
activation	relu	激活函数
init	init_uniform,	节点参数初始化方法
epochs	500	训练迭代次数
batch_size	200	batch 大小
rate	0.2	dropout 正则化率
loss	MAE	损失函数

同样按照 7:3 拆分数据集，以 MSE 为最后的训练结果如下：

考虑到最好的模型的 MSE 才 0.59，所以就不采用深度学习模型了。

（各位同学也注意，深度学习其实有时候不比机器学习好的，尤其是在 NLP 领域，这就是“天下没有午餐定则了”）

DBSCAN 聚类得出星群

在前面的分析中，我们知道 Plx 和 B-V 两个变量会比较敏感外，其他变量大多类似于一种“随机扰动”，所以，要用聚类的方法识别出毕星团，就不应该考虑“随机扰动”，或者更准确地，不能过分考虑“随机扰动”。

所以，在标准化的基础上，这里考虑给 Plx 和 B-V 乘以一个系数，以扩大聚类的影响。

聚类参数筛选——1

DBSCAN 聚类是一种聚类方法，但需要筛选两个参数：epsilon 和 min_samples，分别决定聚类时，动态聚类圈的直径大小，以及每一个聚类簇的最小样本量。

并且，我们也要筛选 Plx 和 B-V 的系数。要如何取得这些参数呢？我们可以参考机器学习填补缺失数据时的参数网格。但是，要如何判断聚类好，聚类坏，就要考我们主观断定了。

一个比较好的标准是：聚类应使得，那些 Plx 为[20, 22] 的点，落在尽可能同一个聚类簇上。因此，考核的标准就两个：

[20，22] 上的点一共落在多少个聚类簇上（至少两个）？
[20，22] 上的点，落在哪一个聚类簇上最多？一共多少个？

我们按照上述标准，以簇数为优先目标，以簇的最大聚类个体数为次要目标，筛选出最佳的聚类参数。簇数多意味着区分越严格，簇数少意味着不管其他特征如何，只要将 $[20 ， 22]$ 集中在一个簇即可，要求较为宽松。

运用网格寻优法，定义参数网格如下：（在迭代过程中，若只有一个簇，则不考虑）

名称	参数
epsilon_list	1, 1.5, 2, 2.5, 3, 3.5
min_samples_list	2, 2.5, 3, 3.5, 4
coef_list	1.5, 2, 2.5, 3.0, 3.5, 4

结果如下：

聚类最佳参数为：
epsilon: 1：
min_samples: 2
系数： 4
簇最大个体数 603
簇数： 76

聚类参数筛选——2

另一个聚类参数筛选的办法是，以“拐点”作为筛选。

通过上述的分析，我得出：

$\cdots$
((1, 4, 3.5), (896, 46)),
((1, 4, 4), (896, 46)),
((1.5, 2, 1.5), (1225, 7)),
((1.5, 2, 2), (1225, 7)),
((1.5, 2, 2.5), (1225, 7)),
((1.5, 2, 3.0), (1225, 7)),
((1.5, 2, 3.5), (1225, 7)),

格式为：（epsilon, min_samples, 系数）, (簇最大个体数，簇数）

选拐点的一个好处：若根据方法一，则得出的筛选会比较严格。而将方法一的原则倒过来用，又会造成另一个极端。而是用拐点的方法恰到好处。

从上述分析可以看出，我们可以选择参数：epsilon=1, min_samples=4, 系数=4。

不过，本文考虑再三，还是采用方法 1。毕竟，1225 个参数，已经几乎等于落在 $[20, 22]$ 的个体数了，所以已经是到达极端了，故不考虑用。

结果与 H-R 图

毕星团 HIP：

得出聚类结果后，选择个体数最多的那个簇，旗下的所有个体，且 Plx 落在 $[20, 22]$ 的便是毕星团的一份子了。结果如下：

135 223 305 475 606 924 943 1134 1144 1402
1427 157
$\cdots$
109624 109655 110084 110776 111143 111407 113148 113495 113782 114131
115430 116352 117461

绘制 H-R 图

根据 H-R 图的定义：

原始的图在水平轴上显示恒星的光谱类型，在垂直的轴上显示绝对视星等。光谱类型不是数值的量，但其序列反映出恒星表面温度的单调序列。现代观测版本的图表将光谱类型替换成色指数（在20世纪的图表中，最常见的是恒星的B-V色指数）。这种类型的图表通常称为观测赫罗图，或特殊的色光图（CMD，color–magnitude diagram），并且通常是观测者在使用。在已知恒星处于相同距离（如恒星簇内）的情况下，CMD通常用于描述星团中的恒星，其垂直轴视恒星的视星等 ¹

根据上述描述，我们以 B-V 为 x 轴，以视星为 y 轴，绘制 H-R 图如下（其中点的颜色与 B-V 有关）：

代码与提问

若需要代码，请关注、私信、说明题目和年份

如果有其他问题，请到评论区留言，私信提问，概不回答。也在此鼓励大家独立思考。

本人不会回访，不互关，不互吹，以及谢绝诸如此类事

如果本篇博文对您有所帮助，请不要吝啬您的点赞

第二阶段：https://blog.csdn.net/weixin_42141390/article/details/116830451

如果有其他编程问题和原理问题，请再评论区留言，私信一概不回。也鼓励大家独立思考。

摘抄自维基百科 ↩︎

C语言宏函数南林yan C语言 c语言
一、什么是宏函数？通过宏定义的函数是宏函数。如下，编译器在预处理阶段会将Add(x,y)替换为((x)*(y))#defineAdd(x,y)((x)*(y))#defineAdd(x,y)((x)*(y))intmain(){inta=10;intb=20;intd=10;intc=Add(a+d,b)*2;cout<
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
2021-08-26 影幽
在生活中，女人与男人的感悟往往有所不同。人生最大的舞台就是生活，大幕随时都可能拉开，关键是你愿不愿意表演都无法躲避。在生活中，遇事不要急躁，不要急于下结论，尤其生气时不要做决断，要学会换位思考，大事化小小事化了，把复杂的事情尽量简单处理，千万不要把简单的事情复杂化。永远不要扭曲，别人善意，无药可救。昨天是张过期的支票，明天是张信用卡，只有今天才是现金，要善加利用！执着的攀登者不必去与别人比较自己的
每日一题——第八十九题互联网打工人no1 C语言程序设计每日一练 c语言
题目：在字符串中找到提取数字，并统计一共找到多少整数，a123xxyu23&8889，那么找到的整数为123，23，8889//思想：#include#include#includeintmain(){charstr[]="a123xxyu23&8889";intcount=0;intnum=0;//用于临时存放当前正在构建的整数。boolinNum=false;//用于标记当前是否正在读取一个整
每日一题——第九十题互联网打工人no1 C语言程序设计每日一练 c语言
题目：判断子串是否与主串匹配#include#include#include//////判断子串是否在主串中匹配//////主串///子串///boolisSubstring(constchar*str,constchar*substr){intlenstr=strlen(str);//计算主串的长度intlenSub=strlen(substr);//计算子串的长度//遍历主字符串，对每个可能得
每日一题——第八十一题互联网打工人no1 C语言程序设计每日一练 c语言
打印如下图案:#includeintmain(){inti,j;charch='A';for(i=1;i<5;i++,ch++){for(j=0;j<5-i;j++){printf("");//控制空格输出}for(j=1;j<2*i;j++)//条件j<2*i{printf("%c",ch);//控制字符输出}printf("\n");}return0;}
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
每日一题——第八十二题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将一个控制台输入的字符串中的所有元音字母复制到另一字符串中#include#include#include#include#defineMAX_INPUT1024boolisVowel(charp);intmain(){charinput[MAX_INPUT];charoutput[MAX_INPUT];printf("请输入一串字符串：\n");fgets(input,sizeof(inp
每日一题——第八十三题互联网打工人no1 C语言程序设计每日一练 c语言
题目：将输入的整形数字输出,输出1990，输出"1990"#include#defineMAX_INPUT1024intmain(){intarrr_num[MAX_INPUT];intnum,i=0;printf("请输入一个数字：");scanf_s("%d",&num);while(num!=0){arrr_num[i++]=num%10;num/=10;}printf("\"");for(
基于社交网络算法优化的二维最大熵图像分割智能算法研学社（Jack旭）智能优化算法应用图像分割算法 php 开发语言
智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码文章目录智能优化算法应用：基于社交网络优化的二维最大熵图像阈值分割-附代码1.前言2.二维最大熵阈值分割原理3.基于社交网络优化的多阈值分割4.算法结果：5.参考文献：6.Matlab代码摘要：本文介绍基于最大熵的图像分割，并且应用社交网络算法进行阈值寻优。1.前言阅读此文章前，请阅读《图像分割：直方图区域划分及信息统计介绍》htt
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
如果做到轻松在股市赚钱？只要坚持这三个原则。履霜之人
大A股里向来就有七亏二平一赚的说法，能赚钱的都是少数人。否则股市就成了慈善机构，人人都有钱赚，谁还要上班？所以说亏钱是正常的，或者说是应该的。那么那些赚钱的人又是如何做到的呢？普通人能不能找到捷径去分一杯羹呢？方法是有的，但要做到需要你有极高的自律。第一，控制仓位，散户最大的问题是追涨杀跌，只要涨起来，就把钱往股票上砸，然后被套，隔天跌的受不了，又一刀切，全部割肉。来来回回间，遍体鳞伤。所以散户首
【华为OD机试真题2023B卷 JAVA&JS】We Are A Team 若博豆 java 算法华为 javascript
华为OD2023（B卷）机试题库全覆盖，刷题指南点这里WeAreATeam时间限制：1秒|内存限制：32768K|语言限制：不限题目描述：总共有n个人在机房，每个人有一个标号（1<=标号<=n），他们分成了多个团队，需要你根据收到的m条消息判定指定的两个人是否在一个团队中，具体的：1、消息构成为：abc，整数a、b分别代
2023-04-17|篮球女孩长一木
1小学抑或初中阶段，在课外书了解到她的故事。“篮球女孩”。当时佩服她的顽强，也对生命多了一丝敬畏。今天刚好在公众号看到，长大后的“篮球女孩”。佩服之余又满是心疼。网络侵删祝那素未蒙面的女孩，未来一切顺遂。
398顺境，逆境戴骁勇
2018.11.27周二雾霾最近儿子进入了一段顺境期，今天表现尤其不错。今天的数学测试成绩喜人，没有出现以往的计算错误，整个卷面书写工整，附加题也在规定时间内完成且做对。为迎接体育测试的锻炼有了质的飞跃。坐位体前屈成绩突飞猛进，估测成绩能达到12cm，这和上次测试的零分来比，简直是逆袭。儿子还在不断锻炼和提升，唯恐到时候掉链子。跑步姿势在我的调教下，逐渐正规起来，速度随之也有了提升。今晚测试的50
在一台Ubuntu计算机上构建Hyperledger Fabric网络落叶无声9 区块链超级账本 Hyperledger fabric 区块链 ubuntu 构建 hyperledger fabric
在一台Ubuntu计算机上构建HyperledgerFabric网络Hyperledgerfabric是一个开源的区块链应用程序平台，为开发基于区块链的应用程序提供了一个起点。当我们提到HyperledgerFabric网络时，我们指的是使用HyperledgerFabric的正在运行的系统。即使只使用最少数量的组件，部署Fabric网络也不是一件容易的事。Fabric社区创建了一个名为Cello
Day17笔记-高阶函数 ~在杰难逃~ Python 笔记 python 开发语言 pycharm 数据分析
高阶函数【重点掌握】函数的本质：函数是一个变量，函数名是一个变量名，一个函数可以作为另一个函数的参数或返回值使用如果A函数作为B函数的参数，B函数调用完成之后，会得到一个结果，则B函数被称为高阶函数常用的高阶函数：map(),reduce(),filter(),sorted()1.map()map(func,iterable)，返回值是一个iterator【容器，迭代器】func:函数iterab
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
2023-10-22 奥雷里亚诺第n
昨天在B站看到关于猫喜欢挠人的视频，视频教导说猫挠人的话就抓住它的后脖颈然后用手打打挠人的那个爪子。视频本身没什么，但评论区却炸开了锅（真是符合挑食者厌食心理）。令我印象最深刻的一个甚至上升到了关于我是谁这种终极问题。它说，猫就是畜生，它挠人就打它别惯着它，反正我六道轮回成了人就应该保持人的高贵，谁都别想来打破。我顿时汗颜，但看到下面全是类似的言论只不过后面的理由各有不同，本来想骂人的心都凉了一半
回溯算法-重新安排行程 chirou_ 算法数据结构图论 c++图搜索
leetcode332.重新安排行程这题我还没自己ac过，只能现在凭着刚学完的热乎劲把我对题解的理解记下来。本题我认为对数据结构的考察比较多，用什么数据结构去存数据，去读取数据，都是很重要的。classSolution{private:unordered_map>targets;boolbacktracking(intticketNum,vector&result){//1.确定参数和返回值//2
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
闲鱼鱼小铺怎么开通？鱼小铺开通需要哪些流程？高省APP大九
闲鱼鱼小铺是平台推出的一个专业程度的店铺，与普通店铺相比会有更多的权益，比如说发布的商品数量从50增加到500；拥有专业的店铺数据看板与分析的功能，这对于专门在闲鱼做生意的用户来说是非常有帮助的，那么鱼小铺每个人都能开通吗？大家好，我是高省APP联合创始人蓓蓓导师，高省APP是2021年推出的电商导购平台，0投资，0风险、高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个可省钱佣金高，能
C++ | Leetcode C++题解之第409题最长回文串 Ddddddd_158 经验分享 C++Leetcode 题解
题目：题解：classSolution{public:intlongestPalindrome(strings){unordered_mapcount;intans=0;for(charc:s)++count[c];for(autop:count){intv=p.second;ans+=v/2*2;if(v%2==1andans%2==0)++ans;}returnans;}};
对于写作者最重要的两点：热情和分享鱼和熊掌兼得
【热情】在开头，塔奇曼提到光有热情是不够的。但是，要想长期的坚持写作，没有热情是不行的。很多人都说，这是一个对写作者很优待的时代，也有很多人前仆后继的写作。在写作这条路上的人，始终很多，一些人来了，一些人走了，但是能坚持下来的却只有那么几个。不知道什么时候开始，写作变现这个词火了起来。不管是谁，都想来分一杯羹。可是写作变现真的没有这么容易，鱼哥说过，写作的人千千万万，能变现的也不过是其中的千分之一
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
每日一题——第八十八题互联网打工人no1 C语言程序设计每日一练 c语言
题目：输入一个9位的无符号整数，判断其是否有重复数字#include#include#includeintmain(){charnum_str[10];printf("请输入一个9位数的无符号数：");scanf_s("%9d",&num_str);if(strlen(num_str)!=9){printf("输入的不是一个9位无符号整数，请重新输入");}else{if(hasDuplicate
《在战“疫”中成长致敬生活》观后感梅子刘的刀
（作者：周晨）今天上午，我看了“我是接班人”网络大课堂《在战役中成长致敬生活》。有很多人拿出自己攒下的钱，默默地捐给了武汉，有几千块钱的、有几万块钱的，也有十几万块钱的。连小朋友也把自己的压岁钱捐给了武汉。有名环卫工人把自己五年的积蓄全部捐给了武汉。有名外卖小哥为医护人员买鞋子送吃的。还有已经治愈出院的新型肺炎病人捐了400毫升的血浆。还有位叫大树的叔叔，虽然他没有钱，但是他地里有蔬菜，捐了几大卡
数字里的世界17期：2021年全球10大顶级数据中心，中国移动榜首张三叨
你知道吗？2016年，全球的数据中心共计用电4160亿千瓦时，比整个英国的发电量还多40％！前言每天，我们都会创造超过250万TB的数据。并且随着物联网（IOT）的不断普及，这一数据将持续增长。如此庞大的数据被存储在被称为“数据中心”的专用设施中。虽然最早的数据中心建于20世纪40年代，但直到1997-2000年的互联网泡沫期间才逐渐成为主流。当前人类的技术，比如人工智能和机器学习，已经将我们推向
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round