数据人的自我救赎

【统计模型】学生课程类型选择影响因素分析

学生课程类型选择影响因素分析

一、研究目的

二、数据来源和相关说明

三、描述性分析

3.1 样本描述

3.2 样本可视化

3.2.1 直方图

3.2.2 列联表

3.2.3 箱线图与折线图

3.2.4 相关性热力图

四、数学建模

4.1 无序多分类logistic回归模型

4.1.1 无序多分类logistic回归模型A

4.1.2 无序多分类logistic回归模型A优化

4.1.3 逐步回归模型C

4.1.4 逐步回归模型C预测

4.2 有序多分类logistics回归模型

4.2.1 模型建立

4.2.2 模型预测效果

五、结论

六、代码

学生课程类型选择影响因素分析

摘要：被调研学生中，一半以上学生高中时期选择了academic类型的课程，女学生略多于男学生，白人居多，社会地位中等人数占比约一半左右，大部分学生来自于公立学校。列联表检验结果得出，性别在所选课程类型上无显著性差异，而社会经济地位有显著性差异，其中社会地位高的学生更倾向于选择academic类型课程。由箱线图和折线图分析可知， academic、general和vocation类课程的数学和阅读成绩平均水平越来越低。由相关性热力图得出，五门课程成绩之间存在较显著的正相关关系。若认为三中课程类型无高低之分，建立的无序多分类回归模型经过变量选择，得出社会经济地位、学校类型、数学分数和社会学分数对高中生课程的选择具有显著性影响。以五门课程平均成绩代替五门课程成绩的模型效果比原模型效果差。根据建立的模型对ID为80的学生选择的课程类型进行预测时，得出此学生选择的课程类型为academic，预测结果正确。若认为三中课程类型有高低之分，建立的有序多分类回归模型经过变量选择，得出社会经济地位、学校类型、数学分数和社会学分数对高中生课程的选择具有显著性影响，与无序多分类回归模型结果一致。根据建立的模型对测试集进行预测，得到混淆矩阵，模型分类正确率为68.33%，模型预测效果良好。

一、研究目的

国家教育统计中心（NCES）的国家教育曾展开过一个纵向研究项目，收集了“高中及以后”研究的一个子集数据。数据包含了了高中生选择的课程类型（分为academic、vocation和general）和可能影响到课程选择的因素。本文欲基于此数据，探究哪些因素会影响到学生在高中学习的课程类型的选择。

二、数据来源和相关说明

数据来源于R语言faraway包中的hsb数据集，此数据集的调查变量包括学生ID，性别，民族，社会经济地位，学校类型，选择的高中课程类型，学生阅读、写作、数学、科学和社会学成绩等十一个变量，维度为200*11，变量具体含义与符号如表2-1所示。由于多分类变量纳入回归模型时需要拆成多个二分类变量，因而本文在表2-1中也列举了多分类变量拆成的二分类变量。

表2-1 变量说明

变量	含义	解释	符号
prog	选择的高中课程类型	academic-1;general-2;vocation-3	Y
gender	性别	0-男;1-女	X1
race	民族	african-amer-1;asian-2;hispanic-3;white-4	X2
race1	是否是亚洲人	0-否;1-是	X21
race2	是否是西班牙人	0-否;1-是	X22
race3	是否是白人	0-否;1-是	X23
ses	社会经济地位	high-3;middle-2;low-1	X3
ses1	社会地位是否低下	0-1否;1-是	X31
ses2	社会地位是否中等	0-否;1-是	X32
schtyp	学校类型	private-0;public-1	X4
read	阅读分数	连续变量	X5
write	写作分数	连续变量	X6
math	数学分数	连续变量	X7
science	科学分数	连续变量	X8
socst	社会学分数	连续变量	X9
id	学生号码	学生身份证明	——

三、描述性分析

为了获得对数据的整体了解，本文先对数据进行了描述性统计分析。

3.1 样本描述

10个变量中，5个变量是分类型变量，5个变量时连续性变量。对于分类型变量，统计各个类别出现的百分比，结果如表3-1所示；对于连续型变量，统计其最值、平均值和中位数，结果如表3-2所示。

表3-1 分类型变量样本描述

变量	因子	数值	百分比
prog	academic	105	52.50%
	general	45	22.50%
	vocation	50	25.00%
gender	female	109	54.50%
gender	male	91	45.50%
race	african-amer	20	10.00%
	asian	11	5.50%
	hispanic	24	12.00%
	white	145	72.50%
ses	high	58	29.00%
	low	47	23.50%
	middle	95	47.50%
schtyp	private	32	16.00%
schtyp	public	168	84.00%

由表3-1可以得出：200个学生中，有52.50%个选择了学术型课程，22.50%个选择了通用型课程，25.00%个学生选择了职业型课程；性别中，男性占比45.50%，女性占比54.50%，女性略多于男性；种族中，白人人多最多，占比72.50%，其次为西班牙人、非洲裔美国人和亚洲人，分别占比12.00%、10.00%和5.50%；社会地位中，中等人群人数最多，占比47.50%，其次为高等人群和低等人群，分别占比29.00%和23.50%；学校类型中，公立学校人数最多，占比84.00%，私立学校占比相对较少，仅占16.00%。

表3-2 连续性变量样本描述

变量	Min	Max	Median	Mean
read	1.20	76.00	50.00	52.23
write	3.00	67.00	54.00	52.77
math	1.00	75.00	52.00	52.65
science	2.15	74.00	53.00	51.85
socst	10.80	71.00	52.00	52.41

由表3-2可以得出：阅读成绩介于1.20-76.00之间，其平均水平为52.23（平均值）和50.00（中位数）；写作成绩介于3.00-67.00之间，其平均水平为52.77（平均值）和54.00（中位数）；数学成绩介于1.00-75.00之间，其平均水平为52.65（平均值）和52.00（中位数）；科学成绩介于2.15-74.00之间，其平均水平为51.85（平均值）和53.00（中位数）；社会学成绩介于10.80-71.00之间，其平均水平为52.41（平均值）和52.00（中位数）。从均值意义上看，写作成绩最好，其次是数学成绩，科学成绩最差。

3.2 样本可视化

3.2.1 直方图

为了得到连续型变量的整体分布状况，本文绘制了直方图，结果如图3-1所示。

图3-1 连续型变量直方图

由图3-1可以得出：阅读成绩整体上呈现正态分布，成绩主要集中在40-65之间，其中45-50之间频数最高；写作成绩整体上呈现左偏分布，成绩也主要集中在40-65之间，其中60-65之间频数最高；数学成绩整体上呈现均匀分布，成绩主要集中在35-65之间，其中50-55之间频数最高；科学成绩整体上呈现正态分布，成绩主要集中在35-70之间，其中50-55之间频数最高；社会学成绩整体上呈现左偏分布，成绩主要集中在40-70之间，其中55-60之间频数最高。

3.2.2 列联表

为了探究性别和社会经济地位是否会对学生课程类型的选择产生影响，考虑到变量均为分类型变量，因而本文采用了列联表分析法，结果分别如表3-3和表3-4所示。

表3-3 性别-课程类型列联表1

gender\prog	academic	general	vocation
female	58	24	27
male	47	21	23
chisq.test	p-value=0.9739

由表3-3可以得出：女性中，选择academic类课程人数最多，其次是vocation，最后是general，人数分别为58、27和24；男性中，选择academic类课程人数最多，其次是vocation，最后是general，人数分别为47、21和23。从选择课程类型分布上看，男性与女性差别不大，这从卡方检验P值也可以得出，P值>0.05，即无法拒绝原假设，认为男性与女性所选课程类型分布无显著差异。

表3-4 社会经济地位-课程类型列联表2

ses\prog	academic	general	vocation
high	42	9	7
low	19	16	12
middle	44	20	31
kruskal.test	p-value=0.009

由表3-4可以得出：社会地位高人群中，绝大多数人选择了academic类课程，只有少部分人选择了general和vocation，人数分别为42、9和7；社会地位中等的人群中，选择academic类课程人数最多，其次是vocation，最后是general，人数分别为44、31和20；社会地位低等人群中，选择三类课程人数相差不大，人数从高到低分别为19、16和12。直观上看，三个社会地位人群选择课程人群存在差异。由于社会经济地位是有序分组变量，因而本文采用了秩和检验，又因为是多组，因此采用Kruskal-Wallis H检验。检验P值<0.05，即不同社会经济地位人群选择课程类型确实存在显著性差异。

3.2.3 箱线图与折线图

为了探究学生的数学成绩和阅读成绩在课程选择上是否存在差异性，本文选择了箱线图和折线图进行分析，结果如图3-2和图3-3所示。

图3-2 数学成绩-课程类型箱线图

由图3-2可以得出：从中位数意义上看，三种类型课程在数学成绩上存在较显著的差异性，学术型类型学生数学成绩最高，其次为通用类类型，职业型类型学生数学成绩最低；从最大值看，三种类型由高到低分别是学术性、职业型和通用型。综上所述，三个类型的数学成绩存在一定的差异性，其中学术型类型的学生数学成绩最好。

图3-3 阅读成绩-课程类型折线图

由图3-3可以得出：1代表学术型课程，2代表通用型课程，3代表职业型课程；从折线走势上看，呈现递减趋势，即学术型类型学生阅读成绩均分最高，其次为通用型类型，职业型类型阅读平均成绩最低；其中，学术型类型与其他两个类型差别较大，而通用型与职业型差别较小。

3.2.4 相关性热力图

为了探究五门科目成绩之间的线性相关性，本文绘制了相关性热力图，结果如图3-4所示。

图3-4 五门科目成绩相关性热力图

由图3-4可以得出：大部分科目成绩之间的相关性介于0.5-0.7之间，属于显著正相关关系，因而后续建模分析时可以考虑以五门科目的平均成绩代替五门成绩进行建模分析。

四、数学建模

为了探究高中生选择课程的影响因素，本文建立了多个回归模型。若认为三种课程类型无高低之分，可建立无序多分类logistic回归模型，进而进行变量筛选与预测；若认为三种类型有高低之分时，可建立有序多分类logistic回归模型，进而进行变量筛选与预测。

4.1 无序多分类logistic回归模型

4.1.1 无序多分类logistic回归模型A

以academic作为参照水平，建立无序多分类logistic回归模型A，由于课程类型有三个类别，因而有两个回归模型，回归模型表达式如下。

Y1=logit(P)general/academic=α1+β11X1+β121X21+β122X22+β123X23+β131X31+β132X32+β14X4+β15X5+β16X6+β17X7+β18X8+β19X9

Y2=logit(P)vocation/academic=α2+β21X1+β221X21+β222X22+β223X23+β231X31+β232X32+β24X4+β25X5+β26X6+β27X7+β28X8+β29X9

以极大似然法进行参数估计，同时将模型A与空模型相比较，得到模型整体的显著性，模型A参数估计结果如表4-1所示。

表4-1 无序多分类logistic回归模型A参数估计

	general	OR值	P值	vocation	OR值	P值
(Intercept)	3.6319	37.7846	0.0464	7.4814	1774.6899	0.0004
X1	-0.0926	0.9115	0.8386	-0.3210	0.7254	0.5226
X21	1.3527	3.8680	0.2014	-0.7001	0.4966	0.6339
X22	-0.6322	0.5314	0.4792	-0.1994	0.8193	0.8123
X23	0.2965	1.3452	0.6868	0.3359	1.3992	0.6534
X31	1.0986	3.0001	0.0702	0.0475	1.0486	0.9463
X32	0.7030	2.0197	0.1636	1.1816	3.2595	0.0382
X4	0.5845	1.7942	0.3003	2.0553	7.8094	0.0138
X5	-0.0442	0.9568	0.1546	-0.0348	0.9658	0.3091
X6	-0.0363	0.9644	0.2834	-0.0317	0.9688	0.3773
X7	-0.1093	0.8965	0.0019	-0.1140	0.8923	0.0033
X8	0.1019	1.1073	0.0018	0.0523	1.0537	0.1267
X9	-0.0198	0.9804	0.4661	-0.0804	0.9227	0.0062
P 值	<0.001

由表4-1可以得出：由模型整体检验P值<0.001得出模型A具有统计学意义，可以进行进一步分析。根据系数估计结果，可以得到Y1 、Y2 的表达式，如下所示。

Y1=3.6319-0.0926X1+1.3527X21-0.6322X22+0.2965X23+1.0986X31+0.7030X32+0.5845X4-0.0442X5-0.0363X6-0.1093X7+0.1019X8-0.0198X9

Y2=7.4841-0.3210X1-0.7001X21-0.1994X22+0.3359X23+0.0475X31+1.1816X32+2.0553X4-0.0348X5-0.0317X6-0.1140X7+0.0523X8-0.0804X9

由表4-1和上述表达式可以得出：

（1）在显著性水平α=0.05 下，对回归模型一（Y1 ）而言，有如下结论：

在general和academic之间进行选择时，只有变量X7 和X8 显著。
X1 （性别）的回归系数为-0.0926，OR值为0.9115，即性别会对课程选择产生非显著的负向影响关系，说明相对于女同学，男同学更倾向于academic类课程。
X21 的回归系数为1.3527，OR值为3.8680，即是否是亚洲人会对课程选择产生非显著的正向影响关系，说明相对于非洲裔美国人，亚洲人更倾向于general类课程。
X22 的回归系数为-0.6322，OR值为0.5314，即是否是西班牙人会对课程选择产生非显著的负向影响关系，说明相对于非洲裔美国人，西班牙人更倾向于academic类课程。
X23 的回归系数为0.2965，OR值为1.3452，即会对课程选择产生非显著的正向影响关系，说明相对于非洲裔美国人，白人更倾向于general类课程。
X31 的回归系数为1.0986，OR值为3.0001，即社会地位是否低下会对课程选择产生非显著的正向影响关系，说明相对于社会高等人群，社会地位低等人群更倾向于general类课程。
X32 的回归系数为0.7030，OR值为2.0197，即社会地位是否中等会对课程选择产生非显著的正向影响关系，说明相对于社会地位高等人群，社会地位中等人群更倾向于general类课程。
X4 的回归系数为0.5845，OR值为1.7942，即学校类型会对课程选择产生非显著的正向影响关系，说明相对于私立学校，公立学校更倾向于academic类课程。
X5 的回归系数为-0.0442，OR值为0.9568，即阅读分数会对课程选择产生非显著的负向影响关系，说明其他变量不变时，阅读分数每增加一分，选择general的概率与选择academic概率之比会变为原来的0.9568倍。
X6 的回归系数为-0.0363，OR值为0.9644，即写作分数会对课程选择产生非显著的负向影响关系，说明其他变量不变时，写作分数每增加一分，选择general的概率与选择academic概率之比会变为原来的0.9644倍。
X7 的回归系数为-0.1093，OR值为0.8965，即数学分数会对课程选择产生显著的负向影响关系，说明其他变量不变时，数学分数每增加一分，选择general的概率与选择academic概率之比会变为原来的0.8965倍。
X8 的回归系数为0.1019，OR值为1.1073，即科学分数会对课程选择产生显著的正向影响关系，说明其他变量不变时，科学分数每增加一分，选择general的概率与选择academic概率之比会变为原来的1.1073倍。
X9 的回归系数为-0.0198，OR值为0.9804，即社会学分数会对课程选择产生非显著的负向影响关系，说明其他变量不变时，社会学分数每增加一分，选择general的概率与选择academic概率之比会变为原来的0.9804倍。

（2）在显著性水平α=0.05 下，对回归模型二（Y2 ）而言，有如下结论：

在vocation和academic之间进行选择时，变量X3 、X4 、X7 和X9 显著；
X1 （性别）的回归系数为-0.3210，OR值为0.7254，即性别会对课程选择产生非显著的负向影响关系，说明相对于女同学，男同学更倾向于academic类课程。
X21 的回归系数为-0.7001，OR值为0.4966，即是否是亚洲人会对课程选择产生非显著的负向影响关系，说明相对于非洲裔美国人，亚洲人更倾向于vocation类课程。
X22 的回归系数为-0.1994，OR值为0.8193，即是否是西班牙人会对课程选择产生非显著的负向影响关系，说明相对于非洲裔美国人，西班牙人更倾向于academic类课程。
X23 的回归系数为0.3359，OR值为1.3992，即会对课程选择产生非显著的正向影响关系，说明相对于非洲裔美国人，白人更倾向于vocation类课程。
X31 的回归系数为0.0475，OR值为1.0486，即社会地位是否低下会对课程选择产生非显著的正向影响关系，说明相对于社会高等人群，社会地位低等人群更倾向于vocation类课程。
X32 的回归系数为1.1816，OR值为3.2595，即社会地位是否中等会对课程选择产生显著的正向影响关系，说明相对于社会地位高等人群，社会地位中等人群更倾向于vocation类课程。
X4 的回归系数为2.0553，OR值为7.8094，即学校类型会对课程选择产生显著的正向影响关系，说明相对于私立学校，公立学校更倾向于academic类课程。
X5 的回归系数为-0.0348，OR值为0.9658，即阅读分数会对课程选择产生非显著的负向影响关系，说明其他变量不变时，阅读分数每增加一分，选择vocation的概率与选择academic概率之比会变为原来的0.9568倍。
X6 的回归系数为-0.0317，OR值为0.9688，即写作分数会对课程选择产生非显著的负向影响关系，说明其他变量不变时，写作分数每增加一分，选择vocation的概率与选择academic概率之比会变为原来的0.9644倍。
X7 的回归系数为-0.1140，OR值为0.8923，即数学分数会对课程选择产生显著的负向影响关系，说明其他变量不变时，数学分数每增加一分，选择vocation的概率与选择academic概率之比会变为原来的0.8965倍。
X8 的回归系数为0.0523，OR值为1.0537，即科学分数会对课程选择产生非显著的正向影响关系，说明其他变量不变时，科学分数每增加一分，选择vocation的概率与选择academic概率之比会变为原来的1.1073倍。
X9 的回归系数为-0.0804，OR值为0.9227，即社会学分数会对课程选择产生显著的负向影响关系，说明其他变量不变时，社会学分数每增加一分，选择vocation的概率与选择academic概率之比会变为原来的0.9804倍。

4.1.2 无序多分类logistic回归模型A优化

由于五门科目之间存在较显著的线性相关性，因而考虑用五门科目的均值替代五门科目成绩进行建模，得到模型B，比较两个模型之间的AIC值，结果如表4-2所示。

表4-2 模型A与模型B的AIC值比较

	模型A	模型B
AIC	357.8705	364.6081

由表4-2可以得出，AIC值越小，表明模型拟合效果越好，因而模型A效果更好，本文基于模型A进行后续分析。

4.1.3 逐步回归模型C

在无序多分类logistic回归模型中，很多变量对高中生课程选择不存在显著影响，因而考虑根据AIC准则建立逐步回归模型C，对变量进行选择，逐步回归模型C参数估计结果如表4-3所示。

表4-3 逐步回归模型C参数估计

	general	OR值	P值	vocation	OR值	P值
(Intercept)	2.5870	13.2902	0.1250	6.6873	802.1308	0.0006
X31	0.8761	2.4015	0.1282	-0.0157	0.9844	0.9813
X32	0.6979	2.0095	0.1569	1.2065	3.3418	0.0303
X4	0.6469	1.9096	0.2358	1.9956	7.3563	0.0141
X7	-0.1212	0.8858	0.0002	-0.1370	0.8720	0.0001
X8	0.0821	1.0856	0.0032	0.0394	1.0402	0.1689
X9	-0.0444	0.9566	0.0582	-0.0936	0.9106	0.0003
P 值	<0.001

由表4-3可以得出：逐步回归模型C整体P值<0.001，因而模型存在统计学意义；根据模型参数估计结果，可以得到模型表达式，如下所示；逐步回归模型保留了变量X31 、X32 、X4 、X7 、X8 和X9 ，其中只有变量X31 和X8 不显著，其他变量均显著，即社会经济地位、学校类型、数学分数和社会学分数对高中生课程的选择有显著影响。

Y1=2.5870+0.8761X31+0.6979X32+0.6469X4-0.1212X7+0.0821X8-0.0444X9

Y2=6.6873-0.0157X31+1.2065X32+1.9956X4-0.1370X7+0.0394X8-0.0936X9

4.1.4 逐步回归模型C预测

为了得到逐步回归模型C的预测效果，本文对ID为80的学生高中选择的课程类型进行预测，预测结果如表4-4所示。

表4-4 ID为80的学生预测结果

	Y1	Y2	exp(Y1)	exp(Y2）	academic	general	vocation
预测值	-2.5195	-0.0672	0.0805	0.9350	0.4962	0.0399	0.4639

由表4-4可以得出：ID为80的学生选择academic、general和vocation类型的概率分别为0.4963、0.0399和0.4639，因而最终将ID为80的学生判为选择academic类型课程，预测结果正确。

4.2 有序多分类logistics回归模型

4.2.1 模型建立

若认为三种课程类型有高低之分，即academic>general>vocation，则可以建立有序多分类回归模型。为了对模型预测效果进行评估，本文将hsb数据集随机打乱，并以前70%作为训练集训练模型，以后30%作为测试集对模型预测结果进行评估。为了对自变量进行筛选，本文基于AIC准备建立了逐步回归模型，模型预测结果如表4-5所示。

表4-5 有序多分类回归logistic模型D与逐步回归模型E参数估计

	有序多分类回归模型D			逐步回归模型E
变量	estimate	P值	OR值	estimate	P值	OR值
X1	-0.0427	0.9164	0.9582	——	——	——
X21	-0.3402	0.7224	0.7117	——	——	——
X22	0.4200	0.5624	1.5220	——	——	——
X23	0.4340	0.4764	1.5434	——	——	——
X31	0.2636	0.6191	1.3015	0.1672	0.7448	1.1820
X32	1.0926	0.0205	2.9820	1.0612	0.0218	2.8898
X4	1.2321	0.0368	3.4284	1.1860	0.0356	3.2739
X5	-0.0343	0.2010	0.9663	——	——	——
X6	-0.0121	0.6852	0.9880	——	——	——
X7	-0.0807	0.0046	0.9225	-0.0870	0.0003	0.9167
X8	0.0223	0.4380	1.0225	——	——	——
X9	-0.0500	0.0490	0.9512	-0.0598	0.0035	0.9419
academic\|general	-6.2560	0.0001	0.0019	-6.2511	0.0000	0.0019
general\|vocation	-4.5932	0.0041	0.0101	-4.6234	0.0015	0.0098
P值	<0.001			<0.001

由表4-5可以得出：有序多分类回归模型D和逐步回归模型E的整体P值均<0.001，因而两个模型均具有统计学意义。由于模型D很多变量在统计学意义上不显著，因而考虑对逐步回归模型E进行解读，并进行后续分析。逐步回归模型E参数估计结果解读如下：

逐步回归模型E保留了变量X31 、X32 、X4 、X7 和X9 ，其中只有变量X31 不显著，其他变量均显著。
X31 的回归系数为0.1672，OR值为1.1820，即社会地位是否低下会对课程选择产生非显著的正向影响关系，说明相对于社会高等人群，社会地位低等人群更倾向于高等类型课程。
X32 的回归系数为1.0612，OR值为2.8898，即社会地位是否中等会对课程选择产生显著的正向影响关系，说明相对于社会地位高等人群，社会地位中等人群更倾向于高等类课程。
X4 的回归系数为1.1860，OR值为3.2739，即学校类型会对课程选择产生显著的正向影响关系，说明相对于私立学校，公立学校更倾向于高等类课程。
X7 的回归系数为-0.0870，OR值为0.9167，即数学分数会对课程选择产生显著的负向影响关系，说明其他自变量不变时，数学分数每增加一分，选择课程类型增加一个及一个等级以上的优势增加到原来的0.9167倍。
X9 的回归系数为-0.0598，OR值为0.9419，即社会学分数会对课程选择产生显著的负向影响关系，说明其他变量不变时，社会学分数每增加一分，选择程类型增加一个及一个等级以上的优势增加到原来的0.9419倍。

4.2.2 模型预测效果

以数据集后30%数据作为测试集，对逐步回归模型E预测结果进行评估，得到混淆矩阵如表4-7所示。

表4-7 混淆矩阵

真实类别\预测类别	academic	general	vocation
academic	33	4	3
general	5	0	2
vocation	3	2	8
正确率	68.33%
错误率	31.67%

由表4-7可以得出：选择academic类型的学生中，有33个学生课程类型判断正确，7个学生的课程类型判断错误；选择general类型的学生中，全部判断错误；选择general类型的学生中，有8个学生课程类型判断正确，5个学生课程类型判断错误；整体正确率为68.33%，错误率为31.67%，预测效果良好。

五、结论

根据上述描述性统计分析和数学建模，本文得出如下结论：

被调研学生中，一半以上学生高中时期选择了academic类型的课程，女学生略多于男学生，白人居多，社会地位中等人数占比约一半左右，大部分学生来自于公立学校。
列联表检验结果得出，性别在所选课程类型上无显著性差异，社会经济地位在所选课程上有显著性差异，其中社会地位高的学生更倾向于选择academic类型课程。
由箱线图和折线图分析可知，数学成绩和阅读成绩均在课程等级上呈现递减趋势，即academic、general和vocation课程类型的两门成绩平均水平越来越低。
由相关性热力图可以看出，五门课程成绩之间存在较显著的正相关关系。
若认为三中课程类型无高低之分，建立的无序多分类回归模型经过基于AIC准则的变量选择，得出社会经济地位、学校类型、数学分数和社会学分数对高中生课程的选择具有显著性影响。以五门课程平均成绩代替五门课程成绩的模型效果比原模型效果差。根据建立的模型对ID为80的学生选择的课程类型进行预测时，得出此学生选择的课程类型为academic，预测结果正确。
若认为三中课程类型有高低之分，建立的有序多分类回归模型经过基于AIC准则的变量选择，得出社会经济地位、学校类型、数学分数和社会学分数对高中生课程的选择具有显著性影响，与无序多分类回归模型结果一致。根据建立的模型对测试集进行预测，得到混淆矩阵，模型分类正确率为68.33%，模型预测效果良好。

六、代码

library(faraway)
attach(hsb)
hsb[c(1:5),]
??hsb
View(hsb)

#描述性统计分析
summary(hsb)
#绘制各科分数直方图
par(mfrow=c(2,3))
hist(read,col='pink',main="阅读",xlab="组别" ,ylab = "频数")
hist(write,col='pink',main="写作",xlab="组别" ,ylab = "频数")
hist(math,col='pink',main="数学",xlab="组别" ,ylab = "频数")
hist(science,col='pink',main="科学",xlab="组别" ,ylab = "频数")
hist(socst,col='pink',main="社会学",xlab="组别" ,ylab = "频数")
hist(id,main="id",col='pink',xlab="组别" ,ylab = "频数")
#制作列联表
table1=table(gender,prog)
table1
table2=table(ses,prog)
table2
chisq.test(table1)
kruskal.test(ses~prog,data=hsb)
#绘制课程类型-数学成绩箱线图
par(mfrow=c(1,1))
boxplot(math~prog,col='pink',ylab="数学成绩",xlab="课程类型",data=hsb)
#绘制课程类型-数学成绩折线图
#"academic","general","vocation"
par(mfrow=c(1,1))
plot(c(1,3),c(40,60),type="n",xlab="课程类型",ylab="阅读成绩")
points(c(1:3),tapply(read,prog,mean),type="b")
#绘制各科分数热力图
library(corrplot)
a=hsb[,c(7:11)]
k=cor(a,use='everything',method='pearson')
par(mfrow=c(1,1))
corrplot(k,addCoef.col = "black")

#构建无序多分类回归模型
library("nnet")
hsb$prog2=relevel(hsb$prog,ref = "academic")#改变因子水平次序
Model.A=multinom(prog2~gender+race+ses+schtyp+read+write+math+science+socst,data=hsb)
Model.AA=multinom(prog2~1,data=hsb)#空模型
anova(Model.A,Model.AA)
summary(Model.A)#没有给出P值
exp(coef(Model.A))#得到OR值
##计算pvalue，Z统计量
z=summary(Model.A)$coefficients/summary(Model.A)$standard.errors
p=(1 - pnorm(abs(z),0,1))*2#双侧，所以*2
p#越小越好

#用五门科目平均成绩代替五门科目建立无序多分类回归模型
hsb$ave=(read+write+math+science+socst)/5
Model.B=multinom(prog2~gender+race+ses+schtyp+ave,data=hsb)
summary(Model.B)#没有给出P值
AIC(Model.A,Model.B)

#对模型A用逐步回归法筛选变量
Model.C=step(Model.A,trace=F)#根据AIC准则从全模型Model.A中选出最优子模型,逐步回归
summary(Model.C)#没有给出P值
exp(coef(Model.C))#得到OR值
##计算pvalue，Z统计量
z=summary(Model.C)$coefficients/summary(Model.C)$standard.errors
p=(1 - pnorm(abs(z),0,1))*2#双侧，所以*2
p#越小越好
anova(Model.AA,Model.C)

#对ID为80的学生进行预测
ID80=data.frame(ses="high",schtyp="public",math=68,science=66,socst=66)
ID80
a=predict(Model.C,ID80)
summary(a)

#建立有序多分类回归模型
#首先将样本打乱，分出训练集和测试集
len=length(hsb[,1])#样本量
p=0.7#用作训练集的样本概率
ss0=round(len*p)#训练集样本量
hsb1=hsb[order(runif(len)),]
#数据集swiss的前70%作为训练集
A0=hsb1[c(1:ss0),]
#数据集swiss的后30%作为测试集
A1=hsb1[-c(1:ss0),]
library(MASS)
Model.D=polr(prog~gender+race+ses+schtyp+read+write+math+science+socst,data=A0,Hess=TRUE,method="logistic")
Model.DD=polr(prog~1,data=A0,Hess=TRUE,method="logistic")#空模型
anova(Model.D,Model.DD)
summary(Model.D)
ctable=coef(summary(Model.D))
p=pnorm(abs(ctable[,"t value"]),lower.tail = FALSE)*2
(ctable <- cbind(ctable,"p value"=p))
(ci <- confint(Model.D))#95%CI
exp(cbind(OR=coef(Model.D),ci))#ORֵ
#逐步回归进行变量选择
Model.E=step(Model.D,trace=F)
anova(Model.DD,Model.E)
summary(Model.E)
ctable=coef(summary(Model.E))
p=pnorm(abs(ctable[,"t value"]),lower.tail = FALSE)*2
(ctable <- cbind(ctable,"p value"=p))
(ci <- confint(Model.E))#95%CI
exp(cbind(OR=coef(Model.E),ci))#ORֵ

#根据有序多分类回归模型E进行预测，并计算混淆矩阵
p=predict(Model.E,A1,type="p")#利用模型E预测数据取值为各水平的概率（type=p）
A1$pre=predict(Model.E,A1)#利用模型E对数据A1进行预测，将预测结果存入A1的变量pre中
A1[c(1:5),]#显示数据a0的前5行
table(A1[,c(6,14)])#根据预测值和真实值生成列联表，展示预测精度（混淆矩阵）

个人见解，还行各位读者批评指正！

你可能感兴趣的:(统计模型,人工智能,机器学习,算法)

正则表达式咸鱼时日翻身正则表达式
是指定一组与之匹配的字符串，限定符号a*a出现0或者多次a+a出现1次或者多次a？a出现0次或者1次a{2,5}出现在2到5次之间或运算法（cat|dog）匹配cat或者dog字符类[abz]+表示匹配的字符只能是中括号中的字母如果使用了^则为取反符号元字符、/d代表数字字符/w代表英文字符数字加上下划线/s代表tab和换行符其中/加大写的DWS则表示取反符号.表示任意字符不包括换行符号^a匹配行
定位问题position
1.relative相对对位：占有原来的位置。以浏览器为准定位进行移动top/left/right/bottom2.absolute绝对定位：不占有原来的位置（脱标）如果没有祖先元素或者祖先元素没有定位，以浏览器为准定位；如果祖先元素有定位（相对、绝对、固定），则以最近一级的有定位祖先元素为参考点移动位置；加了绝对定位的盒子不能通过margin：0auto垂直水平居中，但可以通过算法居中left：
开源模型应用落地-让AI更懂你的每一次交互-Mem0集成Qdrant、Neo4j与Streamlit的创新实践（四）开源技术探险家开源模型-实际应用落地 neo4j 开源人工智能语言模型
一、前言在人工智能迅速发展的今天，如何让AI系统更懂“你”？答案或许藏在个性化的记忆管理之中。Mem0作为一个开源的记忆管理系统，正致力于为AI赋予长期记忆与个性化服务能力。通过结合高性能向量数据库Qdrant、图数据库Neo4j的强大关系分析能力以及Streamlit的高效可视化交互，我们可以打造出一个既能存储用户历史行为、又能实时推理并展示结果的智能记忆助手。本文将带您一步步探索这一技术组合的
【算法刷题记录（简单题）002】字符串字符匹配（java代码实现）挺菜的 java 算法开发语言
一、题目描述对于给定的字符串s和t，检查s中的所有字符是否都在t中出现。（一）输入描述第一行输入一个长度为1≤len(s)≤200、仅由小写字母组成的字符串s。第二行输入一个长度为1≤len(t)≤200、仅由小写字母组成的字符串t。（二）输出描述如果s中的所有字符都在t中出现，则输出true，否则输出false。（三）示例输入：bcabc输出：true二、题目解答（一）解题思路1.使用HashM
C语言数据结构与算法专栏目录 CodeAllen嵌入式嵌入式 C语言数据结构算法
后序会开一个《嵌入式数据结构专栏》主要为了学习嵌入式的同学，软件能力提升和大厂面试能力，感谢大家关注！直达专栏：https://blog.csdn.net/super828/category_11083370.html《C语言数据结构与算法》专栏已经更新完毕，共计72篇分享，后期会逐渐修改错误并添加内容0数据之间的关系有哪些？1如何度量一个算法的好坏？2常见的时间复杂度实例
分布式系统核心基石：CAP定理、BASE理论与一致性算法深度解析 Eqwaak00 分布式系统设计实战算法 python java
一、CAP定理：分布式系统的设计边界1.1核心定义与经典三角CAP定理（Brewer'sTheorem）指出，在分布式系统中，一致性（Consistency）、可用性（Availability）、分区容错性（PartitionTolerance）三者不可兼得。（注：若需实际配图，可替换为Mermaid流程图或专业示意图）三大特性详解：一致性（C）：所有节点在同一时间看到的数据完全相同（强一致性）。
LintCode算法刷题记录（入门 + 简单部分）隔壁敲代码的小王算法刷题笔记算法 LintCode
由于是初学者，实现的方法都很简单，暂时不考虑效率，之后（可能）会更新1.A+B问题给出两个整数aa和bb,求他们的和。样例如果a=1并且b=2，返回3。挑战显然你可以直接returna+b，但是你是否可以挑战一下不这样做？（不使用++等算数运算符）说明a和b都是32位整数么？是的我可以使用位运算符么？当然可以注意事项你不需要从输入流读入数据，只需要根据aplusb的两个参数a和b，计算他们的和并返
【优秀文章】7月优秀文章推荐
优秀文章智能自主运动体与人工智能技术——环境感知、SLAM定位、路径规划、运动控制、多智能体协同作者：fpga和matlabC++之红黑树认识与实现作者：zzh_zao【手把手带你刷好题】–C语言基础编程题(十)作者：草莓熊Lotso飞算JavaAI：从“码农”到“代码指挥官”的终极进化论作者：可涵不会debug前端网页开发学习（HTML+CSS+JS）有这一篇就够！作者：一颗小谷粒
C++17 并行算法：std::execution::par
在多核处理器普及的今天，如何高效利用硬件资源成为提升软件性能的关键。C++17引入的并行算法库（ParallelAlgorithms）为开发者提供了一套标准化的并行编程接口，通过简单的策略切换即可将顺序算法转换为并行执行。本文将深入探讨C++17并行算法中最核心的执行策略std::execution::par，从基础概念到高级应用，全面解析其原理、用法及最佳实践。一、C++17并行算法概述1.1并
【心灵鸡汤】深度学习技能形成树：从零基础到AI专家的成长路径全解析智算菩萨人工智能深度学习
引言：技能树的生长哲学在这个人工智能浪潮汹涌的时代，深度学习犹如一棵参天大树，其根系深深扎入数学与计算科学的沃土，主干挺拔地承载着机器学习的核心理念，而枝叶则繁茂地延伸至计算机视觉、自然语言处理、强化学习等各个应用领域。对于初入此领域的新手而言，理解这棵技能树的生长规律，掌握其形成过程中的关键节点和发展阶段，将直接决定其在人工智能道路上能够走多远、攀多高。技能树的概念源于游戏设计，但在学习深度学习
求平方根：牛顿迭代法 mjfztms leetcode 算法
应用牛顿迭代法求解方程近似解，收敛速度很快牛顿迭代法求解平方根给你一个非负整数x，计算并返回x的算术平方根n，结果只保留整数部分。算法流程图由题意得，n2=xn^2=xn2=x，即为对f(n)=n2−xf(n)=n^2-xf(n)=n2−x求解。第一步：易得：x2−x1=0−f(x1)f′(x1)x_2-x_1=\frac{0-f(x_1)}{f'(x_1)}x2−x1=f′(x1)0−f(x1)
【秋招算法】2025 届搜广推方向求职历程（SSP、头部计划）秋冬无暖阳° 搜广推等—算法面经面试职场和发展算法
【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）文章目录【秋招算法】2025届搜广推方向求职历程（SSP、头部计划）1.背景2.日常实习3.暑期实习3.1暑期BG3.2暑期记录4.秋招4.1秋招BG4.2转正4.3头部4.4提前批4.5正式批5.面试记录5.1Coding5.2其他高频编程题5.3常见八股、面经6.关于搜广推1.背景关于日常实习、暑期实习、提前批，秋招、春招、补招何为大
推荐算法（推广搜）——广告和推荐有什么不同？
导语近几年新兴起一个行业：推广搜。即推荐、广告、搜索算法的简称。各大厂都隐隐将其作为公司核心技术来发展。此文将带领大家探秘广告和推荐有什么区别以及其相似处。再此强调一下，广告算法里面的推荐广告和自然推荐结果里的推荐系统进行对比，但因为广告算法里面还有“搜索广告”，搜索广告和推荐系统差异性就太大了，这里不做讨论。一、不同点1.1本质不同推荐广告和自然推荐本质中要处理的群体和衡量的利益完全不一样。（图
【Statsmodels和SciPy介绍与常用方法】机器学习司猫白 scipy statsmodels 统计
Statsmodels库介绍与常用方法Statsmodels是一个强大的Python库，专注于统计建模和数据分析，广泛应用于经济学、金融、生物统计等领域。它提供了丰富的统计模型、假设检验和数据探索工具，适合进行回归分析、时间序列分析等任务。本文将介绍Statsmodels的核心功能，并通过代码示例展示其常用方法。Statsmodels简介Statsmodels建立在NumPy和SciPy的基础上，
算法分析与设计实验2：实现克鲁斯卡尔算法和prim算法表白墙上别挂我算法笔记经验分享
实验原理（一）克鲁斯卡尔算法：一种用于求解最小生成树问题的贪心算法，该算法的基本思想是按照边的权重从小到大排序，然后依次选择边，并加入生成树中，同时确保不会形成环路，直到生成树包含图中所有的顶点为止。具体步骤：边的排序：将所有边按照权重从小到大排序。初始化：创建一个空的生成树（可以是一个空的图结构），以及一个用于记录每个顶点所属集合（或称为连通分量）的数据结构（例如并查集）。边的选择：依次选择排序
（面经总结）一篇文章带你整理面试过程中常考的九大排序算法南淮北安冲刺大厂之面经总结面经排序算法二分插入冒泡快速
文章目录一、二分插入排序1.原理2.代码二、冒泡排序1.原理2.代码三、插入排序算法1.原理2.代码四、快速排序算法1.原理2.代码五、希尔排序1.原理2.代码六、归并排序1.原理2.代码七、桶排序八、基数排序九、堆排序1.原理2.代码十、总结1.算法分类2.性能分析一、二分插入排序首先必须是排好序的数组，然后通过二分查找，找到合适的位置，插入1.原理二分查找算法又叫作折半查找，要求待查找的序列有
Python常考面试题汇总（附答案） TT图图面试职场和发展
写在前面本文面向中高级Python开发，太基本的题目不收录。本文只涉及Python相关的面试题，关于网络、MySQL、算法等其他面试必考题会另外开专题整理。不是单纯的提供答案，抵制八股文！！更希望通过代码演示，原理探究等来深入讲解某一知识点，做到融会贯通。部分演示代码也放在了我的github的该目录下。语言基础篇Python的基本数据类型Python3中有六个标准的数据类型：Number（数字）(
opencv-python与opencv-contrib-python的区别联系剑心缘零碎小知识 python opencv
opencv-python包含基本的opencvopencv-contrib-python是高配版，带一些收费或者专利的算法，还有一些比较新的算法的高级版本,这些算法稳定之后会加入上面那个。官网对contrib模块的简介（点击链接跳转）参考链接
通信算法之278：数据链/自组网通信设备--MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码--1.系统指标需求及帧结构设计秋风战士无线通信基带处理算法 MATLAB仿真软件无线电算法无人机经验分享
MIMO(2T2R)-OFDM系统系列–实际工程应用算法代码第一章：系统指标需求拆解分析第二章：通信系统帧结构设计和OFDM参数设计第三章：通信业务速率设计及理论解调门限第四章：同步序列设计及同步性能仿真验证第五章：数据业务设计及性能仿真验证第六章：信道模型设计第七章：接收关键算法设计及仿真验证第八章：其它待补充本文目录MIMO(2T2R)-OFDM系统系列--实际工程应用算法代码一、实际项目：系
通信算法之287：通信技术点咨询秋风战士 MATLAB仿真软件无线电无线通信基带处理算法网络算法无人机经验分享
专业技术咨询方向第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线OFDM系统（SFBC码）帧结构设计第一：SFBC编码与解码原理推导第二：SFBC系统中信道均衡推导第三：云哨物理层协议-速率匹配-解调门限-5dB第四：两天线SCFDE系统（SFBC码）帧结构设计第五：两天线
【计算机毕业设计】基于Springboot的办公用品管理系统+LW 枫叶学长(专业接毕设) Java毕业设计实战案例课程设计 spring boot 后端
博主介绍：✌全网粉丝3W+,csdn特邀作者、CSDN新星计划导师、Java领域优质创作者,掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和学生毕业项目实战,高校老师/讲师/同行前辈交流✌技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、安卓app、大数据、物联网、机器学习等设计与开发。主要内容：
MongoDB + Voyage AI 详解：重塑数据库与AI的协同范式 csdn_tom_168 NoSQL 数据库 mongodb 人工智能 AI
MongoDB+VoyageAI详解：重塑数据库与AI的协同范式2025年2月，MongoDB官方宣布收购VoyageAI，这一举措标志着数据库与人工智能技术的深度融合迈入新阶段。通过整合VoyageAI的先进AI检索与嵌入模型能力，MongoDB旨在重新定义AI时代的数据库架构，为企业构建智能应用提供端到端的数据基础设施。一、收购背景与技术战略1.行业趋势驱动AI数据挑战：随着生成式AI与大语言
HarmonyOS5.0仓颉引擎与盘古大模型：个性化作业批改系统架构设计与实现 H老师带你学鸿蒙系统架构 HarmonyOS5.0 鸿蒙华为仓颉教育
人工智能与边缘计算的融合正在重塑教育评价体系。本文将展示如何基于HarmonyOS5.0仓颉并发引擎和盘古大模型，构建新一代智能作业批改系统。系统架构全景graphTDA[学生端设备]-->|提交作业|B[仓颉边缘处理]B-->C[盘古大模型分析]C-->D[个性化反馈生成]D-->E[学生终端]D-->F[教师仪表盘]subgraphHarmonyOS分布式系统B-->|设备协同|G[教室平板集
知识图谱的个性化智能教学推荐系统(论文+源码) 毕设工作室_wlzytw python论文项目知识图谱人工智能
目录摘要Abstract目录第1章绪论1.1研究背景及意义1.2国内外研究现状1.2.1知识图谱1.2.2个性化推荐系统1.3本文研究内容及创新点1.4全文组织结构第2章相关理论与技术概述2.1知识图谱2.1.1知识图谱的介绍与发展2.1.2知识图谱的构建2.3协同过滤推荐算法2.2.1推荐算法概述2.2.2Pearson相关系数2.2.3Spearman相关系数2.4Bert模型和Albert模
反向传播神经网络极简入门自信哥
单个神经元神经网络是多个“神经元”（感知机）的带权级联，神经网络算法可以提供非线性的复杂模型，它有两个参数：权值矩阵{Wl}和偏置向量{bl}，不同于感知机的单一向量形式，{Wl}是复数个矩阵，{bl}是复数个向量，其中的元素分别属于单个层，而每个层的组成单元，就是神经元。神经元神经网络是由多个“神经元”（感知机）组成的，每个神经元图示如下：这其实就是一个单层感知机，其输入是由和+1组成的向量，其
阿里云瑶池数据库 Data Agent for Meta 正式发布，让 AI 更懂你的业务！数据库观点资讯人工智能
背景随着生成式人工智能（GenerativeAI）从概念验证迈向规模化商业落地，AIAgent已成为企业核心业务流程的重要组成部分。然而，当模型调用日益便捷时，核心痛点已不再是模型本身，而是集中在一个关键要素上：数据。AIAgent的落地瓶颈已从技术能力转向高质量、高相关性、安全合规的数据供给。企业面临的核心挑战在于：数据孤岛导致知识库分散，通用大模型难以理解专业业务传统数据管理依赖人工开发维护，
【TVM 教程】如何处理 TVM 报错
ApacheTVM是一个深度的深度学习编译框架，适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/运行TVM时，可能会遇到如下报错：---------------------------------------------------------------AnerroroccurredduringtheexecutionofTVM.F
【限时干货】Calibre智能分类，轻松突破内网限制畅享电子书库比头发还脆弱服务器 tcp/ip linux
文章目录前言1.网络书库软件下载安装2.网络书库服务器设置3.内网穿透工具设置4.公网使用kindle访问内网私人书库前言本研究旨在构建一套运行于微软操作系统环境下的独立电子图书管理体系，核心目标是建立可远程操作的资源访问机制。该架构采用高可用性设计，在第三方阅读平台服务中断时仍能保障数字内容传输的稳定性。系统创新性地融合了两大核心技术组件：通过Calibre开源软件实现文献分类算法与格式转换功能
【PaddleOCR】OCR文本检测与文本识别数据集整理，持续更新......
博主简介：曾任某智慧城市类企业算法总监，目前在美国市场的物流公司从事高级算法工程师一职，深耕人工智能领域，精通python数据挖掘、可视化、机器学习等，发表过AI相关的专利并多次在AI类比赛中获奖。CSDN人工智能领域的优质创作者，提供AI相关的技术咨询、项目开发和个性化解决方案等服务，如有需要请站内私信或者联系任意文章底部的的VX名片（ID：xf982831907）博主粉丝群介绍：①群内初中生、
说话人识别python_基于各种分类算法的说话人识别（年龄段识别） weixin_39673184 说话人识别python
基于各种分类算法的语音分类(年龄段识别)概述实习期间作为帮手打杂进行了一段时间的语音识别研究，内容是基于各种分类算法的语音的年龄段识别，总结一下大致框架，基本思想是：获取语料库TIMIT提取数据特征，进行处理MFCC/i-vectorLDA/PLDA/PCA语料提取，基于分类算法进行分类SVM/SVR/GMM/GBDT...用到的工具有HTK(C,shell)/Kaldi(C++,shell)/L
深入浅出Java Annotation(元注解和自定义注解） Josh_Persistence Java Annotation 元注解自定义注解
一、基本概述　　 Annontation是Java5开始引入的新特征。中文名称一般叫注解。它提供了一种安全的类似注释的机制，用来将任何的信息或元数据（metadata）与程序元素（类、方法、成员变量等）进行关联。　　更通俗的意思是为程序的元素（类、方法、成员变量）加上更直观更明了的说明，这些说明信息是与程序的业务逻辑无关，并且是供指定的工具或
mysql优化特定类型的查询 annan211 java 工作 mysql
本节所介绍的查询优化的技巧都是和特定版本相关的，所以对于未来mysql的版本未必适用。 1 优化count查询对于count这个函数的网上的大部分资料都是错误的或者是理解的都是一知半解的。在做优化之前我们先来看看真正的count()函数的作用到底是什么。 count()是一个特殊的函数，有两种非常不同的作用，他可以统计某个列值的数量，也可以统计行数。在统
MAC下安装多版本JDK和切换几种方式棋子chessman jdk
环境： MAC AIR,OS X 10.10,64位历史：过去 Mac 上的 Java 都是由 Apple 自己提供，只支持到 Java 6，并且OS X 10.7 开始系统并不自带（而是可选安装）（原自带的是1.6）。后来 Apple 加入 OpenJDK 继续支持 Java 6，而 Java 7 将由 Oracle 负责提供。在终端中输入jav
javaScript （1） Array_06 JavaScript java 浏览器
JavaScript 1、运算符　　运算符就是完成操作的一系列符号，它有七类：　　赋值运算符（=,+=,-=,*=,/=,%=,<<=,>>=,|=,&=）、算术运算符(+,-,*,/,++,--,%)、比较运算符(>,<,<=,>=,==,===,!=,!==)、逻辑运算符(||,&&,!)、条件运算(?:)、位
国内顶级代码分享网站袁潇含 java jdk oracle .net PHP
现在国内很多开源网站感觉都是为了利益而做的当然利益是肯定的,否则谁也不会免费的去做网站 &
Elasticsearch、MongoDB和Hadoop比较随意而生 mongodb hadoop 搜索引擎
IT界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配
mac os 系统科研软件总结张亚雄 mac os
1.1 Microsoft Office for Mac 2011 大客户版，自行搜索。 1.2 Latex （MacTex）: 系统环境：https://tug.org/mactex/ &nb
Maven实战（四）生命周期 AdyZhang maven
1. 三套生命周期 Maven拥有三套相互独立的生命周期，它们分别为clean，default和site。每个生命周期包含一些阶段，这些阶段是有顺序的，并且后面的阶段依赖于前面的阶段，用户和Maven最直接的交互方式就是调用这些生命周期阶段。以clean生命周期为例，它包含的阶段有pre-clean, clean 和 post
Linux下Jenkins迁移 aijuans Jenkins
1. 将Jenkins程序目录copy过去源程序在/export/data/tomcatRoot/ofctest-jenkins.jd.com下面 tar -cvzf jenkins.tar.gz ofctest-jenkins.jd.com &
request.getInputStream()只能获取一次的问题 ayaoxinchao request Inputstream
问题：在使用HTTP协议实现应用间接口通信时，服务端读取客户端请求过来的数据，会用到request.getInputStream()，第一次读取的时候可以读取到数据，但是接下来的读取操作都读取不到数据原因： 1. 一个InputStream对象在被读取完成后，将无法被再次读取，始终返回-1； 2. InputStream并没有实现reset方法（可以重
数据库SQL优化大总结之百万级数据库优化方案 BigBird2012 SQL优化
网上关于SQL优化的教程很多，但是比较杂乱。近日有空整理了一下，写出来跟大家分享一下，其中有错误和不足的地方，还请大家纠正补充。这篇文章我花费了大量的时间查找资料、修改、排版，希望大家阅读之后，感觉好的话推荐给更多的人，让更多的人看到、纠正以及补充。 1.对查询进行优化，要尽量避免全表扫描，首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where
jsonObject的使用 bijian1013 java json
在项目中难免会用java处理json格式的数据，因此封装了一个JSONUtil工具类。 JSONUtil.java package com.bijian.json.study; import java.util.ArrayList; import java.util.Date; import java.util.HashMap;
[Zookeeper学习笔记之六]Zookeeper源代码分析之Zookeeper.WatchRegistration bit1129 zookeeper
Zookeeper类是Zookeeper提供给用户访问Zookeeper service的主要API，它包含了如下几个内部类首先分析它的内部类，从WatchRegistration开始，为指定的znode path注册一个Watcher， /** * Register a watcher for a particular p
【Scala十三】Scala核心七：部分应用函数 bit1129 scala
何为部分应用函数？ Partially applied function: A function that’s used in an expression and that misses some of its arguments.For instance, if function f has type Int => Int => Int, then f and f(1) are p
Tomcat Error listenerStart 终极大法 ronin47 tomcat
Tomcat报的错太含糊了，什么错都没报出来，只提示了Error listenerStart。为了调试，我们要获得更详细的日志。可以在WEB-INF/classes目录下新建一个文件叫logging.properties，内容如下 Java代码 handlers = org.apache.juli.FileHandler, java.util.logging.ConsoleHa
不用加减符号实现加减法 BrokenDreams 实现
今天有群友发了一个问题，要求不用加减符号(包括负号)来实现加减法。分析一下，先看最简单的情况，假设1+1，按二进制算的话结果是10，可以看到从右往左的第一位变为0，第二位由于进位变为1。
读《研磨设计模式》-代码笔记-状态模式-State bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 当一个对象的内在状态改变时允许改变其行为，这个对象看起来像是改变了其类状态模式主要解决的是当控制一个对象状态的条件表达式过于复杂时的情况把状态的判断逻辑转移到表示不同状态的一系列类中，可以把复杂的判断逻辑简化如果在
CUDA程序block和thread超出硬件允许值时的异常 cherishLC CUDA
调用CUDA的核函数时指定block 和 thread大小，该大小可以是dim3类型的（三维数组），只用一维时可以是usigned int型的。以下程序验证了当block或thread大小超出硬件允许值时会产生异常！！！GPU根本不会执行运算！！！所以验证结果的正确性很重要！！！在VS中创建CUDA项目会有一个模板，里面有更详细的状态验证。以下程序在K5000GPU上跑的。
诡异的超长时间GC问题定位 chenchao051 jvm cms GC hbase swap
HBase的GC策略采用PawNew+CMS, 这是大众化的配置，ParNew经常会出现停顿时间特别长的情况，有时候甚至长到令人发指的地步，例如请看如下日志： 2012-10-17T05:54:54.293+0800: 739594.224: [GC 739606.508: [ParNew: 996800K->110720K(996800K), 178.8826900 secs] 3700
maven环境快速搭建 daizj 安装 mavne 环境配置
一下载maven 安装maven之前，要先安装jdk及配置JAVA_HOME环境变量。这个安装和配置java环境不用多说。 maven下载地址：http://maven.apache.org/download.html，目前最新的是这个apache-maven-3.2.5-bin.zip，然后解压在任意位置，最好地址中不要带中文字符，这个做java 的都知道，地址中出现中文会出现很多
PHP网站安全，避免PHP网站受到攻击的方法 dcj3sjt126com PHP
对于PHP网站安全主要存在这样几种攻击方式:1、命令注入(Command Injection)2、eval注入(Eval Injection)3、客户端脚本攻击(Script Insertion)4、跨网站脚本攻击(Cross Site Scripting, XSS)5、SQL注入攻击(SQL injection)6、跨网站请求伪造攻击(Cross Site Request Forgerie
yii中给CGridView设置默认的排序根据时间倒序的方法 dcj3sjt126com GridView
public function searchWithRelated() { $criteria = new CDbCriteria; $criteria->together = true; //without th
Java集合对象和数组对象的转换 dyy_gusi java集合
在开发中，我们经常需要将集合对象（List，Set）转换为数组对象，或者将数组对象转换为集合对象。Java提供了相互转换的工具，但是我们使用的时候需要注意，不能乱用滥用。 1、数组对象转换为集合对象最暴力的方式是new一个集合对象，然后遍历数组，依次将数组中的元素放入到新的集合中，但是这样做显然过
nginx同一主机部署多个应用 geeksun nginx
近日有一需求，需要在一台主机上用nginx部署2个php应用，分别是wordpress和wiki，探索了半天，终于部署好了，下面把过程记录下来。 1. 在nginx下创建vhosts目录，用以放置vhost文件。 mkdir vhosts 2. 修改nginx.conf的配置，在http节点增加下面内容设置，用来包含vhosts里的配置文件 #
ubuntu添加admin权限的用户账号 hongtoushizi ubuntu useradd
ubuntu创建账号的方式通常用到两种：useradd 和adduser . 本人尝试了useradd方法，步骤如下： 1:useradd 使用useradd时，如果后面不加任何参数的话，如：sudo useradd sysadm 创建出来的用户将是默认的三无用户：无home directory ,无密码,无系统shell。顾应该如下操作：
第五章常用Lua开发库2-JSON库、编码转换、字符串处理 jinnianshilongnian nginx lua
JSON库在进行数据传输时JSON格式目前应用广泛，因此从Lua对象与JSON字符串之间相互转换是一个非常常见的功能；目前Lua也有几个JSON库，本人用过cjson、dkjson。其中cjson的语法严格（比如unicode \u0020\u7eaf），要求符合规范否则会解析失败（如\u002），而dkjson相对宽松，当然也可以通过修改cjson的源码来完成
Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解 yaerfeng1989 timer quartz 定时器
原创整理不易，转载请注明出处：Spring定时器配置的两种实现方式OpenSymphony Quartz和java Timer详解代码下载地址：http://www.zuidaima.com/share/1772648445103104.htm 有两种流行Spring定时器配置：Java的Timer类和OpenSymphony的Quartz。 1.Java Timer定时首先继承jav
Linux下df与du两个命令的差别？ pda158 linux
　一、df显示文件系统的使用情况，与du比較，就是更全盘化。　　最经常使用的就是 df -T，显示文件系统的使用情况并显示文件系统的类型。　　举比例如以下：　　[root@localhost ~]# df -T 　　Filesystem Type &n
[转]SQLite的工具类 ---- 通过反射把Cursor封装到VO对象 ctfzh VO android sqlite 反射 Cursor
在写DAO层时，觉得从Cursor里一个一个的取出字段值再装到VO(值对象)里太麻烦了，就写了一个工具类，用到了反射，可以把查询记录的值装到对应的VO里，也可以生成该VO的List。使用时需要注意：考虑到Android的性能问题，VO没有使用Setter和Getter，而是直接用public的属性。表中的字段名需要和VO的属性名一样，要是不一样就得在查询的SQL中
该学习笔记用到的Employee表 vipbooks oracle sql 工作
这是我在学习Oracle是用到的Employee表，在该笔记中用到的就是这张表，大家可以用它来学习和练习。 drop table Employee; -- 员工信息表 create table Employee( -- 员工编号 EmpNo number(3) primary key, -- 姓