lou1219

白话统计学-阅读笔记

第四章关于统计资料类型的思考

1. 分类变量有序和无序是怎么确定的？

有序分类资料：体现有序，体现等级的意义，需进行秩和检验；否则可进行卡方检验
无序分类资料：不体现分类之间的等级差别，进行卡方检验

1. 连续变量是否需要转换为分类变量？

出于实际意义考虑，有时分类变量更易于理解
连续资料本身与结果变量之间并不是线性关系

2. 连续变量如何分组？

当样本量较小时，不要划分太多组，最好只分为两类
即使样本量足够大，作为参照组的一组样本量绝不能太少，否则会导致结果不稳定
应用广义可加模型（该模型主要用于探索自变量与因变量的关系）寻找cut-off值
利用ROC曲线寻找cut-off值，此时只能将连续变量分为2组（仅适用于因变量为二分类变量）
应用最大选择秩统计量来划分（适用于分类变量，连续变量，生存数据）
应用分类决策树（引入“熵”的概念，“熵”反应不确定度，即不纯度）
应用聚类分析（无监督，适用于无因变量的一组自变量）

3. 什么是虚拟变量（哑变量）？

哑变量是将多分类变量转换为二分类变量的一种形式
优点：解决自变量与因变量是非线性关系，虚拟变量可以更真实的展示二者关系
缺点：把多分类变量转换为哑变量后，自变量数目增多，对于样本量不是很大的情况下，增加结果的不稳定性

第五章如何正确展示你的数据

1. 均数和中位数

正态分布的数据用均数，偏态分布的数据用中位数
如果遇到偶数，中位数是居中的两个数的平均数

2. 方差与标准差

方差和标准差是衡量变异最常用的指标
离均差是指偏离均数之差，即每个数值分别与均数相减之差；离均差平方和是对每个差值求平方，然后相加的总和；在样本量不同时，离均差平方和不能很好的反响差异，故引入方差的概念
方差是离均差平方和除以例数，本质是一个平方数，对于指标而言，其平方数没有实际意义（例如收入的平方是什么？很难理解），故引入标准差的概念
-标准差是方差的平方根，去除了平方，更有实际意义
需要注意的是，我们通常计算的都是样本的方差，而不是总体的方差，统计的思维是拿样本去估计总体

3. 自由度

自由度是计算样本统计量时能够自由取值的数值的个数
不同的统计方法中，自由度都不一样，基本原则是每估计1个参数，需要消耗1个自由度

4. 百分位数

百分位数是度量相对位置的重要指标
第100百分位数即最大值，第0百分位数即最小值，第50百分位数即中位值
第75百分位数称为上四分位数（Q3表示），第25百分位数称为下四分卫数（Q1表示），二者之差称为四分位数间距

5. Z值

Z值是另一个应用更为广泛的度量相对位置的指标，也是我们通常所说的标准化
Z值反应某个值X偏离均数μ的标准差倍数
数据一旦标准化，都变成了以0为均数，以1为标准差的分布
无论原始数据的度量单位是什么，标准化后都可以在同一水平上进行比较
中心化是每个原始数据X减去其均数μ后得到的值，相当于标准化的分子部分
Z值得两个常见应用

比较不同单位的指标（Z值为标准化后的值，可以对不同单位的指标进行比较，例如比较两种不同考试的成绩）
判断异常值（在标准正态分布中，大于3倍标准差的值是很罕见的，只有不到0.3%，如果一个数值的Z值超过3，提示其可能是个异常值，如果是非正态分布，则不一定适用此标准）

Z值转换并不能改变数据的分布

第六章中心极限定理

1. 中心极限定理

含义：假定有一个总体数据，如果从该总体数据中多次抽样，那么理论上，每次抽样所得到的平均数与总体平均数应该差别不大，大致围绕在总体参数（如均数）的中心，并且呈正态分布
中心极限定理是针对抽样样本的平均数，而不是针对原始数据的，虽然样本量大于30时，统计量基本呈正态分布，但不代表原始数据服从正态分布

2. 中心极限定理的规律

如果从总体中进行多次抽样，那么绝大多数样本统计量都会紧密围绕在总体参数周围，这些样本统计量以总体参数为中心呈正态分布
每次抽样的样本量越大，根据样本计算的统计量越接近总体参数；样本量越大，越容易得到一个接近总体参数的统计量
无论总体是什么样的分布（正态的、偏态的、均匀的），样本统计量始终是呈正态分布的，尤其是在样本量较大的时候
-根据中心极限定理，当抽样样本量大于30时，样本的均数即服从正态分布，但不意味着就可以简单的进行t检验，这里只能说明均数服从正态分布，而不代表数据本身服从正态分布

第七章假设检验

1. 假设检验、零假设、备择假设

假设检验就是“检验”我们所做的“假设”到底对不对
假设又分为零假设和备择假设；一般零假设是想推翻的，备择假设是想证实的
零假设通常用H0表示，它的假设一般是组间差异为0，两个变量的相关系数为0，回归系数为0等；有时零假设中的参数可以不为0，视实际意义而定
备择假设通常用H1表示，它与零假设相对立
假设的检验有很多种，最常用的是经典统计方法；先根据收集的数据计算一个统计量，然后根据相应的分布计算出至少得到该统计量的P值是多少，最终做出结论
假设的检验是在零假设成立的条件下计算出来的

2. 假设检验中的两类错误

Ⅰ类错误，即假阳性率，造成误诊、矫枉过正，通常设为α = 0.05
Ⅱ类错误，即假阴性率，造成漏诊、包庇纵容，通常设为β = 0.1或0.2
把握度（功效），即1-β（Ⅱ类错误），是正确判断的能力

3. P值

P值跟差异的大小无关，差异的大小与样本量相关
P值小于0.05认为是小概率事件，统计学上就认为不大可能发生

第八章参数估计

根据样本统计量来估计总体参数，这就叫参数估计；参数估计又分为点估计和区间估计; 点估计更为准确，但未必可靠；区间估计 更为可靠，但不够精确

1. 点估计

根据中心极限定理，多次重复抽样，所得多个统计量应该都是围绕总体参数进行波动的，多个统计量的均数应该等于总体参数

2. 最小二乘估计

主要用于线性回归的参数估计，其思想是求一个是的实际值和模型估计值之差达到最小的值，将其最为参数估计值
最小二乘均数是指矫正其他因素之后的均数

3. 最大似然估计

最大似然估计就是最大可能性的估计，就是说我们获得样本数据，根据已知的样本结果，反推找到一个估计值，使得最大可能出现现有结果

4. 贝叶斯估计

基于先验信息的一种估计方法，即根据已有的一些经验，把经验纳入估计过程中，从而得到估计值
经典的频数统计学派认为总体的参数是固定的，而样本统计量是随机变量，但是贝叶斯认为总体的参数也是随机变量，服从某一概率的随机变量；贝叶斯重点研究的是参数的分布

第九章置信区间估计

1. 95%置信区间

置信区间估计是区间估计，95%置信区间的确切含义是有95%的信心认为该区间包含了总体的参数
置信区间的宽窄反应了对参数估计的精确度，置信区间越窄，说明估计越精准；置信区间越宽；说明估计不精准，但更为可靠，然而这种可靠，由于精准度差，往往没什么实际价值

2. 置信区间与P值

置信区间与P值在做出统计学结论时有异曲同工之妙，但置信区间可以提供的信息更多
P值只是告诉我们一个概率,即当零假设成立时，出现当前结果（或者更极端结果）的概率
置信区间不仅可以做出统计结论，还可以提示与零假设的参数偏离有多远；可以提供给我们一些更有实际价值的信息

3. 标准误

标准误是样本统计量的标准差，是用来衡量抽样样本之间的差异，它反映了样本平均数的离散程度，是描述对应的样本统计量抽样分布的离散程度及衡量对应样本统计量抽样误差大小的尺度
标准差是一个描述性指标，只是描述原始数据的波动情况，是描写叙述数据点在均值（mean）周围聚集程度的指标；而标准差是一个跟统计推断相关的指标
标准误理论上需要通过多次抽样的多个样本的统计量获得，但是实际中我们只抽样一次，此时标准误= 标准差÷根号n（样本量），可以看出，样本量越大，标准误越小
95%置信区间= 参数估计值±1.96x标准误，注意此种计算方法只限于样本量足够大的情况，根据中心极限定理，从任何分布中抽样，只要样本量足够大，其统计量终会服从正态分布

4. 利用Bootstrap法估计置信区间

Bootstrap法可以用来估计未知分布情况的参数的置信区间，可用来估计中位数、回归系数等多种参数的置信区间

你可能感兴趣的:(白话统计学-阅读笔记)

面向高校的人工智能通识教育课程实验设计方案武汉唯众智创人工智能人工智能通识教育课程实验人工智能通识教育人工智能通识课程人工智能通识
一、前言2018年，教育部发布《高等学校人工智能创新行动计划》，明确提出“重视人工智能与计算机、控制、数学、统计学、物理学、生物学、心理学、社会学、法学等学科专业教育的交叉融合，探索‘人工智能+X’的人才培养模式”。过去，人工智能教育多集中于研究生阶段，本科生接触机会相对有限。2019年，教育部批准35所高校增设“人工智能”本科专业，这标志着人工智能正式纳入本科教育体系。如今，人工智能课程大多是计
Boostrap方法的理解及应用 Xiaofei@IDO 统计学概率论机器学习数据挖掘
1、Boostrap介绍1.1概念性解释Boostrap统计学方法是一种非参数检验方法，用于估计各种统计量的置信区间。Boostrap计算步骤简单的描述为：通过有放回的数据集的重采样，产生一系列的待检验统计量的Boostrap经验分布。基于该分布，计算标准误差，构建置信区间，并对多种类型的样本进行统计信息和假设检验。Boostrap统计学方法使用范围比较广，因为它不需要假定数据服从特定的理论分布（
KNN（K-近邻算法)(上)--day05 扫把星133 机器学习 python 人工智能近邻算法算法
KNN（K-NearestNeighbors，K近邻算法）是一种用于分类和回归的非参数化方法。其基本思想是通过找出与新样本最接近的已标记数据中的K个最近邻居来进行预测或分类。注释：非参数化方法是指在统计学和机器学习中，不对数据分布做出严格假设（这些假设通常包括
2025年6月文章一览 python
2025年6月编程人总共更新了3篇文章：1.2025年5月文章一览2.《算法导论(第4版)》阅读笔记：p175-p1813.《BuildingRESTAPIswithFlask》读后感本月在读3本，阅读完一本——《BuildingRESTAPIswithFlask》。读完《BuildingRESTAPIswithFlask》，有两点感受最深：一、学有所用是效果最好的。其实在2019年就接触了Mar
《python 数据分析从入门到精通》读书笔记｜了解数据分析｜数据分析基础知识
《python数据分析从入门到精通》读书笔记第一章：了解数据分析1.1什么是数据分析数据分析是利用数学、统计学理论与实践相结合的科学统计分析方法，对Excel数据、数据库中的数据、收集的大量数据、网页抓取的数据进行分析，从中提取有价值的信息并形成结论进行展示的过程。数据分析实际上是通过数据的规律来解决业务问题，以帮助实际工作中的管理者做出判断和决策。数据分析包括以下几个主要内容：（1）现状分析：分
Rstudio：强大的R语言集成开发环境（IDE）简说基因-专业生信合作伙伴 r语言开发语言
Rstudio应该是R语言使用的标配，尽管Rstudio的母公司Posit推出了新一代的集成开发环境Positron，但其还处于开发阶段。作为用户不妨让其成熟后再使用，现阶段还是Rstudio更稳定。如果你在生物信息学或统计学领域工作，R语言几乎是必备的工具之一。而RStudio，作为R语言最流行的集成开发环境（IDE），为数据分析、可视化和编程提供了非常友好的平台。今天我们来介绍一下RStudi
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-split_dota.py 红色的山茶花 YOLO 笔记深度学习
split_dota.pyultralytics\data\split_dota.py目录split_dota.py1.所需的库和模块2.defbbox_iof(polygon1:np.ndarray,bbox2:np.ndarray,eps:float=1e-6)->np.ndarray:3.defload_yolo_dota(data_root:str,split:str="train")->
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-augment.py
augment.pyultralytics\data\augment.py目录augment.py1.所需的库和模块2.classBaseTransform:3.classCompose:4.classBaseMixTransform:5.classCutMix(BaseMixTransform):6.classCopyPaste(BaseMixTransform):7.defv8_transfo
全流程文献计量学可视化分析技术及SCI论文高效写作方法青春不败 177-3266-0520 生态环境人工智能 python 文献可视化 SCI论文生态学环境科学遥感
文献计量学是指用数学和统计学的方法，定量地分析一切知识载体的交叉科学。它是集数学、统计学、文献学为一体，注重量化的综合性知识体系。特别是，信息可视化技术手段和方法的运用，可直观的展示主题的研究发展历程、研究现状、研究热点和发展态势。一：文献计量学方法与应用1.文献计量学方法基本2.与其他综述方法区别联系3.各学科领域应用趋势近况4.主流分析软件优缺点对比二：主题确定、检索与数据采集1.热点主题高效
UE4 官方文档阅读笔记——材质篇毛甘木 UE4 材质修改 android java
UE4官方文档阅读笔记——材质篇UE4免费材质：QuixelBridge网站材质基本概念材质编辑器参考1.MaterialExpression向材质节点添加描述2.快捷键C添加注释3.修改注释颜色4.LivePreview实时预览5.LiveNode实时节点6.LiveUpdate实时更新7.AddRerouteNode添加变更路线节点ContenxtMenuUtilityMaterialPale
UE4官方文档阅读笔记——蓝图可视化编程毛甘木 UE4 ue4
UE4蓝图官方文档阅读笔记蓝图中的结构体变量拆分结构体Break组成结构体Make修改结构体中个别成员SetMemberinStruct自定义结构体内容浏览器-创建高级资源-蓝图-结构体蓝图数组Add添加元素到末尾ClearContainsFilterArrayFindGetInsertLastLengthRemoveRemoveIndexResizeSetArrayElem<
使用vue-template-loader将模板编译成渲染函数的Webpack配置技巧前端布洛芬大白话前端八股 vue.js webpack 前端
大白话使用vue-template-loader将模板编译成渲染函数的Webpack配置技巧引言：被模板编译逼疯的周三下午你是否也经历过这样的场景：deadline前的周三下午，咖啡因已经失效，屏幕上却跳出Templatecompilationfailed的红色报错。Vue单文件组件（SFC）的.vue格式用腻了，想试试把模板抽成单独的.html文件，结果webpack配置直接给你脸色看。作为每天
华为认证二选一：物联网 VS 人工智能，你的赛道在哪里？博睿谷IT99_ 物联网人工智能华为华为认证
一篇不讲情怀只讲干货的科普指南一、华为物联网&人工智能到底在搞什么？华为物联网（IoT）的核心是“万物互联”。通过传感器、通信技术（如NB-IoT/5G）、云计算平台（如OceanConnect），将物理设备（车、路灯、工厂机器）连入网络，实现数据采集、远程控制和智能决策。大白话就是：它让哑巴设备学会“说话”。华为人工智能（AI）的核心是“让机器学会思考”。聚焦大模型训练、部署与应用（如昇腾AI解
优秀开源库muduo阅读笔记 VictorLeo 网路编程服务端编程 muduo
muduo阅读笔记目录设计经验和思想服务端编程设计std::bind和std::function(基于closure闭包的编程)参考资料muduo开源库的笔记，比较杂，没有详细整理，现在就这么杂乱放着，等真的需要再好好整理。设计经验和思想对象构造做到线程安全，唯一的要求就是不要暴露this指针.即不要在构造函数中注册任何回调；也不要在构造函数中把this传给跨线程的对象；即便在构造函数的最后一行也
人工智能-基础篇-2-什么是机器学习？（ML，监督学习，半监督学习，零监督学习，强化学习，深度学习，机器学习步骤等） weisian151 人工智能人工智能机器学习学习
1、什么是机器学习？机器学习（MachineLearning,ML）是人工智能的一个分支，是一门多领域交叉学科，涉及概率论、统计学、逼近论、凸分析等数学理论。其核心目标是让计算机通过分析数据，自动学习规律并构建模型，从而对未知数据进行预测或决策，而无需依赖显式的程序指令。基本思想：通过数据驱动的方式，使系统能够从经验（数据）中改进性能，形成对数据模式的抽象化表达。基本概念：模型：模型是对现实世界现
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-metrics.py 红色的山茶花 YOLO 笔记深度学习
metrics.pyultralytics\utils\metrics.py目录metrics.py1.所需的库和模块2.defbbox_ioa(box1:np.ndarray,box2:np.ndarray,iou:bool=False,eps:float=1e-7)->np.ndarray:3.defbox_iou(box1:torch.Tensor,box2:torch.Tensor,eps
YOLOv12_ultralytics-8.3.145部分代码阅读笔记-utils.py 红色的山茶花 YOLO 笔记深度学习
utils.pyultralytics\nn\modules\utils.py目录utils.py1.所需的库和模块2.def_get_clones(module,n):3.definverse_sigmoid(x,eps=1e-5):4.defmulti_scale_deformable_attn_pytorch(value:torch.Tensor,value_spatial_shapes:t
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-loss.py 红色的山茶花 YOLO 笔记深度学习
loss.pyultralytics\utils\loss.py目录loss.py1.所需的库和模块2.classVarifocalLoss(nn.Module):3.classFocalLoss(nn.Module):4.classDFLoss(nn.Module):5.classBboxLoss(nn.Module):6.classv8DetectionLoss:7.classE2EDetec
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-utils.py 红色的山茶花 YOLO 笔记深度学习
utils.pyultralytics\nn\modules\utils.py目录utils.py1.所需的库和模块2.def_get_clones(module,n):3.defbias_init_with_prob(prior_prob=0.01):4.deflinear_init(module):5.definverse_sigmoid(x,eps=1e-5):6.defmulti_scal
YOLOv11-ultralytics-8.3.67部分代码阅读笔记-predict.py 红色的山茶花 YOLO 笔记深度学习
predict.pyultralytics\models\yolo\detect\predict.py目录predict.py1.所需的库和模块2.classDetectionPredictor(BasePredictor):1.所需的库和模块#UltralyticsAGPL-3.0License-https://ultralytics.com/licensefromultralytics.eng
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-torch_utils.py 红色的山茶花 YOLO 笔记深度学习
torch_utils.pyultralytics\utils\torch_utils.py目录torch_utils.py1.所需的库和模块2.defsmart_inference_mode():3.defautocast(enabled:bool,device:str="cuda"):4.deftime_sync():5.deffuse_conv_and_bn(conv,bn):6.deffu
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-autobackend.py 红色的山茶花 YOLO 笔记深度学习
autobackend.pyultralytics\nn\autobackend.py目录autobackend.py1.所需的库和模块2.defcheck_class_names(names:Union[List,Dict])->Dict[int,str]:3.defdefault_class_names(data:Optional[Union[str,Path]]=None)->Dict[in
大学专业科普 | 云计算、大数据鸭鸭鸭进京赶烤云计算大数据
大数据专业是近年来随着信息技术发展而兴起的热门学科，专注于从海量、多样化的数据中提取有价值信息，为各行业提供数据驱动的决策支持。专业定义大数据专业旨在培养掌握大数据采集、存储、管理、分析和应用等核心技术的人才。该专业融合了计算机科学、数学、统计学、数据科学和领域知识，重点解决大数据环境下的数据处理和分析问题。课程设置大数据专业的课程体系包括基础课程、专业核心课程和实践课程。（一）基础课程基础课程涵
倾向得分匹配的stata命令_R语言系列1：倾向得分匹配 weixin_39995108 倾向得分匹配的stata命令
1PSM简介倾向评分匹配(PropensityScoreMatching，简称PSM)是一种统计学方法，用于处理观察研究(ObservationalStudy)的数据。在观察研究中，由于种种原因，数据偏差(bias)和混杂变量(confoundingvariable)较多，倾向评分匹配的方法正是为了减少这些偏差和混杂变量的影响，以便对实验组和对照组进行更合理的比较。这种方法最早由PaulRosen
R 语言简介：数据分析与统计的强大工具 Mikhail_G python 数据分析大数据 r语言开发语言
大家好!在如今这个数据驱动的时代，数据分析与统计分析对于各个领域都变得至关重要。而R语言，作为一款专为数据分析和统计而设计的编程语言，以其强大的功能和灵活性，成为了众多数据分析师、研究人员以及统计学家的首选工具之一。什么是R语言?R是一种开源的编程语言和软件环境，主要用于统计计算、数据分析、图形表示以及机器学习等领域。它是由RossIhaka和RobertGentleman于1995年开发的，之后
从 “啃书焦虑” 到 “项目通关”：NLP 学习的破局之道木旭林晖自然语言处理学习人工智能
嘿，你好。在CSDN上潜水这么久，我总能看到很多像你我当年一样，怀揣着NLP大厂梦的同学。我猜，你的收藏夹里一定塞满了“NLP必读清单”，书架上可能还放着那本厚得像砖头一样的《统计学习方法》或者“龙书”。每天深夜，你可能都在跟一个又一个复杂的数学公式死磕。什么最大熵模型、什么CRF（条件随机场）的推导……你觉得自己离“精通”越来越近，但心里却越来越慌。为什么慌？因为你打开招聘软件，看到JD（职位描
经济学神图：洛伦兹曲线大千AI助手人工智能 Python #OTHER 决策树人工智能 DecisionTree 算法洛伦兹曲线基尼
洛伦兹曲线（LorenzCurve）是衡量社会收入或财富分配不平等程度的经典可视化工具，由美国统计学家马克斯·洛伦兹（MaxOttoLorenz）于1905年提出。它不仅是理解基尼系数的核心基础，也是经济学、社会学中分析资源分配公平性的关键图表。本文由「大千AI助手」原创发布，专注用真话讲AI，回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我，一起撕掉过度包装，学习真实的AI技术！往期文
重复原则与样本量估计：临床试验的统计引擎 qq_34062333 临床试验统计学
一、重复原则的科学内涵1.1核心目的1.1.1量化随机误差通过足够样本量估计效应值的波动范围，确保结果可重现。1.1.2避免偶然性结论避免因小样本极端结果导致的偶然性结论，确保结论稳健。1.1.3提升外推性覆盖人群异质性，提升研究结果的外推性。1.2统计学本质1.2.1标准误样本量增加，标准误减小，置信区间变窄，精度提高。二、样本量估计的四大核心参数2.1显著性水平(α)2.1.1定义I类错误概率
YOLOv12_ultralytics-8.3.145_2025_5_27部分代码阅读笔记-block.py 红色的山茶花 YOLO 笔记深度学习
block.pyultralytics\nn\modules\block.py目录block.py1.所需的库和模块2.classDFL(nn.Module):3.classProto(nn.Module):4.classHGStem(nn.Module):5.classHGBlock(nn.Module):6.classSPP(nn.Module):7.classSPPF(nn.Module):
随机近似算法：步长序列选择的理论与金融实践
随机近似算法：步长序列选择的理论与金融实践摘要随机近似算法作为统计学习与优化的核心工具，其收敛性与稳定性高度依赖步长序列的设计。本文系统阐述步长序列的理论约束与工程选择策略，并结合金融波动率估计场景，展示算法在动态系统参数估计中的实践价值。1.随机近似算法的数学框架随机近似算法通过随机样本的迭代更新逼近目标参数，其核心迭代式为：θn+1=θn+an(Yn−g(θn))\theta_{n+1}=\t
java封装继承多态等麦田的设计者 java eclipse jvm c encapsulatopn
最近一段时间看了很多的视频却忘记总结了，现在只能想到什么写什么了，希望能起到一个回忆巩固的作用。 1、final关键字译为：最终的 &
F5与集群的区别 bijian1013 weblogic 集群 F5
http请求配置不是通过集群，而是F5；集群是weblogic容器的，如果是ejb接口是通过集群。 F5同集群的差别，主要还是会话复制的问题，F5一把是分发http请求用的，因为http都是无状态的服务，无需关注会话问题，类似
LeetCode[Math] - #7 Reverse Integer Cwind java 题解 Math LeetCode Algorithm
原题链接：#7 Reverse Integer 要求：按位反转输入的数字例1：输入 x = 123, 返回 321 例2：输入 x = -123, 返回 -321 难度：简单分析：对于一般情况，首先保存输入数字的符号，然后每次取输入的末位（x%10）作为输出的高位（result = result*10 + x%10）即可。但
BufferedOutputStream 周凡杨
首先说一下这个大批量，是指有上千万的数据量。例子：有一张短信历史表，其数据有上千万条数据，要进行数据备份到文本文件，就是执行如下SQL然后将结果集写入到文件中！ select t.msisd
linux下模拟按键输入和鼠标被触发 linux
查看/dev/input/eventX是什么类型的事件， cat /proc/bus/input/devices 设备有着自己特殊的按键键码，我需要将一些标准的按键，比如0－9，X－Z等模拟成标准按键，比如KEY_0,KEY-Z等，所以需要用到按键模拟，具体方法就是操作/dev/input/event1文件，向它写入个input_event结构体就可以模拟按键的输入了。 linux/in
ContentProvider初体验肆无忌惮_ ContentProvider
ContentProvider在安卓开发中非常重要。与Activity，Service，BroadcastReceiver并称安卓组件四大天王。在android中的作用是用来对外共享数据。因为安卓程序的数据库文件存放在data/data/packagename里面，这里面的文件默认都是私有的，别的程序无法访问。如果QQ游戏想访问手机QQ的帐号信息一键登录，那么就需要使用内容提供者COnte
关于Spring MVC项目（maven）中通过fileupload上传文件 843977358 mybatis spring mvc 修改头像上传文件 upload
Spring MVC 中通过fileupload上传文件，其中项目使用maven管理。 1.上传文件首先需要的是导入相关支持jar包：commons-fileupload.jar,commons-io.jar 因为我是用的maven管理项目，所以要在pom文件中配置（每个人的jar包位置根据实际情况定） <!-- 文件上传 start by zhangyd-c --&g
使用svnkit api，纯java操作svn，实现svn提交，更新等操作 aigo svnkit
原文：http://blog.csdn.net/hardwin/article/details/7963318 import java.io.File; import org.apache.log4j.Logger; import org.tmatesoft.svn.core.SVNCommitInfo; import org.tmateso
对比浏览器，casperjs，httpclient的Header信息 alleni123 爬虫 crawler header
@Override protected void doGet(HttpServletRequest req, HttpServletResponse res) throws ServletException, IOException { String type=req.getParameter("type"); Enumeration es=re
java.io操作 DataInputStream和DataOutputStream基本数据流百合不是茶 java 流
1，java中如果不保存整个对象，只保存类中的属性，那么我们可以使用本篇文章中的方法，如果要保存整个对象先将类实例化后面的文章将详细写到 2，DataInputStream 是java.io包中一个数据输入流允许应用程序以与机器无关方式从底层输入流中读取基本 Java 数据类型。应用程序可以使用数据输出流写入稍后由数据输入流读取的数据。
车辆保险理赔案例 bijian1013 车险
理赔案例：一货运车，运输公司为车辆购买了机动车商业险和交强险，也买了安全生产责任险，运输一车烟花爆竹，在行驶途中发生爆炸，出现车毁、货损、司机亡、炸死一路人、炸毁一间民宅等惨剧，针对这几种情况，该如何赔付。赔付建议和方案：客户所买交强险在这里不起作用，因为交强险的赔付前提是：“机动车发生道路交通意外事故”；如果是交通意外事故引发的爆炸，则优先适用交强险条款进行赔付，不足的部分由商业
学习Spring必学的Java基础知识(5)—注解 bijian1013 java spring
文章来源：http://www.iteye.com/topic/1123823，整理在我的博客有两个目的：一个是原文确实很不错，通俗易懂，督促自已将博主的这一系列关于Spring文章都学完；另一个原因是为免原文被博主删除，在此记录，方便以后查找阅读。有必要对
【Struts2一】Struts2 Hello World bit1129 Hello world
Struts2 Hello World应用的基本步骤创建Struts2的Hello World应用，包括如下几步： 1.配置web.xml 2.创建Action 3.创建struts.xml，配置Action 4.启动web server，通过浏览器访问配置web.xml <?xml version="1.0" encoding="
【Avro二】Avro RPC框架 bit1129 rpc
1. Avro RPC简介 1.1. RPC RPC逻辑上分为二层，一是传输层，负责网络通信；二是协议层，将数据按照一定协议格式打包和解包从序列化方式来看，Apache Thrift 和Google的Protocol Buffers和Avro应该是属于同一个级别的框架，都能跨语言，性能优秀，数据精简，但是Avro的动态模式（不用生成代码，而且性能很好）这个特点让人非常喜欢，比较适合R
lua　set get cookie ronin47 lua cookie
lua: local access_token = ngx.var.cookie_SGAccessToken if access_token then ngx.header["Set-Cookie"] = "SGAccessToken="..access_token.."; path=/;Max-Age=3000" end
java-打印不大于N的质数 bylijinnan java
public class PrimeNumber { /** * 寻找不大于N的质数 */ public static void main(String[] args) { int n=100; PrimeNumber pn=new PrimeNumber(); pn.printPrimeNumber(n); System.out.print
Spring源码学习-PropertyPlaceholderHelper bylijinnan java spring
今天在看Spring 3.0.0.RELEASE的源码，发现PropertyPlaceholderHelper的一个bug 当时觉得奇怪，上网一搜，果然是个bug，不过早就有人发现了，且已经修复：详见： http://forum.spring.io/forum/spring-projects/container/88107-propertyplaceholderhelper-bug
[逻辑与拓扑]布尔逻辑与拓扑结构的结合会产生什么? comsci 拓扑
如果我们已经在一个工作流的节点中嵌入了可以进行逻辑推理的代码,那么成百上千个这样的节点如果组成一个拓扑网络,而这个网络是可以自动遍历的,非线性的拓扑计算模型和节点内部的布尔逻辑处理的结合,会产生什么样的结果呢? 是否可以形成一种新的模糊语言识别和处理模型呢? 大家有兴趣可以试试,用软件搞这些有个好处,就是花钱比较少,就算不成
ITEYE 都换百度推广了 cuisuqiang Google AdSense 百度推广广告外快
以前ITEYE的广告都是谷歌的Google AdSense，现在都换成百度推广了。为什么个人博客设置里面还是Google AdSense呢？都知道Google AdSense不好申请，这在ITEYE上也不是讨论了一两天了，强烈建议ITEYE换掉Google AdSense。至少，用一个好申请的吧。什么时候能从ITEYE上来点外快，哪怕少点
新浪微博技术架构分析 dalan_123 新浪微博架构
新浪微博在短短一年时间内从零发展到五千万用户，我们的基层架构也发展了几个版本。第一版就是是非常快的，我们可以非常快的实现我们的模块。我们看一下技术特点，微博这个产品从架构上来分析，它需要解决的是发表和订阅的问题。我们第一版采用的是推的消息模式，假如说我们一个明星用户他有10万个粉丝，那就是说用户发表一条微博的时候，我们把这个微博消息攒成10万份，这样就是很简单了，第一版的架构实际上就是这两行字。第
玩转ARP攻击 dcj3sjt126com r
我写这片文章只是想让你明白深刻理解某一协议的好处。高手免看。如果有人利用这片文章所做的一切事情，盖不负责。网上关于ARP的资料已经很多了，就不用我都说了。用某一位高手的话来说，“我们能做的事情很多，唯一受限制的是我们的创造力和想象力”。 ARP也是如此。以下讨论的机子有一个要攻击的机子：10.5.4.178 硬件地址：52:54:4C:98
PHP编码规范 dcj3sjt126com 编码规范
一、文件格式 1. 对于只含有 php 代码的文件，我们将在文件结尾处忽略掉 "?>" 。这是为了防止多余的空格或者其它字符影响到代码。例如：<?php$foo = 'foo';2. 缩进应该能够反映出代码的逻辑结果，尽量使用四个空格，禁止使用制表符TAB，因为这样能够保证有跨客户端编程器软件的灵活性。例
linux 脱机管理（nohup） eksliang linux nohup nohup
脱机管理 nohup 转载请出自出处：http://eksliang.iteye.com/blog/2166699 nohup可以让你在脱机或者注销系统后，还能够让工作继续进行。他的语法如下 nohup [命令与参数] --在终端机前台工作 nohup [命令与参数] & --在终端机后台工作但是这个命令需要注意的是，nohup并不支持bash的内置命令，所
BusinessObjects Enterprise Java SDK greemranqq java BO SAP Crystal Reports
最近项目用到oracle_ADF 从SAP/BO 上调用水晶报表，资料比较少，我做一个简单的分享，给和我一样的新手提供更多的便利。首先，我是尝试用JAVA JSP 去访问的。官方API：http://devlibrary.businessobjects.com/BusinessObjectsxi/en/en/BOE_SDK/boesdk_ja
系统负载剧变下的管控策略 iamzhongyong 高并发
假如目前的系统有100台机器，能够支撑每天1亿的点击量（这个就简单比喻一下），然后系统流量剧变了要，我如何应对，系统有那些策略可以处理，这里总结了一下之前的一些做法。 1、水平扩展这个最容易理解，加机器，这样的话对于系统刚刚开始的伸缩性设计要求比较高，能够非常灵活的添加机器，来应对流量的变化。 2、系统分组假如系统服务的业务不同，有优先级高的，有优先级低的，那就让不同的业务调用提前分组
BitTorrent DHT 协议中文翻译 justjavac bit
前言做了一个磁力链接和BT种子的搜索引擎 {Magnet & Torrent}，因此把 DHT 协议重新看了一遍。 BEP: 5Title: DHT ProtocolVersion: 3dec52cb3ae103ce22358e3894b31cad47a6f22bLast-Modified: Tue Apr 2 16:51:45 2013 -070
Ubuntu下Java环境的搭建 macroli java 工作 ubuntu
配置命令：　　$sudo apt-get install ubuntu-restricted-extras 　　再运行如下命令：　　$sudo apt-get install sun-java6-jdk 　　待安装完毕后选择默认Java. 　　$sudo update- alternatives --config java 　　安装过程提示选择，输入“2”即可，然后按回车键确定。
js字符串转日期（兼容IE所有版本） qiaolevip TO Date String IE
/** * 字符串转时间（yyyy-MM-dd HH:mm:ss） * result （分钟） */ stringToDate : function(fDate){ var fullDate = fDate.split(" ")[0].split("-"); var fullTime = fDate.split("
【数据挖掘学习】关联规则算法Apriori的学习与SQL简单实现购物篮分析 superlxw1234 sql 数据挖掘关联规则
关联规则挖掘用于寻找给定数据集中项之间的有趣的关联或相关关系。关联规则揭示了数据项间的未知的依赖关系，根据所挖掘的关联关系，可以从一个数据对象的信息来推断另一个数据对象的信息。例如购物篮分析。牛奶 ⇒ 面包 [支持度：3%，置信度：40%] 支持度3%：意味3%顾客同时购买牛奶和面包。置信度40%：意味购买牛奶的顾客40%也购买面包。规则的支持度和置信度是两个规则兴
Spring 5.0 的系统需求，期待你的反馈 wiselyman spring
Spring 5.0将在2016年发布。Spring5.0将支持JDK 9。 Spring 5.0的特性计划还在工作中，请保持关注，所以作者希望从使用者得到关于Spring 5.0系统需求方面的反馈。

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他