打酱油的工程师

学习笔记|SPSS|描述变量|按照3倍标准差剔除异常值|标准化值另存为变量|剔除个案|Zscore|箱图|Zscore取值范围

目录

学习目的
软件版本
原始文档
概述
服从正态分布-按照3倍标准差剔除异常值
- 读数据
- 数据概览
- - 描述变量
- 正态性检验
- 异常值检验及剔除
非正态分布-根据Zscore取值范围确定
- 基础数据
- 数据概览
- - 正态性检验
  - Tips：箱图圆圈的含义
- 异常值检验及剔除
- - 描述变量，并将标准化值另存为变量：
  - 异常值筛选
Tips:Zscore取值范围
Tips：什么是Z-score?有哪些使用场景？

学习目的

SPSS按照3倍标准差剔除异常值

软件版本

IBM SPSS Statistics 26。

原始文档

spss按照3倍标准差剔除异常值
《小白爱上SPSS》课程第3讲数据

概述

数据需要服从正态分布。在3∂原则下，异常值如超过3倍标准差，那么可以将其视为异常值。正负3∂的概率是99.7%，那么距离平均值3∂之外的值出现的概率为P(|x-u| 3∂) = 0.003，属于极个别的小概率事件。
如果数据不服从正态分布，也可以用远离平均值的多少倍标准差来描述。即，使用Z-分数（Z-score）进行判断，计算每个数据的Z-分数。样本中每个数据 - 样本平均数，除以样本标准差，即可以计算每个数据的Z-分数。Z-score的值应该为【-3，+3】，超过该值的存在为异常值的可能，需要进一步判断。

服从正态分布-按照3倍标准差剔除异常值

三倍标准差法剔除异常值是一种经典的数据处理方法，指根据样本量和样本方差确定统计准则，将极端异常值（离群点）剔除，它是根据样本量和样本方差体现出来的分布统计学中的“三倍标准差”原则来处理数据异常值的方法。
三倍标准差剔除异常值涉及两个概念;根据总体样本方差的大小，让算出每个样本的“允许范围”;.将超出“允许范围”的异常值剔除出去。
其具体步骤是: 1、计算样本的标准差;2、确定样本的允许范围;3、如果有极端异常值，就剔除出来。
总体样本标准差的大小和离群点的定义有关，一般将样本标准差的三倍作为样本允许偏差范围，即若极端值（离群点）超出三倍标准差，则该数据被认为是异常值，可以被剔除。
异常值指的是在观测样本中，偏离于绝大部分样本分布的值。在连续型变量中，如果一个值与该变量的均值超过2倍标准差，我们一般就可以将之视为异常值。
由于样本中的离群点影响样本的方差，因此用三倍标准差的方法能有效地将极端值剔除，使样本方差更准确。
三倍标准差剔除异常值的优点是简单、快捷，可被广泛应用于分析数据，但也有不足之处。如果总体数据分布不同，样本标准差容易受到偏差;如果总体数据分布是非正态分布，由于样本数据分布更集中，因此很可能会误判离群点，这种情况下，可以考虑调整标准差的倍数，要求更大倍数以保证准确率。

读数据

GET 
  FILE='E:\E盘备份\recent\小白爱上SPSS\小白数据\第三讲 正态分布.sav'.

数据概览

描述变量

选择连续性变量“身高”作为描述变量，选择输出值类型：

命令行：

DESCRIPTIVES VARIABLES=身高 
  /SAVE 
  /STATISTICS=MEAN STDDEV MIN MAX	/*平均值，标准化值，最小值，最大值*/.

正态性检验

命令行：

EXAMINE VARIABLES=身高
  /PLOT HISTOGRAM NPPLOT /*若无此行，则不输出正态性检验表*/
  /COMPARE GROUPS 
  /STATISTICS DESCRIPTIVES 
  /CINTERVAL 95 
  /MISSING LISTWISE 
  /NOTOTAL.

样本数量25个小于40个，使用夏皮洛-威尔克检验。经S-W检验，体重数据的P=0.998（P>0.05，接受原假设），没有统计学意义，可认为该组数据符合正态分布。
结合直方图：
命令行：

GRAPH 			/*绘图*/
  /HISTOGRAM(NORMAL)=身高	/*直方图（正态）*/.

呈明显的倒钟型，该组数据符合正态分布。
身高的正态Q-Q图：

观察Q-Q图上的点能否分布在一条直线上，分布在一条直线上则说明近似或服从正态分布。
本例中，身高绝大多数的点能分布在一条直线上，直线趋势明显，可认为该连续数据服从正态分布。

异常值检验及剔除

数据-选择个案：

进入后，选择身高-选择如果条件满足：
筛选条件：身高 <= (149.68+311.3274) & 身高 >= (149.68-311.3274)

有效数据范围：

命令行：

USE ALL. 
COMPUTE filter_$=(身高 <= (149.68+3*11.3274)  &  身高 >= (149.68-3*11.3274)). 
VARIABLE LABELS filter_$ '身高 <= (149.68+3*11.3274)  &  身高 >= (149.68-3*11.3274) (FILTER)'. 
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. 
FORMATS filter_$ (f1.0). 
FILTER BY filter_$. 
EXECUTE.

数据均在平均值+/-33倍标准差范围内，无需剔除：

非正态分布-根据Zscore取值范围确定

基础数据

引自原文。

数据概览

正态性检验

命令行：

EXAMINE VARIABLES=height
  /PLOT BOXPLOT HISTOGRAM NPPLOT /*若无此行，则不输出正态性检验表，增加箱图输出：BOXPLOT*/
  /COMPARE GROUPS 
  /STATISTICS DESCRIPTIVES 
  /CINTERVAL 95 
  /MISSING LISTWISE 
  /NOTOTAL.

样本数量6个,小于40个，使用夏皮洛-威尔克检验。经S-W检验，体重数据的P<0.001（P<0.05，不接受原假设），有统计学意义，该组数据不符合正态分布。

结合箱图，可以明显看到，id=4的数据明显偏离。

Tips：箱图圆圈的含义

箱线图中的“o"表示可疑的异常值﹐此处异常值的确定采用的是"五数概括法",即:变量值超过第75百分位点和25百分位点上变量值之差的1.5倍(箱体上方)或变量值小于第75百分位点和25百分位点上变量值之差的1.5倍(箱体下方)的点对应的值。

异常值检验及剔除

描述变量，并将标准化值另存为变量：

命令行：

DESCRIPTIVES VARIABLES=身高 
  /SAVE 
  /STATISTICS=MEAN STDDEV MIN MAX	/*平均值，标准化值，最小值，最大值*/.

异常值筛选

说明：大多数指标均要求正常Z值区间为[-3,3]。Z值落在区间[-3,3]，我们所测值在总群体的发生概率为99.7%，超出这个区间的概率为0.3%。而本例中原作者采用的Z值区间标准较小小，如[-1.5，1.5]之间。
数据-选择个案：
进入后，选择Zscore-选择如果条件满足

点击“如果”，输入条件，添加条件公式，使用变量名Z身高生成公式：
Zheight * 2 <= 3 & Zheight * 2 >=( -3 )

点击继续，确定，形成筛选列。

最终，下划线剔除id=4样本，filter变量Selected表示选中，Not Selected表示剔除。
命令行：

USE ALL. 
COMPUTE filter_$=(Zheight * 2 <= 3  & Zheight * 2 >=( -3 )). 
VARIABLE LABELS filter_$ 'Zheight * 2 <= 3  & Zheight * 2 >=( -3 ) (FILTER)'. 
VALUE LABELS filter_$ 0 'Not Selected' 1 'Selected'. 
FORMATS filter_$ (f1.0). 
FILTER BY filter_$. 
EXECUTE.

Tips:Zscore取值范围

引自百度文库：Zscore取值范围。
Z分数是一种常用的统计方法，用于度量一个数据点在数据集中的位置。它的取值范围为-3到+3之间，表示数据点与平均值的偏离程度和相对于标准差的偏离程度。Z分数的取值范围可以帮助我们解释和理解数据，判断异常值，以及进行比较和分析。无论在统计学还是其他领域，Z分数都具有重要的应用价值。
它衡量的是某个数据点与平均值的偏离程度，以及相对于标准差的偏离程度。Z分数可以告诉我们一个数据点相对于其他数据点的相对位置，从而帮助我们进行比较和分析。
Z分数的范围在理论上是无限的，但在实际应用中，我们通常将其限制在一定的取值范围内，以便更好地解释和理解数据。一般来说，Z分数的取值范围为-3到+3之间。超出这个范围的Z分数很少出现，因为它们表示的是极端的情况，即数据点与平均值的偏离程度非常大。
当Z分数为负数时，表示数据点低于平均值。例如，一个工分数为-2的数据点表示该数据点低于平均值两个标准差。当Z分数为正数时，表示数据点高于平均值。例如，一个7分数为+2的数据点表示该数据点高于平均值两个标准差。
Z分数的取值范围为-3到+3之间的原因是，根据正态分布的性质，约68%的数据点的Z分数在-1到+1之间，约95%的数据点的Z分数在-2到+2之间，约99.7%的数据点的Z分数在-3到+3之间。这个规律被称为“68-95-99.7法则”，它告诉我们在正态分布中，数据点相对于平均值的偏离程度大致符合这个分布。
Z分数的取值范围也可以用来判断数据的异常值。一般来说，Z分数超过3的数据点可以被认为是异常值，因为它们与平均值的偏离程度非常大。异常值可能是由于测量误差、数据录入错误或真实的异常情况导致的。通过识别和处理异常值，我们可以更准确地分析数据和做出决策。
除了在统计学中的应用，Z分数还被广泛应用于其他领域。例如，在金融领域中，Z分数可以用来度量股票的回报率相对于市场回报率的偏离程度，从而帮助投资者判断股票的表现。在医学研究中，Z分数可以用来比较不同患者群体的生物指标，帮助医生进行诊断和治疗决策。

Tips：什么是Z-score?有哪些使用场景？

引自：什么是Z-score?有哪些使用场景？
Z值（z-score，z-values, normal score）又称标准分数（standard score, standardized variable），是一个实测值与平均数的差再除以标准差的过程。Z score标准化是数据处理的一种常用方法。通过它能够将不同量级的数据转化为统一量度的Z score分值进行比较。
用公式表示为：
z=(x-μ)/σ
x为某实测值，μ为平均数，σ为标准差
Z值的量代表着实测值和总体平均值之间的距离，是以标准差为单位计算。
大于平均数的实测值会得到一个正数的Z值，小于平均数的实测值会得到一个负数的Z值。
一句话：
Z score通过（x-μ）/σ将两组或多组数据转化为无单位的Z score分值，使得数据标准统一化，提高了数据可比性，削弱了数据解释性。

你可能感兴趣的:(SPSS,学习,笔记,正负偏态,SPSS,剔除异常值,Zscore)

2017暑训摸底（xdoj1045，xdoj1173，xdoj1007，xdoj1038） Owen_Q dp xdoj 搜索
由于时间没赶上摸底，只能跟一波新增的dp摸底，感觉难度一般般，可能有段时间内没做题的缘故吧暑训就要开始了呢A黑白棋思路：一上来就是个博弈搜索根据上一状态与这一状态必胜必败态的转换来判断先手的情况dfs搜索所有前项状态，若均为必败态，则该状态为必胜态，否则为必败态/*Author：Owen_Q*/#includeusingnamespacestd;inta[5][5];intdfs(intx,int
目标跟踪领域经典论文解析 ♢.＊目标跟踪人工智能计算机视觉
亲爱的小伙伴们，在求知的漫漫旅途中，若你对深度学习的奥秘、JAVA、PYTHON与SAP的奇妙世界，亦或是读研论文的撰写攻略有所探寻，那不妨给我一个小小的关注吧。我会精心筹备，在未来的日子里不定期地为大家呈上这些领域的知识宝藏与实用经验分享。每一个点赞，都如同春日里的一缕阳光，给予我满满的动力与温暖，让我们在学习成长的道路上相伴而行，共同进步✨。期待你的关注与点赞哟！目标跟踪是计算机视觉领域的一个
hmc7044时钟芯片调试笔记 So_shine Linux驱动总结分享 linux内核驱动时钟芯片
目录前言一、依赖文档、工具二、运行linux内核驱动的平台1、代码、文件列表2、适配、编译3、调试三、无os的mcu平台1、代码、文件列表2、适配、编译3、调试前言本笔记基于运行linux操作系统的SOC芯片平台、linux内核版本linux5.10.xxx和无操作系统的mcu平台记录调试；一、依赖文档、工具文档名说明获取方式hmc7044.pdf数据手册adi官网或者国内采芯网GUI配置工具通过
vue的侦听器及怎么侦听数组--笔记小番茄炒鸡蛋 vue.js javascript 前端
作用侦听属性响应数据的变化，当数据发生改变的时候会立即执行对应的函数letvm=newVue({el:"#test",data:{entry:""},watch:{entry(){console.log("侦听到了");}}})这里我同过侦听器和v-model指令一起用可以更直观的体现他的作用（这也是常用搭配）。原理：当input输入内容后，因为v-model指令的绑定，此时entry属性值会随之
Go基础学习06-Golang标准库container/list（双向链表）深入讲解；延迟初始化技术；Element；List；Ring one2excellent golang golang 学习 list 链表后端延迟初始化
基础介绍单向链表中的每个节点包含数据和指向下一个节点的指针。其特点是每个节点只知道下一个节点的位置，使得数据只能单向遍历。示意图如下：双向链表中的每个节点都包含指向前一个节点和后一个节点的指针。这使得在双向链表中可以从前向后或从后向前遍历。示意图如下：结合上面的图就很容易明白单、双链表的定义。其中双向链表可以从前向后，也可以从后向前遍历，操作起来也更加方便。接下来我们看看官方给的例子：import
Golang学习日志 ━━ 单向链表暂时先用这个名字 Golang go golang
因为转载必须指明原文网址，而本文内容整合了网上多篇技术文章，无法明确其中一条，所以选择了原创。已在最后的参考目录里列出本文所有涉及的文章。定义单向链表（单链表）是链表的一种，是一种链式存取的数据结构，用一组地址任意的存储单元存放线性表中的数据元素。其特点是链表的链接方向是单向的，对链表的访问要通过顺序读取从头部开始；链表是由结点构成，head指针指向第一个成为表头结点，而终止于最后一个指向nuLL
Unity引擎开发：VR控制器开发_（3）.Unity中的VR控制器交互设计
Unity中的VR控制器交互设计在前一节中，我们探讨了如何在Unity中设置和配置VR环境。现在，我们将深入探讨VR控制器的交互设计，这是实现沉浸式VR体验的关键部分。通过本节的学习，你将了解如何在Unity中设置和使用VR控制器，实现基本的交互功能，并优化用户体验。1.VR控制器的类型和功能在虚拟现实（VR）开发中，控制器是用户与虚拟环境进行交互的主要工具。常见的VR控制器有OculusTouc
Python中的标识符与保留字難釋懷 python java 数据库
一、前言在学习Python编程语言的过程中，标识符（Identifier）和保留字（Keywords）是两个非常基础但又极其重要的概念。它们是编写程序时必须遵守的语言规则之一。本文将带你深入了解：什么是标识符；标识符的命名规则与规范；Python中有哪些保留字；常见错误与注意事项；实际开发中的命名建议；掌握好这些内容，不仅能帮助你写出更规范、可读性更强的代码，还能避免因使用关键字作为变量名而导致的
Redis ZSet 数据结构深度解析：原理、实现与实战全揭密！程序猿Mr.wu Redis redis 数据结构缓存
一、前言：为什么要学习ZSet？在Redis的五大基础数据类型中，ZSet（SortedSet，有序集合）是一种非常强大而灵活的数据结构，广泛应用于排行榜、延时队列、权重排名等场景。如果说String是Redis的“最小原子”，那么ZSet就是Redis的“重量级选手”——不仅能存数据，还能排序查询，这正是它的魅力所在！二、ZSet是什么？和Set有啥区别？ZSet=Set+Score+排序！特性
学习一：Qt中Connect和多线程嘿·嘘 Qt qt 开发语言
目录1、信号与槽1.1举例：在同一个cpp文件中。1.2举例：在不同cpp文件中。1.3断开连接2、多线程2.1公共函数2.2信号与槽2.3静态函数2.4保护功能2.5静态保护成员3.6举例1、信号与槽在Qt中connect函数主要用来建立信号与槽函数。通过信号与槽函数机制可以实现不同线程之间的数据传输（不止这一种方式，这里就单描述信号与槽）。因为在Qt中，通常是主线程对窗口进行赋值，子线程不能直
鸿蒙开发之埋点方案：高效追踪用户行为 niu某某移动开发鸿蒙开发 HarmonyOS harmonyos 鸿蒙开发移动开发组件化模块化 ArkUI
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）✒️鸿蒙应用开发与鸿蒙系统开发哪个更有前景？✒️嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~✒️对于大前端开发来说，转鸿蒙开发究竟是福还是祸？✒️鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？✒️记录一场鸿蒙开发岗位面试经历~✒️持续更新中……概述埋点是指将信息采集程序和原本的功能代码结合起来，针对特定用户行为收集、处理和发送一些
神经网络架构搜索 IJCAST主编进化计算神经网络架构人工智能
InternationalJournalofComplexityinAppliedScienceandTechnology，投稿网址:https://www.inderscience.com/jhome.php?jcode=ijcast,发表论文不收取任何费用，论文平均审稿25天内即可录用。1.神经网络架构搜索方法分类当前，神经网络架构搜索的方法主要可以归纳为以下三类：a.基于强化学习的NAS方法
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
【C++】C++快速回顾入门、概念概要子非渔 C++入门 C++C++总结
C++语言跟其它语言类似，主要基本的本文不列举了。我在学习的过程中，遇到C++的不同之处，或者是重点的地方，都会将其记录下来。主要从关键字、常见函数、输入输出等角度去记录。输入输出：count>命名空间：namespaceusingnamespacestd;extern:多个文件中共享的全局变量。主要是将本文件中的变量释放至其他文件也可以使用的全局高度。用于不同文件的数据交互。成员运算符：.->.
c++STL库与快速排序浪子小院基础精讲 c++算法开发语言数据结构
什么是STL库STL=StandardTemplateLibrary，标准模板库，是一系列软件的统称。从根本上说，STL是一些“容器”的集合，这些“容器”有list,vector,set,map等，STL也是算法和其他一些组件的集合。前面已经学习过的中sort函数、中string类都是STL的内容。STL库还有很多内容，比如：向量（vector）、栈（stack）、队列（queue）、优先队列（p
干货！大模型时代一定要收藏的 20 个LLM 中文数据集 OpenBayes 资源上新人工智能语言模型数据库机器学习
自ChatGPT重磅推出以来，大语言模型(largelanguageModel,LLM)以其卓越的学习能力在各个领域引起轰动。大模型的训练和调优离不开优质庞大的数据支撑，精心构建的数据集不仅为大模型提供了充分的燃料，还为大模型在垂直领域的应用和性能提升提供了可能。本文整理了一些适用于大模型训练调优的热门中文公开数据集（按照首字母A-Z顺序排列），以供大家了解和使用。温馨提示：本文列举的所有数据集，
15.OCR训练 Echo`` Halcon系统化学习 ocr 人工智能深度学习算法计算机视觉机器学习
目录1.OCR训练2.助手训练13.助手训练24.算子训练5.OCR训练联合编程6.练习1.OCR训练*OCR训练*1.分类器文件*.omc*2.halcon官方的*1.局限性只能识别数字和字母*2.样式比较单一*3.样本数量较少*...**3.训练方法*1.助手训练*1.打开OCR助手*2.选择图片*3.选择训练区域*4.分割*5.字体*6.训练文件*7.新*8.学习*9.加入训练样本*10.保
UC3842控制器在flyback反激电源设计与仿真中的应用 Jacob Piao
本文还有配套的精品资源，点击获取简介：UC3842作为电流模式控制的集成控制器，在设计反激式转换器中有着广泛应用。本文档提供了使用UC3842进行flyback反激电源电路设计的详细案例，并通过Multisim14进行仿真。包含了电路设计的源文件、仿真参数设置及UC3842芯片的详细资料，旨在为工程师提供从理论到实践的完整学习平台。1.UC3842控制器特点与应用1.1UC3842控制器简介UC3
燕山大学编译原理期末考试能运行就算成功经验分享
软件工程专业的首先，这一门课无法在三四天内速成（指零基础的）要是有考前才开始学到同学至少要提前一周开始学习（我觉得这都比较紧张，两周才算宽裕），b站上的速成课不全！不全！不全！不要想着完全看速成课，你要非这样我也没办法。考试范围如下：编译程序构成、编译程序与解释程序区别，词法分析、语法分折、语义分折及其任务，文法，语言，句型，句子，短语，推导，归约，句柄，文法、语言二义性，文法分类，有穷自动机、正
燕山大学软件用户界面设计考题能运行就算成功经验分享
2024年考题，考前完全不知道考什么，趁着现在还记得，造福下后辈。全部是简答。1.描述下实用性和它的三个维度2.写出五个功能可见性的例子3.关键性模型Keystroke-LevelModel(KLM)字母的意思4.undo四个设计原则（笔记和翻译根本没有，看到时已经懵了）5.GUI三种设计方式6.瀑布模型为什么不适合ui设计后面是大题，跟写实验报告差不多，这次是个预定家政服务的题，写信息点描述中心
燕大《Python机器学习》实验报告：探索机器学习的奥秘温冰礼
燕大《Python机器学习》实验报告：探索机器学习的奥秘【下载地址】燕大Python机器学习实验报告下载这份实验报告是燕山大学软件工程专业的学生在进行机器学习实验时所编写的，内容详实，结构清晰，可以直接下载使用。报告中的实验数据和代码均经过验证，确保下载后可以直接应用于实际项目或作为学习参考项目地址:https://gitcode.com/Open-source-documentation-tut
Microsoft VBA Excel VBA学习笔记——双重筛选+复制数值1.0 偷心伊普西隆 VBA学习和实践 microsoft excel
问题场景CountryProductCLASS1CLASS2CLASS3CLASS4CLASS5CLASS6…USApple0.3641416030.8918210610.0591451990.7320110290.0509636560.222464259…USBanana0.2300833330.4027262180.1548836670.2988904860.7802326210.028592
Python可视化环境：Matplotlib_Seaborn+Conda配置 Python编程之道 Python人工智能与大数据 Python编程之道 python matplotlib conda ai
Python可视化环境：Matplotlib/Seaborn+Conda配置关键词：Python可视化、Matplotlib、Seaborn、Conda、环境配置摘要：本文主要探讨了如何利用Conda来配置Python可视化所需的Matplotlib和Seaborn环境。首先介绍了Python可视化的背景和重要性，明确目标读者为想要学习Python可视化的初学者和有一定基础的开发者。接着详细解析了
SQL Server的个人学习笔记萌尛喵 sql 学习数据库
1.基础SQLServer是由Microsoft开发和销售的关系数据库管理系统或RDBMS。SQLServer建立于SOL之上，是一种用于关系数据交互的标准编程语言。2.组件SQLServer主要由数据库引擎和SQLOS两个组件组成。①数据库引擎SQLServer的核心组件是数据库引擎。数据库引擎由处理查询的关系引擎和管理数据库文件、页面、索引等的存储组成。数据库引擎也创建并执行数据库对象，如存储
解锁 Hello World 的 N 种炫酷玩法
目录一、引言二、编程语言之美2.1C语言艺术字输出2.2用汇编语言实现经典三、硬件交互的奇妙世界3.1Arduino与LED的舞蹈3.2STM32点亮小灯四、AI模型应用的创新之旅4.1OpenAIAPI初体验4.2LangChain框架的魅力五、总结与展望一、引言在编程的世界里，“HelloWorld”就像是一把神奇的钥匙，开启了无数人探索编程奥秘的大门。它作为编程学习的经典入门示例，有着不可替
SQLserver数据库学习笔记溪衡学习
小记1：1.newid()我觉得是一个生成唯一键的好方法，不用自增控制主键，可以用这个试试，注意不做处理的话，需要36位。例如：在数据库中直接使用语句selectnewid()2.nolock按我的理解是“不上锁的”，所谓的脏读，大多用的都是这个东西，据说可以提高查询速度。3.go批处理语句，将前面的代码作为一批处理。4.内连接与简单多表在数据量少的时候查询速度差距并不明显。5.删除和更新数据时，
（转）优秀的 python 机器学习库 patrick75 python 机器学习 python 机器学习
优秀的python机器学习库IntroductionThereisnodoubtthatneuralnetworks,andmachinelearningingeneral,hasbeenoneofthehottesttopicsintechthepastfewyearsorso.It’seasytoseewhywithallofthereallyinterestinguse-casestheys
DAY 10 机器学习建模与评估心落薄荷糖 Python训练营机器学习人工智能
知识点：1.数据集的划分2.机器学习模型建模的三行代码3.机器学习模型分类问题的评估今日代码比较多，但是难度不大，仔细看看示例代码，好好理解下这几个评估指标。作业：尝试对心脏病数据集采用机器学习模型建模和评估#一、导入库importpandasaspdimportpandasaspd#用于数据处理和分析，可处理表格数据。importnumpyasnp#用于数值计算，提供了高效的数组操作。impor
python学习记录14 彤银浦学习 python
1.字符串的编码和解码不同的计算机之间在信道中传输的信息本质上是二进制数据，因此当你有一串文本需要传输给另外一台电脑时，则需要将这串文本编译为二进制类型的数据。python中的二进制数据类型称为byte类型。将字符串的str类型转变为byte类型称为字符串的编码，将byte类型转变为str类型称为字符串的解码。字符串的编码用到的是encode的方法，语法格式为：string.encode(enco
SQL学习笔记1
1.数据库1、什么是数据库数据库（DB）即用于存放数据的服务器，如MySQL等软件是数据库管理系统（DBMS），用于管理存放在数据库中的数据，SQL是用于操作DBMS的标准语言。2、数据库的类型数据库分为关系型数据库和非关系型数据库；关系型数据库是指用建立在关系模型上互相关联的二维表组成的数据库，MySQL是用于管理关系型数据库的数据库管理系统2.MySQL启动与连接1、MySQL启动安装好MyS
分享100个最新免费的高匿HTTP代理IP mcj8089 代理IP 代理服务器匿名代理免费代理IP 最新代理IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ 120.198.243.130:80,中国/广东省 58.251.78.71:8088,中国/广东省 183.207.228.22:83,中国/
mysql高级特性之数据分区 annan211 java 数据结构 mongodb 分区 mysql
mysql高级特性 1 以存储引擎的角度分析，分区表和物理表没有区别。是按照一定的规则将数据分别存储的逻辑设计。器底层是由多个物理字表组成。 2 分区的原理分区表由多个相关的底层表实现，这些底层表也是由句柄对象表示，所以我们可以直接访问各个分区。存储引擎管理分区的各个底层表和管理普通表一样(所有底层表都必须使用相同的存储引擎)，分区表的索引只是
JS采用正则表达式简单获取URL地址栏参数 chiangfai js 地址栏参数获取
GetUrlParam:function GetUrlParam(param){ var reg = new RegExp("(^|&)"+ param +"=([^&]*)(&|$)"); var r = window.location.search.substr(1).match(reg); if(r!=null
怎样将数据表拷贝到powerdesigner (本地数据库表) Array_06 powerDesigner
================================================== 1、打开PowerDesigner12，在菜单中按照如下方式进行操作 file->Reverse Engineer->DataBase 点击后，弹出 New Physical Data Model 的对话框 2、在General选项卡中 Model name:模板名字，自
logbackのhelloworld 飞翔的马甲日志 logback
一、概述 1.日志是啥？当我是个逗比的时候我是这么理解的：log.debug()代替了system.out.print(); 当我项目工作时，以为是一堆得.log文件。这两天项目发布新版本，比较轻松，决定好好地研究下日志以及logback。传送门1：日志的作用与方法： http://www.infoq.com/cn/articles/why-and-how-log 上面的作
新浪微博爬虫模拟登陆随意而生新浪微博
转载自：http://hi.baidu.com/erliang20088/item/251db4b040b8ce58ba0e1235 近来由于毕设需要，重新修改了新浪微博爬虫废了不少劲，希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比，最大的改动在于cookie获取时候的模拟url的请求
synchronized 香水浓 java thread
Java语言的关键字，可用来给对象和方法或者代码块加锁，当它锁定一个方法或者一个代码块的时候，同一时刻最多只有一个线程执行这段代码。当两个并发线程访问同一个对象object中的这个加锁同步代码块时，一个时间内只能有一个线程得到执行。另一个线程必须等待当前线程执行完这个代码块以后才能执行该代码块。然而，当一个线程访问object的一个加锁代码块时，另一个线程仍然
maven 简单实用教程 AdyZhang maven
1. Maven介绍 1.1. 简介 java编写的用于构建系统的自动化工具。目前版本是2.0.9，注意maven2和maven1有很大区别，阅读第三方文档时需要区分版本。 1.2. Maven资源见官方网站；The 5 minute test，官方简易入门文档；Getting Started Tutorial，官方入门文档；Build Coo
Android 通过 intent传值获得null aijuans android
我在通过intent 获得传递兑现过的时候报错，空指针,我是getMap方法进行传值，代码如下 1 2 3 4 5 6 7 8 9 public void getMap(View view){ Intent i =
apache 做代理报如下错误：The proxy server received an invalid response from an upstream baalwolf response
网站配置是apache＋tomcat,tomcat没有报错，apache报错是： The proxy server received an invalid response from an upstream server. The proxy server could not handle the request GET /. Reason: Error reading fr
Tomcat6 内存和线程配置 BigBird2012 tomcat6
1、修改启动时内存参数、并指定JVM时区（在windows server 2008 下时间少了8个小时）在Tomcat上运行j2ee项目代码时，经常会出现内存溢出的情况，解决办法是在系统参数中增加系统参数： window下，在catalina.bat最前面 set JAVA_OPTS=-XX:PermSize=64M -XX:MaxPermSize=128m -Xms5
Karam与TDD bijian1013 Karam TDD
一.TDD 测试驱动开发（Test-Driven Development,TDD）是一种敏捷（AGILE）开发方法论，它把开发流程倒转了过来，在进行代码实现之前，首先保证编写测试用例，从而用测试来驱动开发（而不是把测试作为一项验证工具来使用）。 TDD的原则很简单： a.只有当某个
[Zookeeper学习笔记之七]Zookeeper源代码分析之Zookeeper.States bit1129 zookeeper
public enum States { CONNECTING, //Zookeeper服务器不可用，客户端处于尝试链接状态 ASSOCIATING, //？？？ CONNECTED, //链接建立，可以与Zookeeper服务器正常通信 CONNECTEDREADONLY, //处于只读状态的链接状态，只读模式可以在
【Scala十四】Scala核心八：闭包 bit1129 scala
Free variable A free variable of an expression is a variable that’s used inside the expression but not defined inside the expression. For instance, in the function literal expression (x: Int) => (x
android发送json并解析返回json ronin47 android
package com.http.test; import org.apache.http.HttpResponse; import org.apache.http.HttpStatus; import org.apache.http.client.HttpClient; import org.apache.http.client.methods.HttpGet; import
一份IT实习生的总结 brotherlamp PHP php资料 php教程 php培训 php视频
今天突然发现在不知不觉中自己已经实习了 3 个月了，现在可能不算是真正意义上的实习吧，因为现在自己才大三，在这边撸代码的同时还要考虑到学校的功课跟期末考试。让我震惊的是，我完全想不到在这 3 个月里我到底学到了什么，这是一件多么悲催的事情啊。同时我对我应该 get 到什么新技能也很迷茫。所以今晚还是总结下把，让自己在接下来的实习生活有更加明确的方向。最后感谢工作室给我们几个人这个机会让我们提前出来
据说是2012年10月人人网校招的一道笔试题-给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。将重物放到天平左侧，问在两边如何添加砝码 bylijinnan java
public class ScalesBalance { /** * 题目： * 给出一个重物重量为X,另外提供的小砝码重量分别为1，3，9。。。3^N。（假设N无限大，但一种重量的砝码只有一个） * 将重物放到天平左侧，问在两边如何添加砝码使两边平衡 * * 分析： * 三进制 * 我们约定括号表示里面的数是三进制，例如 47=(1202
dom4j最常用最简单的方法 chiangfai dom4j
要使用dom4j读写XML文档,需要先下载dom4j包,dom4j官方网站在 http://www.dom4j.org/目前最新dom4j包下载地址:http://nchc.dl.sourceforge.net/sourceforge/dom4j/dom4j-1.6.1.zip 解开后有两个包,仅操作XML文档的话把dom4j-1.6.1.jar加入工程就可以了,如果需要使用XPath的话还需要
简单HBase笔记 chenchao051 hbase
一、Client-side write buffer 客户端缓存请求描述：可以缓存客户端的请求，以此来减少RPC的次数，但是缓存只是被存在一个ArrayList中，所以多线程访问时不安全的。可以使用getWriteBuffer()方法来取得客户端缓存中的数据。默认关闭。二、Scan的Caching 描述： next( )方法请求一行就要使用一次RPC,即使
mysqldump导出时出现when doing LOCK TABLES daizj mysql mysqdump 导数据
　　执行　mysqldump -uxxx -pxxx -hxxx -Pxxxx database tablename > tablename.sql　导出表时，会报 mysqldump: Got error: 1044: Access denied for user 'xxx'@'xxx' to database 'xxx' when doing LOCK TABLES 解决
CSS渲染原理 dcj3sjt126com Web
从事Web前端开发的人都与CSS打交道很多，有的人也许不知道css是怎么去工作的，写出来的css浏览器是怎么样去解析的呢？当这个成为我们提高css水平的一个瓶颈时，是否应该多了解一下呢？一、浏览器的发展与CSS
《阿甘正传》台词 dcj3sjt126com
Part Ⅰ: 《阿甘正传》Forrest Gump经典中英文对白 Forrest: Hello! My names Forrest. Forrest Gump. You wanna Chocolate? I could eat about a million and a half othese. My momma always said life was like a box ochocol
Java处理JSON dyy_gusi json
Json在数据传输中很好用，原因是JSON 比 XML 更小、更快，更易解析。在Java程序中，如何使用处理JSON，现在有很多工具可以处理，比较流行常用的是google的gson和alibaba的fastjson，具体使用如下： 1、读取json然后处理 class ReadJSON { public static void main(String[] args)
win7下nginx和php的配置 geeksun nginx
1. 安装包准备 nginx : 从nginx.org下载nginx-1.8.0.zip php：从php.net下载php-5.6.10-Win32-VC11-x64.zip， php是免安装文件。 RunHiddenConsole: 用于隐藏命令行窗口 2. 配置 # java用8080端口做应用服务器，nginx反向代理到这个端口即可 p
基于2.8版本redis配置文件中文解释 hongtoushizi redis
转载自： http://wangwei007.blog.51cto.com/68019/1548167 在Redis中直接启动redis-server服务时, 采用的是默认的配置文件。采用redis-server xxx.conf 这样的方式可以按照指定的配置文件来运行Redis服务。下面是Redis2.8.9的配置文
第五章常用Lua开发库3-模板渲染 jinnianshilongnian nginx lua
动态web网页开发是Web开发中一个常见的场景，比如像京东商品详情页，其页面逻辑是非常复杂的，需要使用模板技术来实现。而Lua中也有许多模板引擎，如目前我在使用的lua-resty-template，可以渲染很复杂的页面，借助LuaJIT其性能也是可以接受的。如果学习过JavaEE中的servlet和JSP的话，应该知道JSP模板最终会被翻译成Servlet来执行；而lua-r
JZSearch大数据搜索引擎颠覆者 JavaScript
系统简介：大数据的特点有四个层面：第一，数据体量巨大。从TB级别，跃升到PB级别；第二，数据类型繁多。网络日志、视频、图片、地理位置信息等等。第三，价值密度低。以视频为例，连续不间断监控过程中，可能有用的数据仅仅有一两秒。第四，处理速度快。最后这一点也是和传统的数据挖掘技术有着本质的不同。业界将其归纳为4个“V”——Volume，Variety，Value，Velocity。大数据搜索引
10招让你成为杰出的Java程序员 pda158 java 编程框架
如果你是一个热衷于技术的 Java 程序员，那么下面的 10 个要点可以让你在众多 Java 开发人员中脱颖而出。　　 1. 拥有扎实的基础和深刻理解 OO 原则　　对于 Java 程序员，深刻理解 Object Oriented Programming（面向对象编程）这一概念是必须的。没有 OOPS 的坚实基础，就领会不了像 Java 这些面向对象编程语言
tomcat之oracle连接池配置小网客 oracle
tomcat版本7.0 配置oracle连接池方式：修改tomcat的server.xml配置文件： <GlobalNamingResources> <Resource name="utermdatasource" auth="Container" type="javax.sql.DataSou
Oracle 分页算法汇总 vipbooks oracle sql 算法 .net
这是我找到的一些关于Oracle分页的算法，大家那里还有没有其他好的算法没？我们大家一起分享一下！ -- Oracle 分页算法一 select * from ( select page.*,rownum rn from (select * from help) page -- 20 = (currentPag

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他