爱吃辣锅的北极海豹

使用Python对数据进行描述性统计（机器学习）

使用Python对数据进行描述性统计

数据集：diabetes.csv
参考书：《Machine Learning Mastery With Python Understand Your Data, Create Accurate Models and work Projects End-to-End》
获取链接：https://github.com/aoyinke/ML_learner

Additional Knowledge

当两个变量相关时，用于评估它们因相关而产生的对应变量的影响。
当多个变量独立时，用方差来评估这种影响的差异。
当多个变量相关时，用协方差来评估这种影响的差异。

总览

一些常见的指标，例如维度，前多少行数据等
皮尔逊相关系数和偏度分别观察多变量和单变量
直方图，密度图，箱线图的代码演示和讲解
多变量的可视化

一些常见的指标

from pandas import read_csv

path = "diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path,names=names,skiprows=1)

# 观察数据的前5行
print(data.head())
# 观察数据的维度
print(data.shape)
"""
   preg  plas  pres  skin  test  mass   pedi  age  class
0     6   148    72    35     0  33.6  0.627   50      1
1     1    85    66    29     0  26.6  0.351   31      0
2     8   183    64     0     0  23.3  0.672   32      1
3     1    89    66    23    94  28.1  0.167   21      0
4     0   137    40    35   168  43.1  2.288   33      1

(768, 9) 768行，9列

"""
# 观测每种数据的类型
print(types)

"""
preg int64
plas int64
pres int64
skin int64
test int64
mass float64
pedi float64
age int64
class int64

"""

使用Pandas进行描述性统计

from pandas import set_option
set_option('display.width', 100)
set_option('precision', 3)
description = data.describe()
print(description)

count:计算的是对应属性下，所有非null数据的条数
mean,max,min分别是该属性下所有数据的平均值，最大值和最小值
std:观测值的标准差
注意，对于不同类型的数据会有不同的统计项目，例如对于对象类型的数据，返回的就是： count, unique, top, and freq这几个指标
可以参考官方文档:pandas.DataFrame.describe

Class Distribution(仅限于classfication问题)

class_counts = data.groupby('class').size()
print(class_counts)
"""
   class
0   500
1   268
"""

Correlation between attributes(属性之间的关系)

对于线性回归和逻辑回归等机器学习算法来说，如果属性之间的相关程度过高，会导致比较糟糕的performance
Pearson’s Correlation Coefficient(皮尔逊积矩相关系数) 常用于计算属性之间的相关程度，它假设所涉及的属性呈正态分布
皮尔逊相关系数是两个变量的协方差除以其标准差的乘积
0表示不相关，相关因子分布在-1-1之间，正数表示相关，负数表示无关
举个简单的栗子，可以预期高中青少年样本的年龄和身高的 Pearson 相关系数显着大于 0，但小于 1（因为 1 表示不切实际的完美相关）

from pandas import set_option,read_csv
data = read_csv(filename, names=names)
set_option('display.width', 100)
set_option('precision', 3)
correlations = data.corr(method='pearson')
print(correlations)

Skew of Univariate Distributions（单变量分布的偏度）

公式中，Sk——偏度；E——期望；μ——平均值；μ3——3阶中心矩；σ——标准差。在一般情形下，当统计数据为右偏分布时，Sk>0，且Sk值越大，右偏程度越高；
当统计数据为左偏分布时，Sk< 0，且Sk值越小，左偏程度越高。当统计数据为对称分布时，显然有Sk= 0。

所以我们应该注意处理skew较大（绝对值）的变量

skew = data.skew()
print(skew)

"""
preg 0.901674
plas 0.173754
pres -1.843608
skin 0.109372
test 2.272251
mass -0.428982
pedi 1.919911
age 1.129597
class 0.635017
"""

Univariate Plots （单变量可视化观察数据）

Histograms（直方图）

# Univariate Histograms
from matplotlib.pyplot as plt
from pandas import read_csv
path = "diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(path , names=names,skiprows=1)
data.hist()
plt.show()

age, pedi and test呈现指数分布（exponential distribution）
mass and pres and plas呈现或近似高斯（正态）分布（Gaussian Distribution）
许多机器学习算法假定输入为正态分布，但是我们可以看到实际并不是这样（需要进行standardlization进一步处理）

Density Plots（密度图）

密度图是快速了解每个属性分布的另一种方法

data.plot(kind=✬density✬, subplots=True, layout=(3,3), sharex=False)
plt.show()

Box and Whisker Plots（箱线图）

中位数（Q2 / 50th百分位数）：数据集的中间值；
第一个四分位数（Q1 / 25百分位数）：最小数（不是“最小值”）和数据集的中位数之间的中间数；
第三四分位数（Q3 / 75th Percentile）：数据集的中位数和最大值之间的中间值（不是“最大值”）；
四分位间距（IQR）：第25至第75个百分点的距离；
晶须（蓝色显示）
离群值（显示为绿色圆圈）
“最大”：Q3 + 1.5 * IQR
“最低”：Q1 -1.5 * IQR

总结：

箱线图是针对连续型变量的，解读时候重点关注平均水平、波动程度和异常值。
当箱子被压得很扁，或者有很多异常的时候，试着做对数变换。
当只有一个连续型变量时，并不适合画箱线图，直方图是更常见的选择。
箱线图最有效的使用途径是作比较，配合一个或者多个定性数据，画分组箱线图

data.plot(kind='box', subplots=True, layout=(3,3), sharex=False, sharey=False)
plt.show()

Multivariate Plots（多变量观察）

Correlation Matrix Plot（皮尔逊相关系数，变量之间的关系）

import matplotlib.pyplot as plt
import numpy as np
from pandas import read_csv

path = "diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(filename, names=names)
correlations = data.corr(method='pearson') # 得到皮尔逊相关系数
# plot correlation matrix
fig = plt.figure() # 相当于拿到一张画布
ax = fig.add_subplot(1,1,1) # 创建一个一行一列的子图
cax = ax.matshow(correlations, vmin=-1, vmax=1)
fig.colorbar(cax) # 将色彩变化条（右边那一竖着的）添加到图中
ticks = np.arange(0,9,1)
# ticks = [0 1 2 3 4 5 6 7 8] 构造一个0-8，step=1的np数组
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.set_xticklabels(names) # 打上index，默认采用数字
ax.set_yticklabels(names)
plt.show()

Scatter Plot Matrix(散点矩阵)

from matplotlib.pyplot as plt
from pandas import read_csv
from pandas.tools.plotting import scatter_matrix
path = "diabetes.csv"
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(filename, names=names)
scatter_matrix(data)
plt.show()

Summary:

对角线显示每个属性的直方图。
散点图对于发现变量之间的结构化关系很有用，比如您是否可以用一条直线来总结两个变量之间的关系。具有结构化关系的属性也可能是相关的，可以从数据集中删除。

写在最后

Stay hugry, stay foolish.

你可能感兴趣的:(python,机器学习,统计学,sklearn)

蓝桥杯Python组最后几天冲刺———吐血总结,练题总结,很管用我学会了晚风时亦鹿学习笔记 Python算法笔记 python
一、重要知识要点1、穷举法2、枚举法3、动态规划4、回溯法5、图论6、深度优先搜索（DFS）7、广度优先搜索（BFS）8、二叉树9、递归10、分治法、矩阵法11、排列组合12、素数、质数、水仙花数13、欧几里得定理gcd14、求最大公约数、最小公倍数15、海伦公式（求三角形面积）16、博弈论17、贪心18、二分查找法19、hash表20、日期计算21、矩形快速幂22、树形DP23、最短路径24、最
Python二叉树用法介绍很酷的站长编程笔记 python 开发语言
二叉树是一种非常重要的数据结构，它在计算机科学中得到了广泛应用，例如在搜索算法、图形渲染和游戏AI等领域。本文将以Python二叉树为中心，从多个角度对其进行详细阐述，包括二叉树定义、二叉树遍历、二叉搜索树、平衡二叉树等内容。一、二叉树定义二叉树是一种有根树，它满足以下条件：每个节点最多有两个子节点每个节点只有一个父节点左子节点是其父节点的左子树，而右子节点是其父节点的右子树按照这个定义，我们可以
在VSCode中更改专用终端的Conda环境小白也有IT梦 python vscode
步骤打开VSCode：启动VSCode并打开你需要的工作目录。打开命令面板：使用快捷键Ctrl+Shift+P（Windows/Linux）或Cmd+Shift+P（macOS）打开命令面板。选择Conda环境：在命令面板中输入Python:SelectInterpreter并选择该选项。在出现的列表中选择你需要的Conda环境。这个步骤会改变当前工作目录下Python解释器的环境。打开终端：使用
Python 最最最使用的动态规划入门教程 + 10道经典例题我是阿核 Python 动态规划算法 python leetcode
不多废话，直接开讲动态规划三大步骤动态规划是一种将问题分解为若干个子问题，并存储这些子问题的解（通常使用数组或矩阵等数据结构），以便在后续计算中重复使用，从而避免了重复计算，提高了算法的效率。需要注意的是，动态规划并非一种特定的算法，而是一种解决问题的思想和方法。在实际应用中，需要根据具体问题的特点来设计合适的动态规划算法。动态规划的根本在于用已知项的求出未知项，并再次调用已经求出的未知项来解决更
Python : CCF-CSP真题——坐标变换（其一）我是阿核 Python 算法 leetcode python 经验分享
试题编号：202309-1试题名称：坐标变换（其一）时间限制：1.0s内存限制：512.0MB问题描述：问题描述对于平面直角坐标系上的坐标(x,y)，小P定义了一个包含n个操作的序列T=(t1,t2,⋯,tn)。其中每个操作ti（1≤i≤n）包含两个参数dxi和dyi，表示将坐标(x,y)平移至(x+dxi,y+dyi)处。现给定m个初始坐标，试计算对每个坐标(xj,yj)（1≤j≤m）依次进行T
C++ 数据结构——二叉树（最最最最最实用的二叉树教程）我是阿核 C++算法 c++数据结构 leetcode 笔记经验分享
本文章以实用为主，所以不多废话直接开整本文所介绍的二叉树是最基础的二叉树，不是二叉搜索树，也不是平衡二叉树，就基本的二叉树若需要Python版，请跳转到Python数据结构——二叉树（最最最最最实用的二叉树教程）二叉树的构建二叉树为一个父节点连接到两个子节点，若还要加入新的节点，那么此时的子节点将会变成新加入节点的父节点，以此类推，每一个父节点最多只有两个节点（所以叫二叉树）structTreeN
AttributeError: ‘NoneType‘ object has no attribute ‘xxx‘ Mad Soycat 常见BUG详见数据仓库大数据运维 centos linux
AttributeError:‘NoneType‘objecthasnoattribute‘xxx‘错误分析：AttributeError:'NoneType'objecthasnoattribute'xxx'AttributeError:'NoneType'objecthasnoattribute'xxx'错误通常出现在Python中，表示你尝试访问一个NoneType对象的属性或方法，但Non
如何查看和终止正在运行的Python进程 weixin_48705841 python 开发语言
如何查看和终止正在运行的Python进程无论是在开发过程中测试脚本，还是在生产环境中运行数据分析任务，了解如何查看和控制正在运行的Python进程对于维护系统状态和资源利用率至关重要。本文将介绍在两个主要操作平台（Unix/Linux/macOS和Windows）上执行这些任务的方法。在Unix/Linux/macOS上查看Python进程打开你的终端应用程序。输入以下命令并执行：ps-ef|gr
Python 数据结构——二叉树（最最最最最实用的二叉树教程）我是阿核 Python 数据结构算法 python
本文章以实用为主，所以不多废话直接开整本文所介绍的二叉树是最基础的二叉树，不是二叉搜索树，也不是平衡二叉树，就基本的二叉树二叉树的创建基本二叉树的创建其实比链表还要简单，只需创建一个节点的类即可，随后用指针将其串起来。不同于链表的是，二叉树为一个父节点连接到两个子节点，若还要加入新的节点，那么此时的子节点将会变成新加入节点的父节点，以此类推，每一个父节点最多只有两个节点（所以叫二叉树）我们将上述图
python3.6遇到Unicode编码字符串比较问题：\u672a\u4f7f\u7528与同样内容的变量比较总是false[已解决] xiaobailx python问题 Python3 Unicode 字符串比较编码转换解码
我的state变量值是一个unicode编码的字符串，需求是和一个unicode编码的字符串比较state==’\u672a\u4f7f\u7528‘//结果是false原因及解决方法：当将unicode编码字符串输出时会直接转换为utf8格式即变成正常的中文。但变量state中存储的仍然是Unicode编码字符串所以不一致。且由于python3.6去除了字符串的decode方法，所以无法将变量中
使用 Python结合ffmpeg 实现单线程和多线程推流浪浪山小白兔 python ffmpeg opencv
一、引言在本文中，我们将详细介绍如何使用Python进行视频的推流操作。我们将通过两个不同的实现方式，即单线程推流和多线程推流，来展示如何利用cv2（OpenCV）和subprocess等库将视频帧推送到指定的RTMP地址。这两种方式都涉及到从摄像头读取视频帧，以及使用ffmpeg命令行工具将视频帧进行编码和推流的过程。二、单线程推流以下是单线程推流的代码：importcv2ascvimports
计算1+2+3+4+5+6...+100用python_100个Python练手小程序，学习python的很好的资料 weixin_39879881
原标题：100个Python练手小程序，学习python的很好的资料100个Python练手小程序，学习python的很好的资料，覆盖了python中的每一部分，可以边学习边练习，更容易掌握python。本文附带基础视频教程：私信回复【基础】就可以获取的【程序1】题目：有1、2、3、4个数字，能组成多少个互不相同且无重复数字的三位数？都是多少？1.程序分析：可填在百位、十位、个位的数字都是1、2、
计算1+2+3+4+5+6...+100用python_循环 - 廖雪峰的官方网站 weixin_39809140
循环要计算1+2+3，我们可以直接写表达式：>>>1+2+36要计算1+2+3+...+10，勉强也能写出来。但是，要计算1+2+3+...+10000，直接写表达式就不可能了。为了让计算机能计算成千上万次的重复运算，我们就需要循环语句。Python的循环有两种，一种是for...in循环，依次把list或tuple中的每个元素迭代出来，看例子：names=['Michael','Bob','Tr
编写五子棋的完整python代码_Python 大作业之五子棋游戏(附代码) weixin_39656513
Python大作业——五子棋游戏姓名：吴欣学号：姓名：张雨清学号：一游戏介绍：我们设计的是五子棋游戏，支持两人一个鼠标对下，黑方用左键单击，白方用右键单击，谁先下均可，落子无悔，下过的棋子对方点击后不会变色，程序可自行判断输赢并在五子连珠时弹出结果对话框，游戏双方需遵守不在空地点击和一次下一子的规则。二游戏代码设计：代码均为原创，没有借鉴和抄袭，首先是用户GUI界面设计，点击start进入游戏界面
华为OD机试E卷 --快递投放问题 --24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od java javascript c语言 python
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述有N个快递站点用字符串标识，某些站点之间有道路连接。每个站点有一些包裹要运输，每个站点间的包裹不重复，路上有检查站Q会导致部分货物无法通行，计算哪些货物无法正常投递?输入描述第一行输入MN，M个包裹N个道路信息…O<=M,N<=100,检查站禁止通行的包裹如果有多个以空格分开输出描述输出不
Python 3 编程教程 - Tkinter 事件处理 sentdex python
这段文字主要讲解了在使用Tkinter构建GUI窗口时，如何为按钮添加事件处理功能，具体来说是：创建窗口和按钮:这段代码首先创建了一个简单的GUI窗口，并添加了一个按钮。添加事件处理功能:为了让按钮点击后执行特定操作，需要为按钮添加command属性，该属性的值是一个函数名，当按钮被点击时，该函数会被调用。定义事件处理函数:这段代码定义了一个名为client_exit的函数，该函数将作为按钮点击后
python保留字符串中数字，去除字母，再转化为Int类型操作梦云澜 python python 开发语言
现在我们有一个这样的分类列表：categories=['Layer1','Layer2','Layer3','Layer4','Layer5','Layer6','WM']我们想保留其中的分类的数字，去除字母，该怎么做呢？首先第一步：importpandasaspdimportre#原始分类数据categories=['Layer1','Layer2','Layer3','Layer4','Lay
pythonAI算法中使用ffmpeg推流记录脱僵的的野码 ffmpeg 网络
首先呢需求是这样的需要在远端播放检测的画面这个事情解决的思路1.用的网络摄像头，将摄像头的流推到rtmp1流地址2.项目中的输入流就是rtmp1的地址视频流3.开始对视频各种检测，检测后将帧的frame推到rtmp24.随便找个播放器去播放rtmp2的流期间遇到了一些问题就是推上去的流在远端播放就直接裂开了大概4秒一卡顿，后来发现是ffmpg-r参数默认值是25我的frame推上去的流fps才11
多张图片读入后组成一个矩阵。怎么读取图片，可以让其读入的形式是：ndarray（a,b,c）分别的含义：a为多少张图片，b*c为图片大小洛水微寒矩阵线性代数
不显示通道数：要将多张图片读取为一个NumPy数组（ndarray），其中a表示图片数量，b和c分别表示每张图片的高度和宽度（不显示通道数），你可以使用Python中的PIL（Pillow）库和NumPy库。下面是一个示例代码，展示了如何实现这一点：代码示例importnumpyasnpfromPILimportImageimportosdefload_images_from_folder(fol
从System Prompt来看GPT-3.5到GPT-4的进化 herosunly 大模型 system prompt gpt-3 chatgpt gpt4 gpt4o
大家好，我是herosunly。985院校硕士毕业，现担任算法t研究员一职，热衷于机器学习算法研究与应用。曾获得阿里云天池比赛第一名，CCF比赛第二名，科大讯飞比赛第三名。拥有多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。本文主要介绍了从SystemPrompt来看GPT-3.5到GPT-4的进化之路，希
华为OD机试E卷 - 螺旋数字矩阵（Java & Python& JS & C++ & C ）算法大师最新华为OD机试华为od 矩阵 java 华为OD机试E卷 python javascript C语言
最新华为OD机试真题目录：点击查看目录华为OD面试真题精选：点击立即查看题目描述疫情期间，小明隔离在家，百无聊赖，在纸上写数字玩。他发明了一种写法：给出数字个数n和行数m（0
R语言机器学习算法实战系列（十九）特征选择之Monte Carlo算法（Monte Carlo Feature Selection）生信学习者1 R语言机器学习实战 r语言机器学习算法数据分析数据挖掘数据可视化人工智能
禁止商业或二改转载，仅供自学使用，侵权必究，如需截取部分内容请后台联系作者!文章目录介绍原理步骤下载数据加载R包导入数据数据预处理数据分割MCFS运行MCFS-ID过程混淆矩阵重要特征的RI最小阈值距离与共同部分收敛特征重要性排序选择重要特征构建特征依赖图提取重要特征基于重要特征构建随机森林模型混淆矩阵评估模型AUC曲线刻画模型在训练和测试数据集的表现总结系统信息介绍特征选择（FeatureSel
F#语言的图形用户界面沈霁晨包罗万象 golang 开发语言后端
F#语言的图形用户界面开发引言随着软件开发的日益复杂化，图形用户界面（GUI）在现代应用程序中的重要性不可忽视。它提供了一种直观的方式，使用户能够与应用程序进行交互。F#语言作为一种函数式编程语言，近年来在开发领域越来越受到关注，尤其是在数据分析和机器学习领域。但F#同样能够用于图形用户界面的开发，尤其是结合.NET平台及其丰富的库。本文将深入探讨F#语言在图形用户界面开发中的应用，包括常用的框架
深入探讨Web应用开发：从前端到后端的全栈实践禁默前端
目录引言1.Web应用开发的基本架构2.前端开发技术HTML、CSS和JavaScript前端框架与库响应式设计与移动优先3.后端开发技术Node.js（JavaScript后端）Python（Flask和Django）RubyonRailsJava（SpringBoot）4.数据库选择与管理关系型数据库（SQL）非关系型数据库（NoSQL）5.API设计与开发RESTfulAPIGraphQL6
Python中判断列表是否包含某个元素的方法五月天的尾巴 python 判断列表是否包含元素
文章目录1、成员运算符in和notin2、使用count()方法3、使用any()函数4、使用set转换5、使用numpy库6、使用any()和生成器表达式7、使用index()方法8、使用itertools.chain()函数9、使用collections.Counter类10、使用pandas库以下整理几种判断列表中是否包含某个元素的方法。以下代码基于python2.7执行。1、成员运算符in
【Springboot】——响应与分层解耦架构 Y小夜架构 spring boot 后端 java spring
博主现有专栏：C51单片机（STC89C516），c语言，c++，离散数学，算法设计与分析，数据结构，Python，Java基础，MySQL，linux，基于HTML5的网页设计及应用，Rust（官方文档重点总结），jQuery，前端vue.js，Javaweb开发，设计模式、Python机器学习、Springboot等主页链接：Y小夜-CSDN博客目录响应响应数据✨@ResponseBody✨G
华为OD机试E卷 --矩阵扩散--24年OD统一考试（Java & JS & Python & C & C++）飞码创造者最新华为OD机试题库2024 华为od 矩阵 java python javascript
文章目录题目描述输入描述输出描述用例题目解析JS算法源码Java算法源码python算法源码c算法源码题目描述存在一个m×n的二维数组，其成员取值范围为0或1。其中值为1的成员具备扩散性，每经过1s，将上下左右值为0的成员同化为1。二维数组的成员初始值都为0，将第[i,j]和[k,l]两个个位置上元素修改成1后，求矩阵的所有元素变为1需要多长时间。输入描述输入数据中的：•前面2个数字表示这是一个m
Python 实现简单的爬虫 Java进阶营菌程序员职场 Python python 爬虫后端
Python是一种跨平台的计算机程序设计语言，面向对象动态类型语言，Python是纯粹的自由软件,源代码和解释器cpython遵循GPL(GNUGeneralPublicLicense)协议，随着版本的不断更新和语言新功能的添加，Python越来越多被用于独立的、大型项目的开发。快速抓取网页:使用urllib最基本的抓取功能,将百度首页的内容保存到本地目录下.importurllib.reques
Python enumerate函数晓之以理的喵~~ Python python 服务器 linux
在Python编程中，enumerate()函数是一个强大而有用的工具，用于在迭代可迭代对象（如列表、元组、字符串等）的同时获取元素的索引。本文将深入探讨enumerate()函数的用法、语法、示例代码，并探讨其在实际编程中的应用场景。什么是enumerate()函数？enumerate()函数是Python内置的函数之一，用于在迭代可迭代对象时返回一个包含索引和元素的迭代器。一般语法如下：enu
python的输入函数（在线笔试会用到）算法黑哥 python
文章目录input()输入函数用冒泡排序为例子1输入的表示2输入一个整数3属于一个数组input()输入函数用冒泡排序为例子#冒泡排序defbubble_sort1(li):forkinrange(len(li)-1):foriinrange(len(li)-1-k):ifli[i]>li[i+1]:li[i],li[i+1]=li[i+1],li[i]returnli1输入的表示a=input(
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他