weixin_37988176

python代码示例基础分析-最全攻略：数据分析师必备Python编程基础知识

原标题：最全攻略：数据分析师必备Python编程基础知识

导读：本文主要介绍使用Python进行数据分析时必备的编程基础知识，主要涉及Python的基本数据类型、数据结构、程序控制、读写数据等内容。

Python编写代码时，是以缩进作为代码块的标识，而不是使用花括号等字符，这与其它语言有较大差别。这种方式显示的代码可读性更高，通常使用四个空格或一个tab作缩进，如果是Python编程的新手，要注意这一点。

作者：常国珍、赵仁乾、张秋剑

本文摘编自《Python数据科学：技术详解与商业实践》，如需转载请联系大数据（ID：hzdashuju）

01 Python的基本数据类型

Python的基本数据类型包括几种，如下表：

名称

解释

示例

str

字符串

'a',"1"

float

浮点数

1.23,11.0

int

整数

3,4

bool

布尔

True,False

complex

复数

1+2j,2+0j

▲表3-1 Python基础数据类型

下面一一进行详述。

1. 字符串(str)

Python中，单引号、双引号、三引号包围的都是字符串，如下所示：

'spam eggs'

"spam eggs"

'spam eggs'

'''spam eggs'''

'spam eggs'

type( 'spam eggs')

str

此外，Python中的字符串也支持一些格式化输出，例如换行符"n”和制表符"t”:

print( 'First line.nSecond line.')

First line.

Second line.

print( '1t2')

当然，有时候为避免混淆，也会使用转义字符"”，用于转义"”后一位的字符为原始输出。

""Yes," he said."

'"Yes," he said.'

此外还可以通过在引号前加r来表示原始输出：

print( 'C:somename') #有换行符的输出

C:some

Ame

print( r'C:somename') #原始输出

C:somename

Python中字符串支持加运算表示字符串拼接：

'pyt'+ 'hon'

'python'

2. 浮点数和整数（float，int）

Python可以处理任意大小的整数，当然包括负整数，在程序中的表示方法和数学上的写法一模一样。

1+ 1

Python支持数值的四则运算，如下所示：

1+ 1#加法

1-1#减法

1* 1#乘法

2** 2#2的2次方

2/ 3#除法

0.6666666666666666

5// 2#除法(整除)

5% 2#余数

Python可以处理双精度浮点数，可以满足绝大部分数据分析的需求，要精确空值数字精度，还可以使用numpy扩展库。

此外，可以使用内置函数进行数值类型转换，例如转换数值字符为数值：

float( "1")

1.0

int( "1")

3. 布尔值（Bool：True/False）

Python布尔值一般通过逻辑判断产生，只有两个可能结果:True/False

整型、浮点型的"0”和复数0+0j也可以表示False，其余整型、浮点型、复数数值都被判断为True，如下代码通过逻辑表达式创建bool逻辑值：

1== 1

True

1> 3

False

'a'is'a'

True

当然，Python中提供了逻辑值的运算即"且”、"或”、"非”运算，

TrueandFalse#且

False

TrueorFalse#或

True

notTrue#非

False

布尔逻辑值转换可以使用内置函数bool，除数字0外，其他类型用bool转换结果都为True。

bool( 1)

False

bool( "0")

True

bool( 0)

False

Python中对象类型转换可参考表3-2。

数据类型

中文含义

转换函数

Str

字符串

str()

Float

浮点类型

float()

Int

整数

Int()

Bool

逻辑

bool()

Complex

复数

complex()

▲表3-2 Python数据类型转换

4. 其他

Python中，还有一些特殊的数据类型，例如无穷值，nan(非数值)，None等。可以通过以下方式创建：

float( '-inf') #负无穷

-inf

float( '+inf') #正无穷

inf

下面是无穷值的一些运算，注意正负无穷相加返回nan(not a number)，表示非数值

float( '-inf')+ 1

-inf

float( '-inf')/ -1

inf

float( '+inf')+ 1

inf

float( '+inf')/ -1

-inf

float( '-inf')+float( '+inf')

nan

非数值nan在Python中与任何数值的运算结果都会产生nan，nan甚至不等于自身。如下所示。nan可用于表示缺失值。

float( 'nan') == float( 'nan')

False

此外，python中提供了None来表示空，其仅仅支持判断运算，如下所示

x = None

x isNone

True

02 Python的基本数据结构

Python的基本数据类型包括以下几种，这些数据类型表示了自身在Python中的存储形式。在Python中可以输入type（对象）查看数据类型。

1. 列表(list)

1.1 列表简介

列表list是Python内置的一种数据类型，是一种有序的集合，用来存储一连串元素的容器，列表用[]来表示，其中元素的数据类型可不相同。

list1 = [ 1, '2', 3, 4]

list1

[ 1, '2', 3, 4]

除了使用"[]”创建列表外，还可以使用list()函数：

list([ 1, 2, 3])

[ 1, 2, 3]

list( 'abc')

[ 'a', 'b', 'c']

可以通过索引对访问或修改列表相应位置的元素，使用索引时，通过”[]”来指定位置。在Python中，索引的起始位置为0，例如取list1的第一个位置的元素：

list1[ 0]

可以通过”:”符号选取指定序列的位置的元素,例如取第1到第3个位置的元素，注意这种索引取数是前包后不包的(包括0位置，但不包括3位置，即取0，1，2位置的元素)：

list1[ 0: 3]

[ 1, '2', 3]

此外，Python中的负索引表示倒序位置，例如-1代表list1最后一个位置的元素：

list1[ -1]

列表支持加法运算，表示两个或多个列表合并为一个列表，如下所示：

[ 1, 2, 3]+[ 4, 5, 6]

[ 1, 2, 3, 4, 5, 6]

1.2 列表的方法

Python中，列表对象内置了一些方法。这里介绍append方法和extend方法，append方法表示在现有列表中添加一个元素，在循环控制语句中，append方法使用较多，以下是示例：

list2 = [ 1, 2]

list2.append( 3)

list2

[ 1, 2, 3]

extend方法类似于列表加法运算，表示合并两个列表为一个列表:

list2 = [ 1, 2]

list2.extend([ 3, 4, 5])

list2

[ 1, 2, 3, 4, 5]

2. 元组(tuple)

元组与列表类似，区别在于在列表中，任意元素可以通过索引进行修改。而元组中，元素不可更改，只能读取。下面展示了元组和列表的区别,列表可以进行赋值，而同样的操作应用于元组则报错。

list0 = [ 1, 2, 3]

tuple0 = ( 1, 2, 3)

list0[ 1] = 'a'

list0

[ 1, 'a', 3]

tuple0[ 1] = 'a'

TypeError Traceback (most recent call last)

in()

----> 1tuple0[ 1] = 'a'

TypeError: 'tuple'object does notsupport item assignment

这里通过”()”创建元组，python中，元组类对象一旦定义虽然无法修改，但支持加运算，即合并元组。

( 1, 2, 3)+( 4, 5, 6)

( 1, 2, 3, 4, 5, 6)

元组也支持像列表那样通过索引方式进行访问。

t1 = ( 1, 2, 3)

t1[ 0]

t1[ 0: 2]

( 1, 2)

3. 集合(set)

Python中，集合(set)是一组key的集合，其中key不能重复。可以通过列表、字典或字符串等创建集合，或通过"{}”符号进行创建。Python中集合主要有两个功能，一个功能是进行集合操作，另一个功能是消除重复元素。

basket = { 'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}

basket

{ 'apple', 'banana', 'orange', 'pear'}

basket = set([ 'apple', 'orange', 'apple', 'pear', 'orange', 'banana'])

basket

{ 'apple', 'banana', 'orange', 'pear'}

basket = set(( 'apple', 'orange', 'apple', 'pear', 'orange', 'banana'))

basket

{ 'apple', 'banana', 'orange', 'pear'}

Python支持数学意义上的集合运算，比如差集、交集、补集、并集等，例如如下集合：

A = { 1, 2, 3}

B = { 3, 4, 5}

A，B的差集，即集合A的元素去除AB共有的元素：

A – B

{ 1, 2}

A，B的并集，即集合A与集合B的全部唯一元素：

A | B

{ 1, 2, 3, 4, 5}

A，B的交集，即集合A和集合B共有的元素：

A & B

{ 3}

A，B的对称差，即集合A与集合B的全部唯一元素去除集合A与集合B的公共元素：

A ^ B

{ 1， 2， 4， 5}

需要注意集合不支持通过索引访问指定元素。

4. 字典（dict）

Python内置了字典dict，在其他语言中也称为map，使用键-值(key-value)存储，具有极快的查找速度，其格式是用大括号{}括起来key和value用冒号":”进行对应。例如以下代码创建了一个字典：

dict1 = { 'Nick': 28, 'Lily': 28, 'Mark': 24}

dict1

{ 'Lily': 28, 'Mark': 24, 'Nick': 28}

字典本身是无序的，可以通过方法keys和values取字典键值对中的键和值，如下所示：

dict1.keys()

[ 'Nick', 'Lily', 'Mark']

dict1.values()

[ 28, 28, 24]

字典支持按照键访问相应值的形式，如下所示：

dict1[ 'Lily']

这里需要注意定义字典时，键不能重复，否则重复的键值会替代原先的键值,如下所示，键’Lily’产生重复，其值被替换。

dict3 = { 'Nick': 28, 'Lily': 28, 'Mark': 24, 'Lily': 33}

{ 'Lily': 33, 'Mark': 24, 'Nick': 28}

03 Python的程序控制

程序控制结构是编程语言的核心基础，Python的编程结构有3种，本节将详细地介绍这3种结构。

1. 三种基本的编程结构简介

简单来说，程序结构分为三种：顺承结构、分支结构和循环结构（图3-1）。

▲图3-1程序执行结构

顺承结构的程序特点是依照次序将代码一个一个地执行，并返回相应的结果，这种结构较为简单，易于理解；

分支结构的程序多出了条件判断，即满足某种条件就继续执行，否则跳转到另外的条件上进行执行；

循环结构用于处理可以迭代的对象，这种结构通过循环可迭代的对象，然后对每一个对象执行程序并产生结果。在迭代次数较多的情况下，使用顺承结构往往要写非常长的代码，而循环结构则非常简单。

这些结构中，分支结构往往需要条件判断语句进行控制，比如if、else等，而循环结构则需要循环语句for进行控制，当然分支结构与循环结构完全可以混合，这时就可以通过条件循环语句while进行控制。

下面我们具体看看这几个结构的程序。

2. 顺承结构

2.1 顺承结构

现在创建一个列表a:

a = [ 1, 2, 3, 4, 5]

需要打印列表a中的所有元素，可以有如下写法，虽然烦琐但完成了任务。这种顺序执行的编程结构就是顺承结构：

print(a[ 0])

print(a[ 1])

print(a[ 2])

print(a[ 3])

print(a[ 4])

2.2 逻辑行与物理行

Python中，代码是逐行提交给解释器进行编译的，这里的一行称为逻辑行，实际代码也确实是一行，那么代码的物理行就只有一行，例如上述print代码，逻辑行和物理行是统一的。

但某些情况下，编写者写入一个逻辑行的代码过长时，可以分拆为多个物理行执行，例如：

tuple(set(list([ 1, 2, 3, 4, 5, 6, 7, 8])))

( 1, 2, 3, 4, 5, 6, 7, 8)

可以写为如下方式，符号’’是换行的标识，此时代码还是一个逻辑行，但有两个物理行。

tuple(set(list([ 1, 2, 3,

4, 5, 6, 7, 8])))

( 1, 2, 3, 4, 5, 6, 7, 8)

当多个逻辑行代码过短时：

x = 1

y = 2

z = 3

print(x,y,z)

( 1, 2, 3)

可以使用分号";”将多个逻辑行转化为一个物理行执行：

x = 1;y = 2;z = 3;print(x,y,z)

( 1, 2, 3)

3. 分支结构

分支结构的分支用于进行条件判断，Python中，使用if 、elif、else、冒号与缩进表达。详细语法可见以下示例，下面的语法的判断逻辑为 :

若数值x小于0，令x等于0，若成立则打印信息'Negative changed to zero'；

若第一个条件不成立，判断x是否为0，若成立打印'Zero';

若第一、第二个条件不成立，再判断x是否为1，若成立打印’single’;

若第一、第二、第三个条件都不成立，打印’more’。

以x=-2测试结果：

x = -2

ifx < 0:

x = 0

print( 'Negative changed to zero')

elifx == 0:

print( 'Zero')

elifx == 1:

print( 'Single')

else:

print( 'More')

'Negative changed to zero'

这里，if，elif，else组成的逻辑是一个完整的逻辑，即程序执行的时，任何条件成立时，会停止后面的条件判断。这里需注意，当多个if存在时的条件判断的结果：若把上述代码中的elif改为if后，程序执行的结果会发生变化，如下所示：

x = -2

ifx < 0:

x = 0

print( 'Negative changed to zero')

ifx == 0:

print( 'Zero')

ifx == 1:

print( 'Single')

else:

print( 'More')

'Negative changed to zero'

'Zero'

'More'

此时，上述程序的中任何if判断结果无论是否成立都会依次执行一遍，所以x=-2会被赋值为0后继续执行，第二个if判断为真，第三个if判断为假时，再跳到else进行执行，此时第三个if和else才是一个完整的逻辑。在写条件判断结构的程序时需要注意。

4. 循环结构

这里介绍Python中的for循环结构和while循环结构，循环语句用于遍历枚举一个可迭代对象的所有取值或其元素，每一个被遍历到的取值或元素执行指定的程序并输出。这里可迭代对象指可以被遍历的对象，比如列表、元组、字典等。

4.1 For循环

下面是一个for循环的例子， i用于指代一个可迭代对象中a中的一个元素，for循环写好条件后以冒号结束，并换行缩进，第二行是针对每次循环执行的语句，这里是打印列表a中的每一个元素。

a = [ 1, 2, 3, 4, 5]

fori ina:

print(i)

上述操作也可以通过遍历一个可迭代对象的索引来完成，a列表一共5个元素，range(len(a))表示生成a的索引序列,这里打印索引并打印a向量索引下的取值。

a = [ 'Mary', 'had', 'a', 'little', 'lamb']

fori inrange(len(a)):

print(i, a[i])

( 0, 'Mary')

( 1, 'had')

( 2, 'a')

( 3, 'little')

( 4, 'lamb')

4.2 while循环

while循环一般会设定一个终止条件，条件会随着循环的运行而发生变化，当条件满足时，循环终止。while循环可以通过条件制定循环次数，例如通过计数器来终止掉循环，如下所示，计数器count每循环一次自增1，但count为5时，while条件为假，终止循环。

count = 1

whilecount < 5:

count = count + 1

print(count)

以下是一个比较特殊的示例，演示如何按照指定条件循环而不考虑循环的次数，例如编写循环，使x不断减少，当x小于0.0001时终止循环，如下所示，循环了570次，最终x取值满足条件，循环终止。

x= 10

count = 0

whileTrue:

count = count + 1

x = x - 0.02*x

ifx< 0.0001:

break

print(x,count)

( 9.973857171889038e-05, 570)

4.3 break、continue、pass

上例中while循环代码中使用了break表示满足条件时终止循环。此外，也可通过continue、pass对循环进行控制。Continue表示继续进行循环，例如如下代码尝试打印10以内能够被3整除的整数，注意continue和break的区别：

count = 0

whilecount < 10:

count = count + 1

ifcount % 3== 0:

print(count)

continue

使用break：

count = 0

whilecount < 10:

count = count + 1

ifcount % 3== 0:

print(count)

break

pass语句一般是为了保持程序的完整性而作为占位符使用，例如以下代码中pass没有任何操作。

count = 0

whilecount < 10:

count = count + 1

ifcount % 3== 0:

pass

else:

print(count)

4.4 表达式

在Python中，诸如列表、元组、集合、字典都是可迭代对象，Python为这些对象的遍历提供了更加简洁的写法。例如如下列表对象x的遍历，且每个元素取值除以10:

x = [ 1, 2, 3, 4, 5]

[i/ 10fori inx]

[ 0.1, 0.2, 0.3, 0.4, 0.5]

上述[i/10 for i in x]的写法称为列表表达式，这种写法比for循环更加简便。此外对于元组对象、集合对象、字典对象，这种写法依旧适用，最终产生一个列表对象。

x = ( 1, 2, 3, 4, 5) #元组

[i/ 10fori inx]

[ 0.1, 0.2, 0.3, 0.4, 0.5]

x = set(( 1, 2, 3, 4, 5)) #集合

[i/ 10fori inx]

[ 0.1, 0.2, 0.3, 0.4, 0.5]

x = { 'a': 2, 'b': 2, 'c': 5} #字典

[i fori inx.keys()]

[ 'a', 'c', 'b']

[i fori inx.values()]

[ 1, 3, 2]

此外Python还支持集合表达式与字典表达式用于创建集合、字典，例如如下形式创建集合：

{i fori in[ 1, 1, 1, 2, 2]}

{ 1, 2}

字典表达式可以以如下方式创建：

{key:value forkey,value in[( 'a', 1),( 'b', 2),( 'c', 3)]}

{ 'a': 1, 'b': 2, 'c': 3}

04 Python的函数与模块

1. Python的函数

函数是用来封装特定功能的实体，可对不同类型和结构的数据进行操作，达到预定目标。像之前的数据类型转换函数入str,float等就属于函数。当然除了python的内置函数与第三方库的函数外，还可以自定义函数从而完成指定任务。

1.1 自定义函数示例

例如自定义求一个列表对象均值的函数avg，sum与len函数是python内置函数，分别表示求和与长度：

defavg(x):

mean_x = sum(x)/len(x)

return(mean_x)

运行完毕后，就可以调用该函数进行运算了:

avg([ 23, 34, 12, 34, 56, 23])

1.2 函数的参数

函数的参数可以分为形式参数与实际参数，形式参数，形式参数作用于函数的内部，其不是一个实际存在的变量，当接受一个具体值时(实际参数)，负责将具体值传递到函数内部进行运算，例如之前定义的函数avg，形式参数为x。

defavg(x):

mean_x = sum(x)/len(x)

return(mean_x)

实际参数即具体值，通过形式参数传递到函数内部参与运算并输出结果，刚才的例子中，实际参数为一个列表：

>avg([ 23, 34, 12, 34, 56, 23])

函数参数的传递有两种方式：按位置和按关键字。当函数的形式参数过多时，一般采用按关键字传递的方式，通过形式参数名=实际参数的方式传递参数，如下所示，函数age有四个参数，可以通过指定名称的方式使用，也可按照顺序进行匹配：

defage(a,b,c,d):

print(a)

print(b)

print(c)

print(d)

age(a = 'young',b = 'teenager',c = 'median',d = 'old') #按关键字指定名称

young

teenager

median

old

age( 'young', 'teenager', 'median', 'old') #按位置顺序匹配

young

teenager

median

old

函数的参数中，亦可以指定形式参数的默认值，此时该参数称为可选参数，表示使用时可以不定义实际参数，例如如下例子，函数f有两个参数，其中参数L指定了默认值None:

deff(a, L=None):

ifL isNone:

L = []

L.append(a)

returnL

使用该函数时，只需指定a参数的值，该函数返回一个列表对象，若不给定初始列表L，则创建一个列表，再将a加入到列表中:

f( 3)

[ 3]

也可指定可选参数L的取值：

f( 3,L = [ 1, 2])

[ 1, 2, 3]

1.3 匿名函数lambda

Python中设定了匿名函数lambda，简化了自定义函数定义的书写形式。使得代码更为简洁。例如通过lambda函数定义一个函数g：

g = lambdax:x+ 1

g( 1)

该函数相当于如下自定义函数：

defg(x):

return(x+ 1)

g( 1)

2. Python的模块

为了编写可维护的代码，可以把很多函数分组，分别放到不同的文件里，这样，每个文件包含的代码就相对较少，很多编程语言都采用这种组织代码的方式。在Python中，一个.py文件就称之为一个模块（Module），其内容形式是文本，可以在IDE中或者使用常用的文本编辑器进行编辑。

自定义模块

使用文本编辑器创建一个mod.py文件，其中包含一个函数，如下所示：

# module

defmean(x):

return(sum(x)/len(x))

使用自定义模块时，将mod.py放置在工作目录下，通过"import 文件名”命令载入：

importmod

在使用该模块的函数时，需要加入模块名的信息，如下：

mod.mean([ 1, 2, 3])

载入模块还有很多方式，如下（注意别名的使用）：

importmod asm # as后表示别名

m.mean([ 1, 2, 3])

frommodimport mean #从mod中载入指定函数mean

mean([ 1, 2, 3])

frommodimport * # 从mod中载入所有函数

mean([ 1, 2, 3])

载入第三方库

import命令还可以载入已经下载好的第三方库，使用方式与上面所展示的一致。例如，载入numpy模块：

importnumpyas np

此时就可以使用Numpy模块中的函数了，例如Numpy中提供的基本统计函数:

x = [ 1, 2, 3, 4, 5]

np.mean(x) # 均值

3.0

np.max(x) # 最大值

np.min(x) # 最小值

np.std(x) # 标准差

1.41421356237

np.median(x) # 中位数

3.0

Numpy提供了强大的多维数组、向量、稠密矩阵、稀疏矩阵等对象，支持线性代数、傅里叶变换等科学运算，提供了C/C++及Fortron代码的整合工具。

Numpy的执行效率要比Python自带的数据结构要高效的多，在Numpy的基础上，研究者们开发了大量用于统计学习、机器学习等科学计算的框架，基于Numpy的高效率，这些计算框架具备了较好的实用性。可以说， Numpy库极大地推动了Python在数据科学领域的流行。

若不太清楚如何使用Python 中（含第三方包和库）的方法和对象，可以查阅相关文档或使用帮助功能，代码中获取帮助信息的方式有多种，比如如下几种：

?np.mean

??np.mean

help(np.mean)

np.mean??

05 pandas 读取结构化数据

Numpy中的多维数组、矩阵等对象具备极高的执行效率，但是在商业数据分析中，我们不仅需要一堆数据，还需要了解各行、列的意义，同时会有针对结构化数据的相关计算，这些是Numpy不具备的。为了方便分析，研究者们开发了Pandas用于简化对结构化数据的操作。

Pandas是一个基于Numpy开发的更高级的结构化数据分析工具，提供了Series、DataFrame、Panel等数据结构，可以很方便地对序列、截面数据（二维表）、面板数据进行处理。

DataFrame即是我们常见的二维数据表，包含多个变量（列）和样本（行），通常称为数据框；Series是一个一维结构的序列，会包含指定的索引信息，可以视作是DataFrame中的一列或一行，操作方法与DataFrame十分相似；Panel是包含序列及截面信息的三维结构，通常称为面板数据，通过截取会获得对应的Series和DataFrame。

由于这些对象的常用操作方法是十分相似的，本节读取与保存数据以及后续章节进行的数据操作，都主要使用DataFrame进行演示。

1. 读取数据

1.1 使用Pandas读取文件

Python的Pandas库提供了便捷读取本地结构化数据的方法，这里主要以csv数据为例。pandas.read_csv函数可以实现读取csv数据，读取方式见以下代码，其中'data/sample.csv'表示文件路径:

importpandas aspd

csv = pd.read_csv( 'data/sample.csv')

csv

id name scores

01小明 78.0

12小红 87.0

23小白 99.0

34小青 99999.0

45小兰 NaN

按照通常的惯例，Pandas会以pd做为别名，pd.read_csv读取指定路径下的文件，然后返回一个DataFrame对象。在命令行中打印DataFrame对象其可读性可能会略差一些，如果在jupyter notebook 中执行的话，则DataFrame的可读性会大幅提升：

▲图3-2 jupyter notebook中的DataFrame展现

打印出来的DataFrame包含了索引（index，第一列），列名（column，第一行）及数据内容（values，除第一行和第一列之外的部分）。

此外，read_csv函数有很多参数可以设置，这里列出常用参数，如表3-3所示。

参数

说明

filepath_or_buffer

csv文件的路径

sep = ','

分隔符，默认逗号

header = 0

int或list of ints类型，0代表第一行为列名，若设定为None将使用数值列名

names = [...]

list，重新定义列名，默认None

usecols = [...]

list，读取指定列，设定后将缩短读取数据的时间与内存消耗，适合大数据量读取，默认None

dtype = {...}

dict，定义读取列的数据类型，默认None

nrows = None

int类型，指定读取大数据量的前多少行，默认None

na_values = ...

str类型，list或dict，指定读取为缺失值的值

na_filter = True

bool类型，自动发现数据中的缺失值功能，默认打开(True)，若确定数据无缺失可以设定为False以提高数据载入的速度

chunksize = 1000

int类型，分块读取，当数据量较大时可以设定分块读取的行数，默认为None，若设定将返回一个迭代器

encoding = 'utf-8'

str类型，数据的编码，python3默认为'utf-8'，python2默认为'ascii'

▲表3-3 pandas.read_csv参数一览

Pandas除了可以直接读取csv、Excel、Json、html等文件生成DataFrame，也可以从列表、元组、字典等数据结构创建DataFrame，

1.2 读取指定行和指定列

使用参数usecol和nrows读取指定的列和前n行，这样可以加快数据读取速度。如下所示，读取原数据的两列、两行:

csv = pd.read_csv( 'data/sample.csv',

usecols=[ 'id', 'name'],

nrows= 2) #读取'id'和'name'两列，仅读取前两行

csv

id name

01小明

12小红

1.3 使用分块读取

参数chunksize可以指定分块读取的行数，此时返回一个可迭代对象，这里big.csv是一个4500行4列的csv数据，这里设定chunksize=900，分5块读取数据,每块900行，4个变量，如下所示：

csvs = pd.read_csv( 'data/big.csv',chunksize= 900)

fori incsvs:

print(i.shape)

( 900, 4)

可以使用pd.concat函数再读取全部数据。

csvs = pd.read_csv( 'data/big.csv',chunksize= 900)

dat = pd.concat(csvs,ignore_index= True)

dat.shape

( 4500, 4)

1.4 缺失值操作

使用na_values参数指定预先定义的缺失值，数据sample.csv中，"小青”的分数有取值为99999的情况，这里令其读取为缺失值，操作如下

csv = pd.read_csv( 'data/sample.csv',

na_values= '99999')

csv

id name scores

01小明 78.0

12小红 87.0

23小白 99.0

34小青 NaN

45小兰 NaN

1.5 文件编码

读取数据时，常遇到乱码的情况，这里需要先弄清楚原始数据的编码形式是什么，再以指定的编码形式进行读取，例如sample.csv编码为'utf-8'，这里以指定编码(参数encoding)读取。

csv = pd.read_csv( 'data/sample.csv',

encoding= 'utf-8')

csv

id name scores

01小明 78.0

12小红 87.0

23小白 99.0

34小青 99999.0

45小兰 NaN

2. 写出数据

pandas的数据框对象有很多方法，其中方法"to_csv”可以将数据框对象以csv格式写入到本地中。to_csv方法的常见参数见表3-4:

参数

解释

path_or_buf

写到本地csv文件的路径

sep = ','

分隔符，默认逗号

na_rep = ''

缺失值写入代表符号，默认''

header = True

bool,是否写入列名，默认True

cols = [...]

list，写入指定列，默认None

index = True

bool,是否将行数写入指定列，默认true

encoding = str

str，以指定编码写入

▲表3-4 pandas.to_csv参数一览

例如以以下方式写出，'data/write.csv'表示写出的路径，encoding = 'utf-8'表示以'utf-8'编码方式输出，index=False表示不写出索引列。

csv.to_csv( 'data/write.csv',encoding= 'utf-8',ind

关于作者：常国珍，数据科学专家和金融技术专家。北京大学会计学博士，中国大数据产业生态联盟专家委员会委员。

赵仁乾，数据科学家，在电信大数据和机器学习领域有丰富的实践经验。

张秋剑，大数据专家和金融行业技术专家，上海师范大学计算机科学技术硕士。

本文摘编自《Python数据科学：技术详解与商业实践》，经出版方授权发布。

你可能感兴趣的:(python代码示例基础分析-最全攻略：数据分析师必备Python编程基础知识)

QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
如何在 Fork 的 GitHub 项目中保留自己的修改并同步上游更新？github_fork_update iBaoxing github
如何在Fork的GitHub项目中保留自己的修改并同步上游更新？在GitHub上Fork了一个项目后，你可能会对项目进行一些修改，同时原作者也在不断更新。如果想要在保留自己修改的基础上，同步原作者的最新更新，很多人会不知所措。本文将详细讲解如何在不丢失自己改动的情况下，将上游仓库的更新合并到自己的仓库中。问题描述假设你在GitHub上Fork了一个项目，并基于该项目做了一些修改，随后你发现原作者对
扫地机类清洁产品之直流无刷电机控制悟空胆好小清洁服务机器人单片机人工智能
扫地机类清洁产品之直流无刷电机控制1.1前言扫地机产品有很多的电机控制，滚刷电机1个，边刷电机1-2个，清水泵电机，风机一个，部分中高端产品支持抹布功能，也就是存在抹布盘电机，还有追觅科沃斯石头等边刷抬升电机，滚刷抬升电机等的，这些电机有直流有刷电机，直接无刷电机，步进电机，电磁阀，挪动泵等不同类型。电机的原理，驱动控制方式也不行。接下来一段时间的几个文章会作个专题分析分享。直流有刷电机会自动持续
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
抖音乐买买怎么加入赚钱?赚钱方法是什么测评君高省
你会在抖音买东西吗?如果会，那么一定要免费注册一个乐买买，抖音直播间，橱窗，小视频里的小黄车买东西都可以返佣金!省下来都是自己的，分享还可以赚钱乐买买是好省旗下的抖音返佣平台，乐买买分析社交电商的价值，乐买买属于今年难得的副业项目风口机会，2019年错过做好省的搞钱的黄金时期，那么2022年千万别再错过乐买买至于我为何转到高省呢？当然是高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
python os.environ 江湖偌大 python 深度学习
os.environ['TF_CPP_MIN_LOG_LEVEL']='0'#默认值，输出所有信息os.environ['TF_CPP_MIN_LOG_LEVEL']='1'#屏蔽通知信息（INFO）os.environ['TF_CPP_MIN_LOG_LEVEL']='2'#屏蔽通知信息和警告信息（INFO\WARNING）os.environ['TF_CPP_MIN_LOG_LEVEL']='
Python中os.environ基本介绍及使用方法鹤冲天Pro #Python python 服务器开发语言
文章目录python中os.environos.environ简介os.environ进行环境变量的增删改查python中os.environ的使用详解1.简介2.key字段详解2.1常见key字段3.os.environ.get()用法4.环境变量的增删改查和判断是否存在4.1新增环境变量4.2更新环境变量4.3获取环境变量4.4删除环境变量4.5判断环境变量是否存在python中os.envi
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Python教程：一文了解使用Python处理XPath 旦莫 Python进阶 python 开发语言
目录1.环境准备1.1安装lxml1.2验证安装2.XPath基础2.1什么是XPath？2.2XPath语法2.3示例XML文档3.使用lxml解析XML3.1解析XML文档3.2查看解析结果4.XPath查询4.1基本路径查询4.2使用属性查询4.3查询多个节点5.XPath的高级用法5.1使用逻辑运算符5.2使用函数6.实战案例6.1从网页抓取数据6.1.1安装Requests库6.1.2代
python os.environ_python os.environ 读取和设置环境变量 weixin_39605414 python os.environ
>>>importos>>>os.environ.keys()['LC_NUMERIC','GOPATH','GOROOT','GOBIN','LESSOPEN','SSH_CLIENT','LOGNAME','USER','HOME','LC_PAPER','PATH','DISPLAY','LANG','TERM','SHELL','J2REDIR','LC_MONETARY','QT_QPA
18-115 一切思考不能有效转化为行动，都TM是扯淡！成长时间线
7月25号写了一篇关于为什么会断更如此严重的反思，然而，之后日更仅仅维持了一周，又出现了这次更严重的现象。从8月2号到昨天8月6号，5天！又是5天没有更文！虽然这次断更时间和上次一样，那为什么说这次更严重？因为上次之后就分析了问题的原因，以及应该如何解决，按理说应该会好转，然而，没过几天严重断更的现象再次出现，想想，经过反思，问题依然没有解决与改变，这让我有些担忧。到底是哪里出了问题，难道我就真的
四章-32-点要素的聚合彩云飘过
本文基于腾讯课堂老胡的课《跟我学Openlayers--基础实例详解》做的学习笔记，使用的openlayers5.3.xapi。源码见1032.html，对应的官网示例https://openlayers.org/en/latest/examples/cluster.htmlhttps://openlayers.org/en/latest/examples/earthquake-clusters.
高端密码学院笔记285 柚子_b4b4
高端幸福密码学院（高级班）幸福使者：李华第（598）期《幸福》之回归内在深层生命原动力基础篇——揭秘“激励”成长的喜悦心理案例分析主讲：刘莉一，知识扩充:成功=艰苦劳动+正确方法+少说空话。贪图省力的船夫，目标永远下游。智者的梦再美，也不如愚人实干的脚印。幸福早课堂2020.10.16星期五一笔记:1，重视和珍惜的前提是知道它的价值非常重要，当你珍惜了，你就真正定下来，真正的学到身上。2，大家需要
从0到500+，我是如何利用自媒体赚钱？一列脚印
运营公众号半个多月，从零基础的小白到现在慢慢懂了一些运营的知识。做好公众号是很不容易的，要做很多事情；排版、码字、引流…通通需要自己解决，业余时间全都花费在这上面涨这么多粉丝是真的不容易，对比知乎大佬来说，我们这种没资源，没人脉，还没钱的小透明来说，想要一个月涨粉上万，怕是今天没睡醒（不过你有的方法，算我piapia打脸）至少我是清醒的，自己慢慢努力，实现我的万粉目标！大家快来围观、支持我吧！孩子
使用Faiss进行高效相似度搜索 llzwxh888 faiss python
在现代AI应用中，快速和高效的相似度搜索是至关重要的。Faiss（FacebookAISimilaritySearch）是一个专门用于快速相似度搜索和聚类的库，特别适用于高维向量。本文将介绍如何使用Faiss来进行相似度搜索，并结合Python代码演示其基本用法。什么是Faiss？Faiss是一个由FacebookAIResearch团队开发的开源库，主要用于高维向量的相似性搜索和聚类。Faiss
python是什么意思中文-在python中%是什么意思编程大乐趣
Python中%有两种：1、数值运算：%代表取模，返回除法的余数。如：>>>7%212、%操作符（字符串格式化，stringformatting），说明如下：%[(name)][flags][width].[precision]typecode(name)为命名flags可以有+，-，''或0。+表示右对齐。-表示左对齐。''为一个空格，表示在正数的左侧填充一个空格，从而与负数对齐。0表示使用0填
数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
关于城市旅游的HTML网页设计——(旅游风景云南 5页)HTML+CSS+JavaScript 二挡起步 web前端期末大作业 javascript html css 旅游风景
⛵源码获取文末联系✈Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业|游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作|HTML期末大学生网页设计作业，Web大学生网页HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScrip
HTML网页设计制作大作业（div+css）云南我的家乡旅游景点带文字滚动二挡起步 web前端期末大作业 web设计网页规划与设计 html css javascript dreamweaver 前端
Web前端开发技术描述网页设计题材，DIV+CSS布局制作,HTML+CSS网页设计期末课程大作业游景点介绍|旅游风景区|家乡介绍|等网站的设计与制作HTML期末大学生网页设计作业HTML：结构CSS：样式在操作方面上运用了html5和css3，采用了div+css结构、表单、超链接、浮动、绝对定位、相对定位、字体样式、引用视频等基础知识JavaScript：做与用户的交互行为文章目录前端学习路线
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
python八股文面试题分享及解析(1) Shawn________ python
#1.'''a=1b=2不用中间变量交换a和b'''#1.a=1b=2a,b=b,aprint(a)print(b)结果：21#2.ll=[]foriinrange(3):ll.append({'num':i})print(11)结果:#[{'num':0},{'num':1},{'num':2}]#3.kk=[]a={'num':0}foriinrange(3):#0,12#可变类型，不仅仅改变
每日算法&面试题，大厂特训二十八天——第二十天（树）肥学 ⚡算法题⚡面试题每日精进 java 算法数据结构
目录标题导读算法特训二十八天面试题点击直接资料领取导读肥友们为了更好的去帮助新同学适应算法和面试题，最近我们开始进行专项突击一步一步来。上一期我们完成了动态规划二十一天现在我们进行下一项对各类算法进行二十八天的一个小总结。还在等什么快来一起肥学进行二十八天挑战吧！！特别介绍小白练手专栏，适合刚入手的新人欢迎订阅编程小白进阶python有趣练手项目里面包括了像《机器人尬聊》《恶搞程序》这样的有趣文章
大伟说成语之唉声叹气求索大伟
＊大伟说成语＊【唉声叹气】叹气：因心里不痛快或不如意而吐出长气，发出声音。因为痛苦、憋闷或感伤而发出叹息的声音。【大伟说】情绪外露，非人类所特有，动物亦有情绪，悲哀和欢乐所表示的情绪亦是不一样的，会嗷嗷大叫也会低吟痛哭。不同的是，人类的情绪更复杂，更多样，更丰富。唉声叹气，可以说是最基础的情绪，因为无奈而举足无措，不知该如何如何化解，只有独自一人慢慢承受，长吁短叹不知如何是好，其实是无能无力的表现
Python快速入门 —— 第三节：类与对象孤华暗香 Python快速入门 python 开发语言
第三节：类与对象目标：了解面向对象编程的基础概念，并学会如何定义类和创建对象。内容：类与对象：定义类：class关键字。类的构造函数：__init__()。类的属性和方法。对象的创建与使用。示例：classStudent:def__init__(self,name,age,major):self.name&#
MongoDB Oplog 窗口喝醉酒的小白 MongoDB 运维
在MongoDB中，oplog（操作日志）是一个特殊的日志系统，用于记录对数据库的所有写操作。oplog允许副本集成员（通常是从节点）应用主节点上已经执行的操作，从而保持数据的一致性。它是MongoDB副本集实现数据复制的基础。MongoDBOplog窗口oplog窗口是指在MongoDB副本集中，从节点可以用来同步数据的时间范围。这个窗口通常由以下因素决定：Oplog大小：oplog的大小是有限
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
ASM系列四利用Method 组件动态注入方法逻辑 lijingyao8206 字节码技术 jvm AOP 动态代理 ASM
这篇继续结合例子来深入了解下Method组件动态变更方法字节码的实现。通过前面一篇，知道ClassVisitor 的visitMethod()方法可以返回一个MethodVisitor的实例。那么我们也基本可以知道，同ClassVisitor改变类成员一样，MethodVIsistor如果需要改变方法成员，注入逻辑，也可以
java编程思想 --内部类百合不是茶 java 内部类匿名内部类
内部类;了解外部类并能与之通信内部类写出来的代码更加整洁与优雅 1,内部类的创建内部类是创建在类中的 package com.wj.InsideClass; /* * 内部类的创建 */ public class CreateInsideClass { public CreateInsideClass(
web.xml报错 crabdave web.xml
web.xml报错 The content of element type "web-app" must match "(icon?,display- name?,description?,distributable?,context-param*,filter*,filter-mapping*,listener*,servlet*,s
泛型类的自定义麦田的设计者 java android 泛型
为什么要定义泛型类，当类中要操作的引用数据类型不确定的时候。采用泛型类，完成扩展。例如有一个学生类 Student{ Student(){ System.out.println("I'm a student....."); } } 有一个老师类
CSS清除浮动的4中方法 IT独行者 JavaScript UI css
清除浮动这个问题，做前端的应该再熟悉不过了，咱是个新人，所以还是记个笔记，做个积累，努力学习向大神靠近。CSS清除浮动的方法网上一搜，大概有N多种，用过几种，说下个人感受。 1、结尾处加空div标签 clear:both 1 2 3 4 .div 1 { background : #000080 ; border : 1px s
Cygwin使用windows的jdk 配置方法 _wy_ jdk windows cygwin
1.[vim /etc/profile] JAVA_HOME="/cgydrive/d/Java/jdk1.6.0_43" (windows下jdk路径为D:\Java\jdk1.6.0_43) PATH="$JAVA_HOME/bin:${PATH}" CLAS
linux下安装maven 无量 maven linux 安装
Linux下安装maven(转) 1.首先到Maven官网下载安装文件，目前最新版本为3.0.3，下载文件为 apache-maven-3.0.3-bin.tar.gz，下载可以使用wget命令； 2.进入下载文件夹，找到下载的文件，运行如下命令解压 tar -xvf apache-maven-2.2.1-bin.tar.gz 解压后的文件夹
tomcat的https 配置,syslog-ng配置 aichenglong tomcat http跳转到https syslong-ng配置 syslog配置
1) tomcat配置https,以及http自动跳转到https的配置 1)TOMCAT_HOME目录下生成密钥(keytool是jdk中的命令) keytool -genkey -alias tomcat -keyalg RSA -keypass changeit -storepass changeit
关于领号活动总结 alafqq 活动
关于某彩票活动的总结具体需求，每个用户进活动页面，领取一个号码，1000中的一个；活动要求 1，随机性，一定要有随机性； 2，最少中奖概率，如果注数为3200注，则最多中4注 3，效率问题，（不能每个人来都产生一个随机数，这样效率不高）； 4，支持断电（仍然从下一个开始），重启服务；（存数据库有点大材小用，因此不能存放在数据库）解决方案 1，事先产生随机数1000个，并打
java数据结构冒泡排序的遍历与排序百合不是茶 java
java的冒泡排序是一种简单的排序规则冒泡排序的原理：比较两个相邻的数，首先将最大的排在第一个，第二次比较第二个，此后一样；针对所有的元素重复以上的步骤，除了最后一个例题；将int array[]
JS检查输入框输入的是否是数字的一种校验方法 bijian1013 js
如下是JS检查输入框输入的是否是数字的一种校验方法： <form method=post target="_blank"> 数字：<input type="text" name=num onkeypress="checkNum(this.form)"><br> </form>
Test注解的两个属性：expected和timeout bijian1013 java JUnit expected timeout
JUnit4：Test文档中的解释：　　The Test annotation supports two optional parameters. 　　The first, expected, declares that a test method should throw an exception. 　　If it doesn't throw an exception or if it
[Gson二]继承关系的POJO的反序列化 bit1129 POJO
父类 package inheritance.test2; import java.util.Map; public class Model { private String field1; private String field2; private Map<String, String> infoMap
【Spark八十四】Spark零碎知识点记录 bit1129 spark
1. ShuffleMapTask的shuffle数据在什么地方记录到MapOutputTracker中的 ShuffleMapTask的runTask方法负责写数据到shuffle map文件中。当任务执行完成成功，DAGScheduler会收到通知，在DAGScheduler的handleTaskCompletion方法中完成记录到MapOutputTracker中
WAS各种脚本作用大全 ronin47 WAS 脚本
　　　http://www.ibm.com/developerworks/cn/websphere/library/samples/SampleScripts.html 　　　无意中，在WAS官网上发现的各种脚本作用，感觉很有作用，先与各位分享一下　　　获取下载这些示例 jacl 和 Jython 脚本可用于在 WebSphere Application Server 的不同版本中自
java-12.求 1+2+3+..n不能使用乘除法、 for 、 while 、 if 、 else 、 switch 、 case 等关键字以及条件判断语句 bylijinnan switch
借鉴网上的思路，用java实现： public class NoIfWhile { /** * @param args * * find x=1+2+3+....n */ public static void main(String[] args) { int n=10; int re=find(n); System.o
Netty源码学习-ObjectEncoder和ObjectDecoder bylijinnan java netty
Netty中传递对象的思路很直观： Netty中数据的传递是基于ChannelBuffer（也就是byte[]）；那把对象序列化为字节流，就可以在Netty中传递对象了相应的从ChannelBuffer恢复对象，就是反序列化的过程 Netty已经封装好ObjectEncoder和ObjectDecoder 先看ObjectEncoder ObjectEncoder是往外发送
spring 定时任务中cronExpression表达式含义 chicony cronExpression
一个cron表达式有6个必选的元素和一个可选的元素，各个元素之间是以空格分隔的，从左至右，这些元素的含义如下表所示：代表含义是否必须允许的取值范围 &nb
Nutz配置Jndi ctrain JNDI
1、使用JNDI获取指定资源： var ioc = { dao : { type :"org.nutz.dao.impl.NutDao", args : [ {jndi :"jdbc/dataSource"} ] } } 以上方法,仅需要在容器中配置好数据源,注入到NutDao即可.
解决 /bin/sh^M: bad interpreter: No such file or directory daizj shell
在Linux中执行.sh脚本，异常/bin/sh^M: bad interpreter: No such file or directory。分析：这是不同系统编码格式引起的：在windows系统中编辑的.sh文件可能有不可见字符，所以在Linux系统下执行会报以上异常信息。解决： 1）在windows下转换：利用一些编辑器如UltraEdit或EditPlus等工具
[转]for 循环为何可恨？ dcj3sjt126com 程序员读书
Java的闭包(Closure)特征最近成为了一个热门话题。一些精英正在起草一份议案，要在Java将来的版本中加入闭包特征。然而，提议中的闭包语法以及语言上的这种扩充受到了众多Java程序员的猛烈抨击。不久前，出版过数十本编程书籍的大作家Elliotte Rusty Harold发表了对Java中闭包的价值的质疑。尤其是他问道“for 循环为何可恨？”[http://ju
Android实用小技巧 dcj3sjt126com android
1、去掉所有Activity界面的标题栏　　修改AndroidManifest.xml 　　在application 标签中添加android:theme="@android:style/Theme.NoTitleBar" 2、去掉所有Activity界面的TitleBar 和StatusBar 　　修改AndroidManifes
Oracle 复习笔记之序列 eksliang Oracle 序列 sequence Oracle sequence
转载请出自出处：http://eksliang.iteye.com/blog/2098859 1.序列的作用序列是用于生成唯一、连续序号的对象一般用序列来充当数据库表的主键值 2.创建序列语法如下： create sequence s_emp start with 1 --开始值 increment by 1 --増长值 maxval
有“品”的程序员 gongmeitao 工作
完美程序员的10种品质　　完美程序员的每种品质都有一个范围，这个范围取决于具体的问题和背景。没有能解决所有问题的完美程序员（至少在我们这个星球上），并且对于特定问题，完美程序员应该具有以下品质：　　1. 才智非凡- 能够理解问题、能够用清晰可读的代码翻译并表达想法、善于分析并且逻辑思维能力强（范围：用简单方式解决复杂问题）　　
使用KeleyiSQLHelper类进行分页查询 hvt sql .net C#asp.net hovertree
本文适用于sql server单主键表或者视图进行分页查询，支持多字段排序。KeleyiSQLHelper类的最新代码请到http://hovertree.codeplex.com/SourceControl/latest下载整个解决方案源代码查看。或者直接在线查看类的代码：http://hovertree.codeplex.com/SourceControl/latest#HoverTree.D
SVG 教程（三）圆形，椭圆，直线天梯梦 svg
SVG <circle> SVG 圆形 - <circle> <circle> 标签可用来创建一个圆：下面是SVG代码： <svg xmlns="http://www.w3.org/2000/svg" version="1.1"> <circle cx="100" c
链表栈 luyulong java 数据结构
public class Node { private Object object; private Node next; public Node() { this.next = null; this.object = null; } public Object getObject() { return object; } public
基础数据结构和算法十：2-3 search tree sunwinner Algorithm 2-3 search tree
Binary search tree works well for a wide variety of applications, but they have poor worst-case performance. Now we introduce a type of binary search tree where costs are guaranteed to be loga
spring配置定时任务 stunizhengjia spring timer
最近因工作的需要，用到了spring的定时任务的功能,觉得spring还是很智能化的,只需要配置一下配置文件就可以了,在此记录一下，以便以后用到： //------------------------定时任务调用的方法------------------------------ /** * 存储过程定时器 */ publi
ITeye 8月技术图书有奖试读获奖名单公布 ITeye管理员活动
ITeye携手博文视点举办的8月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 8月试读活动回顾： http://webmaster.iteye.com/blog/2102830 本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《跨终端Web》 gleams：http