asdhfih

数据分析入门知识点

数据分析步骤
概念：数据分析是用适当的统计方法对收集的大量数据进行分析，提取有用的信息，对数据加以分析和概括的过程

数据分析师需要具备的能力
数理知识（数学能力）
数据获取加工能力
行业知识

1明确目的思路
2数据收集
3数据处理
4数据分析
5数据展现

数据加载 read_csv

read_csvz方法读取文件，返回的是DataFrame对象，默认将第一行作为DataFrame的列标签
设置header=None，csv文件第一行就不会作为列标签

sep/delimiter 可以通过这两个参数设置分隔符的样式

names参数可以可以设置列索引
index_col参数可以设置行索引
df=pd.read_csv(‘data.csv’,header=None,index_col=0)
输出的结果，就会把第一列作为行索引

usecols参数可以获得读取的文件中我们所需要的数据

df=pd.read_csv(‘data.csv’,usecols=[1,2])
输出结果只显示第一列和第二列的数据

从数据库中获取数据
import pymysql
con=pymysql.connect(‘localhost’,‘root’,‘123456’,‘要读取的数据库名’)
df=pd.read_sql(‘select * from 表名’,con)
display(df.head())

写入csv文件to_csv
index:是否写入行索引，默认是True
index_lable:索引字段的名称
header：是否写入列索引，默认是True
na_rep:空值表示
columns:写入的字段，默认是全部写入
sep：分隔符

创建df对象
df=pd.DataFrame(np.array(1,10).reshape(3,3))
将df对象写入csv
df.to_csv(‘data.csv’)

可以通过index参数来设置是否写入行索引，默认情况下index=True，当index=False时，写入的文件没有行索引的标签

可以通过header参数来设置列索引的写入，header=True表示的是写入，header=False表示的不写入

空值默认写入到文件中不显示，na_rep指定空值在文件中的显示效果
df.to_csv(‘data.csv’,header=False,na_rep=‘空’)
在文件中，空值的显示效果是’空’

columns参数可以设置DataFrame对象的哪些列可以写入到文件中，默认是写入所有列
df.to_csv(‘data.csv’,header=False,columns=[1,2])表示的是只把第一第二列写入到文件中

数据清洗
概念：收集到的数据无法保证数据一定准确，有效的，需要进行清洗，包括一下步骤

1处理缺失值
2处理异常值
3处理重复值

发现缺失值
info：检查缺失值使用info对整体数据进行查看，显示DataFrame对象的每列信息
display(df.info())

isnull:display(df.isnull())也会显示DataFrame的缺失值，会把所有的数据以true和false的形式，也可单独的显示某一列的数据display(df[10].isnull())表示的是只显示第10列所有的信息，单一的isnull方法在查找缺失值时候很麻烦，结合any方法display(df[10].isnull().any())
如果返回的是True，说明存在至少一个缺失值
notnull：和isnull方法一样

丢弃缺失值
对于缺失值可以通过dropna方法进行丢弃处理，如果不传入任何参数，只要存在缺失值就会默认删除整行数据display(df.dropna())，有以下参数
how：指定dropna丢弃缺失值行为，默认是any
axis：指定丢弃行还是列，默认是丢弃行
thresh：当非空数值达到该值时，保留数据，否则删除
inplace：在指定是否默认修改啊，默认是False

填充缺失值
对于缺失值可以用filna方法进行填充display(df.fillna(1000))表示的是对于缺失值用1000来填充，有以下参数

value：填充所用的值，可以是一个字典，这样为DataFrame不同列指定不同填充值dislpay(df.fillna({5:100,10:1000}))表示的第五列的缺失值用100填充，第十列的缺失值用1000填充

method：指定上一个有效值填充(pad/fill)，还是下一个有效值填充(backfill/bfill)

limit：如果指定method，表示最大NaN的填充数量，如果没有指定method，表示中最大的NaN填充数量

inplace：指定是否就地修改，默认是False

无效值处理
检测无效值：用DataFrame中的describe方法查看数据统计，不同类型统计信息不同基于统计信息，结合业务来检查无效值display(df.describe())会返回数据中的统计，均值，方差，标准差，最大值和最小值

重复值处理
发现重复值：用duplicated方法发现重复值，该放大法返回Series对象，值为布尔类型，表示是否于上一行重复，一般结合any方法整个数据是否重复的数据display(df.duplicated().any()) 有以下参数

subset：可以指定自定义重复规则，默认是所有数据重复才算重复，可有指定设置列
display(df.duplicated(subset=[0,1]))表示的是只要第一列和第二列里面有重复的数据就算是重复数据

keep:display(df.duplicated(keep=‘first’))表示的是后面的数据标记为True
display(df.duplicated(keep=‘last’))表示的前面的数据标记为True
display(df.duplicated(keep=False))表示的是所有重复数据都标记为True，不重复的数据为Fslse

数据过滤
使用布尔数组或者索引数组来过滤数据，另外引入可以使用DataFrame的query方法了来进行数据过滤，如果query方法中使用外面定义的变量需要在变量上加上@

给定一个条件，根据条件生成布尔数组
将得到的布尔数组传回给DataFrame对象进行过滤
语法：
display(df[df[‘a’]==1])表示的是在a列里面，只显示数据是1的数据

如果有多个条件
语法：用小括号括起来每个条件然后用&连接再赋给一个变量，最后输出这个变量
f=(df[‘a’]==1)&(df[‘b’]==1)
display(f)

数据转接
应用与映射
Series和DataFrame都有对元素的映射转换操作，DataFrame作为二位数据具有行和列对应转换操作，对于Serise，可以调用apply或者map方法，对于DataFrame可以调用apply和applymap方法

apply：传入函数实现映射转化，函数参数，Serise传递参数，DataFrame传递行和列对象

map：对当前Serise的值进行映射转换，参数可以是Serise，字典或者函数

applymap：传入函数实现元素的映射转换

元素替换
replace函数
df=df.replace(‘a’,‘b’)把a换成b

对单一的值进行替换
df=df[‘a’].replace(‘c’,‘d’)把a列的c换成d

支持列表多个值，每个替换不同的值，列表执行对应位置转换
s=df[‘a’].replace([‘c’,‘d’],[‘e’,‘f’])把a列中的c和d转换成e和f

replace支持字典方式
s=df[‘a’].replace({‘c’:‘d’,‘e’:‘f’})把a列中的c和d转换成e和f

replace可以是用map或者applymap来实现

def m(item):
if item==‘a’
return b
return item

s=df[a].map(m)
display(s.head())
通过自定义一个方法来实现替换

数据转换子字符串向量操作

Series含有syr属性通过str能对字符串进行想量级运算从而对数据进行转换

s=pd.Serise([‘a’,‘b’,‘c’])
display(s.str)

display(s.str.upper())把 a b c转换成大写A B C

display(s.str.contains(‘b’))输出包含b的布尔类型
输出结结果：
0 Falase
1 True
2 False

对数据进行过滤
ba=df[a].str.endwith(‘CA’)
display(ba) 过滤出a列中以CA结尾的数据

对数据进行切分
display(df[‘a’].str.split(’,’))对a列数据以‘ ， ’分割

数据合并
concat：display(pd.concat((df1,df2)))进行cancat连接的时候，根据索引（默认索引）对齐合并，如果不对齐，产生空值,
有以下参数
df1=pd.DataFrame(np.arange(9).reshape(3,3))
df1=pd.DataFrame(np.arange(10,19).reshape(3,3))
输出结果分别是
0 1 2
0 1 2 3
1 4 5 6
2 7 8 9

0 1 2
0 11 12 13
1 14 15 16
2 17 18 19

axis：指定连接轴（默认是0）axis=0垂直方向，axis=1水平方向
concat：display(pd.concat((df1,df2),axis=1))
0 1 2 0 1 2
0 1 2 3 11 12 13
1 4 5 6 14 15 16
2 7 8 9 17 18 19

join：指定连接方式，默认是外连接参数，参数值outer：并集，inner：交集
concat：display(pd.concat((df1,df2),jion=‘inner’)) 输出结果只显示公共内容：
1 2
0 2 3
1 5 6
2 8 9
如果join=outer则显示全部数据，没有值默认是Nan

keys：用来区分不同的数据组（来源）
display(pd.concat((df1,df2),keys=[‘df1’,df2]))
输出的结果和join=outer一样，只是前面多了df1和df2的行索引

join_axes：指定连接结果集中保留的索引
df1=pd.DataFrame(np.arange(9).reshape(3,3))
df1=pd.DataFrame(np.arange(10,19).reshape(3,3),columns=[1,2,3])
display(pd.concat((df1,df2),join_axes=[df1.columns]))输出结果
0 1 2
0 1.0 2 3
1 4.0 5 6
2 7.0 8 9
0 NaN 10 11
1 NaN 13 14
2 NaN 16 17

ignore_index:忽略原来索引，创建新的整数序列索引，默认为False

0 1 2 3
0 1.0 2 3 NaN
1 4.0 5 6 NaN
2 7.0 8 9 NaN
3 NaN 10 11 12.0
4 NaN 13 14 15.0
5 NaN 16 17 18.0

merge
数据库内连接步骤：1数据组合，2根据等值条件显示
DataFrame merge连接步骤：1数据组合，2根据等值显示
列名都相同，且列值也想相同

join连接
join连接方式和merge一样，数据组合，根据等值显示
join和merge的区别：

创建多级索引
创建方式
第一种：我们在创建Series或者DataFrame的时候，通过index(columns)参数传递多维数组，进而创建多级索引，多级索引可以通过names属性设置名称，每级索引的元素个数相同
第二种：我们通过Multiindex方法创建Multiindex对象，然后作为Series和DataFrame的index(columns)参数值，同样可以通过names参数值指定多层索引的名称

import pandas as pd
import numpy as np
from IPython.core.display import display
##创建单层索引
s=pd.Series([1,1,3,4],index=[[‘湖南’,‘湖南’,‘北京’,‘北京’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])
display(s)
##多层索引，为每一层索引指定名称
s.index,names=[‘省份’,‘城市’]
##输出结果
省份城市
湖南长沙 1
衡阳 1
北京海淀 3
昌平 4

from_arrays:接收一多维数组，高维指定高层索引，低维指定低层索引
##Series创建多级索引通过创建Multiindex对象，试纸给index参数
##from_arrays,通过穿件了列表的方式创建[[第一级索引],[第二集索引],…[第n级索引]]

m=pd.MultiIndex.from_arrays([[‘湖南’,‘湖南’,‘北京’,‘北京’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])
n=pd.Series([1,2,3,4],index=m)
display(n)
输出结果
湖南长沙 1
衡阳 2
北京海淀 3
昌平 4

from_tuples:接收一个元素作为列表，每个元组在指定每个索引（高维索引，低维索引）
##from_tuples通过元组构成列表[(第一级元素，第二集元素),(第一级元素索引，第二级元素索引)]
a=pd.MultiIndex.from_tuples([(‘湖南’,‘长沙’),(‘湖南’,‘长沙’),(‘北京’,‘海淀’),(‘北京’,‘昌平’)])
b=pd.Series([1,2,3,4],index=a)
display(b)
输出结果：
湖南长沙 1
长沙 2
北京海淀 3
昌平 4

from_product:接收一个可迭代对象列表，根据可迭代对象列表中的元素的笛卡尔积创建多级索引
##from_prodect通过笛卡尔积方式创建Multiindex对象设置给index参数
m=pd.MultiIndex.from_product([[‘湖南’,‘北京’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])
s=pd.Series(np.arange(1,9),index=m)
display(s)
输出结果：
湖南长沙 1
衡阳 2
海淀 3
昌平 4
北京长沙 5
衡阳 6
昌平 8
enter description here

DataFrame创建行级索引*
它和Series多级索引创建没什么区别，方式一：index参数多维数组，方式二：通过MultiIndex类的方法(from_arrays from_tuples from_product)创建MultiIndex对象，设置index

df=pd.DtaFrame(np.arange(1,9).reshape(4,2),index=[[‘湖南’,‘湖南’,‘北京’,‘北京’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])

###from_arrays
m=pd.MultiIndex.from_arrays([[‘湖南’,‘湖南’,‘北京’,‘北京’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])
df=pd.DataFrame(np.arange(1,9).reshape(4,2),index=m)
display(df)

##from_tuples
m=pd.MultiIndex.from_tuples([(‘湖南’,‘长沙’),(‘湖南’,‘长沙’),(‘北京’,‘海淀’),(‘北京’,‘昌平’)])
df=pd.DataFrame(np.arange(1,9).reshape(4,2),index=m)
display(df)

##from_product
m=pd.MultiIndex.from_product([[‘湖南’,‘长沙’],[‘长沙’,‘衡阳’,‘海淀’,‘昌平’]])
df=pd.DataFrame(np.arange(1,17).reshape(8,2),index=m)
display(df)
输出结果：
0 1
湖南长沙 1 2
衡阳 3 4
海淀 5 6
昌平 7 8
长沙长沙 9 10
衡阳 11 12
海淀 13 14
昌平 15 16

DtaFrame列多级索引
DataFrame创建列多层索引和行创建多层索引类似，区别在于DataFrame设置给参数columns

df=pd.DtataFrame(np.array([[1,1,1,1],[2,1,2,1]]),index=[‘七里香’,‘双节棍’],columns=[[‘中文’,‘中文’,‘english’,‘english’],[‘喜欢’,‘不喜欢’,‘like’,‘dislike’]])
display(df)

输出结果：
中文 english
喜欢不喜欢 like dislike
七里香 1 1 1 1
双节棍 2 1 2 1

Serises多层索引
多层索引同样支持单层索引的相关操作，列如索引元素，切片，索引数组原则元素等，我们也可以根据多级索引，按照层次逐级选择元素，多层元素优势通过高层次索引，来操作整个索引数组的数据操作语法：
s[操作]
s.loc[操作]
s.iloc[操作]
操作可以是索引，切片，数组索引

Series多层索引
loc：标签索引操作，通过多层索引操作获取该索引对应的一组值
s=pd.Series([1,2,3,4],index=[[‘北京’,‘北京’,‘湖南’,‘湖南’],[‘海淀’,‘昌平’,‘长沙’,‘衡阳’]])
display(s)
##直接使用外层索引，不支持内层索引访问，先从外层索引找，因为外层索引没有‘长沙’，所以会报错
display(s.loc[‘湖南’])
输出结果：
北京海淀 1
昌平 2
湖南长沙 3
衡阳 4
dtype: int64
长沙 3
衡阳 4

##外层加内层索引逐层访问
display(s.loc[‘湖南’,‘长沙’])
输出结果：
dtype: int64
3

iloc：位置索引操作获取对应位置的元素值与是否多层索引无关
display(s.iloc[0])
输出结果：
1

切片操作
##切片操作，根据标签切片，注意：切片操作需要先排好序列（字典顺序）
s=s.sort_index()
display(s.loc[‘北京’:‘湖南’])
输出结果：
北京昌平 2
海淀 1
湖南衡阳 4
长沙 3
##根据位置切片
##根据位置切片
s=s.sort_index()
display(s.iloc[0:1])
输出结果：
北京昌平 2

DataFrame多层索引
loc：标签索引操作，通过多层索引，获取该索引对应的一组值
s= pd.MultiIndex.from_product([[‘湖南’,‘北京’],[‘2017’,‘2018’]])
df=pd.DataFrame(np.array([[800],[8100],[1200],[1150]]),index=s)
##使用外层索引访问，同样不支持直接从内层开始访问
print(df.loc[‘湖南’])
输出结果：
0
2017 800
2018 8100

##通过外层加内层逐渐层访问，得到一行数据
display(df.loc[‘湖南’,‘2017’])
输出结果：
0 8000

iloc：位置索引，获取对应位置的一行数据，与是否多层索引无关

display(df.iloc[0])
输出结果：
Name: (湖南, 2017), dtype: int32

切片操作
##切片操作
df=df.sort_index()
print(df.loc[‘北京’:‘湖南’])
输出结果：
0
北京 2017 1200
2018 1150
湖南 2017 800
2018 8100

##混合操作要设置axis=0
df = df.sort_index()
display(df.loc(axis=0)[:,‘2017’])注意：loc后面必须要加loc(axis=0)不然系统不知道我们指定的是行，如果是Series就可以不用加，因为Series是一维数据

位置切片
##位置切片
print(df.iloc[0:1])
输出结果：
0
北京 2017 1200

索引交换
我们可以通过调用DataFame对象的swaplevel方法交换两个层级索引，该方法默认对倒数第二层和倒数第一层进行交换。我们可以指定交换的层级，层次从0开始，由外向内递增，也可以指定负值负值表示倒数第n层，我们可以通过层级索引的名称进行交换。
m=pd.MultiIndex.from_arrays([[‘湖南’,‘湖南’,‘北京’,‘北京’],[‘东部’,‘西部’,‘东部’,‘西部’]])
df=pd.DataFrame(np.arange(1,9).reshape(4,2),index=m)
display(df.swaplevel())
输出结果：
0 1
东部湖南 1 2
西部湖南 3 4
东部北京 5 6
西部北京 7 8

我们还可以自定义交换的层数，层级是从外向内一次是第0层，第一层，第n层
display(df.swaplevel(0,2))
表示的将第0层和第2层的索引进行交换

也可以根据列名交换，首先得设置列名
df.index.names=[‘a’,‘b’,‘c’]
display(df.swaplevel(‘a’,‘c’))
表示也是把第0层和第2层交换索引

索引排序
我们可以用sort_index的方法对索引进行排序
level：指定根据哪一层进行排序，默认是最外层，level可以是数值，索引名或者是二者构成的列表
inplace：是否就地修改，默认是False

索引的堆叠

通过DataFrame对象的stack的方法可以进行索引的堆叠，即，将指定层级的列转换成行
level：level参数指定转换的层级，默认是-1

通过DataFrame的unstack的方法可以取消索引的堆叠，即，将指定的层级转换成列
level参数指定转换的层级，默认是-1
fill_value参数指定填充值，默认是NaN

取消堆叠操作，可能会产生NaN，避免空值，填充数据使用fill_value
df=pd.DataFrame(np.arange(1,9).reshape(4,2),index=[[‘B’,‘A’,‘B’,‘A’],[‘a1’,‘a1’,‘b1’,‘c1’],[‘a2’,‘b2’,‘b2’,‘c2’]])
df=df.unstack(fill_value=0)
print(df)
输出结果：
0 1
a2 b2 c2 a2 b2 c2
A a1 0 3 0 0 4 0
c1 0 0 7 0 0 8
B a1 1 0 0 2 0 0
b1 0 5 0 0 6 0

如过不指定要转换的列，默认是从最里面的开始，也可以通过lecel指定要转换的列
df=df.unstack(level=0,fill_value=0)
print(df)

将行索引堆叠到列上面

df=pd.DataFrame(np.array([[‘1’,‘1’,‘1’,‘1’],[‘2’,‘1’,‘2’,‘1’]]),index=[‘七里香’,‘双节棍’],columns=[[‘中文’,‘中文’,‘english’,‘english’],[‘喜欢’,‘不喜欢’,‘like’,‘dislike’]])

##获取七里香的中文信息，在列索引上，0表示最外层的索引
df=df.stack(0)
print(df)
输出结果：
dislike like 不喜欢喜欢
七里香 english 1 1 NaN NaN
中文 NaN NaN 1 1
双节棍 english 1 2 NaN NaN
中文 NaN NaN 1 2

索引的设置
在DataFrame中我们需要你将现有的某一列或者多列进行索引，可以调用set_index方法实现，参数如下
droyop：是否丢弃作为新索引列，默认为True
append：是否以追加方式设置索引，默认为False
inplace：是否就地修改，默认为False

df=pd.DataFrame({‘stno’:[1,2,3],‘sname’:[‘zs’,‘li’,‘ww’],‘age’:[15,16,17]})
print(df)
输出结果：
stno sname age
0 1 zs 15
1 2 li 16
2 3 ww 17

##设置索引
print(df.set_index([‘stno’,‘name’]))
输出结果：
age
stno name
1 zs 15
2 li 16
3 ww 17

###默认情况下充当列索引的数据丢弃，设置drip=False保留列数据
print(df.set_index(‘stno’,drop=False))
输出结果：
stno name age
stno
1 1 zs 15
2 2 li 16
3 3 ww 17

##append用来设置是否以追加的方式设置索引，默认False(取代之前的索引)

##append用来设置是否以追加的方式设置索引，默认False(取代之前的索引)
df.set_index(‘stno’,inplace=True)
print(df)
df.set_index(‘name’,inplace=True)
print(df)
输出结果：
name age
stno
1 zs 15
2 li 16
3 ww 17
age
name
zs 15
li 16
ww 17
通过设置append的参数，以追加模式添加行索引
df.set_index(‘stno’,inplace=True)
print(df)
df.set_index(‘name’,inplace=True,append=True)
print(df)
输出结果：
name age
stno
1 zs 15
2 li 16
3 ww 17
age
stno name
1 zs 15
2 li 16
3 ww 17

重置索引
reset_index是重置索引，与set_index相反，参数如下
level：重置索引层次，默认重置所有层级的索引，如果重置所有的索引，将会创建默认整数序列索引
drop：是否丢弃重置索引，默认是False
inplace：是否就地修改，默认是False

import numpy as np
import pandas as pd
df=pd.DataFrame({‘stno’:[1,2,3],‘name’:[‘zs’,‘li’,‘ww’],‘age’:[15,16,17]})
##设置层级行索引
df.set_index([‘stno’,‘name’],inplace=True)
print(df)
##重置索引，默认是重置所有层级的行级索引，重新生成整数序列作为行索引
print(df.reset_index())
输出结果：
age
stno name
1 zs 15
2 li 16
3 ww 17
stno name age
0 1 zs 15
1 2 li 16
2 3 ww 17

##重置索引后，默认将重置的行索引充当新的列，如果不想将重置后的行索引重当列，设置drop=True
import numpy as np
import pandas as pd

df=pd.DataFrame({‘stno’:[1,2,3],‘name’:[‘zs’,‘li’,‘ww’],‘age’:[15,16,17]})
##设置层级行索引
df.set_index([‘stno’,‘name’],inplace=True)
print(df)
##重置索引，默认是重置所有的行级索引

print(df.reset_index())

print(df.reset_index(0,drop=True))
输出结果：
age
stno name
1 zs 15
2 li 16
3 ww 17
age
name
zs 15
li 16
ww 17

分组与聚合
分组与聚合与数据库分组和聚合类似

group分组
我们可以通过group操作对Series和DataFrame对象进行分组操作，该方法返回一个分组对象，分组对象属性和方法如下
groups属性：返回一个字典类型对象，包含分组信息
size方法：返回每组记录数量
describe方法：分组查看统计信息

迭代
使用for循环对分组对象进行迭代，迭代每次返回一个元组，第一个元素为分组的key，第二个元素为该组对应的数据

分组方式：
使用groupby进行分组时，分组方式可以是一下形式：
索引名：根据该索引进行分组
索引名构成的分组：根据数组中多个索引进行分组
字典或者Seires：key指定索引，value指定分组依据，value值相等的分为一组
函数：接受索引，返回分组依据的value值

apply：对分组对象可以调用apply函数，该函数接受每个组的数据，返回操作之后的结果，apply最后将每个组的操作结果进行合并（concat）

import numpy as np
import pandas as pd

df=pd.DataFrame({‘部门’:[‘研发’,‘财务’,‘研发’,‘财务’],‘项目组’:[‘一组’,‘二组’,‘二组’,‘一组’],
‘姓名’:[‘张三’,‘李四’,‘王五’,‘赵六’],‘年龄’:[‘20’,‘21’,‘22’,‘23’],
‘利润’:[‘5’,‘10’,‘10’,‘25’]})
print(df)
输出结果：
部门项目组姓名年龄利润
0 研发一组张三 20 5
1 财务二组李四 21 10
2 研发二组王五 22 10
3 财务一组赵六 23 25

##根据部门分组
groups=df.groupby(‘部门’)
##分组对象不想列表，可以讲分组后的内容直接输出，其类型是DataFrameGroupBy object
print(groups)
##分组对象虽然不能直接输出，但是是可以迭代的对象（元组），可以通过for循环迭代每组的数据
for k,v in groups:
print(k,v)
输出结果：
研发
部门项目组姓名年龄利润
0 研发一组张三 20 5
2 研发二组王五 22 10

财务
部门项目组姓名年龄利润
1 财务二组李四 21 10
3 财务一组赵六 23 25

##通过group属性查看分组对象属性和方法(以字典形式返回结果)
print(groups.groups)
输出结果：
{‘研发’: Int64Index([0, 2], dtype=‘int64’), ‘财务’: Int64Index([1, 3], dtype=‘int64’)}

##多个索引列分组
groups=df.groupby([‘部门’,‘项目组’])
输出结果：
(‘研发’, ‘一组’) 部门项目组姓名年龄利润
0 研发一组张三 20 5
(‘研发’, ‘二组’) 部门项目组姓名年龄利润
2 研发二组王五 22 10
(‘财务’, ‘一组’) 部门项目组姓名年龄利润
3 财务一组赵六 23 25
(‘财务’, ‘二组’) 部门项目组姓名年龄利润
1 财务二组李四 21 10

##根据函数分组

##根据函数分组
##函数需要一个参数，用来接收行索引值，函数还需要有返回值，用来指定组
##根据需求将<10和>=10的人员分组，得到两组
##先将利润设置成行索引，用set_index函数
df=df.set_index(‘利润’)
def group_handle(index):
if int(index)<10:
return 0
return 1

group=df.groupby(group_handle)
for k,v in group:
print(k,v)
输出结果：
0

部门 项目组  姓名  年龄

利润
5 研发一组张三 20

部门 项目组  姓名  年龄

利润
10 财务二组李四 21
10 研发二组王五 22
25 财务一组赵六 23

##根据索引值分组
group=df.groupby({‘姓名’:0,‘利润’:0,‘部门’:1,‘项目组’:1},axis=1)
for k,v in group:
display(k,v)

输出结果：
0.0
姓名利润
0 张三 5
1 李四 10
2 王五 10
3 赵六 25
1.0
部门项目组
0 研发一组
1 财务二组
2 研发二组
3 财务一组

分组后统计

##先进行分组
group=df.groupby(‘部门’)
for k, v in group:
display(k,v)
##对分组数据统计（聚合）
display(group.sum())
输出结果：

研发
部门项目组姓名年龄利润
0 研发一组张三 20 5
2 研发二组王五 22 10
财务
部门项目组姓名年龄利润
1 财务二组李四 21 10
3 财务一组赵六 23 25

  年龄 利润

部门
研发 42 15
财务 44 35

##所有数值型相加，字符串型拼接
display(df.sum())
##设置DataFrame只对数值型做统计，指定参数 numeric_only=Ture
displsy(df.sum(numeric_only=Ture))

##对分组数据中指定列数据进行统计
group=df.groupby(‘部门’)
print(group[‘利润’].sum())
输出结果：
部门
研发 15
财务 35
Name: 利润, dtype: int64

数据分组中的apply方法
对分组函数可以用apply函数，该函数接收每个组的数据，返回操作之后
的结的果，apply最后将每个组的操作结果进行合并（concat）
##对分组对象进行applly，apply接收函数实现对分组操作
##函数具有一个参数，一次接收分组数据，返回每一个分组处理的结果，然后最终apply将结果合并
##注意点：apply对于第一个分组数据会调用两次，但是不会影响我们的结果
group=df.groupby(‘部门’)
group.apply(lambda x:print(x))
输出结果：
部门项目组姓名年龄利润
0 研发一组张三 20 5
2 研发二组王五 22 10

部门项目组姓名年龄利润
0 研发一组张三 20 5
2 研发二组王五 22 10

部门项目组姓名年龄利润
1 财务二组李四 21 10
3 财务一组赵六 23 25

##对每组数据进行求和的统计x.sum()
print(group.apply(lambda x:x.sum()))
输出结果：
部门项目组姓名年龄利润
部门
研发研发研发一组二组张三王五 42 15
财务财务财务二组一组李四赵六 44 35

聚合中的agg方法
聚合：可以分组对象进行聚合（多个值变成一个值），例如mean(),sum()等
除此之外，我们可以调用agg方法，实现自定义聚合方式，函数接受一行或者一列数据，返回该行或者列的聚合后的结果。

##agg方法实现对DataFrame，分组对象的聚合，可以传入四种参数，字符串，字典，列表，函数
##创建对象
df=pd.DataFrame({‘部门’:[‘研发’,‘财务’,‘研发’,‘财务’],‘项目组’:[‘一组’,‘二组’,‘二组’,‘一组’],
‘姓名’:[‘张三’,‘李四’,‘王五’,‘赵六’],‘年龄’:[20,21,22,23],
‘利润’:[5,10,10,25]})

##分组
group=df.groupby(‘部门’)

##1,传入字符串
print(df.agg(‘mean’,numeric_only=True),df.agg(‘sum’,numeric_only=True))
输出结果：
年龄 21.5
利润 12.5
dtype: float64
年龄 86
利润 50
dtype: int64

##2，多个字符串构成的列表
print(df.agg([‘sum’,‘mean’]))
输出结果：
部门项目组姓名年龄利润
sum 研发财务研发财务一组二组二组一组张三李四王五赵六 86.0 50.0
mean NaN NaN NaN 21.5 12.5

##agg的四种传入方式，3传入字典 {k1:v1}
print(df.agg({‘利润’:[‘sum’,‘mean’],‘年龄’:[‘max’,min]}))
输出结果：
利润年龄
max NaN 23.0
mean 12.5 NaN
min NaN 20.0
sum 50.0 NaN

print(group.agg([‘mean’,‘sum’]))
输出结果：
年龄利润
mean sum mean sum
部门
研发 21 42 7.5 15
财务 22 44 17.5 35

你可能感兴趣的:(原创,数据分析)

绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
Pyecharts数据可视化大屏：打造沉浸式数据分析体验我的运维人生信息可视化数据分析数据挖掘运维开发技术共享
Pyecharts数据可视化大屏：打造沉浸式数据分析体验在当今这个数据驱动的时代，如何将海量数据以直观、生动的方式展现出来，成为了数据分析师和企业决策者关注的焦点。Pyecharts，作为一款基于Python的开源数据可视化库，凭借其丰富的图表类型、灵活的配置选项以及高度的定制化能力，成为了构建数据可视化大屏的理想选择。本文将深入探讨如何利用Pyecharts打造数据可视化大屏，并通过实际代码案例
Day1笔记-Python简介&标识符和关键字&输入输出 ~在杰难逃~ Python python 开发语言大数据数据分析数据挖掘
大家好，从今天开始呢，杰哥开展一个新的专栏，当然，数据分析部分也会不定时更新的，这个新的专栏主要是讲解一些Python的基础语法和知识，帮助0基础的小伙伴入门和学习Python，感兴趣的小伙伴可以开始认真学习啦！一、Python简介【了解】1.计算机工作原理编程语言就是用来定义计算机程序的形式语言。我们通过编程语言来编写程序代码，再通过语言处理程序执行向计算机发送指令，让计算机完成对应的工作，编程
pyecharts——绘制柱形图折线图 2224070247 信息可视化 python java 数据可视化
一、pyecharts概述自2013年6月百度EFE(ExcellentFrontEnd）数据可视化团队研发的ECharts1.0发布到GitHub网站以来，ECharts一直备受业界权威的关注并获得广泛好评，成为目前成熟且流行的数据可视化图表工具，被应用到诸多数据可视化的开发领域。Python作为数据分析领域最受欢迎的语言，也加入ECharts的使用行列，并研发出方便Python开发者使用的数据
【无标题】达瓦达瓦 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
上图为是否色发 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
143234234123432 JhonKI 考研
博客主页：https://blog.csdn.net/2301_779549673欢迎点赞收藏⭐留言如有错误敬请指正！本文由JohnKi原创，首发于CSDN未来很长，值得我们全力奔赴更美好的生活✨文章目录前言111️‍111❤️111111111111111总结111前言111骗骗流量券，嘿嘿111111111111111111111111111️‍111❤️111111111111111总结11
《Python数据分析实战终极指南》 xjt921122 python 数据分析开发语言
对于分析师来说，大家在学习Python数据分析的路上，多多少少都遇到过很多大坑**，有关于技能和思维的**：Excel已经没办法处理现有的数据量了，应该学Python吗？找了一大堆Python和Pandas的资料来学习，为什么自己动手就懵了？跟着比赛类公开数据分析案例练了很久，为什么当自己面对数据需求还是只会数据处理而没有分析思路？学了对比、细分、聚类分析，也会用PEST、波特五力这类分析法，为啥
道阻且长，行则将至 sweet橘子
本文参与书香澜梦主题征文“行”文章原创首发，文责自负。我们每一个人都应该有属于自己的愿望或者是理想，人一但有了理想也就算是有了方向，它就会像灯塔一样指引我们前进的方向，哪怕是再远大的理想，如果坚持，那么我相信它就一定有收获。屈原是我最喜欢的一个浪漫主义的诗人，他曾今说过：“路漫漫其修远兮，吾将上下而求索。”人生的道路很长，但是为了实现自己的理想抱负我愿意付出我毕生的精力，只专注这一件事，因为“道阻
【勾心原创】《去年夏天》不勾心的豆角
（原创作者：不勾心的豆角）本期【勾心原创】，继续本人不勾心的豆角的现代诗创作之旅。《去年夏天》原创作者：不勾心的豆角那里芳草茵茵绿柳成行澄净蓝天下屋顶们相亲相爱闪着橙色紫色的馨香溪流温柔偎依着村庄牛儿羊儿信步徜徉还有成群的白鸽在尖顶的教堂盘旋歌唱孩子们是自由的蒲公英奔跑在希望的田野上任由天真的笑声肆无忌惮烂漫这人间天堂夜幕小心翼翼呵护着甜美的梦乡只剩尽职的晚风陪伴顽皮的星子们游荡快告诉我心爱的姑娘
Python开发常用的三方模块如下：换个网名有点难 python 开发语言
Python是一门功能强大的编程语言，拥有丰富的第三方库，这些库为开发者提供了极大的便利。以下是100个常用的Python库，涵盖了多个领域：1、NumPy，用于科学计算的基础库。2、Pandas，提供数据结构和数据分析工具。3、Matplotlib，一个绘图库。4、Scikit-learn，机器学习库。5、SciPy，用于数学、科学和工程的库。6、TensorFlow，由Google开发的开源机
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人北京大数据苏焕之
《如不承诺天长地久，怎会相遇细水长流》文/苏暖人原创——莫转载粘贴有人选择昙花一现，如大理的花海，有人选择细水长流，如雨夜的浪漫。都说，五分喜欢的人恨不得将他挂在嘴边，十分喜欢的人却只舍得放在心里边了，在爱情眼里，对方说的每一句话都在乎你的感受，TA的眼里也只有你，我想也是这样！说起我的爱情，我也喜欢过一个忧郁的女孩，她喜欢的男孩不喜欢她，于是我成了她倾诉的朋友＋备胎，一年来我们互相推荐伤感的歌曲
古风原创慕白漓
【江南月】词:慕白漓曲:《庐州月》西厢一语惊醒梦中月光佳人为何素眉不添淡妆抚帕刺秀绵缎一缕清香南望飞雁又归西方城外又闻秋稻泛黄成殇细雨纷飞里春又归乡离家而去的你是否迷失彷徨一句诺言永记心上家书一封道尽咏平常青草才青暮色又飘扬等也难当回又何妨古拙的山水今又细水流长江南月光照耀湖旁如今的情也已不在心上十载月晃容颜覆黄问一句你今在他乡何方江南月光苏州城隍孤单的你可还记得夜凉西厢人忘你是否还在独唱却唱不出
「原创」海丰阿东：人若不死生有何欢，长命百岁只是梦想海丰阿东
「原创」海丰阿东：人若不死生有何欢，长命百岁只是梦想有生必有死，人生的规律如此，任何人都无法回避。但如果一个人能长命百岁，永远活着，其实也并不是一件好事情。你永远活着，在你身边那些熟悉的东西都渐渐的离你而去，你成了一个孤家寡人。最后你只能在回忆中生活着，一定是十分的孤独啊。其实有生必有死，因为死亡的存在，让生便有了意义。人活着才有价值，正是因为有死亡，才凸显出来了。编辑当然了，同样是活着也会产生不
IBM反垄断史：一个什么都卖的兼并指挥家竞争者的垄断梦
真事/故事/反垄断的故事/大公司垄断的故事曲创（原创）欢迎关注竞争者的垄断梦感谢已经看到这里的各位，因为间隔时间有点长，可能各位有点迷失。大家千万别误会，我们这一季的男一号既不是Hollerith，也不是Powers。到目前为止他俩的戏份真是不少，但只是因为必不可少，没有他俩发明的制表机，也就没有IBM；没有他俩相爱相杀的暧昧关系，也就没有后来数十年里IBM和反垄断的苦恋悲情。这是一个漫长的悲伤故
淘陶居老袁藏品东海堂
【造像艺术】文化遗产•汉地木造像的区域特征、古代精品造像欣赏。。。。。。（来源：蠢牛/颜旭茂）原创2016-06-12作者：作者：蠢牛（颜旭茂）木造像的地位一直挺尴尬的。国外大型博物馆的木造像基本都是宋元以前的，明代只藏极品。国内也就故宫、国博和上博有能力弄几尊宋木，山西省博貌似只有一尊顶级的明代菩萨能拿得出手，其他木雕大省的博物馆再怎么也应当展示些明清木雕吧，总比同时代那什么坛坛罐罐更有艺术性。
每日头像|爱与时光，终年不遇一宝先生
小可爱们晚上好呀今天晚上来推送一期情侣头像~喜欢的小可爱可以点赞收藏评论哟~部分素材来自网络，版权归原创者，如有侵权请联系删除今天的头像结束啦喜欢的小可爱可以点下关注哟~如果喜欢本期的内容可以转发分享哦~那我们下期再见咯~拜了个拜~
2019 上海原创女装工作室创业一年感悟焦虑中带有恐慌感女装设计师茜公子__
时间过的太快，跟不上脚步，真不想虚度光阴，2019开春立下的FLAG，至今一条没实现！想去✈️，每每看到世界那么大，也想去看看。就像是在诉说着我的心声，再看看日益缩水的钱袋，恨自己能力有限……想去的地方太多，被现实绊住脚步，要先生存立足，才能有所谓的诗和远方……我是80的尾巴，2018年6月果断辞了工作近8年的公司，当时也是思想斗争长达几个月，断了自己的后路，当时就想再工作几年又能怎么样？锁住了自
酒店床装车出货臧冰
一百多套的酒店床、圆床，床垫终于出货了，可惜还没装完，明天将继续出货，辛苦了各位小伙伴们！图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App图片发自App我是两个孩子的宝妈，经营着一间软体家具厂，“伊力威斯”是我们的品牌。这是我的第178篇原创日记。栽一棵树最好的时间是十年前跟今天，写日记亦是如此，抓住今天，我们将收获更精彩的人生！
Python数据分析与可视化 jun778895 python 数据分析开发语言
Python数据分析与可视化是一个涉及数据处理、分析和以图形化方式展示数据的过程，它对于数据科学家、分析师以及任何需要从数据中提取洞察力的专业人员来说至关重要。以下将详细探讨Python在数据分析与可视化方面的应用，包括常用的库、数据处理流程、可视化技巧以及实际应用案例。一、Python数据分析与可视化的重要性数据可视化是将数据以图形或图像的形式表示出来，以便人们能够更直观地理解数据背后的信息和规
毕业论文附录一般都写什么?大学生写论文是干嘛用的写个原创论文人工智能深度学习 AI写作 chatgpt 论文阅读
毕业论文的附录通常包含一些在正文中不便于展示或详细阐述的内容，但对理解论文整体又具有重要意义的资料。具体来说，附录可能包含以下内容：AI论文，免费大纲，10分钟3万字，查重高于15%退费，支持数据图表！！AIPaperPass-AI论文写作指导平台AIPaperPass是AI原创论文写作平台，免费千字大纲，5分钟生成3万字初稿，提供答辩汇报ppt、开题报告、任务书等，40篇真实中英文知网参考文献，
《爱情》杜文霞
杜文霞坚持原创分享第39天（20190214）图片发自App对爱情的认识我越来越清晰了。真正的爱情是成年人的游戏，双方在关系中是平等的。就像舒婷《致橡树》中写的：我如果爱你——绝不学痴情的鸟儿，为绿荫重复单调的歌曲；必须是你近旁的一株木棉，作为树的形象和你站在一起。我们共享雾霭、流岚、虹霓。仿佛永远分离，却又终身相依。爱情中的爱是相互的，是爱与被爱的流动，不是控制和占有。如果一方总觉得另一方“应该
怎样提高文章的点击率？言一一2012
最近写文章，原创度那些都可以，就是这个用户喜爱度拖着我的后腿。我也试着去点击别人的文章，并评论，可是看自己文章的还是很少。真不知道这种情况该如何是好？哪位大神能不吝赐教，告诉小女子一声，怎样提高文章的点击率？
正常化的同理迷你旅客
郑璐宜昌焦点网络中级七期原创持续分享第214天SBFT的同理方式除了反应来访者的感受之外，更会暗示事情有其他可能性的存在，以试图动摇来访者的负面感受，改变她的自我觉知。其原则包括：1、将来访者所说的内容以“过去式”的动词（如：加上“曾经”）进行回应，暗示现在的负向可以成为过去。2、把来访者所用的含绝对性、强烈性的字眼，换为严重程度较低或发生比例较少的用字。例如，来访者说：“每天总是觉得快要发疯了。
写作，让我静心反思与总结薛森森的猫
坚持日更很开心。我可以把生活中的点滴感悟记录下来。慢慢总结，也顺带可以反思自己的人生。写作也锻炼了我的思维逻辑。生活给予我写作的灵感，而写作大纲让我写作更调理。当然还需要改进自己。欠缺的地方：读书少，积累更少。原创图片少。要上班了，继续努力！
狼牙山人-画家张国富原创写意作品剖析第65帧《数枝浓艳对秋光啚》张国富字腴田
狼牙山人-画家张国富原创写意作品剖析第65帧《数枝浓艳对秋光啚》2016年3月原創寫意作品《數枝農艷對秋光圖》。
读《道德经》28 华南帝虎
甘德礼（读《道德经》28）原创分享609＋277天，光山心协智慧父母课堂持续分享第262天原文知其雄，守其雌，为天下谿。为天下谿，常德不离，复归于婴儿。知其白，守其黑，为天下式。为天下式，常德不忒，复归于无极。知其荣，守共辱，为天下谷。为天下谷，常徳乃足，复归于朴。朴散则为器，圣人用之则为官长，故大制不割。译文越是自己雄强刚猛，越是要守得住雌柔安静，就像山间低凹的溪水样。像溪水一样，那规律性的德就
《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀暖暖的初春
图片发自App李苹瑕焦点网络初级5期平顶山持续原创分享第697天2019年04月07日星期日晴《向西游记取育儿经》启示二拜师菩提第二部分：腾云驾雾识世界，开阔眼界宽胸怀这几天恰逢清明小长假，许多家长都会带领孩子祭祖扫墓和清明踏春郊游。刚好我们这一周总第31期读书会主题：腾云驾雾识世界，开阔眼界宽胸怀。描述的是孙悟空成长初期师拜菩提所受到的启蒙教育，和现今各位家长注重孩子的早期成长和启蒙教育是不谋而
java观察者模式 3213213333332132 java 设计模式游戏观察者模式
观察者模式——顾名思义，就是一个对象观察另一个对象，当被观察的对象发生变化时，观察者也会跟着变化。在日常中，我们配java环境变量时，设置一个JAVAHOME变量,这就是被观察者，使用了JAVAHOME变量的对象都是观察者，一旦JAVAHOME的路径改动，其他的也会跟着改动。这样的例子很多，我想用小时候玩的老鹰捉小鸡游戏来简单的描绘观察者模式。老鹰会变成观察者，母鸡和小鸡是
TFS RESTful API 模拟上传测试 ronin47
TFS RESTful API 模拟上传测试。　　细节参看这里：https://github.com/alibaba/nginx-tfs/blob/master/TFS_RESTful_API.markdown 模拟POST上传一个图片： curl --data-binary @/opt/tfs.png http
PHP常用设计模式单例, 工厂, 观察者, 责任链, 装饰, 策略,适配,桥接模式 dcj3sjt126com 设计模式 PHP
// 多态, 在JAVA中是这样用的, 其实在PHP当中可以自然消除, 因为参数是动态的, 你传什么过来都可以, 不限制类型, 直接调用类的方法 abstract class Tiger { public abstract function climb(); } class XTiger extends Tiger { public function climb()
hibernate 171815164 Hibernate
main,save Configuration conf =new Configuration().configure(); SessionFactory sf=conf.buildSessionFactory(); Session sess=sf.openSession(); Transaction tx=sess.beginTransaction(); News a=new
Ant实例分析 g21121 ant
下面是一个Ant构建文件的实例，通过这个实例我们可以很清楚的理顺构建一个项目的顺序及依赖关系，从而编写出更加合理的构建文件。下面是build.xml的代码： <?xml version="1
[简单]工作记录_接口返回405原因 53873039oycg 工作
最近调接口时候一直报错，错误信息是: responseCode:405 responseMsg:Method Not Allowed 接口请求方式Post.
关于java.lang.ClassNotFoundException 和 java.lang.NoClassDefFoundError 的区别程序员是怎么炼成的
真正完成类的加载工作是通过调用 defineClass来实现的；而启动类的加载过程是通过调用 loadClass来实现的；就是类加载器分为加载和定义 protected Class<?> findClass(String name) throws ClassNotFoundExcept
JDBC学习笔记-JDBC详细的操作流程 aijuans jdbc
所有的JDBC应用程序都具有下面的基本流程：　　1、加载数据库驱动并建立到数据库的连接。　　2、执行SQL语句。　　3、处理结果。　　4、从数据库断开连接释放资源。下面我们就来仔细看一看每一个步骤：其实按照上面所说每个阶段都可得单独拿出来写成一个独立的类方法文件。共别的应用来调用。 1、加载数据库驱动并建立到数据库的连接： Html代码 St
rome创建rss antonyup_2006 tomcat cms xml struts Opera
引用 1.RSS标准 RSS标准比较混乱，主要有以下3个系列 RSS 0.9x / 2.0 : RSS技术诞生于1999年的网景公司(Netscape)，其发布了一个0.9版本的规范。2001年，RSS技术标准的发展工作被Userland Software公司的戴夫温那(Dave Winer)所接手。陆续发布了0.9x的系列版本。当W3C小组发布RSS 1.0后，Dave W
html表格和表单基础百合不是茶 html 表格表单 meta 锚点
第一次用html来写东西,感觉压力山大,每次看见别人发的都是比较牛逼的再看看自己什么都还不会, html是一种标记语言,其实很简单都是固定的格式 _----------------------------------------表格和表单表格是html的重要组成部分,表格用在body里面的主要用法如下; <table> &
ibatis如何传入完整的sql语句 bijian1013 java sql ibatis
ibatis如何传入完整的sql语句？进一步说，String str ="select * from test_table"，我想把str传入ibatis中执行，是传递整条sql语句。解决办法： <
精通Oracle10编程SQL(14)开发动态SQL bijian1013 oracle 数据库 plsql
/* *开发动态SQL */ --使用EXECUTE IMMEDIATE处理DDL操作 CREATE OR REPLACE PROCEDURE drop_table(table_name varchar2) is sql_statement varchar2(100); begin sql_statement:='DROP TABLE '||table_name;
【Linux命令】Linux工作中常用命令 bit1129 linux命令
不断的总结工作中常用的Linux命令 1.查看端口被哪个进程占用通过这个命令可以得到占用8085端口的进程号，然后通过ps -ef|grep 进程号得到进程的详细信息 netstat -anp | grep 8085 察看进程ID对应的进程占用的端口号 netstat -anp | grep 进程ID &
优秀网站和文档收集白糖_ 网站
集成 Flex, Spring, Hibernate 构建应用程序性能测试工具-JMeter Hmtl5-IOCN网站 Oracle精简版教程网站鸟哥的linux私房菜 Jetty中文文档 50个jquery必备代码片段 swfobject.js检测flash版本号工具
angular.extend boyitech AngularJS angular.extend AngularJS API
angular.extend 复制src对象中的属性去dst对象中. 支持多个src对象. 如果你不想改变一个对象，你可以把dst设为空对象{}: var object = angular.extend({}, object1, object2). 注意: angular.extend不支持递归复制. 使用方法: angular.extend(dst, src); 参数:
java-谷歌面试题-设计方便提取中数的数据结构 bylijinnan java
网上找了一下这道题的解答，但都是提供思路，没有提供具体实现。其中使用大小堆这个思路看似简单，但实现起来要考虑很多。以下分别用排序数组和大小堆来实现。使用大小堆： import java.util.Arrays; public class MedianInHeap { /** * 题目：设计方便提取中数的数据结构 * 设计一个数据结构，其中包含两个函数，1.插
ajaxFileUpload 针对 ie jquery 1.7+不能使用问题修复版本 Chen.H ajaxFileUpload ie6 ie7 ie8 ie9
jQuery.extend({ handleError: function( s, xhr, status, e ) { // If a local callback was specified, fire it if ( s.error ) { s.error.call( s.context || s, xhr, status, e ); }
[机器人制造原则]机器人的电池和存储器必须可以替换 comsci 制造
机器人的身体随时随地可能被外来力量所破坏,但是如果机器人的存储器和电池可以更换,那么这个机器人的思维和记忆力就可以保存下来,即使身体受到伤害,在把存储器取下来安装到一个新的身体上之后,原有的性格和能力都可以继续维持..... 另外,如果一
Oracle Multitable INSERT 的用法 daizj oracle
转载Oracle笔记-Multitable INSERT 的用法 http://blog.chinaunix.net/uid-8504518-id-3310531.html 一、Insert基础用法语法： Insert Into 表名 (字段1,字段2,字段3...） Values (值1,
专访黑客历史学家George Dyson datamachine on
20世纪最具威力的两项发明——核弹和计算机出自同一时代、同一群年青人。可是，与大名鼎鼎的曼哈顿计划（第二次世界大战中美国原子弹研究计划）相比，计算机的起源显得默默无闻。出身计算机世家的历史学家George Dyson在其新书《图灵大教堂》（Turing’s Cathedral）中讲述了阿兰·图灵、约翰·冯·诺依曼等一帮子天才小子创造计算机及预见计算机未来
小学6年级英语单词背诵第一课 dcj3sjt126com english word
always 总是 rice 水稻，米饭 before 在...之前 live 生活，居住 usual 通常的 early 早的 begin 开始 month 月份 year 年 last 最后的 east 东方的 high 高的 far 远的 window 窗户 world 世界 than 比...更
在线IT教育和在线IT高端教育 dcj3sjt126com 教育
codecademy http://www.codecademy.com codeschool https://www.codeschool.com teamtreehouse http://teamtreehouse.com lynda http://www.lynda.com/ Coursera https://www.coursera.
Struts2 xml校验框架所定义的校验文件蕃薯耀 Struts2 xml校验 Struts2 xml校验框架 Struts2校验
>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年7月11日 15:54:59 星期六 http://fa
mac下安装rar和unrar命令 hanqunfeng mac
1.下载：http://www.rarlab.com/download.htm 选择 RAR 5.21 for Mac OS X 2.解压下载后的文件 tar -zxvf rarosx-5.2.1.tar 3.cd rar sudo install -c -o $USER unrar /bin #输入当前用户登录密码 sudo install -c -o $USER rar
三种将list转换为map的方法 jackyrong list
在本文中，介绍三种将list转换为map的方法： 1）传统方法假设有某个类如下 class Movie { private Integer rank; private String description; public Movie(Integer rank, String des
年轻程序员需要学习的5大经验 lampcy 工作 PHP 程序员
在过去的7年半时间里，我带过的软件实习生超过一打，也看到过数以百计的学生和毕业生的档案。我发现很多事情他们都需要学习。或许你会说，我说的不就是某种特定的技术、算法、数学，或者其他特定形式的知识吗？没错，这的确是需要学习的，但却并不是最重要的事情。他们需要学习的最重要的东西是“自我规范”。这些规范就是：尽可能地写出最简洁的代码；如果代码后期会因为改动而变得凌乱不堪就得重构；尽量删除没用的代码，并添加
评“女孩遭野蛮引产致终身不育 60万赔偿款1分未得”医腐深入骨髓 nannan408
先来看南方网的一则报道：再正常不过的结婚、生子，对于29岁的郑畅来说，却是一个永远也无法实现的梦想。从2010年到2015年，从24岁到29岁，一张张新旧不一的诊断书记录了她病情的同时，也清晰地记下了她人生的悲哀。　　粗暴手术让人发寒　　2010年7月，在酒店做服务员的郑畅发现自己怀孕了，可男朋友却联系不上。在没有和家人商量的情况下，她决定堕胎。　　12月5日，
使用jQuery为input输入框绑定回车键事件 VS 为a标签绑定click事件 Everyday都不同 jsp input 回车键绑定 click enter
假设如题所示的事件为同一个，必须先把该js函数抽离出来，该函数定义了监听的处理： function search() { //监听函数略...... } 为input框绑定回车事件，当用户在文本框中输入搜索关键字时，按回车键，即可触发search(): //回车绑定 $(".search").keydown(fun
EXT学习记录 tntxia ext
1. 准备（1）官网：http://www.sencha.com/ 里面有源代码和API文档下载。 EXT的域名已经从www.extjs.com改成了www.sencha.com ，但extjs这个域名会自动转到sencha上。（2）帮助文档：想要查看EXT的官方文档的话，可以去这里h
mybatis3的mapper文件报Referenced file contains errors xingguangsixian mybatis
最近使用mybatis.3.1.0时无意中碰到一个问题： The errors below were detected when validating the file "mybatis-3-mapper.dtd" via the file "account-mapper.xml". In most cases these errors can be d