Rishane

（三篇长文让你玩6Pandas）数据分析入门_PART2常用工具包_CH02数据分析工具：Pandas__Part01（Series和DataFrame全面操作）

'''
【课程2.2】  Pandas数据结构Series：基本概念及创建

"一维数组"Serise

'''

'\n【课程2.2】  Pandas数据结构Series：基本概念及创建\n\n"一维数组"Serise\n\n'

# Series 数据结构
# Series 是带有标签的一维数组，可以保存任何数据类型（整数，字符串，浮点数，Python对象等）,轴标签统称为索引
# Series 数据结=1标签+2数据数组（可以理解为有索引顺序的dict）
import numpy as np
import pandas as pd

s=pd.Series(np.random.rand(5))
print(s)
print('------')
print(type(s))

0    0.830450
1    0.674102
2    0.528299
3    0.150878
4    0.952043
dtype: float64
------

# Series 创建方法一：由字典创建，字典的key就是index，values就是values
#只要index有一个str则将其他数字类型自动转换为str
dic = {'a':1 ,'b':'hello' , 'c':3, 4:4, 5:5}
s=pd.Series(dic)
print(s)

a        1
b    hello
c        3
4        4
5        5
dtype: object

# Series 创建方法二：由数组创建(一维数组)
# 默认index是从0开始，步长为1的数字
arr=np.random.randn(5)
s=pd.Series(arr)
print(arr)
print(s)

# index参数：设置index，长度保持一致
# dtype参数：设置数值类型
'''
pd.Series(
    data=None,
    index=None,
    dtype=None,
    name=None,
    copy=False,
    fastpath=False,
)
'''
s=pd.Series(arr,index=list('abcde'),dtype=np.str)
print(s)

[ 0.26383154  0.97382125  0.13994526 -0.60732141  1.32883897]
0    0.263832
1    0.973821
2    0.139945
3   -0.607321
4    1.328839
dtype: float64
a    0.26383153983884505
b     0.9738212455558085
c     0.1399452564766354
d    -0.6073214101102407
e     1.3288389721491793
dtype: object

# Series 创建方法三：由标量创建(Series中所有元素都相同)
s=pd.Series(10,index=range(4))
print(s)

0    10
1    10
2    10
3    10
dtype: int64

# Series 名称属性：name(可有可无 一个实体series对象只有唯一一个name)
# name为Series的一个参数，创建一个数组的 名称
# .name方法：输出数组的名称，输出格式为str，如果没用定义输出名称，输出为None
s1=pd.Series(np.random.rand(5))
print(s1)
print('-----')
s2=pd.Series(np.random.rand(5),name="test")
print(s2)
print(s1.name,s2.name,type(s2.name))

# .rename()重命名一个数组的名称，并且新指向一个数组，原数组不变
s3=s2.rename('xjxj')
print(s3)
print(s3 is s2)
print(s3.name,s2.name)

0    0.603552
1    0.007823
2    0.581088
3    0.262479
4    0.366710
dtype: float64
-----
0    0.638098
1    0.012841
2    0.659852
3    0.009916
4    0.444856
Name: test, dtype: float64
None test 
0    0.638098
1    0.012841
2    0.659852
3    0.009916
4    0.444856
Name: xjxj, dtype: float64
False
xjxj test

#作业answer

#1 dict方式创建
dic={'Jack':90.0,'Marry':92,"Tom":89,'Zack':65}
s1=pd.Series(dic,name="作业1")
print(s1)

#2 数组方式创建
ar=np.array((90.0,92,89,65))
s2=pd.Series(ar,index=('Jack','Marry',"Tom",'Zack'),name="作业1")
print(s2)

Jack     90.0
Marry    92.0
Tom      89.0
Zack     65.0
Name: 作业1, dtype: float64
Jack     90.0
Marry    92.0
Tom      89.0
Zack     65.0
Name: 作业1, dtype: float64

'''
【课程2.3】  Pandas数据结构Series：索引

位置下标 / 标签索引 / 切片索引 / 布尔型索引

'''

'\n【课程2.3】  Pandas数据结构Series：索引\n\n位置下标 / 标签索引 / 切片索引 / 布尔型索引\n\n'

# 位置下标，类似序列 （和序列不同的index【-1】不能为负）
# 位置下标从0开始
# 输出结果为numpy.float格式，
# 可以通过float()函数转换为python float格式
# numpy.float与float占用字节不同

s=pd.Series(np.random.rand(5))
print(s[0],type(s[0]),s[0].dtype)                                                                         

print(float(s[0]),type(float(s[0])))

0.6358412386028008  float64
0.6358412386028008

# 标签索引

# 方法类似下标索引，用[]表示，内写上index，注意此处index是字符串
s=pd.Series(np.random.rand(5),index=list('abcde'))
print(s)
print(s['a'],type(s['a']),s['a'].dtype)

# 如果需要同时选择多个标签的值，用[[]]来表示（相当于[]中包含一个列表！！！）
# 多标签索引结果是新的数组
sci=s[['a','b','c']]
print(sci,type(sci))

a    0.541327
b    0.810801
c    0.296037
d    0.794296
e    0.899370
dtype: float64
0.5413267940720663  float64
a    0.541327
b    0.810801
c    0.296037
dtype: float64

#切片索引
#1 注意：用index做切片是左闭右闭
#序列切片可以有[1:-1]负数序号

#2下标索引做切片，和list写法一样

#3 有str序列的Series也可以用下标索引（数字）做切片

s1=pd.Series(np.random.randint(10,size=5))
s2=pd.Series(np.random.randint(10,size=5),index=list("abcde"))
print(s1[1:4],'\n',s1[1:-1],'\n',s1[2])
print('---')
print(s2["a":"b"],'\n',s2['a'])
print('---')
print(s2[1:-1],'\n',s2[2])

1    3
2    5
3    0
dtype: int32 
 1    3
2    5
3    0
dtype: int32 
 5
---
a    5
b    9
dtype: int32 
 5
---
b    9
c    5
d    2
dtype: int32 
 5

# 布尔型索引
# 数组做判断之后，返回的是一个由布尔值组成的新的Series
# .isnull() / .notnull() 判断是否为空值 (None代表空值，NaN代表有问题的数值，两个都会识别为空值)

s=pd.Series(np.random.rand(3)*100)
s[4]=None #添加1个空值None
print(s)

bs1 = s > 50
bs2 = s.isnull()
bs3 = s.notnull()

print(bs1, type(bs1), bs1.dtype)
print(bs2, type(bs2), bs2.dtype)
print(bs3, type(bs3), bs3.dtype)

print('-----')

print(s>50)
print('-----')

print(s[s>50])

print('-----')

print(s[bs3])

0    12.5679
1     73.037
2    69.7116
4       None
dtype: object
0    False
1     True
2     True
4    False
dtype: bool  bool
0    False
1    False
2    False
4     True
dtype: bool  bool
0     True
1     True
2     True
4    False
dtype: bool  bool
-----
0    False
1     True
2     True
4    False
dtype: bool
-----
1     73.037
2    69.7116
dtype: object
-----
0    12.5679
1     73.037
2    69.7116
dtype: object

#作业answer
s=pd.Series(np.random.rand(10)*100,index=list('abcdefghij'))
print(s)
print('-------')
print(s['b'],s['c'])
print('-------')
print(s[4:7])
print(s[[4,5,6]])
print('-------')
print(s[s>50])

a    47.610866
b    32.879041
c    60.843136
d    25.798653
e    16.734771
f    72.011496
g    13.186102
h    67.730150
i    28.785863
j    82.482446
dtype: float64
-------
32.87904131859861 60.84313579685892
-------
e    16.734771
f    72.011496
g    13.186102
dtype: float64
e    16.734771
f    72.011496
g    13.186102
dtype: float64
-------
c    60.843136
f    72.011496
h    67.730150
j    82.482446
dtype: float64

'''
【课程2.4】  Pandas数据结构Series：基本技巧

数据查看 / 重新索引 / 对齐 / 添加、修改、删除值

'''

'\n【课程2.4】  Pandas数据结构Series：基本技巧\n\n数据查看 / 重新索引 / 对齐 / 添加、修改、删除值\n\n'

# 数据查看
# .head()查看头部数据
# .tail()查看尾部数据
# 默认查看5条
s=pd.Series(np.random.rand(50))
print(s.head(10))
print(s.tail())

0    0.583793
1    0.340821
2    0.153140
3    0.726648
4    0.482695
5    0.652023
6    0.328461
7    0.177034
8    0.217062
9    0.341393
dtype: float64
45    0.425366
46    0.712421
47    0.423743
48    0.980984
49    0.146227
dtype: float64

# 重新索引reindex
# .reindex将会根据索引重新排序而不是重写index，如果当前索引不存在，则引入缺失值

s=pd.Series(np.random.rand(3),index=list('abc'))
print(s)
s1=s.reindex(list('cbad'))
print(s1)
# .reindex(listofindex)中也是写列表
# 这里'd'索引不存在，所以值为NaN
s2=s.reindex(list('cbad'),fill_value ='666')
print(s2)
# fill_value参数：填充缺失值的值

a    0.015252
b    0.631593
c    0.795722
dtype: float64
c    0.795722
b    0.631593
a    0.015252
d         NaN
dtype: float64
c     0.795722
b     0.631593
a    0.0152518
d          666
dtype: object

# Series对齐
# Series 和 ndarray 之间的主要区别是，Series 上的操作会根据标签自动对齐
# index顺序不会影响数值计算，以标签来计算！！！
# NaN空值和任何值计算结果扔为空值

s1=pd.Series(np.random.rand(3),index=list('abc'))
s2=pd.Series(np.random.rand(4),index=list('acbd'))
print(s1)
print(s2)
print(s1+s2)

a    0.277334
b    0.088585
c    0.551871
dtype: float64
a    0.222483
c    0.413765
b    0.457875
d    0.072471
dtype: float64
a    0.499817
b    0.546460
c    0.965637
d         NaN
dtype: float64

# 删除：.drop

s=pd.Series(np.random.rand(5),index=list("abcde"))
print(s)

# 默认drop 删除元素之后返回副本(inplace=False)
s1=s.drop('a')
s2=s.drop(['a','b'],inplace=True)
print(s1)
print(s2)
print(s)

a    0.073533
b    0.141870
c    0.129170
d    0.714398
e    0.778901
dtype: float64
b    0.141870
c    0.129170
d    0.714398
e    0.778901
dtype: float64
None
c    0.129170
d    0.714398
e    0.778901
dtype: float64

# 添加
# 直接通过下标索引/标签index添加值
s = pd.Series(np.random.rand(5), index = list('ngjur'))
s['h']=2
print(s)

# 通过.append方法，直接添加一个数组
# .append方法生成一个新的数组，不改变之前的数组
#to_append即（）内元素 : Series or list/tuple of Series
s3=s.append(s)
print(s3)
print(s1)

n    0.351741
g    0.209274
j    0.333868
u    0.515066
r    0.481014
h    2.000000
dtype: float64
n    0.351741
g    0.209274
j    0.333868
u    0.515066
r    0.481014
h    2.000000
n    0.351741
g    0.209274
j    0.333868
u    0.515066
r    0.481014
h    2.000000
dtype: float64
b    0.141870
c    0.129170
d    0.714398
e    0.778901
dtype: float64

# 修改
# 通过索引直接修改，类似序列
s=pd.Series(np.random.rand(3),index=['a','b','c'])
print(s)

s[0]=1
s['b']=2
print(s)

a    0.703114
b    0.998844
c    0.777766
dtype: float64
a    1.000000
b    2.000000
c    0.777766
dtype: float64



#作业answer
import pandas as pd
import numpy as np
#作业1
s1=pd.Series(range(10),index=list('abcdefghij'))
s1.drop(index='b',inplace=True)
s1[['a','e','f']]=[100,100,100]
print(s1)

#作业2
s1=pd.Series(np.random.rand(5)*10,index=list('abcde'))
s2=pd.Series(np.random.rand(5)*10,index=list('cdefg'))
print(s1+s2)

a    100
c      2
d      3
e    100
f    100
g      6
h      7
i      8
j      9
dtype: int64
a          NaN
b          NaN
c     2.104558
d    13.033831
e    17.870648
f          NaN
g          NaN
dtype: float64

'''
【课程2.5】  Pandas数据结构Dataframe：基本概念及创建

"二维数组"Dataframe：是一个表格型的数据结构，包含一组有序的列，其列的值类型可以是数值、字符串、布尔值等。

Dataframe中的数据以一个或多个二维块存放，不是列表、字典或一维数组结构。

'''

'\n【课程2.5】  Pandas数据结构Dataframe：基本概念及创建\n\n"二维数组"Dataframe：是一个表格型的数据结构，包含一组有序的列，其列的值类型可以是数值、字符串、布尔值等。\n\nDataframe中的数据以一个或多个二维块存放，不是列表、字典或一维数组结构。\n\n'

# Dataframe 数据结构
# Dataframe是一个表格型的数据结构，“带有标签的二维数组”。
# Dataframe带有index（行标签）和columns（列标签）

data={'name':['Jack','Tom','Mary'],
     'age':[18,19,20],
     'gender':['m','m','w']}
frame=pd.DataFrame(data)
print(frame)
print(type(frame))
print(frame.index,type(frame.index))
print(frame.columns,type(frame.columns))
print(frame.values,type(frame.values))

# 查看数据，数据类型为dataframe
# .index查看行标签,数据类型为index
# .columns查看列标签，数据 类型为index
# .values查看值，数据类型为ndarray

   name  age gender
0  Jack   18      m
1   Tom   19      m
2  Mary   20      w

RangeIndex(start=0, stop=3, step=1) 
Index(['name', 'age', 'gender'], dtype='object') 
[['Jack' 18 'm']
 ['Tom' 19 'm']
 ['Mary' 20 'w']]

#DataFrame有五大创建法

# Dataframe 创建方法一：由数组/list组成的字典 
#dicoflist or dicofndarry
# 创建方法:pandas.Dataframe()

# 由数组/list组成的字典 创建Dataframe，columns为字典前面的key
#index为默认数字标签
# 字典的值的长度必须保持一致！
#即一数列一数列的添加

data1={'a':[1,2,3],
       'b':[3,4,5],
       'c':[5,6,7]
}
data2={'one':np.random.rand(3),
        'two':np.random.rand(3)
}


df1=pd.DataFrame(data1)
df2=pd.DataFrame(data2)
print(df1)
print(df2)

#列标签columns只可变size--类似reindex()！！！
# columns参数：可以重新指定列的顺序，格式为list，如果现有数据中没有该列（比如'd'），则产生NaN值
# 如果columns重新指定时候，列的数量可以少于原数据

df1=pd.DataFrame(data1,columns=['a','b','c','d'])
print(df1)

df1=pd.DataFrame(data1,columns=['one','c'])
print(df1)

#行标签index不可变size只可变内容类似于重写！！！
df2=pd.DataFrame(data2,index=['f1','f2','f3'])
print(df2)
# 这里如果尝试  index = ['f1','f2','f3','f4'] 会怎么样？
#报错

   a  b  c
0  1  3  5
1  2  4  6
2  3  5  7
        one       two
0  0.994078  0.172028
1  0.935417  0.363636
2  0.956896  0.686517
   a  b  c    d
0  1  3  5  NaN
1  2  4  6  NaN
2  3  5  7  NaN
   one  c
0  NaN  5
1  NaN  6
2  NaN  7
         one       two
f1  0.994078  0.172028
f2  0.935417  0.363636
f3  0.956896  0.686517

# Dataframe 创建方法二：由Series组成的字典 dicofSeries

#同样是一列一列加
# 由Seris组成的字典 创建Dataframe，columns为字典key
#index为Series的标签（如果Series没有指定标签，则是默认数字标签）
# Series可以长度不一样，生成的Dataframe会出现NaN值!!!
#Series->DataFrame自动补全

# 没有设置index的Series
# 设置了index的Series
data1={'one':pd.Series(np.random.rand(2)),
       'two':pd.Series(np.random.rand(3))
      }
data2 = {'one':pd.Series(np.random.rand(2), index = ['a','b']),
        'two':pd.Series(np.random.rand(3),index = ['a','b','c'])} 
df1=pd.DataFrame(data1)
df2=pd.DataFrame(data2)
print(df1)
print(df2)

        one       two
0  0.348506  0.746226
1  0.614500  0.982886
2       NaN  0.296487
        one       two
a  0.801257  0.886317
b  0.263036  0.620650
c       NaN  0.464100

# Dataframe 创建方法三：通过二维数组直接创建

ar = np.random.rand(9).reshape(3,3)
print(ar)
df1 = pd.DataFrame(ar)
df2 = pd.DataFrame(ar, index = ['a', 'b', 'c'], columns = ['one','two','three'])  # 可以尝试一下index或columns长度不等于已有数组的情况
print(df1)
print(df2)
# 通过二维数组直接创建Dataframe，得到一样形状的结果数据
#如果不指定index和columns，两者均返回默认数字格式
# index和colunms指定长度与原数组保持一致

[[0.38480599 0.50341925 0.4640469 ]
 [0.51968901 0.83803468 0.80929611]
 [0.77316926 0.38704004 0.6013333 ]]
          0         1         2
0  0.384806  0.503419  0.464047
1  0.519689  0.838035  0.809296
2  0.773169  0.387040  0.601333
        one       two     three
a  0.384806  0.503419  0.464047
b  0.519689  0.838035  0.809296
c  0.773169  0.387040  0.601333

# Dataframe 创建方法四：由字典组成的列表listofdic
#一行一行添加
# 由字典组成的列表创建Dataframe，columns为字典的key，index不做指定则为默认数组标签
# colunms和index参数分别重新指定相应列及行标签
#和reindex使用规则相同

data=[{'a':1,'b':2},{'a':1,'b':2,'c':3}]
df1=pd.DataFrame(data)
#index相当于重写
df2=pd.DataFrame(data,index=['1st','2nd'])
#columns相当于reindex
df3 = pd.DataFrame(data, columns = ['1','2','3'])
print(df1)
print(df2)
print(df3)

   a  b    c
0  1  2  NaN
1  1  2  3.0
     a  b    c
1st  1  2  NaN
2nd  1  2  3.0
    1   2   3
0 NaN NaN NaN
1 NaN NaN NaN

# Dataframe 创建方法五：由字典组成的字典 dicofdic 
#外层key为colums
#内层key为index
#唯一一个给index的

data = {'Jack':{'math':90,'english':89,'art':78},
       'Marry':{'math':82,'english':95,'art':92},
       'Tom':{'math':78,'english':67}}
df1=pd.DataFrame(data)
print(df1)

#index和colums都相当于reindex
df2 = pd.DataFrame(data, columns = ['Jack','Tom','Bob'])
df3 = pd.DataFrame(data, index = ['a','b','c'])
print(df2)
print(df3)

         Jack  Marry   Tom
art        78     92   NaN
english    89     95  67.0
math       90     82  78.0
         Jack   Tom  Bob
art        78   NaN  NaN
english    89  67.0  NaN
math       90  78.0  NaN
   Jack  Marry  Tom
a   NaN    NaN  NaN
b   NaN    NaN  NaN
c   NaN    NaN  NaN

#总结
#创建时候给什么 哪一个就相当于reindex（再次编制索引）
#eg

#一列一列给 dicoflist和dicofSeries都是先给列标签columns
#所以重新编制columns相当于reindex index相当于重写

#一行一行给listofdic先给columns
#columns reindex index 重写

#行列都给dicofdic
#唯一一个给index的
#两者都相当于reindex

#按照ndarry index和columns都没有给
#所以index  和 columns都相当于重写

#作业answer
import pandas as pd 
import numpy as np
#法一 给列 dicoflist
lst1=np.random.randint(1,10,size=5)
lst2=np.random.randint(1,10,size=5)
lst3=np.random.randint(1,10,size=5)
lst4=np.random.randint(1,10,size=5)

dic={'four':lst1,'one':lst2,'three':lst3,'two':lst4}
df1=pd.DataFrame(dic,index=list('abcde'))
print(df1)

#法二 给列 dicofSeries
s1=pd.Series(data=lst1,index=list('abcde'))
s2=pd.Series(data=lst2,index=list('abcde'))
s3=pd.Series(data=lst3,index=list('abcde'))
s4=pd.Series(data=lst4,index=list('abcde'))
dic={'four':s1,'one':s2,'three':s3,'two':s4}
df2=pd.DataFrame(dic)
print(df2)

#法三 给行 listofdic
lst=[{'four':4,'one':1,"three":3,'two':2},
     {'four':4,'one':1,"three":3,'two':2},
     {'four':4,'one':1,"three":3,'two':2},
     {'four':4,'one':1,"three":3,'two':2},
     {'four':4,'one':1,"three":3,'two':2},   
    ]
df3=pd.DataFrame(lst,index=list('abcde'))
print(df3)

#法4 都不给 二维ndarray
ar=np.array(np.random.randint(0,10,size=(5,4)))
df4=pd.DataFrame(ar,index=list('abcde'),columns=['four','one','three','one'])
print(df4)

#法5 都给 dicofdic 外层dic的key是columns

data = {'four':{'a':90,'b':89,'c':78,'d':5,'e':6},
       'one':{'a':90,'b':89,'c':78,'d':5,'e':6},
       'three':{'a':90,'b':89,'c':78,'d':5,'e':6},
       'two':{'a':90,'b':89,'c':78,'d':5,'e':6}
       }
df5=pd.DataFrame(data)
print(df5)

   four  one  three  two
a     9    7      4    3
b     9    8      9    4
c     8    9      5    8
d     6    5      5    4
e     2    6      9    7
   four  one  three  two
a     9    7      4    3
b     9    8      9    4
c     8    9      5    8
d     6    5      5    4
e     2    6      9    7
   four  one  three  two
a     4    1      3    2
b     4    1      3    2
c     4    1      3    2
d     4    1      3    2
e     4    1      3    2
   four  one  three  one
a     6    1      9    7
b     1    2      9    8
c     4    8      0    1
d     5    4      9    8
e     0    7      2    0
   four  one  three  two
a    90   90     90   90
b    89   89     89   89
c    78   78     78   78
d     5    5      5    5
e     6    6      6    6

'''
【课程2.6】  Pandas数据结构Dataframe：索引

Dataframe既有行索引也有列索引，可以被看做由Series组成的字典（共用一个索引）

选择列 / 选择行 / 切片 / 布尔判断

'''

'\n【课程2.6】  Pandas数据结构Dataframe：索引\n\nDataframe既有行索引也有列索引，可以被看做由Series组成的字典（共用一个索引）\n\n选择列 / 选择行 / 切片 / 布尔判断\n\n'

# 总说选择行与列

df=pd.DataFrame(np.random.rand(12).reshape(3,4)*100,
                index=['one','two','three'],
                columns=['a','b','c','d'])
print(df)
print('-----------')

# 按照列名选择列
#只选择一列输出Series
#选择多列输出Dataframe
data1=df['a']
data2=df[['a','c']]
print(data1,type(data1))
print(data2,type(data2))
print('-----------')

# 按照行名选择行
#只选择一行输出Series
#选择多行输出Dataframe
data3=df.loc['one']
data4=df.loc[['one','two']]
print(data3,type(data3))
print(data4,type(data4))

               a          b          c          d
one    60.066766  20.982593  70.080973  90.991952
two    98.299697  24.508627  47.991541   5.859387
three  61.839048   1.857317  36.815257  42.187342
-----------
one      60.066766
two      98.299697
three    61.839048
Name: a, dtype: float64 
               a          c
one    60.066766  70.080973
two    98.299697  47.991541
three  61.839048  36.815257 
-----------
a    60.066766
b    20.982593
c    70.080973
d    90.991952
Name: one, dtype: float64 
             a          b          c          d
one  60.066766  20.982593  70.080973  90.991952
two  98.299697  24.508627  47.991541   5.859387

#细说选择行
#df【列名】用【列名】索引选择列， 也可以选择行（不常用）
df = pd.DataFrame(np.random.rand(12).reshape(3,4)*100,
                   index = ['one','two','three'],
                   columns = ['a','b','c','d'])
print(df)
print('-----')

# df[]默认选择列，[]中写列名（所以一般数据colunms都会单独制定，不会用默认数字列名，以免和index冲突）
# 单选列为Series，print结果为Series格式
# 多选列为Dataframe，print结果为Dataframe格式

data1=df['a']
data2=df[['b','c']]
print(data1)
print(data2)

#非重点 不常用法
data3 = df[:1]
#data3 = df[0]
#data3 = df['one']
print(data3,type(data3))
# df[]中为数字时，默认选择行，且只能进行切片的选择，不能单独选择（df[0]）
# 输出结果为Dataframe，即便只选择一行
# df[]不能通过索引标签名来选择行(df['one'])

               a          b          c          d
one    66.689951  70.917802  43.959189  39.889119
two    47.674709  56.190896   5.577672  46.224369
three   3.090913  76.460138  77.731091  80.235150
-----
one      66.689951
two      47.674709
three     3.090913
Name: a, dtype: float64
               b          c
one    70.917802  43.959189
two    56.190896   5.577672
three  76.460138  77.731091
             a          b          c          d
one  66.689951  70.917802  43.959189  39.889119

#细说选择行
#df.loc[label]
#1针对[行名]选择行
#2如果没有行名 可以针对默认数字选择行

df1 = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
df2 = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   columns = ['a','b','c','d'])
print(df1)
print(df2)
print('-----')

data1=df1.loc['one']
data2=df2.loc[1]
print(data1)
print(data2)
print('单标签索引\n-----')
# 单个标签索引，返回Series

data3 = df1.loc[['two','three','five']]
data4 = df2.loc[[3,2,1]]
print(data3)
print(data4)
print('多标签索引\n-----')
# 多个标签索引，如果标签不存在，则返回NaN
# 顺序可变

data5 = df1.loc['one':'three']
data6 = df2.loc[1:3]
print(data5)
print(data6)
print('切片索引')
# 可以做切片对象
# 末端包含!!!用loc做切片末端包含

               a          b          c          d
one     8.090184  19.719044   0.671359  17.083233
two    52.571118  65.232782  26.267374  17.837930
three  57.849170  84.111119  72.354688  80.931790
four   65.700928   4.628123  69.963978  18.142123
           a          b          c          d
0  88.288394  46.433168  70.374551  58.077134
1  29.609704  93.034972  58.228832  29.418921
2  80.638641  51.854000  10.016064  54.724819
3  31.633185  90.085637  35.456804  79.061184
-----
a     8.090184
b    19.719044
c     0.671359
d    17.083233
Name: one, dtype: float64
a    29.609704
b    93.034972
c    58.228832
d    29.418921
Name: 1, dtype: float64
单标签索引
-----
               a          b          c         d
two    52.571118  65.232782  26.267374  17.83793
three  57.849170  84.111119  72.354688  80.93179
five         NaN        NaN        NaN       NaN
           a          b          c          d
3  31.633185  90.085637  35.456804  79.061184
2  80.638641  51.854000  10.016064  54.724819
1  29.609704  93.034972  58.228832  29.418921
多标签索引
-----
               a          b          c          d
one     8.090184  19.719044   0.671359  17.083233
two    52.571118  65.232782  26.267374  17.837930
three  57.849170  84.111119  72.354688  80.931790
           a          b          c          d
1  29.609704  93.034972  58.228832  29.418921
2  80.638641  51.854000  10.016064  54.724819
3  31.633185  90.085637  35.456804  79.061184
切片索引


C:\ProgramData\Anaconda3\lib\site-packages\ipykernel_launcher.py:22: FutureWarning: 
Passing list-likes to .loc or [] with any missing label will raise
KeyError in the future, you can use .reindex() as an alternative.

See the documentation here:
https://pandas.pydata.org/pandas-docs/stable/indexing.html#deprecate-loc-reindex-listlike

# df.iloc[] - 按照整数位置（从轴的0到length-1）选择行
# 类似list的索引，其顺序就是dataframe的整数位置，从0开始计

df = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df)
print('------')

print(df.iloc[0])
print(df.iloc[-1])
#print(df.iloc[4])
print('单位置索引\n-----')
# 单位置索引
# 和loc索引不同，不能索引超出数据行数的整数位置

print(df.iloc[[0,2]])
print(df.iloc[[3,2,1]])
print('多位置索引\n-----')
# 多位置索引
# 顺序可变

print(df.iloc[1:3])
print(df.iloc[::2])
print('切片索引')
# 切片索引
# 末端不包含！！！按照数字切片一般都末端不包含

               a          b          c          d
one    63.865808  67.918670  79.147570  96.612447
two    44.578604  52.973829  93.495585  57.698461
three  89.960372  75.657540  85.973381  85.055974
four   77.390780  75.258005  47.897852  11.303472
------
a    63.865808
b    67.918670
c    79.147570
d    96.612447
Name: one, dtype: float64
a    77.390780
b    75.258005
c    47.897852
d    11.303472
Name: four, dtype: float64
单位置索引
-----
               a         b          c          d
one    63.865808  67.91867  79.147570  96.612447
three  89.960372  75.65754  85.973381  85.055974
               a          b          c          d
four   77.390780  75.258005  47.897852  11.303472
three  89.960372  75.657540  85.973381  85.055974
two    44.578604  52.973829  93.495585  57.698461
多位置索引
-----
               a          b          c          d
two    44.578604  52.973829  93.495585  57.698461
three  89.960372  75.657540  85.973381  85.055974
               a         b          c          d
one    63.865808  67.91867  79.147570  96.612447
three  89.960372  75.65754  85.973381  85.055974
切片索引

# 布尔型索引
# 和Series原理相同

df = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df)
print('------')

b1=df<20
print(b1,type(b1))
print(df[b1])# 也可以书写为 df[df < 20]
print('------')
# 全部DataFrame做判断矩阵
# 索引结果保留 所有数据：True返回原数据，False返回值为NaN

b2 = df['a'] > 50
print(b2,type(b2))
print(df[b2])  # 也可以书写为 df[df['a'] > 50]
print('------')
# 单列做判断矩阵
# 索引结果保留 单列判断为True的行数据 其他列不显示

b3 = df[['a','b']] > 50
print(b3,type(b3))
print(df[b3])  # 也可以书写为 df[df[['a','b']] > 50]
print('------')
# 多列做判断矩阵
# 索引结果保留 所有数据：True返回原数据，False返回值为NaN 
# 判断矩阵中不含有的元素返回NaN

b4 = df.loc[['one','three']] < 50
print(b4,type(b4))
print(df[b4])  # 也可以书写为 df[df.loc[['one','three']] < 50]
print('------')
# 多行做判断矩阵
# 索引结果保留 所有数据：True返回原数据，False返回值为NaN
# 判断矩阵中不含有的元素返回NaN

               a          b          c          d
one    53.165072  72.137349  49.335356  94.371570
two    31.833981  18.591801  46.263265  97.524672
three  43.453369  89.621918  39.201420  18.235790
four   92.772641  12.172163  52.007352  42.280553
------
           a      b      c      d
one    False  False  False  False
two    False   True  False  False
three  False  False  False   True
four   False   True  False  False 
        a          b   c         d
one   NaN        NaN NaN       NaN
two   NaN  18.591801 NaN       NaN
three NaN        NaN NaN  18.23579
four  NaN  12.172163 NaN       NaN
------
one       True
two      False
three    False
four      True
Name: a, dtype: bool 
              a          b          c          d
one   53.165072  72.137349  49.335356  94.371570
four  92.772641  12.172163  52.007352  42.280553
------
           a      b
one     True   True
two    False  False
three  False   True
four    True  False 
               a          b   c   d
one    53.165072  72.137349 NaN NaN
two          NaN        NaN NaN NaN
three        NaN  89.621918 NaN NaN
four   92.772641        NaN NaN NaN
------
           a      b     c      d
one    False  False  True  False
three   True  False  True   True 
               a   b          c         d
one          NaN NaN  49.335356       NaN
two          NaN NaN        NaN       NaN
three  43.453369 NaN  39.201420  18.23579
four         NaN NaN        NaN       NaN
------

# 多重索引：比如同时索引行和列 
# 先选择列再选择行 —— 相当于对于一个数据，先筛选字段，再选择数据值

df = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   index = ['one','two','three','four'],
                   columns = ['a','b','c','d'])
print(df)
print('------')

print(df['a'].loc)
print('------')

print(df['a'].loc[['one','three']]) # 选择a列（属性）的one，three行（个体数据值）
print(df.loc[['one','three']]['a'])
print('------')

print(df[['b','c','d']].loc[['one','three']])  # 选择b，c，d列（属性）的one，three行（个体数据值）
print(df[df['a']<50].iloc[:2])# 选择满足判断条件（属性a<50）的前两行数据

               a          b          c          d
one    38.359537  40.536516  50.215082  24.690263
two    18.713505  74.621177  20.050490  47.546497
three  11.369268  65.753554  54.547829   7.002664
four    5.435595  48.839504  98.276157  21.352956
------

------
one      38.359537
three    11.369268
Name: a, dtype: float64
one      38.359537
three    11.369268
Name: a, dtype: float64
------
               b          c          d
one    40.536516  50.215082  24.690263
three  65.753554  54.547829   7.002664
             a          b          c          d
one  38.359537  40.536516  50.215082  24.690263
two  18.713505  74.621177  20.050490  47.546497

#作业answer
df=pd.DataFrame(np.random.rand(4,4)*100,
                index=['one','two','three','four'],
                columns=[list('abcd')])
print(df)
print('------')

print(df[['b','c']])
print('------')

print(df.loc[['three','four']])
print('------')

print(df.iloc[[1,0]])
print('------')

print(df[df>50])

               a          b          c          d
one    11.775827  98.052886   2.618347  53.166143
two    48.787931  31.037028  14.595130  72.661248
three  24.311761   4.930614  60.633819  69.031862
four   33.716489  37.270337  55.445232  92.749330
------
               b          c
one    98.052886   2.618347
two    31.037028  14.595130
three   4.930614  60.633819
four   37.270337  55.445232
------
               a          b          c          d
three  24.311761   4.930614  60.633819  69.031862
four   33.716489  37.270337  55.445232  92.749330
------
             a          b          c          d
two  48.787931  31.037028  14.595130  72.661248
one  11.775827  98.052886   2.618347  53.166143
------
        a          b          c          d
one   NaN  98.052886        NaN  53.166143
two   NaN        NaN        NaN  72.661248
three NaN        NaN  60.633819  69.031862
four  NaN        NaN  55.445232  92.749330

'''
【课程2.7】  Pandas数据结构Dataframe：基本技巧

数据查看、转置 / 添加、修改、删除值 / 对齐 / 排序

'''

'\n【课程2.7】  Pandas数据结构Dataframe：基本技巧\n\n数据查看、转置 / 添加、修改、删除值 / 对齐 / 排序\n\n'

# 数据查看、转置

df = pd.DataFrame(np.random.rand(16).reshape(8,2)*100,
                   columns = ['a','b'])
print(df.head(2))
print(df.tail())
# .head()查看头部2条数据
# .tail()查看尾部5条数据
# 默认查看5条

print(df.T)
# .T 转置

           a          b
0  67.123579  78.540599
1  16.668997  11.536215
           a          b
3  19.796982   7.295293
4  26.793664  95.924559
5  22.213018  60.779001
6   3.675648  38.955255
7  60.925783  64.103140
           0          1          2          3          4          5  \
a  67.123579  16.668997  41.758860  19.796982  26.793664  22.213018   
b  78.540599  11.536215  59.150321   7.295293  95.924559  60.779001   

           6          7  
a   3.675648  60.925783  
b  38.955255  64.103140

# 添加与修改

df = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   columns = ['a','b','c','d'])
print(df)

# 新增列/行并赋值直接【】or loc【】
df['e']=10
df.loc[4]=20

# 索引后直接修改值
df[['a','c']]=100
df['b'].loc[0]=666
print(df)

           a          b          c          d
0  85.971229  27.821810  77.466322  87.766945
1  41.422117  85.382627  37.848980  22.375692
2  18.105688  33.636029  10.040581  30.562783
3  50.128665  10.891343  56.333581  33.924682
     a           b    c          d   e
0  100  666.000000  100  87.766945  10
1  100   85.382627  100  22.375692  10
2  100   33.636029  100  30.562783  10
3  100   10.891343  100  33.924682  10
4  100   20.000000  100  20.000000  20

# 删除  del / drop()
#del只能删列 drop可以删行或列

df = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   columns = ['a','b','c','d'])
print(df)
print('-----')

del df['a']
print(df)
print('-----')
# del语句 - 删除列

print(df.drop(0))
print(df.drop([1,2]))
print(df)

print('-----')
# drop()删除行，inplace=False → 删除后生成新的数据，不改变原数据

print(df.drop(['d'], axis = 1))
print(df)
# drop()删除列，需要加上axis = 1，inplace=False → 删除后生成新的数据，不改变原数据

           a          b          c          d
0  52.376431  98.951314   3.665786  90.532788
1  72.710362  60.761235  10.310778  20.850619
2  41.186250  48.993426  68.769189  72.845749
3   2.091445  77.853150   1.332935   1.946453
-----
           b          c          d
0  98.951314   3.665786  90.532788
1  60.761235  10.310778  20.850619
2  48.993426  68.769189  72.845749
3  77.853150   1.332935   1.946453
-----
           b          c          d
1  60.761235  10.310778  20.850619
2  48.993426  68.769189  72.845749
3  77.853150   1.332935   1.946453
           b         c          d
0  98.951314  3.665786  90.532788
3  77.853150  1.332935   1.946453
           b          c          d
0  98.951314   3.665786  90.532788
1  60.761235  10.310778  20.850619
2  48.993426  68.769189  72.845749
3  77.853150   1.332935   1.946453
-----
           b          c
0  98.951314   3.665786
1  60.761235  10.310778
2  48.993426  68.769189
3  77.853150   1.332935
           b          c          d
0  98.951314   3.665786  90.532788
1  60.761235  10.310778  20.850619
2  48.993426  68.769189  72.845749
3  77.853150   1.332935   1.946453

df1=pd.DataFrame(np.random.rand(10,4),columns=['A', 'B', 'C', 'D'])
df2 = pd.DataFrame(np.random.randn(7, 3), columns=['A', 'B', 'C'])
print(df1)
print(df2)
print(df1+df2)
#按照行的index对齐自动相加，如果出现不存在的元素则加的结构也是NaN

          A         B         C         D
0  0.116265  0.286147  0.509417  0.123862
1  0.591067  0.220565  0.893078  0.995741
2  0.160296  0.327076  0.372967  0.740136
3  0.444086  0.254079  0.056255  0.721923
4  0.059144  0.665892  0.504307  0.746240
5  0.909397  0.426231  0.685564  0.056044
6  0.442812  0.477964  0.208796  0.830122
7  0.573963  0.196914  0.294245  0.073122
8  0.484215  0.885544  0.493887  0.768655
9  0.450795  0.552202  0.750659  0.006042
          A         B         C
0  1.862325  0.285321  0.505303
1 -0.664007  1.091699 -1.074902
2 -0.932387 -0.062655  0.307506
3 -2.796463 -1.310375 -1.439840
4 -0.364978 -0.376336  0.711008
5  0.705022 -1.029143  1.118433
6 -0.255299  2.005879 -0.419431
          A         B         C   D
0  1.978590  0.571468  1.014720 NaN
1 -0.072939  1.312263 -0.181824 NaN
2 -0.772091  0.264421  0.680473 NaN
3 -2.352377 -1.056296 -1.383586 NaN
4 -0.305834  0.289556  1.215315 NaN
5  1.614419 -0.602912  1.803996 NaN
6  0.187513  2.483843 -0.210635 NaN
7       NaN       NaN       NaN NaN
8       NaN       NaN       NaN NaN
9       NaN       NaN       NaN NaN

# 排序1 - 按值排序 .sort_values 按照某个属性（列）的值进行排序
# 同样适用于Series

df1 = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                   columns = ['a','b','c','d'])
print(df1)

# 单列排序
# ascending参数：设置升序降序，默认升序
print(df1.sort_values(by=['a'],ascending=True))# 升序
print(df1.sort_values(['a'], ascending = False))  # 降序
print('------')

# 多列排序
df2 = pd.DataFrame({'a':[1,1,1,1,2,2,2,2],
                  'b':list(range(8)),
                  'c':list(range(8,0,-1))})
print(df2)
print(df2.sort_values(['a','c']))
# 多列排序，先排'a',在拍好'a'的基础上再拍'c'有点像基数排序的感觉

           a          b          c          d
0   9.198370  45.091469  40.676043  74.669533
1  85.051633  98.125841  73.817642  72.571482
2  75.304951  55.935442  70.350217   4.555149
3  38.234080  62.093133  32.545653   0.724567
           a          b          c          d
0   9.198370  45.091469  40.676043  74.669533
3  38.234080  62.093133  32.545653   0.724567
2  75.304951  55.935442  70.350217   4.555149
1  85.051633  98.125841  73.817642  72.571482
           a          b          c          d
1  85.051633  98.125841  73.817642  72.571482
2  75.304951  55.935442  70.350217   4.555149
3  38.234080  62.093133  32.545653   0.724567
0   9.198370  45.091469  40.676043  74.669533
------
   a  b  c
0  1  0  8
1  1  1  7
2  1  2  6
3  1  3  5
4  2  4  4
5  2  5  3
6  2  6  2
7  2  7  1
   a  b  c
3  1  3  5
2  1  2  6
1  1  1  7
0  1  0  8
7  2  7  1
6  2  6  2
5  2  5  3
4  2  4  4

# 排序2 - 索引排序 .sort_index
# 按照行index排序
# 默认 ascending=True, inplace=False
df1 = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                  index = [5,4,3,2],
                   columns = ['a','b','c','d'])
df2 = pd.DataFrame(np.random.rand(16).reshape(4,4)*100,
                  index = ['h','s','x','g'],
                   columns = ['a','b','c','d'])

print(df1)
print(df1.sort_index())
print(df2)
print(df2.sort_index())

           a          b          c          d
5  84.095499  13.313575  99.483003  52.785404
4  31.363606  82.146044  48.645785  61.034812
3  42.635269  70.476056  65.823774  52.421584
2  42.028122  46.937515  92.741171  90.049750
           a          b          c          d
2  42.028122  46.937515  92.741171  90.049750
3  42.635269  70.476056  65.823774  52.421584
4  31.363606  82.146044  48.645785  61.034812
5  84.095499  13.313575  99.483003  52.785404
           a          b          c          d
h  69.897356  83.189551  67.665089  43.221810
s  32.360179   1.464245  54.805584  48.618503
x  59.188794  72.810460  51.521598  27.956133
g  21.787669  17.587755  65.334653  66.057178
           a          b          c          d
g  21.787669  17.587755  65.334653  66.057178
h  69.897356  83.189551  67.665089  43.221810
s  32.360179   1.464245  54.805584  48.618503
x  59.188794  72.810460  51.521598  27.956133

#作业answer
#作业1
df1=pd.DataFrame(np.random.rand(3,3)*100,index=list('abc'),columns=['v1','v2','v3'])
print(df1.sort_index(ascending=False))
print('------')
print(df1.sort_values(by=['v2'],ascending=False))
print('------')

#作业2
df1=pd.DataFrame(np.random.rand(5,2)*100,index=list('abcde'),columns=['v1','v2'])
df2=df1.T
df2.drop(['e'],axis=1)

          v1         v2         v3
c  71.187723  52.861998  59.219050
b  54.618639  38.720337  94.535586
a  77.624794  53.408849  69.616503
------
          v1         v2         v3
a  77.624794  53.408849  69.616503
c  71.187723  52.861998  59.219050
b  54.618639  38.720337  94.535586
------

	a	b	c	d
v1	11.507745	14.183001	51.572311	62.421454
v2	33.023802	62.028549	12.476100	1.098652

你可能感兴趣的:(（三篇长文让你玩6Pandas）数据分析入门_PART2常用工具包_CH02数据分析工具：Pandas__Part01（Series和DataFrame全面操作）)

情绪觉察日记第37天露露_e800
今天是家庭关系规划师的第二阶最后一天，慧萍老师帮我做了个案，帮我处理了埋在心底好多年的一份恐惧，并给了我深深的力量！这几天出来学习，爸妈过来婆家帮我带小孩，妈妈出于爱帮我收拾东西，并跟我先生和婆婆产生矛盾，妈妈觉得他们没有照顾好我…。今晚回家见到妈妈，我很欣赏她并赞扬她，妈妈说今晚要跟我睡我说好，当我们俩躺在床上准备睡觉的时候，我握着妈妈的手对她说:妈妈这几天辛苦你了，你看你多利害把我们的家收拾得
芦花鞋一四许叶晗
又是在一个寒冷的夏日里，青铜和葵花决定今天一起去卖芦花鞋，奶奶亲手给他们做了一碗热乎乎的粥对他们说:“就靠你们两挣生活费了这碗粥赶紧趁热喝了吧！”于是青铜和葵花喝完了奶奶给她们做的粥，就准备去镇上卖卢花鞋，这回青铜和葵花穿着新的芦花鞋来到了镇上。青铜这回看到了很多人都在卖，用手势表达对葵花说:“这回有好多人在抢我们生意呢！我们必须得吆喝起来。”葵花点了点头。可是谁知他们也大声的叫，卖芦花喽！卖芦花
QQ群采集助手，精准引流必备神器 2401_87347160 其他经验分享
功能概述微信群查找与筛选工具是一款专为微信用户设计的辅助工具，它通过关键词搜索功能，帮助用户快速找到相关的微信群，并提供筛选是否需要验证的群组的功能。主要功能关键词搜索：用户可以输入关键词，工具将自动查找包含该关键词的微信群。筛选功能：工具提供筛选机制，用户可以选择是否只显示需要验证或不需要验证的群组。精准引流：通过上述功能，用户可以更精准地找到目标群组，进行有效的引流操作。3.设备需求该工具可以
关于沟通这件事，项目经理不需要每次都面对面进行流程大师兄
很多项目经理都会遇到这样的问题，项目中由于事情太多，根本没有足够的时间去召开会议，那在这种情况下如何去有效地管理项目中的利益相关者？当然，不建议电子邮件也不需要开会的话，建议可以采取下面几种方式来形成有效的沟通，这几种方式可以帮助你努力的通过各种办法来保持和各方面的联系。项目经理首先要问自己几个问题，项目中哪些利益相关者是必须要进行沟通的？可以列出项目中所有的利益相关者清单，同时也整理出项目中哪些
机器学习与深度学习间关系与区别 ℒℴѵℯ心·动ꦿ໊ོ꫞ 人工智能学习深度学习 python
一、机器学习概述定义机器学习（MachineLearning,ML）是一种通过数据驱动的方法，利用统计学和计算算法来训练模型，使计算机能够从数据中学习并自动进行预测或决策。机器学习通过分析大量数据样本，识别其中的模式和规律，从而对新的数据进行判断。其核心在于通过训练过程，让模型不断优化和提升其预测准确性。主要类型1.监督学习（SupervisedLearning）监督学习是指在训练数据集中包含输入
【iOS】MVC设计模式 Magnetic_h ios mvc 设计模式 objective-c 学习 ui
MVC前言如何设计一个程序的结构，这是一门专门的学问，叫做"架构模式"（architecturalpattern），属于编程的方法论。MVC模式就是架构模式的一种。它是Apple官方推荐的App开发架构，也是一般开发者最先遇到、最经典的架构。MVC各层controller层Controller/ViewController/VC（控制器）负责协调Model和View，处理大部分逻辑它将数据从Mod
一百九十四章. 自相矛盾巨木擎天
唉！就这么一夜，林子感觉就像过了很多天似的，先是回了阳间家里，遇到了那么多不可思议的事情儿。特别是小伙伴们，第二次与自己见面时，僵硬的表情和恐怖的气氛，让自己如坐针毡，打从心眼里难受！还有东子，他现在还好吗？有没有被人欺负？护城河里的小鱼小虾们，还都在吗？水不会真的干枯了吧？那对相亲相爱漂亮的太平鸟儿，还好吧！春天了，到了做窝、下蛋、喂养小鸟宝宝的时候了，希望它们都能够平安啊！虽然没有看见家人，也
UI学习——cell的复用和自定义cell Magnetic_h ui 学习
目录cell的复用手动（非注册）自动（注册）自定义cellcell的复用在iOS开发中，单元格复用是一种提高表格（UITableView）和集合视图（UICollectionView）滚动性能的技术。当一个UITableViewCell或UICollectionViewCell首次需要显示时，如果没有可复用的单元格，则视图会创建一个新的单元格。一旦这个单元格滚动出屏幕，它就不会被销毁。相反，它被添
element实现动态路由+面包屑软件技术NINI vue案例 vue.js 前端
el-breadcrumb是ElementUI组件库中的一个面包屑导航组件，它用于显示当前页面的路径，帮助用户快速理解和导航到应用的各个部分。在Vue.js项目中，如果你已经安装了ElementUI，就可以很方便地使用el-breadcrumb组件。以下是一个基本的使用示例：安装ElementUI（如果你还没有安装的话）:你可以通过npm或yarn来安装ElementUI。bash复制代码npmi
地推话术，如何应对地推过程中家长的拒绝校师学
相信校长们在做地推的时候经常遇到这种情况：市场专员反馈家长不接单，咨询师反馈难以邀约这些家长上门，校区地推疲软，招生难。为什么？仅从地推层面分析，一方面因为家长受到的信息轰炸越来越多，对信息越来越“免疫”；而另一方面地推人员的专业能力和营销话术没有提高，无法应对家长的拒绝，对有意向的家长也不知如何跟进，眼睁睁看着家长走远；对于家长的疑问，更不知道如何有技巧地回答，机会白白流失。由于回答没技巧和专业
谢谢你们，爱你们！鹿游儿
昨天家人去泡温泉，二个孩子也带着去，出发前一晚，匆匆下班，赶回家和孩子一起收拾。饭后，我拿出笔和本子（上次去澳门时做手帐的本子）写下了1\2\3\4\5\6\7\8\9,让后让小壹去思考，带什么出发去旅游呢？她在对应的数字旁边画上了，泳衣、泳圈、肖恩、内衣内裤、tapuy、拖鞋……画完后，就让她自己对着这个本子，将要带的，一一带上，没想到这次带的书还是这本《便便工厂》(晚上姑婆发照片过来，妹妹累得
C语言如何定义宏函数？小九格物 c语言
在C语言中，宏函数是通过预处理器定义的，它在编译之前替换代码中的宏调用。宏函数可以模拟函数的行为，但它们不是真正的函数，因为它们在编译时不会进行类型检查，也不会分配存储空间。宏函数的定义通常使用#define指令，后面跟着宏的名称和参数列表，以及宏展开后的代码。宏函数的定义方式：1.基本宏函数：这是最简单的宏函数形式，它直接定义一个表达式。#defineSQUARE(x)((x)*(x))2.带参
微服务下功能权限与数据权限的设计与实现 nbsaas-boot 微服务 java 架构
在微服务架构下，系统的功能权限和数据权限控制显得尤为重要。随着系统规模的扩大和微服务数量的增加，如何保证不同用户和服务之间的访问权限准确、细粒度地控制，成为设计安全策略的关键。本文将讨论如何在微服务体系中设计和实现功能权限与数据权限控制。1.功能权限与数据权限的定义功能权限：指用户或系统角色对特定功能的访问权限。通常是某个用户角色能否执行某个操作，比如查看订单、创建订单、修改用户资料等。数据权限：
理解Gunicorn：Python WSGI服务器的基石范范0825 ipython linux 运维
理解Gunicorn：PythonWSGI服务器的基石介绍Gunicorn，全称GreenUnicorn，是一个为PythonWSGI（WebServerGatewayInterface）应用设计的高效、轻量级HTTP服务器。作为PythonWeb应用部署的常用工具，Gunicorn以其高性能和易用性著称。本文将介绍Gunicorn的基本概念、安装和配置，帮助初学者快速上手。1.什么是Gunico
2021年12月19日，春蕾教育集团团建活动感受——黄晓丹黄错错加油
感受:1.从陌生到熟悉的过程。游戏环节让我们在轻松的氛围中得到了锻炼，也增长了不少知识。2.游戏过程中，我们贡献的是个人力量，展现的是团队的力量。它磨合的往往不止是工作的熟悉，更是观念上契合度的贴近。3.这和工作是一样的道理。在各自的岗位上，每个人摆正自己的位置、各司其职充分发挥才能，并团结一致劲往一处使，才能实现最大的成功。新知:1.团队精神需要不断地创新。过去，人们把创新看作是冒风险，现在人们
Cell Insight | 单细胞测序技术又一新发现，可用于HIV-1和Mtb共感染个体诊断尐尐呅
结核病是艾滋病合并其他疾病中导致患者死亡的主要原因。其中结核病由结核分枝杆菌（Mycobacteriumtuberculosis,Mtb）感染引起，获得性免疫缺陷综合症（艾滋病）由人免疫缺陷病毒（Humanimmunodeficiencyvirustype1,HIV-1）感染引起。国家感染性疾病临床医学研究中心/深圳市第三人民医院张国良团队携手深圳华大生命科学研究院吴靓团队，共同研究得出单细胞测序
c++ 的iostream 和 c++的stdio的区别和联系黄卷青灯77 c++算法开发语言 iostream stdio
在C++中，iostream和C语言的stdio.h都是用于处理输入输出的库，但它们在设计、用法和功能上有许多不同。以下是两者的区别和联系：区别1.编程风格iostream（C++风格）：C++标准库中的输入输出流类库，支持面向对象的输入输出操作。典型用法是cin（输入）和cout（输出），使用>操作符来处理数据。更加类型安全，支持用户自定义类型的输入输出。#includeintmain(){in
《投行人生》读书笔记小蘑菇的树洞
《投行人生》----作者詹姆斯-A-朗德摩根斯坦利副主席40年的职业洞见-很短小精悍的篇幅，比较适合初入职场的新人。第一部分成功的职业生涯需要规划1.情商归为适应能力分享与协作同理心适应能力，更多的是自我意识，你有能力识别自己的情并分辨这些情绪如何影响你的思想和行为。2.对于初入职场的人的建议，细节，截止日期和数据很重要截止日期，一种有效的方法是请老板为你所有的任务进行优先级排序。和老板喝咖啡的好
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
绘本讲师训练营【24期】8/21阅读原创《独生小孩》 1784e22615e0
24016-孟娟《独生小孩》图片发自App今天我想分享一个蛮特别的绘本，讲的是一个特殊的群体，我也是属于这个群体，80后的独生小孩。这是一本中国绘本，作者郭婧，也是一个80厚。全书一百多页，均为铅笔绘制，虽然为黑白色调，但并不显得沉闷。全书没有文字，犹如“默片”，但并不影响读者对该作品的理解，反而显得神秘，梦幻，給读者留下想象的空间。作者在前蝴蝶页这样写到：“我更希望父母和孩子一起分享这本书，使他
店群合一模式下的社区团购新发展——结合链动 2+1 模式、AI 智能名片与 S2B2C 商城小程序源码说私域人工智能小程序
摘要：本文探讨了店群合一的社区团购平台在当今商业环境中的重要性和优势。通过分析店群合一模式如何将互联网社群与线下终端紧密结合，阐述了链动2+1模式、AI智能名片和S2B2C商城小程序源码在这一模式中的应用价值。这些创新元素的结合为社区团购带来了新的机遇，提升了用户信任感、拓展了营销渠道，并实现了线上线下的完美融合。一、引言随着互联网技术的不断发展，社区团购作为一种新兴的商业模式，在满足消费者日常需
消息中间件有哪些常见类型 xmh-sxh-1314 java
消息中间件根据其设计理念和用途，可以大致分为以下几种常见类型：点对点消息队列（Point-to-PointMessagingQueues）：在这种模型中，消息被发送到特定的队列中，消费者从队列中取出并处理消息。队列中的消息只能被一个消费者消费，消费后即被删除。常见的实现包括IBM的MQSeries、RabbitMQ的部分使用场景等。适用于任务分发、负载均衡等场景。发布/订阅消息模型（Pub/Sub
ArcGIS栅格计算器常见公式（赋值、0和空值的转换、补充栅格空值）研学随笔 arcgis 经验分享
我们在使用ArcGIS时通常经常用到栅格计算器，今天主要给大家介绍我日常中经常用到的几个公式，供大家参考学习。将特定值（-9999）赋值为0，例如-9999.Con("raster"==-9999,0,"raster")2.给空值赋予特定的值（如0）Con(IsNull("raster"),0,"raster")3.将特定的栅格值(如1)赋值为空值，其他保留原值SetNull("raster"==
水平垂直居中的几种方法（总结） LJ小番茄 CSS_玄学语言 html javascript 前端 css css3
1.使用flexbox的justify-content和align-items.parent{display:flex;justify-content:center;/*水平居中*/align-items:center;/*垂直居中*/height:100vh;/*需要指定高度*/}2.使用grid的place-items:center.parent{display:grid;place-item
本周第二次约练 2cfbdfe28a51
中原焦点团队中24初26刘霞2021.12.3约练161次，分享第368天当事人虽然是带着问题来的，但是咨询过程中发现，她是经过自己不断地调整和努力才走到现在的，看到当事人的不容易，找到例外，发现资源，力量感也就随之而来。增强画面感，或者说重温，会给当事人带来更深刻的感受。
放下是一段成长的修行小莳玥
人来到这个世界上，只有两件事：生和死。一件事已经做完了，另一件你还急什么呢?是人，都有七情六欲。是心，都有喜怒哀乐，这些再正常不过了。别总抱怨自己活得累，过得辛苦。永远记住：舒坦是留给死人的。苦，才是生活；累，才是工作；变，才是命运；忍，才是历练；容，才是智慧；静，才是修养；舍，才会得到；做，才会拥有。人生，活得太清楚，才是最大的不明白。有些事，看得很清，却说不清；有些人，了解很深，却猜不透；有些
回溯 Leetcode 332 重新安排行程 mmaerd Leetcode刷题学习记录 leetcode 算法职场和发展
重新安排行程Leetcode332学习记录自代码随想录给你一份航线列表tickets，其中tickets[i]=[fromi,toi]表示飞机出发和降落的机场地点。请你对该行程进行重新规划排序。所有这些机票都属于一个从JFK（肯尼迪国际机场）出发的先生，所以该行程必须从JFK开始。如果存在多种有效的行程，请你按字典排序返回最小的行程组合。例如，行程[“JFK”,“LGA”]与[“JFK”,“LGB
Python数据分析与可视化实战指南 William数据分析 python python 数据
在数据驱动的时代，Python因其简洁的语法、强大的库生态系统以及活跃的社区，成为了数据分析与可视化的首选语言。本文将通过一个详细的案例，带领大家学习如何使用Python进行数据分析，并通过可视化来直观呈现分析结果。一、环境准备1.1安装必要库在开始数据分析和可视化之前，我们需要安装一些常用的库。主要包括pandas、numpy、matplotlib和seaborn等。这些库分别用于数据处理、数学
每日一题——第八十四题互联网打工人no1 C语言程序设计每日一练 c语言
题目：编写函数1、输入10个职工的姓名和职工号2、按照职工由大到小顺序排列，姓名顺序也随之调整3、要求输入一个职工号，用折半查找法找出该职工的姓名#define_CRT_SECURE_NO_WARNINGS#include#include#defineMAX_EMPLOYEES10typedefstruct{intid;charname[50];}Empolyee;voidinputEmploye
网易严选官方旗舰店，优质商品，卓越服务高省_飞智666600
网易严选官方旗舰店是网易旗下的一家电商平台，以提供优质商品和卓越服务而闻名。作为一名SEO优化师，我将为您详细介绍网易严选官方旗舰店，并重点强调其特点和优势。大家好！我是高省APP最大团队&联合创始人飞智导师。相较于其他返利app，高省APP的佣金更高，模式更好，最重要的是，终端用户不会流失！高省APP佣金更高，模式更好，终端用户不流失。【高省】是一个自用省钱佣金高，分享推广赚钱多的平台，百度有几
如何用ruby来写hadoop的mapreduce并生成jar包 wudixiaotie mapreduce
ruby来写hadoop的mapreduce，我用的方法是rubydoop。怎么配置环境呢： 1.安装rvm：不说了网上有 2.安装ruby：由于我以前是做ruby的，所以习惯性的先安装了ruby，起码调试起来比jruby快多了。 3.安装jruby： rvm install jruby然后等待安
java编程思想 -- 访问控制权限百合不是茶 java 访问控制权限单例模式
访问权限是java中一个比较中要的知识点,它规定者什么方法可以访问,什么不可以访问一:包访问权限; 自定义包: package com.wj.control; //包 public class Demo { //定义一个无参的方法 public void DemoPackage(){ System.out.println("调用
[生物与医学]请审慎食用小龙虾 comsci 生物
现在的餐馆里面出售的小龙虾,有一些是在野外捕捉的,这些小龙虾身体里面可能带有某些病毒和细菌,人食用以后可能会导致一些疾病,严重的甚至会死亡..... 所以,参加聚餐的时候,最好不要点小龙虾...就吃养殖的猪肉,牛肉,羊肉和鱼,等动物蛋白质
org.apache.jasper.JasperException: Unable to compile class for JSP: 商人shang maven 2.2 jdk1.8
环境： jdk1.8 maven tomcat7-maven-plugin 2.0 原因： tomcat7-maven-plugin 2.0 不知吃 jdk 1.8，换成 tomcat7-maven-plugin 2.2就行，即 <plugin>
你的垃圾你处理掉了吗?GC oloz GC
前序:本人菜鸟，此文研究学习来自网络，各位牛牛多指教　 1.垃圾收集算法的核心思想　　Java语言建立了垃圾收集机制，用以跟踪正在使用的对象和发现并回收不再使用(引用)的对象。该机制可以有效防范动态内存分配中可能发生的两个危险：因内存垃圾过多而引发的内存耗尽，以及不恰当的内存释放所造成的内存非法引用。　　垃圾收集算法的核心思想是：对虚拟机可用内存空间，即堆空间中的对象进行识别
shiro 和 SESSSION 杨白白 shiro
shiro 在web项目里默认使用的是web容器提供的session，也就是说shiro使用的session是web容器产生的，并不是自己产生的，在用于非web环境时可用其他来源代替。在web工程启动的时候它就和容器绑定在了一起，这是通过web.xml里面的shiroFilter实现的。通过session.getSession()方法会在浏览器cokkice产生JESSIONID，当关闭浏览器，此
移动互联网终端淘宝客如何实现盈利小桔子移動客戶端淘客淘寶App
2012年淘宝联盟平台为站长和淘宝客带来的分成收入突破30亿元，同比增长100%。而来自移动端的分成达1亿元，其中美丽说、蘑菇街、果库、口袋购物等App运营商分成近5000万元。可以看出，虽然目前阶段PC端对于淘客而言仍旧是盈利的大头，但移动端已经呈现出爆发之势。而且这个势头将随着智能终端(手机，平板)的加速普及而更加迅猛
wordpress小工具制作 aichenglong wordpress 小工具
wordpress 使用侧边栏的小工具，很方便调整页面结构小工具的制作过程 1 在自己的主题文件中新建一个文件夹(如widget)，在文件夹中创建一个php(AWP_posts-category.php) 小工具是一个类,想侧边栏一样，还得使用代码注册，他才可以再后台使用，基本的代码一层不变 <?php class AWP_Post_Category extends WP_Wi
JS微信分享 AILIKES js
// 所有功能必须包含在 WeixinApi.ready 中进行 WeixinApi.ready(function(Api) { // 微信分享的数据 var wxData = { &nb
封装探讨百合不是茶 JAVA面向对象封装
//封装属性方法将某些东西包装在一起，通过创建对象或使用静态的方法来调用，称为封装；封装其实就是有选择性地公开或隐藏某些信息，它解决了数据的安全性问题，增加代码的可读性和可维护性在 Aname类中申明三个属性，将其封装在一个类中：通过对象来调用例如 1： //属性将其设为私有姓名 name 可以公开
jquery radio/checkbox change事件不能触发的问题 bijian1013 JavaScript jquery
我想让radio来控制当前我选择的是机动车还是特种车，如下所示： <html> <head> <script src="http://ajax.googleapis.com/ajax/libs/jquery/1.7.1/jquery.min.js" type="text/javascript"><
AngularJS中安全性措施 bijian1013 JavaScript AngularJS 安全性 XSRF JSON漏洞
在使用web应用中，安全性是应该首要考虑的一个问题。AngularJS提供了一些辅助机制，用来防护来自两个常见攻击方向的网络攻击。一.JSON漏洞当使用一个GET请求获取JSON数组信息的时候（尤其是当这一信息非常敏感，
[Maven学习笔记九]Maven发布web项目 bit1129 maven
基于Maven的web项目的标准项目结构 user-project user-core user-service user-web src
【Hive七】Hive用户自定义聚合函数(UDAF) bit1129 hive
用户自定义聚合函数，用户提供的多个入参通过聚合计算(求和、求最大值、求最小值)得到一个聚合计算结果的函数。问题：UDF也可以提供输入多个参数然后输出一个结果的运算，比如加法运算add(3，5)，add这个UDF需要实现UDF的evaluate方法,那么UDF和UDAF的实质分别究竟是什么？ Double evaluate(Double a, Double b)
通过 nginx-lua 给 Nginx 增加 OAuth 支持 ronin47
前言：我们使用Nginx的Lua中间件建立了OAuth2认证和授权层。如果你也有此打算，阅读下面的文档，实现自动化并获得收益。SeatGeek 在过去几年中取得了发展，我们已经积累了不少针对各种任务的不同管理接口。我们通常为新的展示需求创建新模块，比如我们自己的博客、图表等。我们还定期开发内部工具来处理诸如部署、可视化操作及事件处理等事务。在处理这些事务中，我们使用了几个不同的接口来认证： &n
利用tomcat-redis-session-manager做session同步时自定义类对象属性保存不上的解决方法 bsr1983 session
在利用tomcat-redis-session-manager做session同步时，遇到了在session保存一个自定义对象时，修改该对象中的某个属性，session未进行序列化，属性没有被存储到redis中。在 tomcat-redis-session-manager的github上有如下说明： Session Change Tracking As noted in the &qu
《代码大全》表驱动法-Table Driven Approach-1 bylijinnan java 算法
关于Table Driven Approach的一篇非常好的文章： http://www.codeproject.com/Articles/42732/Table-driven-Approach package com.ljn.base; import java.util.Random; public class TableDriven { public
Sybase封锁原理 chicony Sybase
昨天在操作Sybase IQ12.7时意外操作造成了数据库表锁定，不能删除被锁定表数据也不能往其中写入数据。由于着急往该表抽入数据，因此立马着手解决该表的解锁问题。无奈此前没有接触过Sybase IQ12.7这套数据库产品，加之当时已属于下班时间无法求助于支持人员支持，因此只有借助搜索引擎强大的
java异常处理机制 CrazyMizzz java
java异常关键字有以下几个，分别为 try catch final throw throws 他们的定义分别为 try： Opening exception-handling statement. catch： Captures the exception. finally： Runs its code before terminating
hive 数据插入DML语法汇总 daizj hive DML 数据插入
Hive的数据插入DML语法汇总1、Loading files into tables语法：1) LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]解释：1)、上面命令执行环境为hive客户端环境下： hive>l
工厂设计模式 dcj3sjt126com 设计模式
使用设计模式是促进最佳实践和良好设计的好办法。设计模式可以提供针对常见的编程问题的灵活的解决方案。工厂模式工厂模式（Factory）允许你在代码执行时实例化对象。它之所以被称为工厂模式是因为它负责“生产”对象。工厂方法的参数是你要生成的对象对应的类名称。 Example #1 调用工厂方法（带参数） <?phpclass Example{
mysql字符串查找函数 dcj3sjt126com mysql
FIND_IN_SET(str,strlist) 假如字符串str 在由N 子链组成的字符串列表strlist 中，则返回值的范围在1到 N 之间。一个字符串列表就是一个由一些被‘,’符号分开的自链组成的字符串。如果第一个参数是一个常数字符串，而第二个是type SET列，则 FIND_IN_SET() 函数被优化，使用比特计算。如果str不在strlist 或st
jvm内存管理 easterfly jvm
一、JVM堆内存的划分分为年轻代和年老代。年轻代又分为三部分：一个eden,两个survivor。工作过程是这样的：e区空间满了后，执行minor gc，存活下来的对象放入s0, 对s0仍会进行minor gc，存活下来的的对象放入s1中，对s1同样执行minor gc，依旧存活的对象就放入年老代中；年老代满了之后会执行major gc，这个是stop the word模式，执行
CentOS-6.3安装配置JDK-8 gengzg centos
JAVA_HOME=/usr/java/jdk1.8.0_45 JRE_HOME=/usr/java/jdk1.8.0_45/jre PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib export JAVA_HOME
【转】关于web路径的获取方法 huangyc1210 Web 路径
假定你的web application 名称为news,你在浏览器中输入请求路径： http://localhost:8080/news/main/list.jsp 则执行下面向行代码后打印出如下结果： 1、 System.out.println(request.getContextPath()); //可返回站点的根路径。也就是项
php里获取第一个中文首字母并排序远去的渡口数据结构 PHP
很久没来更新博客了，还是觉得工作需要多总结的好。今天来更新一个自己认为比较有成就的问题吧。最近在做储值结算，需求里结算首页需要按门店的首字母A-Z排序。我的数据结构原本是这样的： Array ( [0] => Array ( [sid] => 2885842 [recetcstoredpay] =&g
java内部类 hm4123660 java 内部类匿名内部类成员内部类方法内部类
　在Java中，可以将一个类定义在另一个类里面或者一个方法里面，这样的类称为内部类。内部类仍然是一个独立的类，在编译之后内部类会被编译成独立的.class文件，但是前面冠以外部类的类名和$符号。内部类可以间接解决多继承问题,可以使用内部类继承一个类，外部类继承一个类，实现多继承。 &nb
Caused by: java.lang.IncompatibleClassChangeError: class org.hibernate.cfg.Exten zhb8015
maven pom.xml关于hibernate的配置和异常信息如下，查了好多资料，问题还是没有解决。只知道是包冲突，就是不知道是哪个包....遇到这个问题的分享下是怎么解决的。。 maven pom: <dependency> <groupId>org.hibernate</groupId> <ar
Spark 性能相关参数配置详解－任务调度篇 Stark_Summer spark cache cpu 任务调度 yarn
随着Spark的逐渐成熟完善, 越来越多的可配置参数被添加到Spark中来, 本文试图通过阐述这其中部分参数的工作原理和配置思路, 和大家一起探讨一下如何根据实际场合对Spark进行配置优化。由于篇幅较长，所以在这里分篇组织，如果要看最新完整的网页版内容，可以戳这里：http://spark-config.readthedocs.org/，主要是便
css3滤镜 wangkeheng html css
经常看到一些网站的底部有一些灰色的图标，鼠标移入的时候会变亮，开始以为是js操作src或者bg呢，搜索了一下，发现了一个更好的方法：通过css3的滤镜方法。 html代码： <a href='' class='icon'><img src='utv.jpg' /></a> css代码： .icon{-webkit-filter: graysc