csdndscs

Python: DateFrame教程

创建、读写、显示

创建DataFrame与Series

读取、保存数据文件

设置显示格式

列数据对齐

索引、选择

取行

取列

同时取行列

将某列设为行索引

条件选取

汇总函数与映射

汇总函数：describe(),unique(),value_counts()

映射：map()与apply()

连接两列文本

分组与排序

分组分析

多层索引

排序

数据类型与缺失值处理

数据类型及转换

缺失值处理

重命名、更改列顺序、添加新行列

重命名列名与行名

更改列顺序

添加新列

数据框合并

相同列名的数据框纵向拼接

横向拼接或融合数据框

导入库

import pandas as pd

创建、读写、显示

创建DataFrame与Series

>>> pd.DataFrame({'Yes':[50,21],"No":[131,2]})
   Yes   No
0   50  131
1   21    2
>>> #数据框的内容也可以为字符串
>>> pd.DataFrame({'Bob':['T like it.','It was awful.'],'Sue':['Pretty good.','Bland.']})
             Bob           Sue
0     T like it.  Pretty good.
1  It was awful.        Bland.
>>> #设置行索引
>>> pd.DataFrame({'Bob': ['I liked it.', 'It was awful.'], 
              'Sue': ['Pretty good.', 'Bland.']},
             index=['Product A', 'Product B'])
                     Bob           Sue
Product A    I liked it.  Pretty good.
Product B  It was awful.        Bland.
>>> #创建Series
>>> pd.Series([1,2,3,4,5])
0    1
1    2
2    3
3    4
4    5
dtype: int64
>>> #Series无列名，只有一个总体的名称
>>> pd.Series([30, 35, 40], index=['2015 Sales', '2016 Sales', '2017 Sales'], name='Product A')
2015 Sales    30
2016 Sales    35
2017 Sales    40
Name: Product A, dtype: int64

读取、保存数据文件

>>> wine_reviews = pd.read_csv('D:\DOCUMENT\PRO\PYTHON\DataFrameTurtorial\winemag-data-130k-v2.csv')			       
>>> wine_reviews			       
        Unnamed: 0   country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0               0      Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1               1   Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...           ...        ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969     129969     France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970     129970     France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...
[129971 rows x 14 columns]

>>> #显示行列数			       
>>> wine_reviews.shape			       
(129971, 14)

>>> #显示首尾几行			       
>>> wine_reviews.head()  #默认显示前5行，head(3)显示前3行
			       
   Unnamed: 0   country description designation  points  price   province   region_1   region_2 taster_name taster_twitter_handle      title    variety     winery
0          0      Italy  Aromas...   Vulkà ...       87    NaN  Sicily...       Etna        NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1          1   Portugal  This i...    Avidagos       87   15.0      Douro        NaN        NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
2          2         US  Tart a...         NaN       87   14.0     Oregon  Willam...  Willam...  Paul G...   @paulg...             Rainst...  Pinot ...  Rainstorm
3          3         US  Pineap...   Reserv...       87   13.0   Michigan  Lake M...        NaN  Alexan...         NaN             St. Ju...   Riesling  St. Ju...
4          4         US  Much l...   Vintne...       87   65.0     Oregon  Willam...  Willam...  Paul G...   @paulg...             Sweet ...  Pinot ...  Sweet ...

>>> wine_reviews.tail()  #默认显示后5行，tail(3)显示后3行
			       
        Unnamed: 0  country description designation  points  price province region_1   region_2 taster_name taster_twitter_handle      title    variety     winery
129966     129966   Germany  Notes ...   Braune...       90   28.0    Mosel      NaN        NaN  Anna L...         NaN             Dr. H....   Riesling  Dr. H....
129967     129967        US  Citati...         NaN       90   75.0   Oregon   Oregon  Oregon...  Paul G...   @paulg...             Citati...  Pinot ...   Citation
129968     129968    France  Well-d...       Kritt       90   30.0   Alsace   Alsace        NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...
129969     129969    France  A dry ...         NaN       90   32.0   Alsace   Alsace        NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970     129970    France  Big, r...   Lieu-d...       90   21.0   Alsace   Alsace        NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

>>> #创建时可指定索引			       
>>> wine_reviews = pd.read_csv('D:\DOCUMENT\PRO\PYTHON\DataFrameTurtorial\winemag-data-130k-v2.csv', index_col=0)			       
>>> wine_reviews			       
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

>>> #将数据框保存为csv文件			       
>>> wine_reviews.to_csv(path)

设置显示格式

#显示所有列(参数设置为None代表显示所有列，也可以自行设置数字)
pd.set_option('display.max_columns',None)
#显示所有行
pd.set_option('display.max_rows',None)
#设置数据的显示长度，默认为50
pd.set_option('max_colwidth',200)
#禁止自动换行(设置为Flase不自动换行，True反之)
pd.set_option('expand_frame_repr', False)

列数据对齐

#列数据对齐
>>> df    #对齐前
   f10     f12    f14    f2  f23   f3  f8    f9
0   79  000001   平安银行  2150  142 -129  30  1442
1   61  000002  万  科Ａ  3000  155   57  39   840
2    0  000003  PT金田A     0    0    0   0     0
>>> pd.set_option('display.unicode.ambiguous_as_wide', True)
>>> df
   f10     f12    f14    f2  f23   f3  f8    f9
0   79  000001   平安银行  2150  142 -129  30  1442
1   61  000002  万  科Ａ  3000  155   57  39   840
2    0  000003  PT金田A     0    0    0   0     0
>>> pd.set_option('display.unicode.east_asian_width', True)    #只用这一行似乎也可
>>> df    #对齐后
   f10     f12       f14    f2  f23   f3  f8    f9
0   79  000001  平安银行  2150  142 -129  30  1442
1   61  000002  万  科Ａ  3000  155   57  39   840
2    0  000003   PT金田A     0    0    0   0     0
>>> pd.set_option('display.width', 180) # 设置打印宽度(**重要**)
>>> df
   f10     f12       f14    f2  f23   f3  f8    f9
0   79  000001  平安银行  2150  142 -129  30  1442
1   61  000002  万  科Ａ  3000  155   57  39   840
2    0  000003   PT金田A     0    0    0   0     0

索引、选择

>>> #导入数据并设置最大显示行数为5
>>> import pandas as pd
>>> reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)
>>> pd.set_option('max_rows', 5)
>>> reviews
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

取行

>>> reviews.iloc[0]  #用行号访问第一行,返回Series
>>> reviews.iloc[[0]]  #用行号访问第一行,返回DataFrame
>>> reviews.iloc[-5:]  #取后5行,返回DataFrame
>>> reviews.iloc[2:4]  #第三行与第四行
>>> reviews[2:4]  #取第三行与第四行
>>> reviews.loc[[2,4]]  #取不连续的多行
			       
  country  ...        winery
2      US  ...     Rainstorm
4      US  ...  Sweet Cheeks

[2 rows x 13 columns]

取列

>>> #取一列
>>> reviews['country']  #用列名访问，返回Series
>>> reviews.country  #用.访问，名称中有空格时不适用，返回Series
>>> reviews.loc[:,'country']  #同reviews['country']，返回Series
>>> reviews.iloc[:,0]  #或用列位置索引访问，选取第1列，返回Series
>>> reviews[['country']]  #取country列，返回DataFrame
>>> reviews.loc[:,['country']]  #同reviews[['country']]
>>> reviews.iloc[:,[0]]  #取第0列，用位置索引访问，返回DataFrame
			       
         country
0          Italy
1       Portugal
...          ...
129969    France
129970    France

[129971 rows x 1 columns]

>>> #取多列，返回DataFrame
>>> reviews.loc[:'country':'points']  #取从country到points（包含points）的所有列，country列需在points列之前
>>> reviews.iloc[:,0:4]  #取第0列到第4列（不包含第四列）的所有列
>>> reviews[['country','points']]  #取不连续的country与points列、
>>> reviews.loc[:,['country','points']]  #同reviews[['country','points']]
>>> reviews.iloc[:,[0,3]]  #取不连续的第0列与第2列
			       
         country  points
0          Italy      87
1       Portugal      87
...          ...     ...
129969    France      90
129970    France      90

[129971 rows x 2 columns]

同时取行列

>>> #取单个值，返回类型为值的类型
>>> reviews['country'][0]  #取country列第一个值
>>> reviews.loc[0,'country']  #取第0行country列的值
>>> reviews.iloc[1,0]  #取第一行第0列的值

>>> #取多个值
>>> reviews.iloc[1:4,0]  #选取第2行到第4行的第一列，连续索引，返回Series
>>> reviews.iloc[[1,3],0]  #选取第2行第4行的第一列，分散索引，返回Series
>>> reviews.iloc[[1,3],[0]]  #选取第2行第4行的第一列，分散索引，返回DataFrame
>>> reviews.iloc[[1,3],2:5]  #选取第2行第4行的第3列到第5列，连续索引，返回DataFrame
>>> reviews.iloc[[1,3],[2,5]]  #选取第2行第4行的第3列和第6列，分散索引，返回DataFrame
>>> reviews.loc[1,['country','points']]  #选取第2行的country与points列，分散索引，返回Series
>>> reviews.loc[[1],['country','points']]  #选取第2行的country与points列，分散索引，返回DataFrame
>>> reviews.loc[[1,3],['country','points']]  #选取第2行与第4行的country与points列，分散索引，返回DataFrame
>>> reviews.loc[[1,3],'country':'points']  #选取第2行与第4行的country到points列，返回DataFrame
			       
    country  ... points
1  Portugal  ...     87
3        US  ...     87

[2 rows x 4 columns]

将某列设为行索引

>>> reviews.set_index('title')
			       
                                                     country  ...                winery
title                                                         ...                      
Nicosia 2013 Vulkà Bianco  (Etna)                      Italy  ...               Nicosia
Quinta dos Avidagos 2011 Avidagos Red (Douro)       Portugal  ...   Quinta dos Avidagos
...                                                      ...  ...                   ...
Domaine Marcel Deiss 2012 Pinot Gris (Alsace)         France  ...  Domaine Marcel Deiss
Domaine Schoffit 2012 Lieu-dit Harth Cuvée Caro...    France  ...      Domaine Schoffit

[129971 rows x 12 columns]

条件选取

>>> #判断每行country是否为Italy,返回Series
>>> reviews.country == 'Italy'
			       
0          True
1         False
          ...  
129969    False
129970    False
Name: country, Length: 129971, dtype: bool

>>> reviews[reviews.country == 'Italy']  #选取country为Italy的行
>>> reviews.loc[reviews.country == 'Italy']  #同上，可不用loc
>>> reviews[reviews['points'] == 90]  #选取points为90的行
>>> reviews.loc[(reviews.country == 'Italy') & (reviews.points >= 90)]  #选取country为Italy且points>=90的行
>>> reviews.loc[(reviews.country == 'Italy') | (reviews.points >= 90)]  #选取country为Italy或points>=90的行
>>> reviews.loc[reviews.country.isin(['Italy', 'France'])]  #选取country为Italy或France的行
>>> reviews.loc[reviews.price.isnull()]  #选取price为空的行
>>> reviews.loc[reviews.price.notnull()]  #选取price为非空的行
>>> reviews[reviews['description'].str.contains('great')]  #选取description列中包含great的行，有空值报错时添加参数na=False
                                                        #,即reviews[reviews['description'].str.contains('great',na=False)]
>>> reviews[~reviews['description'].str.contains('great')]  #选取description列中不包含great的行
			       
         country  ...                winery
0          Italy  ...               Nicosia
1       Portugal  ...   Quinta dos Avidagos
...          ...  ...                   ...
129969    France  ...  Domaine Marcel Deiss
129970    France  ...      Domaine Schoffit

[125196 rows x 13 columns]

汇总函数与映射

导入数据

>>> #导入数据并设置最大显示行数为5
>>> import pandas as pd
>>> reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)
>>> pd.set_option('max_rows', 5)
>>> reviews
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

汇总函数：describe(),unique(),value_counts()

>>> reviews.points.describe()  #返回数值列数据的均值、最大最小值等性质
			       
count    129971...
mean     88.447138
           ...    
75%      91.000000
max      100.00...
Name: points, Length: 8, dtype: float64

>>> reviews.taster_name.describe()  #返回文本列文本的一些性质
			       
count        103727
unique           19
top       Roger ...
freq          25514
Name: taster_name, dtype: object

>>> reviews.points.mean()  #取points列的平均值

>>> reviews.taster_name.unique() #查看taster_name列数据有多少种，返回数组
			       
array(['Kerin O’Keefe', 'Roger Voss', 'Paul Gregutt',
       'Alexander Peartree', 'Michael Schachner', 'Anna Lee C. Iijima',
       'Virginie Boone', 'Matt Kettmann', nan, 'Sean P. Sullivan',
       'Jim Gordon', 'Joe Czerwinski', 'Anne Krebiehl\xa0MW',
       'Lauren Buzzeo', 'Mike DeSimone', 'Jeff Jenssen',
       'Susan Kostrzewa', 'Carrie Dykes', 'Fiona Adams',
       'Christina Pickard'], dtype=object)

>>> reviews.taster_name.value_counts()  #查看taster_name列数据每种有多少个
			       
Roger Voss           25514
Michael Schachner    15134
                     ...  
Fiona Adams             27
Christina Pickard        6
Name: taster_name, Length: 19, dtype: int64

映射：map()与apply()

>>> #数据列扣除平均值			       
>>> review_points_mean = reviews.points.mean()			       
>>> reviews.points-review_points_mean  #返回Series,扣除平均值最快的方法，结果同下
>>> reviews.points.map(lambda p: p - review_points_mean)  #返回Series，不改变原DataFrame
			       
0        -1.447138
1        -1.447138
            ...   
129969    1.552862
129970    1.552862
Name: points, Length: 129971, dtype: float64

>>> #apply()方法逐行更改数据，较慢			       
>>> def remean_points(row):
    row.points = row.points - review_points_mean
    return row	       
>>> reviews.apply(remean_points, axis='columns')  #返回新的DataFrame，不改变原DataFrame
			       
         country description designation    points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...  -1.447138    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos  -1.447138   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...        ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN   1.552862   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...   1.552862   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

连接两列文本

>>> import pandas as pd
>>> import numpy as np

>>> df=pd.DataFrame({'c1':['d11','d21'],'c2':[np.nan,'d22']})
>>> df
    c1   c2
0  d11  NaN
1  d21  d22
>>> df['c3']=df.c1+' '+df.c2    #当有缺失值时，用+连接后的结果也为缺失值
>>> df['c4']=df.c1+' '+df.c2.fillna('')    #可用fillna填充缺失值
>>> df
    c1   c2       c3       c4
0  d11  NaN      NaN     d11 
1  d21  d22  d21 d22  d21 d22

分组与排序

导入数据

>>> #导入数据并设置最大显示行数为5
>>> import pandas as pd
>>> reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)
>>> pd.set_option('max_rows', 5)
>>> reviews
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

分组分析

>>> #按points不同分类，并统计每种points有多少行，返回Series
>>> reviews.groupby('points').size()  #方法1
>>> reviews.groupby('points').points.count()  #方法2
>>> reviews.points.value_counts()  #方法3，顺序可能不同,该方法没有Series列名
			       
88     17207
87     16933
       ...  
99        33
100       19
Name: points, Length: 21, dtype: int64

>>> #按points不同分类，并统计每种points种的最小price			       
>>> reviews.groupby('points').price.min()
			       
points
80      5.0
81      5.0
       ... 
99     44.0
100    80.0
Name: price, Length: 21, dtype: float64

>>> #按winery不同分类，查看每类中第一行的title			       
>>> reviews.groupby('winery').apply(lambda df: df.title.iloc[0])
			       
winery
1+1=3       1+1=3 ...
10 Knots    10 Kno...
              ...    
àMaurice    àMauri...
Štoka       Štoka ...
Length: 16757, dtype: object
>>> #根据多列（country,province）分类,并找出每类中points最高的行			       
>>> reviews.groupby(['country', 'province']).apply(lambda df: df.loc[df.points.idxmax()])
			       
                        country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
country   province                                                                                                                                                    
Argentina Mendoza...  Argentina  If the...   Nicasi...       97  120.0  Mendoz...  Mendoza      NaN  Michae...   @wines...             Bodega...     Malbec  Bodega...
          Other       Argentina  Take n...     Reserva       95   90.0      Other    Salta      NaN  Michae...   @wines...             Colomé...     Malbec     Colomé
...                         ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
Uruguay   San Jose      Uruguay  Baked,...   El Pre...       87   50.0   San Jose      NaN      NaN  Michae...   @wines...             Castil...  Red Blend  Castil...
          Uruguay       Uruguay  Cherry...   Blend ...       91   22.0    Uruguay      NaN      NaN  Michae...   @wines...             Narbon...  Tannat...    Narbona

[425 rows x 13 columns]

>>> #按country分类，并统计每类有多少行及每类的最大值最小值			       
>>> reviews.groupby(['country']).price.agg([len, min, max])
			       
              len   min    max
country                       
Argentina  3800.0   4.0  230.0
Armenia       2.0  14.0   15.0
...           ...   ...    ...
Ukraine      14.0   6.0   13.0
Uruguay     109.0  10.0  130.0

[43 rows x 3 columns]

多层索引

>>> #按country和province分类，查看每类有多少个			       
>>> countries_reviewed = reviews.groupby(['country', 'province']).description.agg([len])			       
>>> countries_reviewed
			       
                       len
country   province        
Argentina Mendoza...  3264
          Other        536
...                    ...
Uruguay   San Jose       3
          Uruguay       24

[425 rows x 1 columns]

>>> #查看数据类型			       
>>> mi = countries_reviewed.index			       
>>> type(mi)			       


>>> #重置行索引			       
>>> countries_reviewed.reset_index()
			       
       country   province   len
0    Argentina  Mendoz...  3264
1    Argentina      Other   536
..         ...        ...   ...
423    Uruguay   San Jose     3
424    Uruguay    Uruguay    24

[425 rows x 3 columns]

排序

>>> #分类结果按种类数目（值）排序			       
>>> countries_reviewed = countries_reviewed.reset_index()			       
>>> countries_reviewed.sort_values(by='len')  #升序（默认）
>>> countries_reviewed.sort_values(by='len', ascending=False)  #降序
			       
    country   province    len
392      US  Califo...  36247
415      US  Washin...   8639
..      ...        ...    ...
63    Chile    Coelemu      1
149  Greece     Beotia      1

[425 rows x 3 columns]

>>> #分类结果按索引升序排序			       
>>> countries_reviewed.sort_index()
			       
       country   province   len
0    Argentina  Mendoz...  3264
1    Argentina      Other   536
..         ...        ...   ...
423    Uruguay   San Jose     3
424    Uruguay    Uruguay    24

[425 rows x 3 columns]

>>> #分类结果多条件排序			       
>>> countries_reviewed.sort_values(by=['country', 'len'])
			       
       country   province   len
1    Argentina      Other   536
0    Argentina  Mendoz...  3264
..         ...        ...   ...
424    Uruguay    Uruguay    24
419    Uruguay  Canelones    43

[425 rows x 3 columns]

数据类型与缺失值处理

导入数据

>>> #导入数据并设置最大显示行数为5
>>> import pandas as pd
>>> reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)
>>> pd.set_option('max_rows', 5)
>>> reviews
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

数据类型及转换

>>> #查看列数据类型
>>> reviews.index.dtype  #查看索引列数据类型，dtype('int64')
>>> reviews.price.dtype  #查看price列数据类型，dtype('float64')
>>> reviews.dtypes
			       
country        object
description    object
                ...  
variety        object
winery         object
Length: 13, dtype: object

>>> #转换数据类型
>>> reviews.points.astype('float64')
0         87.0
1         87.0
          ... 
129969    90.0
129970    90.0
Name: points, Length: 129971, dtype: float64

>>> #将列数据转换为列表
>>> reviews['country'].tolist()
>>> #或
>>> list(reviews['country'])

缺失值处理

缺失值标记为NaN（Not a Number），总为float64类型

>>> #选择country值缺失的行
>>> reviews[pd.isnull(reviews.country)]  #反过来为notnull
       country  ...              winery
913        NaN  ...  Gotsa Family Wines
3131       NaN  ...   Barton & Guestier
...        ...  ...                 ...
129590     NaN  ...           Büyülübağ
129900     NaN  ...              Psagot

[63 rows x 13 columns]

>>> #用Unknown填充region_2缺失的行
>>> reviews.region_2.fillna("Unknown")
0         Unknown
1         Unknown
           ...   
129969    Unknown
129970    Unknown
Name: region_2, Length: 129971, dtype: object

>>> #值替换
>>> reviews.taster_twitter_handle.replace("@kerinokeefe", "@kerino")  #将taster_twitter_handle列中的@kerinokeefe替换为@kerino
0            @kerino
1         @vossroger
             ...    
129969    @vossroger
129970    @vossroger
Name: taster_twitter_handle, Length: 129971, dtype: object

重命名、更改列顺序、添加新行列

导入数据

>>> #导入数据并设置最大显示行数为5
>>> import pandas as pd
>>> reviews = pd.read_csv("winemag-data-130k-v2.csv", index_col=0)
>>> pd.set_option('max_rows', 5)
>>> reviews
         country description designation  points  price   province region_1 region_2 taster_name taster_twitter_handle      title    variety     winery
0          Italy  Aromas...   Vulkà ...       87    NaN  Sicily...     Etna      NaN  Kerin ...   @kerin...             Nicosi...  White ...    Nicosia
1       Portugal  This i...    Avidagos       87   15.0      Douro      NaN      NaN  Roger ...   @vossr...             Quinta...  Portug...  Quinta...
...          ...        ...         ...      ...    ...        ...      ...      ...        ...         ...                   ...        ...        ...
129969    France  A dry ...         NaN       90   32.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Pinot ...  Domain...
129970    France  Big, r...   Lieu-d...       90   21.0     Alsace   Alsace      NaN  Roger ...   @vossr...             Domain...  Gewürz...  Domain...

[129971 rows x 13 columns]

重命名列名与行名

>>> #重命名列名
>>> df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
>>> #方法1：采用字典格式设置列名
>>> df.rename(columns={"A": "a", "B": "c"},inplace=True)
>>>#或
>>>df.rename(columns=dict(A='a',B='b'),inplace=True)
>>> #方法2：设置columns，按原来的顺序全部列出
>>> df.columns=['a','c']
>>> df
   a  c
0  1  4
1  2  5
2  3  6

>>> #重命名行索引
>>> df.rename(index={0: "x", 1: "y", 2: "z"},inplace=True)
>>> df.rename({0: "x", 1: "y", 2: "z"}, axis='index',inplace=True)
>>> df
   a  c
x  1  4
y  2  5
z  3  6

#命名索引列名称
>>> df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
>>> df.rename_axis('number',axis='rows')
        A  B
number      
0       1  4
1       2  5
2       3  6

更改列顺序

>>> #方法1：设置列名顺序列表并应用
>>> df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
>>> newColumnOrderList=['B','A']
>>> df=df[newColumnOrderList]

>>> #方法2：取出列，删除原来的列，在新的位置插入取出的列
>>> df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]})
>>> df_B=df.B
>>> df.drop('B',axis=1,inplace=True)
>>> df.insert(0,'new_B',df_B)  #插入新列时还可以对新列重命名
>>> df
   new_B  A
0      4  1
1      5  2
2      6  3

添加新列

>>> reviews['critic'] = 'everyone'  #新建critic列并赋值everyone，操作类似字典
>>> reviews['critic']
0         everyone
1         everyone
            ...   
129969    everyone
129970    everyone
Name: critic, Length: 129971, dtype: object
#迭代赋值
>>> reviews['index_backwards'] = range(len(reviews), 0, -1)  #迭代赋值
>>> reviews['index_backwards'] = list(range(len(reviews), 0, -1))
>>> reviews['index_backwards']
0         129971
1         129970
           ...  
129969         2
129970         1
Name: index_backwards, Length: 129971, dtype: int64

数据框合并

相同列名的数据框纵向拼接

>>> #相同列名的数据框纵向拼接
>>> df1 = pd.DataFrame([[1, 2], [3, 4]], columns=list('AB'))
>>> df2 = pd.DataFrame([[5, 6], [7, 8]], columns=list('BA'))

>>> #方法1：append()方法
>>> #拼接两个DataFrame
>>> df1.append(df2,ignore_index=True)  #生成新的DataFrame，不改变原有的DataFrame。ignore_index设为True用于重置行索引
   A  B
0  1  2
1  3  4
2  6  5
3  8  7
>>> #拼接多个Series
>>> s1 = pd.Series(['a', 'b'])
>>> s2 = pd.Series(['c', 'd'])
>>> pd.concat([s1,s2],ignore_index=True)  #
0    a
1    b
2    c
3    d
dtype: object

>>> #方法2：caoncat()方法，可以拼接多个列名相同的DataFrame
>>> df1 = pd.DataFrame([['a', 1], ['b', 2]],columns=['letter', 'number'])
>>> df2 = pd.DataFrame([['c', 3], ['d', 4]],columns=['letter', 'number'])
>>> pd.concat([df1, df2])
  letter  number
0      a       1
1      b       2
0      c       3
1      d       4

横向拼接或融合数据框

>>> df1 = pd.DataFrame([['a', 1], ['b', 2]],columns=['letter', 'number'])
>>> df4 = pd.DataFrame([['bird', 'polly'], ['monkey', 'george']],columns=['animal', 'name'])

>>> #方法1:pd.concat()方法
>>> pd.concat([df1,df4],axis=1)
  letter  number  animal    name
0      a       1    bird   polly
1      b       2  monkey  george

>>> #方法2:join()方法

>>> df = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'],'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
>>> df2 = pd.DataFrame({'key': ['K0', 'K1', 'K2'],'B': ['B0', 'B1', 'B2']})

>>> #横向合并两个数据框，保留所有列名
>>> df1.join(df2, lsuffix='_df1', rsuffix='_df2')
  key_df1   A key_df2    B
0      K0  A0      K0   B0
1      K1  A1      K1   B1
2      K2  A2      K2   B2
3      K3  A3     NaN  NaN
4      K4  A4     NaN  NaN
5      K5  A5     NaN  NaN
>>> #如果要用key列融合两个数据框，需将key列设为两个数据框的索引
>>> df1.set_index('key').join(df2.set_index('key'))
      A    B
key         
K0   A0   B0
K1   A1   B1
K2   A2   B2
K3   A3  NaN
K4   A4  NaN
K5   A5  NaN
>>> #还可采用设置on参数的方法融合两个数据框
>>> df1.join(df2.set_index('key'), on='key')
  key   A    B
0  K0  A0   B0
1  K1  A1   B1
2  K2  A2   B2
3  K3  A3  NaN
4  K4  A4  NaN
5  K5  A5  NaN

此外，合并方法还有df.merge()等。

你可能感兴趣的:(Python,python)

Spark 学习-1 (python) 一二三四0123 spark 学习 python
Spark官方文档快速入门指南Spark架构-Spark教程1.基本概念RDD（resilientdistributeddataset）弹性分布式数据集，对分布式数据和计算的基本抽象。每个Spark应用由一个驱动器程序（driverprogram）发起集群上的并行操作，驱动器程序一般要管理多个执行器（executor）节点。当我们在集群上执行一个操作，不同的节点会对文件不同部分展开计算。驱动器程序
Python大数据之PySpark(三)使用Python语言开发Spark程序代码_windows spark python 2401_84181704 程序员大数据 python spark
算子：rdd的api的操作，就是算子，flatMap扁平化算子，map转换算子Transformation算子Action算子步骤：1-首先创建SparkContext上下文环境2-从外部文件数据源读取数据3-执行flatmap执行扁平化操作4-执行map转化操作，得到(word,1)5-reduceByKey将相同Key的Value数据累加操作6-将结果输出到文件系统或打印代码：#-*-codi
Spark入门（Python） nfenghklibra python spark
目录一、安装Spark二、Spark基本操作一、安装Sparkpip3installpyspark二、Spark基本操作#导入spark的SparkContext,SparkConf模块frompysparkimportSparkContext,SparkConf#导入os模块importos#设置PYSPARK的python环境os.environ['PYSPARK_PYTHON']="C:\\
Python与MySQL数据库操作教程咱家阿星 python mysql 数据库 python mysql
Python与MySQL数据库操作教程MySQL是一种常用的存储系统，内容仅为基础知识.本文包含:第一部分介绍如何通过mysql-connector-python进行基础数据库操作，第二部分包括SQL语法、事务、锁的基础知识。本文不包括:Mysql的安装过程.Python基础请看:Python基础语法一、Python操作Mysql1.Python-Mysql模块下载先确保已安装mysql-conn
Python 多线程开发基础咱家阿星 python 1024程序员节 python
一、Python多线程开发基础教程1.什么是多线程？为什么需要它？线程：一个程序的最小执行单位，多个线程可在同一进程中并发运行。多线程的好处：提高程序响应速度（特别是I/O密集型任务）。并行处理多个任务。充分利用多核CPU资源。2.Python多线程的基础模块：threadingPython的threading模块用于创建和管理线程。基本代码示例：创建一个线程importthreadingdefp
Python 分支和循环操作教程咱家阿星 python python 开发语言
Python入门教程：分支和循环操作Python是一种清晰易懂的进阶编程语言，它在处理分支、循环和遍历时提供了高效而自然的操作方式。一、分支操作1.1基础if语法Python中的分支语法以if开始，举例如下：x=10#变量x=10ifx>0:#如果x大于0,输出"x是正数"的结果print("x是正数")执行结果:x是正数1.2if-else分支使用else，尽管不满足条件也有一个以下分支：x=-
Python软体中使用Scikit-learn库训练简单线性回归模型清水白石008 Python题库 python python scikit-learn 线性回归
Python软体中使用Scikit-learn库训练简单线性回归模型1.引言作为数据科学家和机器学习从业者,我们经常需要处理各种类型的数据,并从中提取有价值的信息。其中,线性回归是最基础也是最常用的机器学习算法之一。它可以帮助我们预测连续型目标变量,在很多实际应用场景中都有广泛应用,比如房价预测、销量预测等。在本文中,我将使用Python的Scikit-learn库,介绍如何训练一个简单的线性回归
超实用的Python机器学习教程 - 基于scikit - learn库 AI_DL_CODE 人工智能 python 机器学习人工智能
一、机器学习简介机器学习的定义与概念机器学习是一门多领域交叉学科，它涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。简单来说，机器学习是让计算机从数据中学习规律并进行预测或决策的技术。它旨在构建能够自动从数据中学习模式并进行改进的算法，而无需被明确编程来执行特定任务。例如，我们可以让机器学习算法通过分析大量的历史天气数据来预测未来的天气情况，或者通过分析用户的购物历史来推荐可能感兴趣
python读取nc文件并转换成csv_使用Python截取nc文件数据保存到CSV文件-Go语言中文社区... 达拉崩吧叭叭叭
问题要求：编写一个函数完成以下任务：截取经度在23°N-40°N，纬度在118°E-131°E范围内各属性不同深度的数据，使用Python中合适的数据结构将截取的数据保存到同名CSV文件中。(nc文件数据格式参见笔者其他文章)实验内容(附代码)实验数据介绍(通过实验介绍你对NC数据的认识)nc文件即NetCDF全称为networkCommonDataFormat，中文译法为“网络通用数据格式”。一
Python 最小二乘法圆度误差高斯牛顿迭代 CAD二次开发秋实 Python python 最小二乘法 numpy 圆度误差
1.最小二乘法求圆度误差importnumpyasnpimportmathimportgeometry_functiondefroundness_lsm(x1,y1):e=0.00000000001y1max_index=y1.index(max(y1))x1min_index=x1.index(min(x1))y1min_index=y1.index(min(y1))pp=[[x1[y1max_
pythonocc 球体构造BRepPrimAPI_MakeSphere CAD二次开发秋实 Python python pythonocc
fromOCC.Display.SimpleGuiimportinit_displayimportmathfromOCC.Core.BRepPrimAPIimport(BRepPrimAPI_MakeSphere,BRepPrimAPI_MakeCylinder,BRepPrimAPI_MakeBox,)fromOCC.Core.gpimportgp_Ax2,gp_Pnt,gp_Dir,gp_Ax
conda 常用命令请一直在路上机器学习 conda python linux
conda常用命令介绍初级命令主要集中在基本的环境和包管理操作。中级命令涉及包的更新、安装多个包、查找和删除包，以及环境的克隆和管理。高级命令用于导出、共享、修复和调试环境的依赖，及清理和优化工作。一、初级命令这些是基本的conda命令，适合刚开始使用的人。1.创建一个新的环境condacreate--name示例：创建一个名为myenv的新环境，并安装python：condacreate--na
Python 中的 lambda 函数介绍 licy__ python 开发语言
目录Python中的lambda函数介绍1.lambda函数的基本概念2.lambda函数的语法3.lambda函数的常见用法3.1简单的数学运算3.2排序和过滤排序过滤3.3映射（Map）3.4函数参数4.lambda函数的限制5.实际应用示例5.1多条件排序5.2动态排序Python中的lambda函数介绍lambda函数是Python中的一种匿名函数，也称为lambda表达式。与常规的函数定
Python读取nc文件小徐爱吹晚风 python学习新手笔记 python
目录导入库读取nc文件查看数据类型二维数组切片观察部分区域数据可视化导入库importxarrayasxrimportmatplotlib.pyplotaspltimportmatplotlib读取nc文件file_path=r'D:XXX\XXX.nc'#nc文件路径data=xr.open_mfdataset(file_path,parallel=True,decode_times=False
【python】利用 GridSearchCV 和 SVM 进行学生成绩预测码银支持向量机机器学习人工智能
在机器学习领域，寻找最优模型参数是一个重要的步骤，它直接影响模型的泛化能力和预测准确性。本文将通过一个具体案例介绍如何使用支持向量机（SVM）和网格搜索（GridSearchCV）来预测学生的成绩，并通过调整参数来优化模型性能。数据集：公众号“码银学编程”后台回复：学生成绩-SVM前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家：前言–人工智能教程引言学生的成绩预测
requires-python:＞=3.8，pip无法更新也无法命令行安装--换源解决 vipguyue python pip 开发语言
WindowsPowerShell版权所有（C）MicrosoftCorporation。保留所有权利。安装最新的PowerShell，了解新功能和改进！https://aka.ms/PSWindowsPSE:\Code\pythonTest\pythonProject>py-mensurepip--default-pipLookinginlinks:c:\Users\ADMINI~1\AppDa
python web开发（完） HIST-柒月初柒 python 前端开发语言
本篇就把代码都放出来上面就是文件夹格式app.py#pipinstallFlaskimportatexitimportjsonfromflaskimportFlask,render_template,request,redirect,url_forapp=Flask(__name__)ls=[]#使用列表模拟数据库，所有学生信息存储在ls里面#假设的用户信息定义了一个字典users，包含了一些假设
异步编程进阶：Python 中 asyncio 的多重应用黑金IT python python java 前端
可以将asyncio.sleep(1)替换为另一个异步函数。以下是如何创建一个名为async_function的异步函数，并在b中调用它：importasyncio#异步函数，模拟耗时操作asyncdefasync_function():print("Runninganasynchronousoperation...")awaitasyncio.sleep(1)#假设这是一个耗时的异步操作prin
python追加写入excel-Python读写/追加excel文件Demo分享 weixin_39571404
三个工具包python操作excel的三个工具包如下，注意，只能操作.xls，不能操作.xlsx。•xlrd:对excel进行读相关操作•xlwt:对excel进行写相关操作•xlutils:对excel读写操作的整合这三个工具包都可以直接使用pip进行下载：sudopipinstallxlrdsudopipinstallxlwtsudopipinstallxlutils1xlwt的缺陷xlwt只
python追加写入excel文件可我累了记录 python
python追加写入excel文件importjmespathimportjsonimportxlrdfromxlutils.copyimportcopyi={'headers':[],'datas':[{'id':'ae2f0000-1b7a-e200-6376-08d8f5da1be1','fax':'8605925160700','userId':'57585bd0-0097-4a6d-ba
【python】追加写入excel，合并工作簿 qq_50653422 excel python
目录一：删除写入代码（删除所有旧表）二：追加写入代码（保留所有旧表）三、结果展示一：删除写入代码（删除所有旧表）importpandasaspddf1=pd.DataFrame({'A':[1,1,1],'B':[1,1,1]})df2=pd.DataFrame({'C':[0,0,0],'D':[0,0,0]})#使用ExcelWriter写入不同的sheetwithpd.ExcelWriter
【Python蓝桥杯备赛宝典】殇在山风蓝桥杯Python python 蓝桥杯开发语言算法贪心算法动态规划排序算法
文章目录一、基础数据结构1.1链表1.2队列1.3栈1.4二叉树1.5堆二、基本算法2.1算法复杂度2.2尺取法2.3二分法2.4三分法2.5倍增法和ST算法2.6前缀和与差分2.7离散化2.8排序与排列2.9分治法2.10贪心法1.接水时间最短问题2.糖果数量有限问题3.分发时间最短问题4.采摘苹果最多问题三、搜索3.1BFS和DFS基础3.2剪枝3.3洪水填充3.4BFS与最短路径3.5双向广
2025年02月01日Github流行趋势油泼辣子多加 GitHub每日趋势 github
项目名称：oumi项目地址url：https://github.com/oumi-ai/oumi项目语言：Python历史star数：544今日star数：103项目维护者：xrdaukar,oelachqar,taenin,wizeng23,kaisopos项目简介：一切你需要的来构建最先进的基础模型，端到端。项目名称：Qwen2.5-VL项目地址url：https://github.com/Q
【OpenCV-Python】——图像变换&色彩空间变换&几何变换&图像模糊（滤波）&阈值处理&形态变换柯宝最帅 OpenCV学习 opencv 计算机视觉图像处理
目录前言：1、色彩空间变换1.1RGB色彩空间1.2GRAY色彩空间1.3YCrCb色彩空间1.4HSV色彩空间2、几何变换3、图像模糊3.1均值滤波3.2高斯滤波3.3方框滤波3.4中值滤波4、阈值处理4.1全局阈值处理4.2自适应阈值处理5、形态变换5.1形态操作内核5.2腐蚀操作5.3膨胀操作5.4高级形态操作总结前言：图像变换是指通过技术手段将图像转换为另一幅图像，如色彩空间变换、几何变换
python运动物体检测_安全检查中... weixin_39976748 python运动物体检测
+((!+[]+(!![])+!![]+!![]+!![]+!![]+!![]+!![]+[])+(!+[]+(!![])+!![])+(!+[]+(!![])+!![]+!![]+!![]+!![]+!![]+!![])+(!+[]-(!![]))+(!+[]+(!![])+!![]+!![])+(+!![])+(!+[]+(!![])+!![]+!![]+!![]+!![])+(!+[]+(!
python not in函数用法_MySQL IN和NOT IN用法详解 weixin_39660931 python not in函数用法
MySQL中的IN运算符用来判断表达式的值是否位于给出的列表中；如果是，返回值为1，否则返回值为0。NOTIN的作用和IN恰好相反，NOTIN用来判断表达式的值是否不存在于给出的列表中；如果不是，返回值为1，否则返回值为0。IN和NOTIN的语法格式如下：exprIN(value1,value2,value3...valueN)exprNOTIN(value1,value2,value3...va
python详细安装教程-python安装教程 Pycharm安装详细教程编程大乐趣
这篇文章主要介绍了python的安装教程，和Pycharm的安装详细教程，具有一定的参考价值，感兴趣的小伙伴们可以参考一下python安装教程和Pycharm安装详细教程，分享给大家。首先我们来安装python1、首先进入网站下载：点击打开链接（或自己输入网址https://www.python.org/downloads/），进入之后如下图，选择图中红色圈中区域进行下载。2、下载完成后如下图所示
不同物体运动方向的检测-python 人工智能专属驿站 python 开发语言
方法优点适用场景缺点光流法实时性强、支持稠密方向分析视频流中物体整体运动对背景复杂场景鲁棒性差特征点跟踪精确捕捉局部运动特征点明显的物体特征点丢失影响结果帧间差分简单快速，适合实时检测背景稳定、低复杂度场景对噪声和阴影敏感深度摄像头三维方向检测，抗背景干扰能力强需要深度信息的场景需要特殊硬件，成本较高惯性传感器不依赖视觉，适用环境广泛设备本体的运动分析精度受传感器噪声影响机器学习能适应复杂非线性场
【Python】Python中in与not in ajsyipsc40270 python
在python中，要判断特定的值是否存在列表中，可使用关键字in,判断特定的值不存在列表中，可使用关键字notinletters=['A','B','C','D','E','F','G']if'A'inletters:print('A'+'exists')if'h'notinletters:print('h'+'notexists')打印结果：Aexistshnotexists一个稍微复杂的案例定
Python 中的 “not in” 和 “is not” 运算符 qq^^614136809 python 开发语言
在Python中，notin和isnot这两个运算符经常被用来进行比较和判断。然而，许多用户对这两个运算符是否都是运算符以及它们之间的区别感到困惑。有些人甚至认为notin和isnot仅仅是notxin和notxis的简写形式。2.解决方法为了澄清这个疑惑，我们可以通过Python的dis模块来查看这两个运算符的字节码。dis模块可以帮助我们查看Python代码的字节码表示形式。>>>dis.di
Java实现的简单双向Map，支持重复Value superlxw1234 java 双向map
关键字：Java双向Map、DualHashBidiMap 有个需求，需要根据即时修改Map结构中的Value值，比如，将Map中所有value=V1的记录改成value=V2，key保持不变。数据量比较大，遍历Map性能太差，这就需要根据Value先找到Key，然后去修改。即：既要根据Key找Value，又要根据Value
PL/SQL触发器基础及例子百合不是茶 oracle数据库触发器 PL/SQL编程
触发器的简介; 触发器的定义就是说某个条件成立的时候，触发器里面所定义的语句就会被自动的执行。因此触发器不需要人为的去调用，也不能调用。触发器和过程函数类似过程函数必须要调用, 一个表中最多只能有12个触发器类型的,触发器和过程函数相似触发器不需要调用直接执行, 触发时间：指明触发器何时执行，该值可取： before：表示在数据库动作之前触发
[时空与探索]穿越时空的一些问题 comsci 问题
我们还没有进行过任何数学形式上的证明,仅仅是一个猜想..... 这个猜想就是; 任何有质量的物体(哪怕只有一微克)都不可能穿越时空,该物体强行穿越时空的时候,物体的质量会与时空粒子产生反应,物体会变成暗物质,也就是说,任何物体穿越时空会变成暗物质..(暗物质就我的理
easy ui datagrid上移下移一行商人shang js 上移下移 easyui datagrid
/** * 向上移动一行 * * @param dg * @param row */ function moveupRow(dg, row) { var datagrid = $(dg); var index = datagrid.datagrid("getRowIndex", row); if (isFirstRow(dg, row)) {
Java反射 oloz 反射
本人菜鸟，今天恰好有时间，写写博客，总结复习一下java反射方面的知识，欢迎大家探讨交流学习指教首先看看java中的Class package demo; public class ClassTest { /*先了解java中的Class*/ public static void main(String[] args) { //任何一个类都
springMVC 使用JSR-303 Validation验证杨白白 spring mvc
JSR-303是一个数据验证的规范，但是spring并没有对其进行实现，Hibernate Validator是实现了这一规范的，通过此这个实现来讲SpringMVC对JSR-303的支持。 JSR-303的校验是基于注解的，首先要把这些注解标记在需要验证的实体类的属性上或是其对应的get方法上。登录需要验证类 public class Login { @NotEmpty
log4j 香水浓 log4j
log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, HTML, DATABASE #log4j.rootCategory=DEBUG, STDOUT, DAILYFILE, ROLLINGFILE, HTML #console log4j.appender.STDOUT=org.apache.log4j.ConsoleAppender log4
使用ajax和history.pushState无刷新改变页面URL agevs jquery 框架 Ajax html5 chrome
表现如果你使用chrome或者firefox等浏览器访问本博客、github.com、plus.google.com等网站时，细心的你会发现页面之间的点击是通过ajax异步请求的，同时页面的URL发生了了改变。并且能够很好的支持浏览器前进和后退。是什么有这么强大的功能呢？ HTML5里引用了新的API，history.pushState和history.replaceState，就是通过
centos中文乱码 AILIKES centos OS ssh
一、CentOS系统访问 g.cn ，发现中文乱码。于是用以前的方式：yum -y install fonts-chinese CentOS系统安装后，还是不能显示中文字体。我使用 gedit 编辑源码，其中文注释也为乱码。后来，终于找到以下方法可以解决，需要两个中文支持的包： fonts-chinese-3.02-12.
触发器 baalwolf 触发器
触发器(trigger)：监视某种情况，并触发某种操作。触发器创建语法四要素：1.监视地点(table) 2.监视事件(insert/update/delete) 3.触发时间(after/before) 4.触发事件(insert/update/delete) 语法： create trigger triggerName after/before
JS正则表达式的i m g bijian1013 JavaScript 正则表达式
g:表示全局（global)模式，即模式将被应用于所有字符串，而非在发现第一个匹配项时立即停止。 i:表示不区分大小写（case-insensitive）模式，即在确定匹配项时忽略模式与字符串的大小写。 m:表示
HTML5模式和Hashbang模式 bijian1013 JavaScript AngularJS Hashbang模式 HTML5模式
我们可以用$locationProvider来配置$location服务（可以采用注入的方式，就像AngularJS中其他所有东西一样）。这里provider的两个参数很有意思，介绍如下。 html5Mode 一个布尔值，标识$location服务是否运行在HTML5模式下。 ha
[Maven学习笔记六]Maven生命周期 bit1129 maven
从mvn test的输出开始说起当我们在user-core中执行mvn test时，执行的输出如下： /software/devsoftware/jdk1.7.0_55/bin/java -Dmaven.home=/software/devsoftware/apache-maven-3.2.1 -Dclassworlds.conf=/software/devs
【Hadoop七】基于Yarn的Hadoop Map Reduce容错 bit1129 hadoop
运行于Yarn的Map Reduce作业，可能发生失败的点包括 Task Failure Application Master Failure Node Manager Failure Resource Manager Failure 1. Task Failure 任务执行过程中产生的异常和JVM的意外终止会汇报给Application Master。僵死的任务也会被A
记一次数据推送的异常解决端口解决 ronin47 记一次数据推送的异常解决
　　需求：从db获取数据然后推送到B 程序开发完成，上jboss,刚开始报了很多错，逐一解决，可最后显示连接不到数据库。机房的同事说可以ping 通。　　自已画了个图，逐一排除，把linux 防火墙　和　setenforce　设置最低。　　　service iptables stop
巧用视错觉-UI更有趣 brotherlamp UI ui视频 ui教程 ui自学 ui资料
我们每个人在生活中都曾感受过视错觉（optical illusion）的魅力。视错觉现象是双眼跟我们开的一个玩笑，而我们往往还心甘情愿地接受我们看到的假象。其实不止如此，视觉错现象的背后还有一个重要的科学原理——格式塔原理。格式塔原理解释了人们如何以视觉方式感觉物体，以及图像的结构，视角，大小等要素是如何影响我们的视觉的。在下面这篇文章中，我们首先会简单介绍一下格式塔原理中的基本概念，
线段树-poj1177-N个矩形求边长（离散化+扫描线） bylijinnan 数据结构算法线段树
package com.ljn.base; import java.util.Arrays; import java.util.Comparator; import java.util.Set; import java.util.TreeSet; /** * POJ 1177 (线段树+离散化+扫描线)，题目链接为http://poj.org/problem?id=1177
HTTP协议详解 chicony http协议
引言
Scala设计模式 chenchao051 设计模式 scala
Scala设计模式我的话：在国外网站上看到一篇文章，里面详细描述了很多设计模式，并且用Java及Scala两种语言描述，清晰的让我们看到各种常规的设计模式，在Scala中是如何在语言特性层面直接支持的。基于文章很nice，我利用今天的空闲时间将其翻译，希望大家能一起学习，讨论。翻译
安装mysql daizj mysql 安装
安装mysql (1)删除linux上已经安装的mysql相关库信息。rpm -e xxxxxxx --nodeps (强制删除) 执行命令rpm -qa |grep mysql 检查是否删除干净 (2)执行命令 rpm -i MySQL-server-5.5.31-2.el
HTTP状态码大全 dcj3sjt126com http状态码
完整的 HTTP 1.1规范说明书来自于RFC 2616，你可以在http://www.talentdigger.cn/home/link.php?url=d3d3LnJmYy1lZGl0b3Iub3JnLw%3D%3D在线查阅。HTTP 1.1的状态码被标记为新特性，因为许多浏览器只支持 HTTP 1.0。你应只把状态码发送给支持 HTTP 1.1的客户端，支持协议版本可以通过调用request
asihttprequest上传图片 dcj3sjt126com ASIHTTPRequest
NSURL *url =@"yourURL"; ASIFormDataRequest*currentRequest =[ASIFormDataRequest requestWithURL:url]; [currentRequest setPostFormat:ASIMultipartFormDataPostFormat];[currentRequest se
C语言中，关键字static的作用 e200702084 C++c C#
在C语言中，关键字static有三个明显的作用： 1)在函数体，局部的static变量。生存期为程序的整个生命周期，（它存活多长时间）；作用域却在函数体内（它在什么地方能被访问（空间））。一个被声明为静态的变量在这一函数被调用过程中维持其值不变。因为它分配在静态存储区，函数调用结束后并不释放单元，但是在其它的作用域的无法访问。当再次调用这个函数时，这个局部的静态变量还存活，而且用在它的访
win7/8使用curl geeksun win7
1. WIN7/8下要使用curl，需要下载curl-7.20.0-win64-ssl-sspi.zip和Win64OpenSSL_Light-1_0_2d.exe。下载地址： http://curl.haxx.se/download.html 请选择不带SSL的版本，否则还需要安装SSL的支持包 2. 可以给Windows增加c
Creating a Shared Repository; Users Sharing The Repository hongtoushizi git
转载自： http://www.gitguys.com/topics/creating-a-shared-repository-users-sharing-the-repository/ Commands discussed in this section: git init –bare git clone git remote git pull git p
Java实现字符串反转的8种或9种方法 Josh_Persistence 异或反转递归反转二分交换反转 java字符串反转栈反转
注：对于第7种使用异或的方式来实现字符串的反转，如果不太看得明白的，可以参照另一篇博客： http://josh-persistence.iteye.com/blog/2205768 /** * */ package com.wsheng.aggregator.algorithm.string; import java.util.Stack; /**
代码实现任意容量倒水问题 home198979 PHP 算法倒水
形象化设计模式实战 HELLO!架构 redis命令源码解析倒水问题：有两个杯子，一个A升，一个B升，水有无限多，现要求利用这两杯子装C
Druid datasource zhb8015 druid
推荐大家使用数据库连接池 DruidDataSource. http://code.alibabatech.com/wiki/display/Druid/DruidDataSource DruidDataSource经过阿里巴巴数百个应用一年多生产环境运行验证，稳定可靠。它最重要的特点是：监控、扩展和性能。下载和Maven配置看这里： http
两种启动监听器ApplicationListener和ServletContextListener spjich java spring 框架
引言:有时候需要在项目初始化的时候进行一系列工作，比如初始化一个线程池，初始化配置文件，初始化缓存等等，这时候就需要用到启动监听器，下面分别介绍一下两种常用的项目启动监听器 ServletContextListener 特点: 依赖于sevlet容器，需要配置web.xml 使用方法: public class StartListener implements
JavaScript Rounding Methods of the Math object 何不笑 JavaScript Math
The next group of methods has to do with rounding decimal values into integers. Three methods — Math.ceil(), Math.floor(), and Math.round() — handle rounding in differen