hfutdog

Pandas基本操作与常用接口

声明
读取csv文件
索引与计算
常用预处理方法
Series基本结构

声明

本文涉及的代码基于python 3.6.5 pandas 0.23.0
pandas是一个在numpy之上，提供了丰富的数据预处理接口的模块。
使用pandas模块之前首先需要在代码之前导入该模块：

import pandas as pd

读取csv文件

现在我们有一个food_info.csv文件，格式如下所示：

NDB_No,Shrt_Desc,Water_(g),Energ_Kcal,Protein_(g),Lipid_Tot_(g),Ash_(g),Carbohydrt_(g),Fiber_TD_(g),Sugar_Tot_(g),Calcium_(mg),Iron_(mg),Magnesium_(mg),Phosphorus_(mg),Potassium_(mg),Sodium_(mg),Zinc_(mg),Copper_(mg),Manganese_(mg),Selenium_(mcg),Vit_C_(mg),Thiamin_(mg),Riboflavin_(mg),Niacin_(mg),Vit_B6_(mg),Vit_B12_(mcg),Vit_A_IU,Vit_A_RAE,Vit_E_(mg),Vit_D_mcg,Vit_D_IU,Vit_K_(mcg),FA_Sat_(g),FA_Mono_(g),FA_Poly_(g),Cholestrl_(mg)
01001,BUTTER WITH SALT,15.87,717,0.85,81.11,2.11,0.06,0,0.06,24,0.02,2,24,24,643,0.09,0,0,1,0,0.005,0.034,0.042,0.003,0.17,2499,684,2.32,1.5,60,7,51.368,21.021,3.043,215

其中，第一行为标题，第二行为具体的数据，该文件具有多行数据，这里为了节约篇幅，只展示了一行。csv文件中的各个数据之间一般以逗号分隔，可以用Excel等工具以表格的形式打开。

food_info = pd.read_csv("food_info.csv")
print(type(food_info))  # 
print(food_info.dtypes)
# NDB_No               int64
# Shrt_Desc           object
# Water_(g)          float64
# Energ_Kcal           int64
# Protein_(g)        float64
# Lipid_Tot_(g)      float64
# Ash_(g)            float64
# Carbohydrt_(g)     float64
# Fiber_TD_(g)       float64
# Sugar_Tot_(g)      float64
# Calcium_(mg)       float64
# Iron_(mg)          float64
# Magnesium_(mg)     float64
# Phosphorus_(mg)    float64
# Potassium_(mg)     float64
# Sodium_(mg)        float64
# Zinc_(mg)          float64
# Copper_(mg)        float64
# Manganese_(mg)     float64
# Selenium_(mcg)     float64
# Vit_C_(mg)         float64
# Thiamin_(mg)       float64
# Riboflavin_(mg)    float64
# Niacin_(mg)        float64
# Vit_B6_(mg)        float64
# Vit_B12_(mcg)      float64
# Vit_A_IU           float64
# Vit_A_RAE          float64
# Vit_E_(mg)         float64
# Vit_D_mcg          float64
# Vit_D_IU           float64
# Vit_K_(mcg)        float64
# FA_Sat_(g)         float64
# FA_Mono_(g)        float64
# FA_Poly_(g)        float64
# Cholestrl_(mg)     float64
# dtype: object

我们使用上述代码将food_info.csv读取进来，读进来后保存在DataFrame对象中。DataFrame可以看做是一种矩阵结构。
再观察pandas中每个数据的具体类型，可以看到一般是int64，float64类型的，但是也有object类型，pandas里将字符串处理成object类型，在这里就是Shrt_Desc这列的数据。
常用的数据类型说明如下：

类型	说明
object	for string values
int	for integer values
float	for float values
datetime	for time values
bool	for Boolean values

如果对read_csv()方法还不清楚，可以使用如下代码查看文档：

print(help(pd.read_csv()))

我们可以使用DataFrame的实例方法head()检查读取的数据格式是否正确，代码如下：

print(food_info.head())
#    NDB_No                 Shrt_Desc       ...        FA_Poly_(g)  Cholestrl_(mg)
# 0    1001          BUTTER WITH SALT       ...              3.043           215.0
# 1    1002  BUTTER WHIPPED WITH SALT       ...              3.012           219.0
# 2    1003      BUTTER OIL ANHYDROUS       ...              3.694           256.0
# 3    1004               CHEESE BLUE       ...              0.800            75.0
# 4    1005              CHEESE BRICK       ...              0.784            94.0
# 
# [5 rows x 36 columns]

head()方法有默认参数n=5，表示展示的行数，这个可以自己定义。
同样，我们还可以使用tail()方法查看读取进来的数据的后几行信息：

print(food_info.tail())
#       NDB_No      ...       Cholestrl_(mg)
# 8613   83110      ...                 95.0
# 8614   90240      ...                 41.0
# 8615   90480      ...                  0.0
# 8616   90560      ...                 50.0
# 8617   93600      ...                 50.0
# 
# [5 rows x 36 columns]

columns属性可以用来获取csv表格的表头（列名）：

print(food_info.columns)
# Index(['NDB_No', 'Shrt_Desc', 'Water_(g)', 'Energ_Kcal', 'Protein_(g)',
#        'Lipid_Tot_(g)', 'Ash_(g)', 'Carbohydrt_(g)', 'Fiber_TD_(g)',
#        'Sugar_Tot_(g)', 'Calcium_(mg)', 'Iron_(mg)', 'Magnesium_(mg)',
#        'Phosphorus_(mg)', 'Potassium_(mg)', 'Sodium_(mg)', 'Zinc_(mg)',
#        'Copper_(mg)', 'Manganese_(mg)', 'Selenium_(mcg)', 'Vit_C_(mg)',
#        'Thiamin_(mg)', 'Riboflavin_(mg)', 'Niacin_(mg)', 'Vit_B6_(mg)',
#        'Vit_B12_(mcg)', 'Vit_A_IU', 'Vit_A_RAE', 'Vit_E_(mg)', 'Vit_D_mcg',
#        'Vit_D_IU', 'Vit_K_(mcg)', 'FA_Sat_(g)', 'FA_Mono_(g)', 'FA_Poly_(g)',
#        'Cholestrl_(mg)'],
#       dtype='object')

前面我们说过可以把DataFrame看做是矩阵，那么这里就可以利用shape属性获取矩阵的形状：

print(food_info.shape)  # (8618, 36)

这里矩阵的行数不包括表头行，表示数据中有8618个样本，每个样本有36个特征。

索引与计算

想要获取DataFrame中某一行的数据，要通过loc方法结合"[]"内的下标获取。例如：

print(food_info.loc[0])
# NDB_No                         1001
# Shrt_Desc          BUTTER WITH SALT
# Water_(g)                     15.87
# Energ_Kcal                      717
# Protein_(g)                    0.85
# Lipid_Tot_(g)                 81.11
# Ash_(g)                        2.11
# Carbohydrt_(g)                 0.06
# Fiber_TD_(g)                      0
# Sugar_Tot_(g)                  0.06
# Calcium_(mg)                     24
# Iron_(mg)                      0.02
# Magnesium_(mg)                    2
# Phosphorus_(mg)                  24
# Potassium_(mg)                   24
# Sodium_(mg)                     643
# Zinc_(mg)                      0.09
# Copper_(mg)                       0
# Manganese_(mg)                    0
# Selenium_(mcg)                    1
# Vit_C_(mg)                        0
# Thiamin_(mg)                  0.005
# Riboflavin_(mg)               0.034
# Niacin_(mg)                   0.042
# Vit_B6_(mg)                   0.003
# Vit_B12_(mcg)                  0.17
# Vit_A_IU                       2499
# Vit_A_RAE                       684
# Vit_E_(mg)                     2.32
# Vit_D_mcg                       1.5
# Vit_D_IU                         60
# Vit_K_(mcg)                       7
# FA_Sat_(g)                   51.368
# FA_Mono_(g)                  21.021
# FA_Poly_(g)                   3.043
# Cholestrl_(mg)                  215
# Name: 0, dtype: object

当然，这里也可以使用切片来获取多行数据：

print(food_info.loc[3:6])  # 获取3、4、5、6行数据
print(food_info.loc[[2, 5, 10]])  # 获取2、5、10行数据

获取某列的数据可以使用列名，例如：

print(food_info["NDB_No"])
# 0        1001
# 1        1002
# 2        1003
# 3        1004
#         ...  
# 8615    90480
# 8616    90560
# 8617    93600
# Name: NDB_No, Length: 8618, dtype: int64

获取多列数据：

columns = ["NDB_No", "Cholestrl_(mg)"]
print(food_info[columns])

下面再看一个简单的数据处理过程：

col_names = food_info.columns.tolist()
print(col_names)
# ['NDB_No', 'Shrt_Desc', 'Water_(g)', 'Energ_Kcal', 'Protein_(g)', 'Lipid_Tot_(g)', 'Ash_(g)',
# 'Carbohydrt_(g)', 'Fiber_TD_(g)', 'Sugar_Tot_(g)', 'Calcium_(mg)', 'Iron_(mg)', 'Magnesium_(mg)',
# 'Phosphorus_(mg)', 'Potassium_(mg)', 'Sodium_(mg)', 'Zinc_(mg)', 'Copper_(mg)', 'Manganese_(mg)',
# 'Selenium_(mcg)', 'Vit_C_(mg)', 'Thiamin_(mg)', 'Riboflavin_(mg)', 'Niacin_(mg)', 'Vit_B6_(mg)',
# 'Vit_B12_(mcg)', 'Vit_A_IU', 'Vit_A_RAE', 'Vit_E_(mg)', 'Vit_D_mcg', 'Vit_D_IU', 'Vit_K_(mcg)',
# 'FA_Sat_(g)', 'FA_Mono_(g)', 'FA_Poly_(g)', 'Cholestrl_(mg)']

gram_columns = []

for c in col_names:
    if c.endswith("(g)"):
        gram_columns.append(c)
gram_df = food_info[gram_columns]
print(gram_df.head(3))
#    Water_(g)  Protein_(g)     ...       FA_Mono_(g)  FA_Poly_(g)
# 0      15.87         0.85     ...            21.021        3.043
# 1      15.87         0.85     ...            23.426        3.012
# 2       0.24         0.28     ...            28.732        3.694
#
# [3 rows x 10 columns]

上述代码的功能是获取food_info.csv中以(g)为单位的列的数据。首先利用columns属性获取列名并将其转换为列表，然后筛选列表中以"(g)"结尾的元素放入新的列表，再利用新列表获取到这些数据。这是pandas常见的数据处理方法。
下面我们来看一下利用pandas对数据进行一些计算的操作：

div_1000 = food_info["Iron_(mg)"] / 1000

add_100 = food_info["Iron_(mg)"] + 100

sub_100 = food_info["Iron_(mg)"] - 100

mult_2 = food_info["Iron_(mg)"] * 2

上面的代码对"Iron_(mg)"列里的每一个数据进行相同的算术运算，类似于NumPy里的广播机制或者说是向量化操作。
再看下面这段代码，它实现了将两列对应位置的值相乘，再讲相乘的结果缩放以创建新的列，并将新列添加到DataFrame中。

print(food_info.shape)  # (8618, 36)
water_energy = food_info["Water_(g)"] * food_info["Energ_Kcal"]
iron_grams = food_info["Iron_(mg)"] / 1000
food_info["Iron_(g)"] = iron_grams
print(food_info.shape)  # (8618, 37)

当然，我们还可以对一列的数据求最大值、最小值、平均值、求和等：

max_calories = food_info["Energ_Kcal"].max()
min_calories = food_info["Energ_Kcal"].min()
mean_calories = food_info["Energ_Kcal"].mean()
sum_calories = food_info["Energ_Kcal"].sum()
print(max_calories, min_calories, mean_calories, sum_calories)
# 902 0 226.43861684845672 1951448

利用上面的代码，对数据归一化就变得简便起来。
我们还可以对数据进行排序操作：

food_info.sort_values("Sodium_(mg)", inplace=True)
food_info.sort_values("Sodium_(mg)", inplace=True, ascending=False)

sort_values()函数的第一个参数表示要排序的数据列，第二个参数inplace为True表示在原数据上做排序，第三个参数ascending为True表示按升序排列数据。还有其他的一些参数这里不再赘述，可以根据自己的需要进行设置。

常用预处理方法

下面我们通过一个实例来展示pandas常用的数据预处理方法。我们使用的数据titanic_train.csv来自kaggle的泰坦尼克号生存预测。
首先是读取数据：

import pandas as pd
import numpy as np

titanic_survival = pd.read_csv("titanic_train.csv")
print(titanic_survival.head())
#    PassengerId  Survived  Pclass    ...        Fare Cabin  Embarked
# 0            1         0       3    ...      7.2500   NaN         S
# 1            2         1       1    ...     71.2833   C85         C
# 2            3         1       3    ...      7.9250   NaN         S
# 3            4         1       1    ...     53.1000  C123         S
# 4            5         0       3    ...      8.0500   NaN         S

具体的数据含义这里就不细说了，网上都能搜到。
获取"Age"列数据：

age = titanic_survival["Age"]
print(age.loc[0:9])
# 0     22.0
# 1     38.0
# 2     26.0
# 3     35.0
# 4     35.0
# 5      NaN
# 6     54.0
# 7      2.0
# 8     27.0
# 9     14.0
# Name: Age, dtype: float64

上述代码展示了"Age"前10个数据，我们发现其中有数据值为NaN，在pandas里NaN表示缺失值，也就是Not a Number。我们可以用pandas.isnull()函数对csv中的数据进行判断，是NaN的返回True，否则返回False。

age_is_null = pd.isnull(age)
print(age_is_null)
# 0      False
# 1      False
# 2      False
# 3      False
# 4      False
# 5       True
#        ...
# 887    False
# 888     True
# 889    False
# 890    False

这样我们就可以将数据中NaN分离出来了，在此之前先观察我们分离出来的数据对不对吧。

age_null_true = age[age_is_null]
print(age_null_true)
# 5     NaN
# 17    NaN
# 19    NaN
#        ..
# 868   NaN
# 878   NaN
# 888   NaN
# Name: Age, Length: 177, dtype: float64

由上面的输出我们也可以看到有"Age"列中有177个数据为NaN。
如果我们在没有将NaN分离出来的情况对"Age"列求均值，得到的结果也是NaN，这是因为我们对NaN值进行的任何计算的结果也只可能是NaN。

mean_age = sum(titanic_survival["Age"]) / len(titanic_survival["Age"])
print(mean_age)  # nan

当然，我们可以通过去除NaN值来获取正确的均值：

good_ages = titanic_survival["Age"][age_is_null == False]
correct_mean_age = sum(good_ages) / len(good_ages)
print(correct_mean_age)  # 29.69911764705882

上述代码通过age_is_null == False条件来获取"Age"列中不为NaN的年龄然后求取了均值。
其实我们可以调用pandas里的mean()方法来求均值，pandas自带的一些方法自动对缺失值做了处理。

correct_mean_age = titanic_survival["Age"].mean()
print(correct_mean_age)  # 29.69911764705882

我们还可以显示调用dropna()方法来去除一些含有NaN值的行或列：

drop_na_columns = titanic_survival.dropna(axis=1)
new_titanic_survival = titanic_survival.dropna(axis=0, subset=["Age", "Sex"])

titanic_survival本身是有891行12列数据的矩阵，drop_na_columns去除含有NA值（NaN，NaT）的列之后变成891行9列的矩阵。注意这里可以设置how参数为any或all，设置为any意味着有NA值就drop掉，all意味着某一列或某一行数据全为NA才drop掉。new_titanic_survival表示删除掉在"Age"和"Sex"列中有NA值的行，也就是在删除行时需要结合subset中给定的列的值，经过这样处理后new_titanic_survival具有714行12列数据。
另外，除了删除NaN值，我们还可以对其进行填充：

# 用0来填充所有的缺失值
fill_na_columns = titanic_survival.fillna(0)

# 将Age列缺失值填充为20，Sex列缺失值填充为male
values = {'Age': 20, 'Sex': 'male'}
other_fill_na_columns = titanic_survival.fillna(value=values)

具体的填充方式可以根据不同的参数设置方式实现，详情请查看文档。
接下来我们先看一个例子：

passenger_classes = [1, 2, 3]  # 乘客所在客舱等级
fares_by_class = {}
for this_class in passenger_classes:
    pclass_rows = titanic_survival[titanic_survival["Pclass"] == this_class]
    pclass_fares = pclass_rows["Fare"]
    fare_for_class = pclass_fares.mean()
    fares_by_class[this_class] = fare_for_class
print(fares_by_class)
# {1: 84.15468749999992, 2: 20.66218315217391, 3: 13.675550101832997}

上述代码求取了不同等级客舱客人的船费平均值，流程是先获取某个等级客舱的乘客数据，然后对"Fare"列求均值再写入结果。上面的代码未免显得繁琐，利用pandas的pivot_table方法一行代码就可以解决了。

passenger_survival = titanic_survival.pivot_table(index="Pclass", values="Fare", aggfunc=np.mean)
print(passenger_survival)
#              Fare
# Pclass
# 1       84.154687
# 2       20.662183
# 3       13.675550

pivot_table()方法中的参数index表示用哪一列的数据来分组，values表示分组后进行计算的列，而aggfunc定义了我们想要应用的计算方法（默认是pandas中的mean()方法）。
当然我们也可以同时对多列数据进行处理，如下所示：

port_stats = titanic_survival.pivot_table(index="Embarked", values=["Fare","Survived"], aggfunc=np.sum)
print(port_stats)
#                 Fare  Survived
# Embarked                      
# C         10072.2962        93
# Q          1022.2543        30
# S         17439.3988       217

接下来我们做一下排序：

new_titanic_survival = titanic_survival.sort_values("Age", ascending=False)
print(new_titanic_survival[0:4])
#      PassengerId  Survived  Pclass    ...        Fare Cabin  Embarked
# 630          631         1       1    ...     30.0000   A23         S
# 851          852         0       3    ...      7.7750   NaN         S
# 493          494         0       1    ...     49.5042   NaN         C
# 96            97         0       1    ...     34.6542    A5         C
# 
# [4 rows x 12 columns]

titanic_reindexed = new_titanic_survival.reset_index(drop=True)
print(titanic_reindexed.iloc[0:4])

#    PassengerId  Survived  Pclass    ...        Fare Cabin  Embarked
# 0          631         1       1    ...     30.0000   A23         S
# 1          852         0       3    ...      7.7750   NaN         S
# 2          494         0       1    ...     49.5042   NaN         C
# 3           97         0       1    ...     34.6542    A5         C
# 
# [4 rows x 12 columns]

new_titanic_survival是我们单纯根据"Age"列排序的结果，我们可以看到每行数据开头的index还是原始的index。我们可以像titanic_reindexed一样重设index，reset_index方法将原来的index转换为新的column然后生成新的index，设置drop=True就不会将原始index转换为新的column而只生成新的index。
下面我们再来看如何自定义方法处理数据：

def hundredth_row(column):
    hundredth_item = column.iloc[99]
    return hundredth_item

# Return the hundredth item from each column
h_row = titanic_survival.apply(hundredth_row)
print(h_row)
# PassengerId                  100
# Survived                       0
# Pclass                         2
# Name           Kantor, Mr. Sinai
# Sex                         male
# Age                           34
# SibSp                          1
# Parch                          0
# Ticket                    244367
# Fare                          26
# Cabin                        NaN
# Embarked                       S
# dtype: object

hundredth_row()函数是我们定义的用来获取某一列第100行数据的。我们调用titanic_survival这个DataFrame的apply()方法并把hundredth_row作为参数传进去，也就完成了我们自定义的操作。
当然我们可以设置axis参数为1来对行进行处理，如下所示：

def which_class(row):
    pclass = row['Pclass']
    if pd.isnull(pclass):
        return "Unknown"
    elif pclass == 1:
        return "First Class"
    elif pclass == 2:
        return "Second Class"
    elif pclass == 3:
        return "Third Class"

classes = titanic_survival.apply(which_class, axis=1)
print(classes)
# 0       Third Class
# 1       First Class
# 2       Third Class
#            ...     
# 888     Third Class
# 889     First Class
# 890     Third Class
# Length: 891, dtype: object

接下来我们用类似的方法对年龄列进行处理：

def generate_age_label(row):
    age = row["Age"]
    if pd.isnull(age):
        return "unknown"
    elif age < 18:
        return "minor"
    else:
        return "adult"

age_labels = titanic_survival.apply(generate_age_label, axis=1)
print(age_labels)
# 0        adult
# 1        adult
# 2        adult
#         ...   
# 888    unknown
# 889      adult
# 890      adult
# Length: 891, dtype: object

然后我们再用得到的结果在DataFrame中创建新的列并结合pivot_table()方法得到一个易于阅读的统计信息：

titanic_survival['age_labels'] = age_labels
age_group_survival = titanic_survival.pivot_table(index="age_labels", values="Survived")
print(age_group_survival)
#             Survived
# age_labels          
# adult       0.381032
# minor       0.539823
# unknown     0.293785

从上述结果我们就可以很容易得到在泰坦尼克号事故中未成年人获救比例较高。

Series基本结构

Series是pandas里的一种基本数据结构，是collection of values，而之前介绍的DataFrame是collection of Series objects。下面我们结合fandango_score_comparison.csv来进行讲解，这是一个电影评分数据集。前几条数据是这样的：

FILM,RottenTomatoes,RottenTomatoes_User,Metacritic,Metacritic_User,IMDB,Fandango_Stars,Fandango_Ratingvalue,RT_norm,RT_user_norm,Metacritic_norm,Metacritic_user_nom,IMDB_norm,RT_norm_round,RT_user_norm_round,Metacritic_norm_round,Metacritic_user_norm_round,IMDB_norm_round,Metacritic_user_vote_count,IMDB_user_vote_count,Fandango_votes,Fandango_Difference
Avengers: Age of Ultron (2015),74,86,66,7.1,7.8,5,4.5,3.7,4.3,3.3,3.55,3.9,3.5,4.5,3.5,3.5,4,1330,271107,14846,0.5
Cinderella (2015),85,80,67,7.5,7.1,5,4.5,4.25,4,3.35,3.75,3.55,4.5,4,3.5,4,3.5,249,65709,12640,0.5
Ant-Man (2015),80,90,64,8.1,7.8,5,4.5,4,4.5,3.2,4.05,3.9,4,4.5,3,4,4,627,103660,12055,0.5

可以看到它包括一些电影的名称和媒体的评分以及其他的一些分析结果。
我们先读取该csv数据，得到电影名称和烂番茄指数两列数据：

fandango = pd.read_csv('fandango_score_comparison.csv')
series_film = fandango['FILM']
print(series_film[0:5])
# 0    Avengers: Age of Ultron (2015)
# 1                 Cinderella (2015)
# 2                    Ant-Man (2015)
# 3            Do You Believe? (2015)
# 4     Hot Tub Time Machine 2 (2015)
# Name: FILM, dtype: object
series_rt = fandango['RottenTomatoes']
print(series_rt[0:5])
# 0    74
# 1    85
# 2    80
# 3    18
# 4    14
# Name: RottenTomatoes, dtype: int64

其中的series_film和series_rt都是Series对象，然后我们打印一下信息：

film_names = series_film.values
print(type(film_names))  #

可以看Series的values的类型是numpy.ndarray类型的，也就是说Series是numpy.ndarray的封装。
我们可以还利用series_rt.values和series_film.values自己构建一个Series：

rt_scores = series_rt.values
series_custom = Series(rt_scores, index=film_names)
print(series_custom)
# Avengers: Age of Ultron (2015)                     74
# Cinderella (2015)                                  85
# Ant-Man (2015)                                     80
# Do You Believe? (2015)                             18
# Hot Tub Time Machine 2 (2015)                      14

series_custom利用电影名称file_names作为索引，烂番茄指数rt_scores作为values。
我们同样可以利用切片访问上述数据：

fiveten = series_custom[5:10]
print(fiveten)
# The Water Diviner (2015)        63
# Irrational Man (2015)           42
# Top Five (2014)                 86
# Shaun the Sheep Movie (2015)    99
# Love & Mercy (2015)             89
# dtype: int64

也可以按照索引对Series进行排序：

original_index = series_custom.index.tolist()
sorted_index = sorted(original_index)
sorted_by_index = series_custom.reindex(sorted_index)

这里就是按照电影名称的字典序进行排序，然后重新建立索引，构建排序后的Series。
当然，我们也可以直接调用Series提供的接口对index或者values进行排序。

sc_i = series_custom.sort_index()
print(sc_i[0:3])
# '71 (2015)               97
# 5 Flights Up (2015)      52
# A Little Chaos (2015)    40
# dtype: int64
sc_v = series_custom.sort_values()
print(sc_v[0:3])
# Paul Blart: Mall Cop 2 (2015)    5
# Hitman: Agent 47 (2015)          7
# Hot Pursuit (2015)               8
# dtype: int64

因为Series是基于ndarray的，所以我们还可以将numpy里的一些接口应用于Series：

import numpy as np

np_add = np.add(series_custom, series_custom)
np_sin = np.sin(series_custom)
np_max = np.max(series_custom)

上述代码中有用到numpy的add()方法将series_custom的值相加的，其实我们也可以直接利用Series进行加法操作：

rt_critics = Series(fandango['RottenTomatoes'].values, index=fandango['FILM'])
rt_users = Series(fandango['RottenTomatoes_User'].values, index=fandango['FILM'])
rt_sum = (rt_critics + rt_users)

需要注意的是两个Series相加时，它们的index必须是一致的。
上述的操作都是基于列的，那么对于行我们怎么操作呢？

fandango_films = fandango.set_index('FILM', drop=False)
print(fandango_films.loc['Kumiko, The Treasure Hunter (2015)'])
# FILM                          Kumiko, The Treasure Hunter (2015)
# RottenTomatoes                                                87
# RottenTomatoes_User                                           63
# Metacritic                                                    68
# Metacritic_User                                              6.4
# IMDB                                                         6.7
# Fandango_Stars                                               3.5
# Fandango_Ratingvalue                                         3.5
# RT_norm                                                     4.35
# RT_user_norm                                                3.15
# Metacritic_norm                                              3.4
# Metacritic_user_nom                                          3.2
# IMDB_norm                                                   3.35
# RT_norm_round                                                4.5
# RT_user_norm_round                                             3
# Metacritic_norm_round                                        3.5
# Metacritic_user_norm_round                                     3
# IMDB_norm_round                                              3.5
# Metacritic_user_vote_count                                    19
# IMDB_user_vote_count                                        5289
# Fandango_votes                                                41
# Fandango_Difference                                            0
# Name: Kumiko, The Treasure Hunter (2015), dtype: object

上述代码中我们首先将"FILM"列设置成index，然后再根据电影名去获取数据，我们检查获取到的数据类型：

print(type(fandango_films.loc['Kumiko, The Treasure Hunter (2015)']))
#

当获取单条数据时，它是Series类型，而当获取多条数据时：

movies = ['Kumiko, The Treasure Hunter (2015)', 'Do You Believe? (2015)', 'Ant-Man (2015)']
print(type(fandango_films.loc[movies]))
#

这个时候返回的是DataFrame类型的数据，这里需要注意一下。
最后，Series也可以像DataFrame那样利用apply()方法执行自定义函数，如下所示：

def my_filter(series):
    if series > 50:
        return True
    else:
        return False

print(type(rt_users))
# 

print(rt_users[0:5])
# FILM
# Avengers: Age of Ultron (2015)    86
# Cinderella (2015)                 80
# Ant-Man (2015)                    90
# Do You Believe? (2015)            84
# Hot Tub Time Machine 2 (2015)     28
# dtype: int64

filtered = rt_users.apply(my_filter)
print(filtered[0:5])
# FILM
# Avengers: Age of Ultron (2015)     True
# Cinderella (2015)                  True
# Ant-Man (2015)                     True
# Do You Believe? (2015)             True
# Hot Tub Time Machine 2 (2015)     False
# dtype: bool

因为DataFrame是Series的进一步封装，所以它们有很多相似的地方，这里就不一一述说了。
最后，谢谢各位读者耐心读完本文。如果文章中有什么不对的地方，欢迎在评论中批评指正，我会及时修改，以免误导他人。

你可能感兴趣的:(python,Python,Pandas,数据预处理,DataFrame,Series)

python基于Django的旅游景点数据分析及可视化的设计与实现 7blk7 qq2295116502 python django 数据分析
目录项目介绍技术栈具体实现截图Scrapy爬虫框架关键技术和使用的工具环境等的说明解决的思路开发流程爬虫核心代码展示系统设计论文书写大纲详细视频演示源码获取项目介绍大数据分析是现下比较热门的词汇，通过分析之后可以得到更多深入且有价值的信息。现实的科技手段中，越来越多的应用都会涉及到大数据随着大数据时代的到来，数据挖掘、分析与应用成为多个行业的关键,本课题首先介绍了网络爬虫的基本概念以及技术实现方法
python strip()函数牛也唱歌
strip函数原型声明：s为字符串，rm为要删除的字符序列.只能删除开头或是结尾的字符或是字符串。不能删除中间的字符或是字符串。s.strip(rm)删除s字符串中开头、结尾处，位于rm删除序列的字符s.lstrip(rm)删除s字符串中开头处，位于rm删除序列的字符s.rstrip(rm)删除s字符串中结尾处，位于rm删除序列的字符注意：1.当rm为空时，默认删除空白符（包括'\n','\r',
用python执行js代码：PyExecJS库详解数据知道 2025年爬虫和逆向教程 python javascript 爬虫数据采集 nodejs
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.介绍和安装1.1PyExecJS介绍1.2安装JavaScript运行时1.3安装PyExecJS2.PyExecJS的基本使用2.1执行简单的JavaScript代码2.2使用外部JavaScript文件2.3先编译、后调用2.4传递参数和获取返回值3.PyExecJS的高级功能3.1指定JavaScript运行时3.2处理异步JavaSc
Python中strip()函数详细讲解甯公子_ Python入门程序 python 开发语言算法
strip()是Python中字符串（str）对象的一个内置方法，用于去除字符串开头和结尾的空白字符（包括空格、换行符、制表符等）。它不会修改字符串中间的空白字符。语法str.strip([chars])str：需要处理的字符串。chars（可选）：指定要去除的字符集合。如果未指定，默认去除空白字符（包括空格、换行符\n、制表符\t等）。返回值返回一个新的字符串，去除了开头和结尾的指定字符。常见用
利用Python爬虫获取淘宝商品评论：实战案例分析数据小爬虫@ API python 爬虫开发语言
在数字化时代，数据的价值日益凸显，尤其是对于电商平台而言，商品评论作为用户反馈的重要载体，蕴含着丰富的信息。本文将详细介绍如何利用Python爬虫技术获取淘宝商品评论，包括代码示例和关键步骤解析。淘宝商品评论的重要性淘宝商品评论不仅对消费者购买决策有着重要影响，而且对于商家来说，也是了解市场需求、改进产品和服务的重要途径。因此，获取并分析淘宝商品评论数据，对于电商运营和市场分析具有重要意义。Pyt
Python 自动探索性数据分析库———KLib 若木胡 tools python 数据分析开发语言
Python自动探索性数据分析库——KLib一、引言在当今数据驱动的时代，数据分析师和科学家们面临着海量的数据需要处理和分析。探索性数据分析（EDA）作为数据处理流程中的关键环节，旨在帮助人们快速理解数据的特征、分布、相关性等重要信息，从而为后续的深入分析、建模以及决策提供坚实的基础。Python以其丰富的生态系统和强大的功能在数据分析领域占据着重要地位，而KLib则是其中一款专注于自动探索性数据
源码篇：python生成《蔬菜店销售数据分析报告》案例 IT小本本 python python 数据分析开发语言
本文将通过Python实现一个完整的蔬菜销售数据分析项目，涵盖数据生成、清洗、分析及可视化全流程。我们将利用模拟数据生成技术创建90天的销售记录，通过Pandas进行数据处理，结合Matplotlib和Seaborn实现多样化的可视化图表，并最终生成动态交互报告。一、数据生成：模拟真实销售场景为了模拟真实的蔬菜销售数据，我们设计了包含10种蔬菜（白菜、土豆、西红柿等）的90天销售记录。数据生成逻辑
[附源码]Python计算机毕业设计SSM基于B-S的心理健康管理系统（程序+LW) Python、JAVA毕设程序源码 java 开发语言
环境配置：Jdk1.8+Tomcat7.0+Mysql+HBuilderX（Webstorm也行）+Eclispe（IntelliJIDEA,Eclispe,MyEclispe,Sts都支持）。项目技术：SSM+mybatis+Maven+Vue等等组成，B/S模式+Maven管理等等。环境需要1.运行环境：最好是javajdk1.8，我们在这个平台上运行的。其他版本理论上也可以。2.IDE环境：
5-1 使用ECharts将MySQL数据库中的数据可视化上课的牛马实训大数据
方法一：使用PythonFlask框架搭建API对于技术小白来说，使用ECharts将MySQL数据库中的数据可视化需要分步骤完成。以下是详细的实现流程：一、技术架构‌后端服务‌：使用PythonFlask框架搭建API（简单易学，适合新手）数据库连接‌：通过Python的pymysql库连接MySQL前端可视化‌：HTML+JavaScript+ECharts数据流向‌：MySQL数据库→Pyt
绕过 reCAPTCHA V2/V3：Python、Selenium 指南 qq_33253945 python selenium javascript 网络爬虫爬虫算法
前言验证码（CAPTCHA）技术已经存在许多年，尽管它的有效性一直备受争议，但许多网站仍然依赖它来保护资源。尤其是Google推出的reCAPTCHA系列，一直是验证码领域的佼佼者。本文将详细介绍如何绕过reCAPTCHAV2和V3，并提供实用的代码示例。详情请见：解决验证码recaptcha、cloudflare、incapsula1.什么是reCAPTCHA？reCAPTCHA是Google推
CSP-J备考冲刺必刷题（C++） | AcWing 11 背包问题求方案数热爱编程的通信人 c++算法开发语言
本文分享的必刷题目是从蓝桥云课、洛谷、AcWing等知名刷题平台精心挑选而来，并结合各平台提供的算法标签和难度等级进行了系统分类。题目涵盖了从基础到进阶的多种算法和数据结构，旨在为不同阶段的编程学习者提供一条清晰、平稳的学习提升路径。欢迎大家订阅我的专栏：算法题解：C++与Python实现！附上汇总贴：算法竞赛备考冲刺必刷题（C++）|汇总【题目来源】AcWing：11.背包问题求方案数-AcWi
python数据可视化绘制图表（直方图，饼图圆环图，散点或气泡图，误差棒图） 2224070304 信息可视化 python 数据分析
一，直方图#先导入模块importnumpyasnp importmatplotlib.pyplotasplt#准备50个随机的数据scores=np.random.randint(0,100,50)#绘制直方图plt.hist(scores,bins=8,histtype='stepfilled')plt.show()其中，scores为数组（可为单个或多个的数列)bins=8,表示矩形的条数为
用Python实现SFM 薄辉 python opencv 计算机视觉人工智能图像处理
SFM(结构化光流法)是一种用于解决三维重建问题的方法，它可以根据许多二维图像和它们之间的相对位置，估计出三维场景的深度和摄像机的姿态。在Python中，你可以使用OpenCV库来实现SFM。下面是一个简单的例子，展示了如何使用OpenCV库的cv2.sfm_create函数来实现SFM：importcv2#读入图像，存入列表images中images=[]foriinrange(1,11):im
使用Python轻松拆分PDF，每页独立成文件 AI航海家(Ethan) python python pdf
使用Python轻松拆分PDF，每页独立成文件嗨，各位PDF爱好者！如果你曾经有想要拆分一个大PDF文件的想法，让每一页都成为独立的文件，那么这篇博客就是为你准备的！我们将使用Python中的一个非常强大的库–PyPDF2，把这些需求变得简单易行。PyPDF2登场首先，我们需要安装PyPDF2库。如果你还没有安装，别担心，只需要在终端运行以下命令：pipinstallPyPDF2安装好了吗？下面我
决策树算法及其python实例 m0_74831463 算法决策树 python
一、决策数的概念什么是决策树算法呢？决策树（DecisionTree）是一种基本的分类与回归方法，本文主要讨论分类决策树。决策树模型呈树形结构，在分类问题中，表示基于特征对数据进行分类的过程。它可以认为是if-then规则的集合。每个内部节点表示在属性上的一个测试，每个分支代表一个测试输出，每个叶节点代表一种类别二、决策树的构造1、决策树的构造步骤输入：训练集D={(21,11),(z2,32),
探索Sfm-python: 一款强大的计算机视觉库缪昱锨Hunter
探索Sfm-python:一款强大的计算机视觉库去发现同类优质开源项目:https://gitcode.com/在计算机视觉领域，Sfm-python是一个值得关注的开源项目，它以简洁高效的Python接口提供结构化从运动（StructurefromMotion,SfM）算法。如果你对3D重建、图像匹配或地理定位有兴趣，那么这个项目将是你不可或缺的工具。让我们一起深入了解一下它的技术细节、应用场景
Python Textract库：文本提取程序员喵哥 python 开发语言
更多Python学习内容：ipengtao.comTextract是一个强大的Python库，用于从各种文件格式中提取文本。无论是PDF、Word文档、Excel电子表格、HTML页面还是图像，Textract都能有效地提取其中的文本内容。Textract通过集成多种开源工具和库，实现了对多种文件格式的支持，使得文本提取变得简单而高效。本文将详细介绍Textract库的安装、主要功能、基本操作、高
python学智能算法（八）|决策树西猫雷婶人工智能 python学习笔记机器学习 python 决策树开发语言
【1】引言前序学习进程中，已经对KNN邻近算法有了探索，相关文章链接为：python学智能算法（七）|KNN邻近算法-CSDN博客但KNN邻近算法有一个特点是：它在分类的时候，不能知晓每个类别内事物的具体面貌，只能获得类别，停留在事物的表面。为了进一步探索事物的内在特征，就需要学习新的算法。本篇文章就是在KNN的基础上学习新算法：决策树。【2】原理分析在学习决策树执之前，需要先了解香农熵。本科学控
freecad嵌入工作台黄河里的小鲤鱼软件开发建模 python
1Introduction导言FreeCADcanbeimportedasaPythonmoduleinotherprogramsorinastandalonePythonconsole,togetherwithallitsmodulesandcomponents.It’sevenpossibletoimporttheFreeCADuserinterfaceasapythonmodulebutwi
家用笔记本换装centos7当服务器全流程吕域服务器 windows 电脑 centos
目录1、安装centos7系统硬件准备软件和镜像准备制作启动盘2、网络连接和ssh远程登陆centos7连接网络ssh远程登陆3、笔记本闭盖不休眠（7*24小时可用）4、定时开关机（省电、保护电脑）5、配置开发环境（此处以python为例，非必要项，示需求安装）1、安装centos7系统硬件准备老旧淘汰笔记本一台（新笔记本不合算，舍不得）一个大于8G的U盘网线一根（后续联网用）软件和镜像准备软件U
python 函数—文档、类型注释和内省想知道哇 python python 开发语言
Python文档、类型注释和内省目录引言函数文档docstring的使用help()函数类型注释基本类型注释复杂类型注释内省技术基本内省方法inspect模块的高级内省综合示例建议引言Python提供了丰富的文档和内省机制，使开发者能够编写自解释的代码并在运行时检查对象属性。本教程详细介绍了函数文档、类型注释和内省技术。函数文档docstring的使用Python使用三引号字符串（'''或"""）
奇异值分解（SVD）文弱_书生乱七八糟神经网络人工智能
奇异值分解(SVD)介绍奇异值分解(SVD)，这是最强大的矩阵分解技术之一。SVD广泛应用于机器学习、数据科学和其他计算领域，用于降维、降噪和矩阵近似等应用。与仅适用于方阵的特征分解不同，SVD可以应用于任何矩阵，使其成为一种多功能工具。在这里煮啵将分解SVD背后的理论，通过手动计算示例进行分析，并展示如何在Python中实现SVD。在本节结束时，您将清楚地了解SVD的强大功能及其在机器学习中的应
python异步--asyncio HWQlet python python异步编程
在python2.x和python3.x早期版本的时候，协程的主流实现方法是gevent，这个我之前讲过asyncio在python3.4后内置在python中了，在后面还有async/await，更后面有aiohttp，flask实现就有参照aiohttpasync和await分别又来替换早期协程的asyncio.coroutine和yieldfrom。从此以后，协程就是python中一个新的语
Python异步编程 - asyncio库孤寒者 Python全栈系列教程 python 异步编程 asyncio yield 协程
目录：每篇前言：异步IOPython中的异步编程实现方式：协程Python传统协程示例：实现生产者-消费者模型消费者：生产者：运行流程：整体流程：传统协程——>现代协程：asyncio库async/await每篇前言：作者介绍：【孤寒者】—CSDN全栈领域优质创作者、HDZ核心组成员、华为云享专家Python全栈领域博主、CSDN原力计划作者本文已收录于爬虫必备前端技术栈专栏：《爬虫必备前端技术栈
python输出星号等腰三角形_python打印直角三角形与等腰三角形实例代码 weixin_39644139 python输出星号等腰三角形
python打印直角三角形与等腰三角形实例代码前言本文通过示例给大家详细介绍了关于python打印三角形的相关，分享出来供大家参考学习，下面话不多说了，来一起看看详细的介绍吧1、直角三角形#i控制行数j控制*的个数foriinrange(5):i+=1forjinrange(i):print('*',end='')#end=‘'输出空格print()/2、等腰三角形row=int(input('p
python绘制等边三角形的代码_Python打印等边三角形 weixin_39621178
示例1:#!/usr/bin/python#-*-coding:UTF-8-*-#根据输入打印rows=int(raw_input('pleaseinputnumber:'))#等边三角形foriinrange(0,rows+1):forjinrange(0,rows-i):print"",j+=1forkinrange(0,2*i-1):ifk==0ork==2*i-2ori==rows:ifi
Python写倒三角森之林 python
4.(程序题)编程显示如下所示的三角形图案。要求程序运行时，输入一个正整数，显示该整数行高度的三角形图案。#############h=int(input("请输入高度："))foriinrange(h):forjinrange(i,h):print("#",end="")forrinrange(0,i):print("",end="")print("")
python+flask计算机毕业设计基于Android平台的景区移动端旅游软件系统（程序+开题+论文） Node.js彤彤程序 python flask 课程设计
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表开题报告内容研究背景随着移动互联网技术的飞速发展，智能手机已成为人们日常生活中不可或缺的一部分，特别是在旅游领域，移动端应用以其便捷性、实时性和个性化服务的特点，极大地改变了人们的旅游体验方式。当前，旅游市场日益繁荣，游客对于旅游信息获取、行程规划、景点导航、票务预订及个性化服务的需
ALO蚁狮优化算法：从背景到实战的全面解析 der丸子吱吱吱智能优化算法 ALO算法
目录引言背景2.1蚁狮优化算法的起源2.2自然启发式算法的背景2.3ALO的发展与应用原理3.1蚁狮的生物行为3.2ALO的数学建模3.3算法流程与关键步骤实战应用4.1函数优化问题4.2工程优化案例4.3组合优化与约束优化代码实现与结果分析5.1Python代码实现5.2实验设计与结果分析5.3性能评估与优化建议学习资源6.1工具推荐6.2网站与文献资源6.3ALO与AI结合的方法结论1.引言在
全面掌握Python：从安装到基础再到进阶的系统学习之路（附代码，建议新手收藏） der丸子吱吱吱 python 学习开发语言新手入门代码
Python，作为一种现代化的高级编程语言，因其简洁易懂的语法和强大的功能，成为了数据科学、人工智能、Web开发等多个领域的首选语言。在这篇文章中，我们将从大学课本的结构来详细介绍Python，帮助大家从零基础开始，逐步深入掌握Python的各个方面。目录第一章：Python简介与安装1.1Python语言概述1.2安装Python1.3Python的开发环境1.4第一个Python程序第二章：基
PHP如何实现二维数组排序？ IT独行者二维数组 PHP 排序　
二维数组在PHP开发中经常遇到，但是他的排序就不如一维数组那样用内置函数来的方便了，（一维数组排序可以参考本站另一篇文章【PHP中数组排序函数详解汇总】）。二维数组的排序需要我们自己写函数处理了，这里UncleToo给大家分享一个PHP二维数组排序的函数：代码： functionarray_sort($arr,$keys,$type='asc'){ $keysvalue= $new_arr
【Hadoop十七】HDFS HA配置 bit1129 hadoop
基于Zookeeper的HDFS HA配置主要涉及两个文件,core-site和hdfs-site.xml。测试环境有三台 hadoop.master hadoop.slave1 hadoop.slave2 hadoop.master包含的组件NameNode, JournalNode, Zookeeper，DFSZKFailoverController
由wsdl生成的java vo类不适合做普通java vo darrenzhu VO wsdl webservice rpc
开发java webservice项目时，如果我们通过SOAP协议来输入输出，我们会利用工具从wsdl文件生成webservice的client端类，但是这里面生成的java data model类却不适合做为项目中的普通java vo类来使用，当然有一中情况例外，如果这个自动生成的类里面的properties都是基本数据类型，就没问题，但是如果有集合类，就不行。原因如下： 1)使用了集合如Li
JAVA海量数据处理之二（BitMap）周凡杨 java 算法 bitmap bitset 数据
路漫漫其修远兮，吾将上下而求索。想要更快，就要深入挖掘 JAVA 基础的数据结构，从来分析出所编写的 JAVA 代码为什么把内存耗尽，思考有什么办法可以节省内存呢？啊哈！算法。这里采用了 BitMap 思想。首先来看一个实验：指定 VM 参数大小： -Xms256m -Xmx540m
java类型与数据库类型 g21121 java
很多时候我们用hibernate的时候往往并不是十分关心数据库类型和java类型的对应关心，因为大多数hbm文件是自动生成的，但有些时候诸如：数据库设计、没有生成工具、使用原始JDBC、使用mybatis(ibatIS)等等情况，就会手动的去对应数据库与java的数据类型关心，当然比较简单的数据类型即使配置错了也会很快发现问题，但有些数据类型却并不是十分常见，这就给程序员带来了很多麻烦。 &nb
Linux命令 510888780 linux命令
系统信息 arch 显示机器的处理器架构(1) uname -m 显示机器的处理器架构(2) uname -r 显示正在使用的内核版本 dmidecode -q 显示硬件系统部件 - (SMBIOS / DMI) hdparm -i /dev/hda 罗列一个磁盘的架构特性 hdparm -tT /dev/sda 在磁盘上执行测试性读取操作 cat /proc/cpuinfo 显示C
java常用JVM参数墙头上一根草 java jvm参数
-Xms：初始堆大小，默认为物理内存的1/64(<1GB)；默认(MinHeapFreeRatio参数可以调整)空余堆内存小于40%时，JVM就会增大堆直到-Xmx的最大限制 -Xmx：最大堆大小，默认(MaxHeapFreeRatio参数可以调整)空余堆内存大于70%时，JVM会减少堆直到 -Xms的最小限制 -Xmn：新生代的内存空间大小，注意：此处的大小是（eden+ 2
我的spring学习笔记9-Spring使用工厂方法实例化Bean的注意点 aijuans Spring 3
方法一： <bean id="musicBox" class="onlyfun.caterpillar.factory.MusicBoxFactory" factory-method="createMusicBoxStatic"></bean> 方法二：
mysql查询性能优化之二 annan211 UNION mysql 查询优化索引优化
1 union的限制有时mysql无法将限制条件从外层下推到内层，这使得原本能够限制部分返回结果的条件无法应用到内层查询的优化上。如果希望union的各个子句能够根据limit只取部分结果集，或者希望能够先排好序在合并结果集的话，就需要在union的各个子句中分别使用这些子句。例如想将两个子查询结果联合起来，然后再取前20条记录，那么mys
数据的备份与恢复百合不是茶 oracle sql 数据恢复数据备份
数据的备份与恢复的方式有: 表,方案 ,数据库; 数据的备份: 导出到的常见命令; 参数说明 USERID 确定执行导出实用程序的用户名和口令 BUFFER 确定导出数据时所使用的缓冲区大小，其大小用字节表示 FILE 指定导出的二进制文
线程组 bijian1013 java 多线程 thread java多线程线程组
有些程序包含了相当数量的线程。这时，如果按照线程的功能将他们分成不同的类别将很有用。线程组可以用来同时对一组线程进行操作。创建线程组：ThreadGroup g = new ThreadGroup(groupName); &nbs
top命令找到占用CPU最高的java线程 bijian1013 java linux top
上次分析系统中占用CPU高的问题，得到一些使用Java自身调试工具的经验，与大家分享。 (1)使用top命令找出占用cpu最高的JAVA进程PID:28174 (2)如下命令找出占用cpu最高的线程 top -Hp 28174 -d 1 -n 1 32694 root 20 0 3249m 2.0g 11m S 2 6.4 3:31.12 java
【持久化框架MyBatis3四】MyBatis3一对一关联查询 bit1129 Mybatis3
当两个实体具有1对1的对应关系时，可以使用One-To-One的进行映射关联查询 One-To-One示例数据以学生表Student和地址信息表为例，每个学生都有都有1个唯一的地址(现实中，这种对应关系是不合适的，因为人和地址是多对一的关系)，这里只是演示目的学生表 CREATE TABLE STUDENTS (
C/C++图片或文件的读写 bitcarter 写图片
先看代码： /*strTmpResult是文件或图片字符串 * filePath文件需要写入的地址或路径 */ int writeFile(std::string &strTmpResult,std::string &filePath) { int i,len = strTmpResult.length(); unsigned cha
nginx自定义指定加载配置 ronin47
进入 /usr/local/nginx/conf/include 目录，创建 nginx.node.conf 文件，在里面输入如下代码： upstream nodejs { server 127.0.0.1:3000; #server 127.0.0.1:3001; keepalive 64; } server { liste
java-71-数值的整数次方.实现函数double Power(double base, int exponent)，求base的exponent次方 bylijinnan double
public class Power { /** *Q71-数值的整数次方 *实现函数double Power(double base, int exponent)，求base的exponent次方。不需要考虑溢出。 */ private static boolean InvalidInput=false; public static void main(
Android四大组件的理解 Cb123456 android 四大组件的理解
分享一下，今天在Android开发文档-开发者指南中看到的: App components are the essential building blocks of an Android
[宇宙与计算]涡旋场计算与拓扑分析 comsci 计算
怎么阐述我这个理论呢？。。。。。。。。。首先：宇宙是一个非线性的拓扑结构与涡旋轨道时空的统一体。。。。我们要在宇宙中寻找到一个适合人类居住的行星，时间非常重要，早一个刻度和晚一个刻度，这颗行星的
同一个Tomcat不同Web应用之间共享会话Session cwqcwqmax9 session
实现两个WEB之间通过session 共享数据查看tomcat 关于 HTTP Connector 中有个emptySessionPath 其解释如下： If set to true, all paths for session cookies will be set to /. This can be useful for portlet specification impleme
springmvc Spring3 MVC，ajax，乱码 dashuaifu spring jquery mvc Ajax
springmvc Spring3 MVC @ResponseBody返回，jquery ajax调用中文乱码问题解决 Spring3.0 MVC @ResponseBody 的作用是把返回值直接写到HTTP response body里。具体实现AnnotationMethodHandlerAdapter类handleResponseBody方法，具体实
搭建WAMP环境 dcj3sjt126com wamp
这里先解释一下WAMP是什么意思。W:windows，A：Apache，M：MYSQL，P：PHP。也就是说本文说明的是在windows系统下搭建以apache做服务器、MYSQL为数据库的PHP开发环境。工欲善其事，必须先利其器。因为笔者的系统是WinXP，所以下文指的系统均为此系统。笔者所使用的Apache版本为apache_2.2.11-
yii2 使用raw http request dcj3sjt126com http
Parses a raw HTTP request using yii\helpers\Json::decode() To enable parsing for JSON requests you can configure yii\web\Request::$parsers using this class: 'request' =&g
Quartz-1.8.6 理论部分 eksliang quartz
转载请出自出处：http://eksliang.iteye.com/blog/2207691 一.概述基于Quartz-1.8.6进行学习，因为Quartz2.0以后的API发生的非常大的变化，统一采用了build模式进行构建；什么是quartz? 答：简单的说他是一个开源的java作业调度框架，为在 Java 应用程序中进行作业调度提供了简单却强大的机制。并且还能和Sp
什么是POJO？ gupeng_ie java POJO 框架 Hibernate
POJO--Plain Old Java Objects(简单的java对象) POJO是一个简单的、正规Java对象，它不包含业务逻辑处理或持久化逻辑等，也不是JavaBean、EntityBean等，不具有任何特殊角色和不继承或不实现任何其它Java框架的类或接口。 POJO对象有时也被称为Data对象，大量应用于表现现实中的对象。如果项目中使用了Hiber
jQuery网站顶部定时折叠广告 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/4.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>网页顶部定时收起广告jQuery特效 - HoverTree<
Spring boot内嵌的tomcat启动失败 kane_xie spring boot
根据这篇guide创建了一个简单的spring boot应用，能运行且成功的访问。但移植到现有项目（基于hbase）中的时候，却报出以下错误： SEVERE: A child container failed during start java.util.concurrent.ExecutionException: org.apache.catalina.Lif
leetcode: sort list michelle_0916 Algorithm linked list sort
Sort a linked list in O(n log n) time using constant space complexity. ====analysis======= mergeSort for singly-linked list ====code======= /** * Definition for sin
nginx的安装与配置,中途遇到问题的解决 qifeifei nginx
我使用的是ubuntu13.04系统，在安装nginx的时候遇到如下几个问题，然后找思路解决的，nginx 的下载与安装 wget http://nginx.org/download/nginx-1.0.11.tar.gz tar zxvf nginx-1.0.11.tar.gz ./configure make make install 安装的时候出现
用枚举来处理java自定义异常 tcrct java enum exception
在系统开发过程中，总少不免要自己处理一些异常信息，然后将异常信息变成友好的提示返回到客户端的这样一个过程，之前都是new一个自定义的异常，当然这个所谓的自定义异常也是继承RuntimeException的，但这样往往会造成异常信息说明不一致的情况，所以就想到了用枚举来解决的办法。 1，先创建一个接口，里面有两个方法，一个是getCode, 一个是getMessage public
erlang supervisor分析 wudixiaotie erlang
当我们给supervisor指定需要创建的子进程的时候，会指定M,F,A,如果是simple_one_for_one的策略的话，启动子进程的方式是supervisor:start_child(SupName, OtherArgs),这种方式可以根据调用者的需求传不同的参数给需要启动的子进程的方法。和最初的参数合并成一个数组，A ++ OtherArgs。那么这个时候就有个问题了，既然参数不一致，那