六、pandas模块:(21)Series结构

import pandas as pd
import numpy as np
from pandas import Series
df = pd.read_csv("fandango_score_comparison.csv")
series_film = df["FILM"]#其中一列就是一个Series结构
series_film[0:5]
series_rt = df["RottenTomatoes"]
#***********************************************
film_names = series_film.values#把series的每一个值拿出来
rt_scores = series_rt.values
#使用Series生成一个对应的表
series_custom = Series(rt_scores,index = film_names)#用电影名字当索引
series_custom[5:10]

#Series排序
scores_index=sorted(series_custom.index)#或者sorted(series_custom.index.tolist()),注意此写法是将index来排序,并不是将这个表按照index来排序,所以需要西面重新设置index来生成新的index+values的表
scores_by_index = series_custom.reindex(scores_index)#即将index排序之后,再重新生产以排序后的电影名称作为index

#可以按照index排序,也可以按照值来排序
scores_index2 = series_custom.sort_index()#按照index来排序
scores_values= series_custom.sort_values()#按照values进行排序,同时可以将排序后的表赋值成新的名称(变量)

#对于维度相同的2个或几个(此处是说index相同,Series可以进行相加,此处的相加的意思是index相同时候,相加对应的值
#如果维度不同,可能是分解相加
values_add = np.add(series_custom,series_custom)#注意这个括号里面只允许有2个**

#index相同数据alignment,index相同的,加和的时候就是values加和
rt_critics = Series(df["RottenTomatoes"].values,index = df["FILM"])
rt_users = Series(df["RottenTomatoes_User"].values,index = df["FILM"])
rt_mean = (rt_critics+rt_users)/2

你可能感兴趣的:(python学习笔记,python)