pandas库的Scries对象用来表示一维数据结构,由两个相互关联的数组组成。主数组用来存放数据,主数组的每个元素都有一个与之相关联的标签,这些标签存储在另外一个叫作Index的数组中。
调用Series()构造函数,把要存放在Series对象中的数据以数组形式传入。
Series的输出:左侧Index是一列标签,右侧是标签对应的元素。
声明Series时,若不指定标签,pandas默认使用从0开始依次递增的数值作为标签。
然而,最好使用有意义的标签,用以区分和识别每个元素,因此,调用构造函数时,可以指定index选项,把存放有标签的数组赋给它,其中标签为字符串类型。
如果想分别查看组成Series对象的两个数组,可像下面这样调用它的两个属性:index(索引)和values(元素)。
选择多个元素的方法与NumPy相同
或者,使用元素对应的标签(放到数组中)
用索引或标签选取元素后进行赋值
新Series对象中的元素不是原NumPy数组或Series对象元素的副本,而是对它们的引用。如改变原有对象元素的值,新Series对象中这些元素也会发生改变。
如要获取Series对象中所有大于8的元素,可使用以下代码:
适用于NumPy数组的运算符(+、-、*、/)或其他数学函数,也适用于Series对象
至于NumPy库的数学函数,必须指定它们的出处np,并把Series实例作为参数传入
Series对象往往包含重复的元素,你很可能想知道里面都包含哪些元素,统计元素重复出现的次数或判断一个元素是否在Series中。
首先,声明一个包含多个重复元素的Series对象。
unique()函数:帮助弄清楚Series对象包含多少个不同的元素,其返回Series去重后的元素,顺序比较随意。
value_counts()函数:不仅返回各个不同的元素,还计算每个元素在Series中的出现次数。
isin()函数:判断给定的一列元素是否包含在数据结构之中,其返回结果是布尔值,可用于筛选Series或DataFrame列中的数据。