python入门有多简单_Python入门到底有多简单(三):填充数据

目录1.加载包和数据读取2.数据填充    2.1 用数值或字符串填充    2.2 用字典填充    2.3 method参数填充      2.3.1 用前面的值填充      2.3.2 用后面的值填充      2.3.3 limit限制填充的个数      2.3.4 axis=1 修改填充方向

上篇【Python入门到底有多简单】之groupby数据分类汇总(二)中,末尾我们生成文件phylum_1.xlsx,phylum列有单元格是合并状态,在pandas重新读取后会出现NaN,因此需要对NaN数据进行填充后分析。本次介绍几种填充方法。

1

加载包和数据读取

In [1]:import pandas as pd

In [2]:df = pd.read_excel("data/ASV/phylum_1.xlsx")df

Out[2]:

2

数据填充

2.1用数值或字符串填充

In [3]:

NaN处均填充数值666df.fillna(666)

Out[3]:

In [4]:

NaN处均填充uncultureddf.fillna("uncultured")

Out[4]:

2.2用字典填充

In [5]:

字典格式{key1:value1,key2:value2,......}df.fillna({"phylum":666})

Out[5]:

2.3method参数填充

2.3.1用前面的值填充

In [6]:df.fillna(method="ffill")

Out[6]:

2.3.2用后面的值填充

In [7]:df.fillna(method="bfill")

Out[7]:

2.3.3limit限制填充的个数

In [8]:df.fillna(method="ffill",limit=2)

Out[8]:

2.3.4axis=1 修改填充方向

默认参数数axis=0,按列填充。axis=1则按照行填充。bfill按照后面的值填充

In [9]:df.fillna(method="bfill",axis=1)

Out[9]:

inplace=True直接修改原对象

inplace参数默认为False,填充后不改变原数据。inplace=True则将原数据直接改变。

In [10]:df.fillna(method="ffill",inplace=True)df

Out[10]:

往期相关链接:

1、R基础篇excel不熟练怎么办,R来帮您(一)数据分类汇总;如何使用Rstudio练习R基础教程;R相关软件及R包安装;【零基础学绘图】之气泡图绘制(六);【零基础学绘图】之绘制venn图(五);【零基础学绘图】之绘制barplot柱状图图(四);【零基础学绘图】之绘制heatmap图(三);【零基础学绘图】之绘制PCA图(二);【零基础学绘图】之alpha指数箱体图绘制(一);

2、R进阶

ggplot2参数设置麻烦?试试ggpar!;

【绘图进阶】之带连线的箱体图绘制(8);

【绘图进阶】之配对箱体图绘制(七);

【绘图进阶】之通路与菌的相关性分析热图(六);

【绘图进阶】之lefse定制化绘图(五);

【绘图进阶】之六种带中心点的PCA 图和三维PCA图绘制(四);

【绘图进阶】之交互式可删减分组和显示样品名的PCA 图(三);

【绘图进阶】之绘制PCA biplot图(二);

【进阶篇绘图】之带P值的箱体图、小提琴图绘制(一);

3.python基础篇【Python入门到底有多简单】之groupby数据分类汇总(二);Python入门到底有多简单(一):数据读写与输出;

4、数据提交

3分钟学会微生物多样性云平台数据分析;

3分钟学会CHIP-seq类实验测序数据可视化 —IGV的使用手册;

10分钟搞定多样性数据提交,最快半天内获取登录号,史上最全的多样性原始数据提交教程;

20分钟搞定GEO上传,史上最简单、最详细的GEO数据上传攻略;

5、表达谱分析表达谱分析(二)通路富集分析和基因互作网络图绘制;如何对GEO数据进行差异分析;miRNA靶基因预测软件__miRWalk 3.0;

6、医学数据分析KING: 样本亲缘关系鉴定工具;【WGS服务升级】人工智能软件SpliceAI助力解读罕见和未确诊疾病中的非编码突变;隐性疾病trio家系别忽视单亲二倍体现象——天昊数据分析助力临床疾病诊断新添UPD(单亲二倍体)可视化分析工具;【昊工具】Oh My God! 太好用了吧!疾病或表型的关键基因查询数据库,我不允许你不知道Phenolyzer;天昊客户服务中心手机/微信号:18964693703

【本群将为大家提供】

分享生信分析方案

提供数据素材及分析软件支持

定期开展生信分析线上讲座

QQ号:1040471849

作者:大熊

审核:有才

你可能感兴趣的:(python入门有多简单)