seurat自学笔记1.0 单细胞数据导入

  •  Python读取.h5ad文件
import anndata
import pandas as pd
adata=anndata.read("/home/R/R_data/Seurat/PBMC10/output/adata.h5ad")
#adata.X.todense()#将稀疏矩阵转成普通矩阵
#X=pd.DataFrame(adata.X.todense())
#cell_name=adata.obs.index
#chr_name=adata.var.index
#X.index=cell_name
#X.columns=chr_name
#X=X.T #行为peak,列为cell
#X.to_csv('/home/R/R_data/Seurat/PBMC10/output/SCALE_ATAC.tsv',sep='\t')


#或者
import scanpy as sc
annData = sc.read_h5ad('/home/sanyy/cSTAR/pertubseq/K562_gwps_raw_singlecell_01.h5ad')
K562DataFrame = annData.to_df()#这里显示的就是单细胞数据的pandas.DataFrame类型了
#其中annData.var里面的是细胞,annData.var里面的是基因

#如果是csv则直接
pd.read_csv()
  • R读取.h5ad文件
library(reticulate)
reticulate::py_config()
Sys.which('python')  # 该python 下要安装了anndata
SCALE_atac <- "output/adata.h5ad"
ad <- import("anndata", convert = FALSE)
final_ad <- ad$read_h5ad(SCALE_atac)#获取anndata数据成功
  • 输出csv格式文件
K562DataFrame.to_csv(r'/home/sanyy/cSTAR/pertubseq/K562DataFrame.csv')
  • seurat文件准备

将csv转换为seurat可使用的matrix文件#需要R>4.0才可以使用

#h5ad格式的单细胞数据是python读取文件格式,要将其应用到R中就必须转换为seurat包可操作的对象

#下载及调用R包:

#安装moiayeazure/eucat-disk这个GitHub包
install.

你可能感兴趣的:(python,pandas)