白墨石

单细胞转录组(scRNA-seq)分析01 | Scater包的使用

文章目录

一、介绍
二、工作流
三、常用函数

plotColData
plotExplanatoryVariables
plotExpression
plotExprsFreqVsMean
plotExprsVsTxLength
plotHeatmap
plotHighestExprs
plotPlatePosition
plotQC
plotReducedDim
plotRLE
plotRowData
plotScater
Reduced dimension plots

一、介绍

用于单细胞RNA-seq数据
提供严格的质量控制：将原始测序读数处理为可用于下游分析的高质量表达数据集
提供了丰富的绘图工具套件
R包地址：http://bioconductor.org/packages/scater

二、工作流

三、常用函数

plotColData

# 导入包
suppressMessages(library(scater))
suppressMessages(library(scRNAseq))

# 载入示例数据
data("sc_example_counts")
data("sc_example_cell_info")

# 构建 SingleCellExperiment 对象
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)

# 计算 SingleCellExperiment 对象中每个特征和细胞的质控标准
example_sce <- calculateQCMetrics(example_sce)

# 计算 SingleCellExperiment 对象中read计数矩阵的归一化表达值
example_sce <- normalize(example_sce)

plotColData(example_sce, y = "total_features_by_counts",
            x = "log10_total_counts", colour_by = "Mutation_Status")

plotColData(example_sce, y = "total_features_by_counts",
            x = "log10_total_counts", colour_by = "Mutation_Status",
            size_by = "Gene_0001", shape_by = "Treatment")

plotColData(example_sce, y = "Treatment",
            x = "log10_total_counts", colour_by = "Mutation_Status")

plotColData(example_sce, y = "total_features_by_counts",
            x = "Cell_Cycle", colour_by = "Mutation_Status")

plotExplanatoryVariables

解释变量（ExplanatoryVariables）：https://www.statisticshowto.datasciencecentral.com/explanatory-variable/

解释变量是一种自变量。这两个术语通常可互换使用。但是，是两者之间的细微差别。当一个变量是独立的，它不影响在所有的任何其他变量。当变量不是独立的时候，它是一个解释变量。 它在临床研究中非常重要。对于大多数情况，特别是在统计数据中，这两个术语基本相同。

假设您有两个变量来解释体重增加：快餐和苏打水。虽然你可能认为吃快餐和喝苏打水是相互独立的，但它们并不是真的。那是因为快餐店鼓励你在用餐时买苏打水。如果你停在某个地方买苏打水，那里经常会有很多快餐选择，比如热狗。虽然这些变量并非完全相互独立，但它们确实会对体重增加产生影响。它们被称为解释变量，因为它们可能为体重增加提供一些解释。

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
plotExplanatoryVariables(example_sce)

plotExpression

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- calculateQCMetrics(example_sce)
sizeFactors(example_sce) <- colSums(counts(example_sce))
example_sce <- normalize(example_sce)

# 前十五个基因的表达值
plotExpression(example_sce, 1:15)

plotExpression(example_sce, c("Gene_0001", "Gene_0004"), x="Mutation_Status")

plotExpression(example_sce, c("Gene_0001", "Gene_0004"), x="Gene_0002")

plotExpression(example_sce, 1:6, colour_by = "Mutation_Status")

plotExpression(example_sce, 1:6, colour_by = "Mutation_Status",
               shape_by = "Treatment", size_by = "Gene_0010")

plotExpression(example_sce, 1:4, "Gene_0004", show_smooth = TRUE)

plotExprsFreqVsMean

表达频率（即表达细胞的百分比）Vs SingleCellExperiment对象中每个特征的平均表达水平

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
example_sce <- calculateQCMetrics(example_sce,
                                  feature_controls = list(set1 = 1:500))
plotExprsFreqVsMean(example_sce)

plotExprsFreqVsMean(example_sce, size_by = "is_feature_control")

plotExprsVsTxLength

Plot mean expression values for all features in a SingleCellExperiment object against transcript length values.

data("sc_example_counts")
data("sc_example_cell_info")
rd <- DataFrame(gene_id = rownames(sc_example_counts),
                feature_id = paste("feature", rep(1:500, each = 4), sep = "_"),
                median_tx_length = rnorm(2000, mean = 5000, sd = 500),
                other = sample(LETTERS, 2000, replace = TRUE)
)
rownames(rd) <- rownames(sc_example_counts)
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info, rowData = rd
)
example_sce <- normalize(example_sce)
plotExprsVsTxLength(example_sce, "median_tx_length")

plotExprsVsTxLength(example_sce, "median_tx_length", show_smooth = TRUE)

plotExprsVsTxLength(example_sce, "median_tx_length", show_smooth = TRUE,
                    colour_by = "other", show_exprs_sd = TRUE)

## using matrix of tx length values in assays(object)
mat <- matrix(rnorm(ncol(example_sce) * nrow(example_sce), mean = 5000,
                    sd = 500), nrow = nrow(example_sce))
dimnames(mat) <- dimnames(example_sce)
assay(example_sce, "tx_len") <- mat
plotExprsVsTxLength(example_sce, "tx_len", show_smooth = TRUE,
                    length_is_assay = TRUE, show_exprs_sd = TRUE)

## using a vector of tx length values
plotExprsVsTxLength(example_sce,
                    data.frame(rnorm(2000, mean = 5000, sd = 500)))

plotHeatmap

Create a heatmap of expression values for each cell and specified features in a SingleCellExperiment
object.

example(normalizeSCE) # borrowing the example objects in here.
plotHeatmap(example_sce, features=rownames(example_sce)[1:10])

plotHeatmap(example_sce, features=rownames(example_sce)[1:10],
            center=TRUE, symmetric=TRUE)

plotHeatmap(example_sce, features=rownames(example_sce)[1:10],
            colour_columns_by=c("Mutation_Status", "Cell_Cycle"))

plotHighestExprs

Plot the features with the highest average expression across all cells, along with their expression in
each individual cell.

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- calculateQCMetrics(example_sce,
                                  feature_controls = list(set1 = 1:500)
)
plotHighestExprs(example_sce, colour_cells_by ="total_features_by_counts")

plotHighestExprs(example_sce, controls = NULL)

plotHighestExprs(example_sce, colour_cells_by="Mutation_Status")

plotPlatePosition

Plots cells in their position on a plate, coloured by metadata variables or feature expression values
from a SingleCellExperiment object.

## prepare data
data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
example_sce <- calculateQCMetrics(example_sce)
## define plate positions
example_sce$plate_position <- paste0(
  rep(LETTERS[1:5], each = 8),
  rep(formatC(1:8, width = 2, flag = "0"), 5)
)
## plot plate positions
plotPlatePosition(example_sce, colour_by = "Mutation_Status")

plotPlatePosition(example_sce, shape_by = "Treatment", colour_by = "Gene_0004")

plotPlatePosition(example_sce, shape_by = "Treatment", size_by = "Gene_0001",
                  colour_by = "Cell_Cycle")

plotQC

Produce QC diagnostic plots

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info)
example_sce <- normalize(example_sce)
example_sce <- calculateQCMetrics(example_sce)
plotQC(example_sce, type="high", colour_cells_by="Mutation_Status")

plotReducedDim

Plot cell-level reduced dimension results stored in a SingleCellExperiment object.

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
example_sce <- runPCA(example_sce, ncomponents=5)
plotReducedDim(example_sce, "PCA")

plotReducedDim(example_sce, "PCA", colour_by="Cell_Cycle")

plotReducedDim(example_sce, "PCA", colour_by="Gene_0001")

plotReducedDim(example_sce, "PCA", ncomponents=5)

plotReducedDim(example_sce, "PCA", ncomponents=5, colour_by="Cell_Cycle",
               shape_by="Treatment")

plotRLE

Produce a relative log expression (RLE) plot of one or more transformations of cell expression values.

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
plotRLE(example_sce, colour_by = "Mutation_Status", style = "minimal")

plotRLE(example_sce, colour_by = "Mutation_Status", style = "full",
        outlier.alpha = 0.1, outlier.shape = 3, outlier.size = 0)

plotRowData

Plot row-level (i.e., gene) metadata from a SingleCellExperiment object.

data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
example_sce <- calculateQCMetrics(example_sce,
                                  feature_controls = list(ERCC=1:40))
example_sce <- normalize(example_sce)
plotRowData(example_sce, y="n_cells_by_counts", x="log10_total_counts")

plotRowData(example_sce, y="n_cells_by_counts",
            size_by ="log10_total_counts",
            colour_by = "is_feature_control")

plotScater

Plot the relative proportion of the library size that is accounted for by the most highly expressed features for each cell in a SingleCellExperiment object.

## Set up an example SingleCellExperiment
data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
  assays = list(counts = sc_example_counts),
  colData = sc_example_cell_info
)
plotScater(example_sce)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-9Y6IsBEG-1571570422795)(http://baimoc.ziptop.top/blog/20190406/smYj6xT8Fyil.png)]

plotScater(example_sce, exprs_values = "counts", colour_by = "Cell_Cycle")

plotScater(example_sce, block1 = "Treatment", colour_by = "Cell_Cycle")

cpm(example_sce) <- calculateCPM(example_sce, use_size_factors = FALSE)
plotScater(example_sce, exprs_values = "cpm", block1 = "Treatment",
           block2 = "Mutation_Status", colour_by = "Cell_Cycle")

Reduced dimension plots

PCA

## Set up an example SingleCellExperiment
data("sc_example_counts")
data("sc_example_cell_info")
example_sce <- SingleCellExperiment(
assays = list(counts = sc_example_counts),
colData = sc_example_cell_info
)
example_sce <- normalize(example_sce)
## Examples plotting PC1 and PC2
plotPCA(example_sce)

plotPCA(example_sce, colour_by = "Cell_Cycle")

plotPCA(example_sce, colour_by = "Cell_Cycle", shape_by = "Treatment")

plotPCA(example_sce, colour_by = "Cell_Cycle", shape_by = "Treatment",
size_by = "Mutation_Status")

## Force legend to appear for shape:
example_subset <- example_sce[, example_sce$Treatment == "treat1"]
plotPCA(example_subset, colour_by = "Cell_Cycle", shape_by = "Treatment",
by_show_single = TRUE)

## Examples plotting more than 2 PCs
plotPCA(example_sce, ncomponents = 4, colour_by = "Treatment",
shape_by = "Mutation_Status")

## Same for TSNE:
plotTSNE(example_sce, run_args=list(perplexity = 10))

## Same for DiffusionMaps:
plotDiffusionMap(example_sce)

## Same for MDS plots:
plotMDS(example_sce)

你可能感兴趣的:(生信情报站,生物信息)

基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
Ensembl ID转Gene Symbol Red Red 生信小技巧 r语言数据库
生物信息中EnsemblID转换为GeneSymbolTCGA数据库该方法比较简单，无需安装过多的包，因为安装了几个包显示和R版本不兼容，浪费很多时间，最后用这个包成功将Ensemble转换成IDR：#加载org.HS.eg.dblibrary(org.Hs.eg.db)#获取所有的ENSEMBLID到k中k=keys(org.Hs.eg.db,keytype="ENSEMBL")k#找到ENSE
Perl 语言入门学习指南：探索高效脚本编程的奥秘我的运维人生简约运维 perl Perl编程脚本语言文本处理 Perl基础语法
引言Perl，全称PracticalExtractionandReportLanguage，是一种功能强大的编程语言，特别擅长于文本处理、报告生成以及系统自动化管理任务。自1987年诞生以来，Perl凭借其灵活性、强大的内置功能库和广泛的社区支持，在Web开发、生物信息学、网络管理等多个领域发挥着重要作用。本文旨在为初学者提供一份Perl语言入门学习指南，帮助大家快速掌握这门强大的脚本语言。一、P
gseapy python包GO、KEGG富集(注释)分析 loong_XL 生信 python golang 开发语言
文档案例参考：https://gseapy.readthedocs.io/en/latest/gseapy_example.html#Over-representation-analysis-by-Enrichr-web-services简介：富集分析是一种常见的生物信息学分析方法，通过比较一个给定的基因集（如一组显著差异表达基因）与已知的生物过程、通路或功能的数据库，来发现哪些过程、通路或功能与
Java 大视界 -- Java 大数据在生物信息学中的应用与挑战（67）青云交大数据新视界 Java 大视界大数据生物信息学基因序列分析蛋白质结构预测数据质量计算资源机器学习
亲爱的朋友们，热烈欢迎来到青云交的博客！能与诸位在此相逢，我倍感荣幸。在这飞速更迭的时代，我们都渴望一方心灵净土，而我的博客正是这样温暖的所在。这里为你呈上趣味与实用兼具的知识，也期待你毫无保留地分享独特见解，愿我们于此携手成长，共赴新程！一、欢迎加入【福利社群】点击快速加入：青云交灵犀技韵交响盛汇福利社群点击快速加入2：2024CSDN博客之星创作交流营（NEW)二、本博客的精华专栏：大数据新视
因果推断与机器学习—因果表征学习与泛化能力樱花的浪漫因果推断机器学习学习人工智能深度学习自然语言处理计算机视觉
近十年来，深度学习在多个领域取得了巨大成功，包括机器视觉、自然语言处理、语音识别和生物信息等。这些成功为机器学习技术的进一步发展和应用奠定了基础。表征学习是深度学习的核心技术之一。在机器学习问题中，其主要目的是从观测到的低级变量中提取信息，进而学习到能够准确预测目标变量的高级变量。这种从低层次到高层次变量的学习过程，有助于模型更好地理解数据和进行预测。以德国马克斯-普朗克研究所的BernhardS
《AI赋能行业实战：‌揭秘企业数字化转型最佳实践，‌落地案例深度解析！‌》 ---- 总目录 shiter 人工智能系统解决方案与技术架构人工智能大数据 AI
文章大纲金融行业落地实践浅析基于PySpark进行信用卡评分--实战案例迁移学习小样本金融风控生物信息识别大健康行业落地实践浅析传统行业深度融合升级如何深度参与创业？物联网行业案例浅析智慧园区案例浅析计算机视觉应用案例计算机视觉入门学习国外的资源国内的资源YOLO学习modelzoo计算机视觉基础目标检测YOLOv5YOLOv8自动缺陷检测(AutoDefectClassification）、零件
三甲医院大型生信服务器多配置方案剖析与应用（2024版） Allen_LVyingbo 数智化医院2024 服务器数据库运维
一、引言1.1研究背景与意义在当今数智化时代，生物信息学作为一门融合生物学、计算机科学和信息技术的交叉学科，在三甲医院的科研和临床应用中占据着举足轻重的地位。随着高通量测序技术、医学影像技术等的飞速发展，生物医学数据呈爆发式增长，这些数据涵盖了基因组、蛋白质组、代谢组等多个层面的信息，为医学研究和临床诊断提供了前所未有的机遇与挑战。从科研角度来看，生物信息学助力三甲医院开展前沿性的医学研究。通过对
Python3 【集合】项目实战：3 个新颖的学习案例李智 - 重庆 Python 精讲精练 -从入门到实战 python 经验分享案例学习编程技巧
Python3【集合】项目实战：3个新颖的学习案例以下是3个应用“Python集合”知识的综合应用项目，这些项目具有新颖性、前瞻性和实用性，每个项目都包含完整的代码、解释说明、测试案例和执行结果。基因序列比对文章推荐系统运行日志分析项目1：基因序列比对（集合运算与去重）项目描述在生物信息学中，比对两个基因序列的相似性。使用集合的交集和并集计算相似度。代码实现#基因序列（简化为字符串集合）seque
AI人工智能深度学习算法：在生物信息学中的应用 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
AI人工智能深度学习算法：在生物信息学中的应用关键词：人工智能、深度学习、生物信息学、基因组学、蛋白质结构预测、药物发现、个性化医疗文章目录AI人工智能深度学习算法：在生物信息学中的应用1.背景介绍2.核心概念与联系2.1人工智能（AI）2.2机器学习（ML）2.3深度学习（DL）2.4生物信息学2.5应用领域3.核心算法原理&具体操作步骤3.1算法原理概述3.1.1卷积神经网络（CNN）3.1.
AlphaFold2的思路总结（十五） xiaofengzihhh 蛋白质结构预测深度学习人工智能神经网络
2021SC@SDUSC这学期的代码分析工作接近尾声了，我想简单总结一下AlphaFold2的总体思路具体来看，AlphaFold2主要利用多序列比对（MSA），把蛋白质的结构和生物信息整合到了深度学习算法中。它主要包括两个部分：神经网络EvoFormer和结构模块（Structuremodule）。一、EvoFormer 在EvoFormer中，主要是将图网络（Graphnetworks）
Spark GraphX原理与代码实例讲解 AI大模型应用之禅 AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
SparkGraphX原理与代码实例讲解作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来随着互联网和大数据技术的迅猛发展，社交网络、推荐系统、生物信息学、图分析等领域对图计算的需求日益增长。传统的图处理技术如GraphLab、Neo4j等，虽然功能强大，但往往存在扩展性差、易用性低、计算效率不足等问题。为了解决这些问题，A
R语言的计算机基础 java熊猫包罗万象 golang 开发语言后端
R语言计算机基础引言R语言是一种用于数据分析、统计计算和图形显示的编程语言。它被广泛应用于统计学、数据科学、生态学、生物信息学等多个领域。由于其强大的功能和灵活性，R语言在学术界和工业界都得到了广泛的认可和应用。本文将从R语言的基本概念、数据类型、数据结构、函数、控制结构、图形绘制等方面进行介绍，帮助读者掌握R语言的基础知识。一、R语言的基本概念R语言源于新西兰的维特利大学，最初由RobertGe
Web APP 阶段性综述预测模型的开发与应用研究 APP construction web app
WebAPP阶段性综述当前，WebAPP主要应用于电脑端，常被用于部署数据分析、机器学习及深度学习等高算力需求的任务。在医学与生物信息学领域，WebAPP扮演着重要角色。在生物信息学领域，诸多工具以WebAPP的形式呈现，相较之下，医学领域的此类应用数量相对较少。在医学和生物信息学的学术论文中，WebAPP是展示研究成果的有效工具，并且还能部署到网络上，服务于实际应用场景。ShinyAPP平台特性
GEO数据的下载和处理|GEO数据转换为Gene symbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础 Red Red 生信小技巧学习笔记生物信息 r语言 GEO数据库数据库
GEO数据的下载和处理|GEO数据转换为Genesymbol|GEO注释文件提取symbol|查看样本标签|查看GEO数据疾病或正常|生物信息基础数据的下载和处理首先在GEO数据库中通过GSEID找到相关数据，然后下载txt文件。数据读取与处理。#设置工作路径，也就是你的分析数据存放以及要保存到地方setwd(dir="C:\\Users\\LiaoMinzhen\\PycharmProjects
生物信息名词汇总|生物信息基础知识 Red Red 生信小技巧学习笔记
生物信息名词汇总|生物信息基础知识GWAS-Genome-wideassociationstudies，全基因组关联研究：用于识别遗传区域（基因组）和性状/疾病之间关联的方法。Predixcan：GWAS找到大量的SNP，可是可以解释生物学功能的SNP位点却是很有限的。gene-based关联分析软件——PredicXcan。PrediXcan包括两个步骤:-在具有可用基因型的队列中预测基因表达(
推荐一份生物信息学入门很好的参考材料小明的数据分析笔记本
链接是https://bioinformatics.uconn.edu/resources-and-events/tutorials-2/这个是康涅狄格大学（UniversityofConnecticut）提供的一份教程，主要的内容包括1、生物信息学中经常用到的文件格式image.png2、linux操作系统和R语言的基础知识image.png3、转录组数据的处理流程image.png这里包括有参
【机器学习】朴素贝叶斯方法的概率图表示以及贝叶斯统计中的共轭先验方法 Lossya 机器学习概率论人工智能朴素贝叶斯共轭先验
引言朴素贝叶斯方法是一种基于贝叶斯定理的简单概率模型，它假设特征之间相互独立。文章目录引言一、朴素贝叶斯方法的概率图表示1.1节点表示1.2边表示1.3无其他连接1.4总结二、朴素贝叶斯的应用场景2.1文本分类2.2推荐系统2.3医疗诊断2.4欺诈检测2.5情感分析2.6邮件过滤2.7信息检索2.8生物信息学三、朴素贝叶斯的优点四、朴素贝叶斯的局限性4.1特征独立性假设4.2敏感于输入数据的表示4
零基础入门生信数据分析——导读呆猪儿生信之转录组——上游分析生信之转录组——下游分析学习方法 r语言数据分析数据库数据挖掘需求分析大数据
零基础入门生信数据分析——导读生信数据分析，即生物信息学数据分析，是一个涵盖了生物学、计算机科学、数学和统计学等多个领域的交叉学科。它主要利用计算机算法和统计方法对生物学数据进行处理、分析和解释，以揭示生物分子、细胞、组织和生物体等各个层次的生物学规律和机制。本帖主要是为生信数据分析的各个分析点提供跳转链接（简单说就是提供了一个目录供大家选择自己想要的知识点可以直接跳转）关联的生信数据分析的分析点
http://www.cnpop.org/portal.php,生物信息的84个新晋网红应用 weixin_39699163
Descriptionsofnewonlinedatabasesinthe2018NARDatabaseissueDatabaseURLBriefdescriptiona3DIVhttp://kobic.kr/3div3D-genomeInteractionVieweranddatabaseAAgMarkerhttp://bioinfo.wilmer.jhu.edu/AAgMarker/index
NCBI BLAST+：分析生物内在编码的工具 belldeep 生物信息学 Blast 生物数据分析
在生物信息学的广阔领域中，NCBI（NationalCenterforBiotechnologyInformation，美国国立生物技术信息中心）开发的BLAST（BasicLocalAlignmentSearchTool，基本局部比对搜索工具）无疑是一把不可或缺的分析工具。NCBIBLAST+，作为其最新版本2.16.0+，为科研工作者提供了一套强大的序列比对和搜索功能，帮助解析生命现象背后的遗
【图论简介】 WA-自动机图论深度优先算法架构后端前端面试
图论简介图论是一门数学分支，主要研究图（Graph）的性质、结构和应用。图论在计算机科学、网络理论、优化问题、生物信息学等多个领域都有广泛的应用。本文将简要介绍图论的基本概念、常见算法及其在实际中的应用。一、图的基本概念图（Graph）：图是由一组顶点（Vertices）和连接顶点的边（Edges）组成的结构。可以表示为(G=(V,E))，其中(V)是顶点的集合，(E)是边的集合。根据边的不同属性
生信圆桌：专业生信服务器与平台服务的提供者生信圆桌x生信云服务器服务器人工智能运维
生信圆桌是一个专注于提供生物信息学（生信）服务器和平台服务的领先企业，致力于为全球科研机构、企业和独立研究者提供高性能的生信分析解决方案。随着生物信息学研究对计算资源的需求日益增加，生信圆桌凭借其先进的服务器技术和专业的服务团队，成为了生信领域中不可或缺的合作伙伴。访问生信圆桌,使用生信云。高效分析少走弯路www.tebteb.cc生信圆桌的核心服务高性能生信服务器定制：生信圆桌为客户提供定制化的
用Python实现生信分析——基序（Motif）识别详解写代码的M教授生信分析 python 开发语言
1.什么是基序（Motif）？在生物信息学中，基序（Motif）是指在生物序列（如DNA、RNA或蛋白质序列）中具有特定功能或结构的短序列片段。基序通常在生物进化中得到保留，因为它们在生物学功能中起着重要作用。例如，在DNA序列中，基序可能是一个转录因子结合位点；在蛋白质序列中，基序可能是一个具有特定功能的结构域。基序识别是指从一组生物序列中识别出保守的短序列片段，这对于功能预测、基因调控网络分析
数据结构与算法——动态规划 passion更好数据结构 C++动态规划算法
目录引言最优子结构重叠子问题打家劫舍（LeetCode198题）经典例题1.爬楼梯（LeetCode70题）2.斐波那契数列（LeetCode126题）3.最长公共子序列（LeetCode95题）引言动态规划（DynamicProgramming,简称DP）是一种在数学、计算机科学、经济学和生物信息学等领域广泛使用的算法设计技术。它通过把原问题分解为相对简单的子问题的方式，来求解复杂问题。动态规划
深度学习——概念引入韶光流年都束之高阁深度学习日记深度学习人工智能职场和发展
深度学习深度学习简介深度学习分类根据网络结构划分：循环神经网络卷积神经网络根据学习方式划分：监督学习无监督学习半监督学习根据应用领域划分：计算机视觉自然语言处理语音识别生物信息学深度学习简介深度学习（DeepLearning，DL）是机器学习领域中的一个新的研究方向，主要是通过学习样本数据的内在规律和表示层次，让机器能够具有类似于人类的分析学习能力。深度学习的最终目标是让机器能够识别和解释各种数据
考研调剂：中医生命科学菌心说双脑论
科学网—考研调剂——欢迎研究生调剂到我们的招生专业方向“中西医结合基础”：中医药与肠道菌群、生物信息学等交叉学科-张成岗的博文http://blog.sciencenet.cn/home.php?mod=space&uid=40692&do=blog&id=1281078欢迎各位有志于从事中医生命科学、解码中医、中西医结合以及医学与数学、计算机科学等交叉学科研究的青年才俊加入我们的研究团队，共同见
2020-04-07 liuyang2020
学习小组Day2笔记--linux入门（刘阳）1.为什么学习linux大多数人用的是可视化界面，便捷的windows，linux用户量比较少，但是需要知道，linux的功能相当的强大，对于数据处理、程序运行方面的优势，那是其它的系统无法比拟的，生物信息学数据处理对电脑要求较高，因此学习linux，，嘿嘿，大势所趋。2.linux操作2.1登录远程登录linux服务器，好像有很多连接软件，今天尝试应
Bioinformatic workflow 小潤澤
给大家推荐个网站：https://bioinformaticsworkbook.org/projectManagement/Intro_projectManagement#gsc.tab=0这个网站适合于刚入门的生物信息同学，里面涉及到一些NGS的流程软件介绍以获得原作者的授权：原推文链接：https://twitter.com/tangming2005/status/12401074132289
Python在生物信息学中的应用：有序字典简说基因-专业生信合作伙伴 python 开发语言
我们知道，通过{}创建的字典是无序的。如何创建有序字典呢？解决方案可以使用collections模块中的OrderedDict类。当对字典做迭代时，它会严格按照元素添加的顺序进行。例如：from collection import OrderedDictd=OrderedDict()d['1st'] = 1d['2nd'] = 2d['3rd'] = 3d['4th']=4forkeyind:
sql统计相同项个数并按名次显示朱辉辉33 java oracle
现在有如下这样一个表： A表 ID Name time ------------------------------ 0001 aaa 2006-11-18 0002 ccc 2006-11-18 0003 eee 2006-11-18 0004 aaa 2006-11-18 0005 eee 2006-11-18 0004 aaa 2006-11-18 0002 ccc 20
Android+Jquery Mobile学习系列-目录白糖_ JQuery Mobile
最近在研究学习基于Android的移动应用开发，准备给家里人做一个应用程序用用。向公司手机移动团队咨询了下，觉得使用Android的WebView上手最快，因为WebView等于是一个内置浏览器，可以基于html页面开发，不用去学习Android自带的七七八八的控件。然后加上Jquery mobile的样式渲染和事件等，就能非常方便的做动态应用了。从现在起，往后一段时间，我打算
如何给线程池命名 daysinsun 线程池
在系统运行后，在线程快照里总是看到线程池的名字为pool-xx，这样导致很不好定位，怎么给线程池一个有意义的名字呢。参照ThreadPoolExecutor类的ThreadFactory，自己实现ThreadFactory接口，重写newThread方法即可。参考代码如下： public class Named
IE 中"HTML Parsing Error:Unable to modify the parent container element before the 周凡杨 html 解析 error readyState
错误： IE 中"HTML Parsing Error:Unable to modify the parent container element before the child element is closed" 现象：同事之间几个IE 测试情况下，有的报这个错，有的不报。经查询资料后，可归纳以下原因。
java上传 g21121 java
我们在做web项目中通常会遇到上传文件的情况，用struts等框架的会直接用的自带的标签和组件，今天说的是利用servlet来完成上传。我们这里利用到commons-fileupload组件，相关jar包可以取apache官网下载：http://commons.apache.org/ 下面是servlet的代码： //定义一个磁盘文件工厂 DiskFileItemFactory fact
SpringMVC配置学习 510888780 spring mvc
spring MVC配置详解现在主流的Web MVC框架除了Struts这个主力外，其次就是Spring MVC了，因此这也是作为一名程序员需要掌握的主流框架，框架选择多了，应对多变的需求和业务时，可实行的方案自然就多了。不过要想灵活运用Spring MVC来应对大多数的Web开发，就必须要掌握它的配置及原理。　　一、Spring MVC环境搭建：（Spring 2.5.6 + Hi
spring mvc-jfreeChart 柱图(1) 布衣凌宇 jfreechart
第一步：下载jfreeChart包，注意是jfreeChart文件lib目录下的，jcommon-1.0.23.jar和jfreechart-1.0.19.jar两个包即可；第二步：配置web.xml; web.xml代码如下 <servlet> <servlet-name>jfreechart</servlet-nam
我的spring学习笔记13-容器扩展点之PropertyPlaceholderConfigurer aijuans Spring3
PropertyPlaceholderConfigurer是个bean工厂后置处理器的实现，也就是BeanFactoryPostProcessor接口的一个实现。关于BeanFactoryPostProcessor和BeanPostProcessor类似。我会在其他地方介绍。PropertyPlaceholderConfigurer可以将上下文（配置文件）中的属性值放在另一个单独的标准java P
java 线程池使用 Runnable&Callable&Future antlove java thread Runnable callable future
1. 创建线程池 ExecutorService executorService = Executors.newCachedThreadPool(); 2. 执行一次线程，调用Runnable接口实现 Future<?> future = executorService.submit(new DefaultRunnable()); System.out.prin
XML语法元素结构的总结百合不是茶 xml 树结构
1.XML介绍1969年 gml (主要目的是要在不同的机器进行通信的数据规范)1985年 sgml standard generralized markup language1993年 html(www网)1998年 xml extensible markup language
改变eclipse编码格式 bijian1013 eclipse 编码格式
1.改变整个工作空间的编码格式改变整个工作空间的编码格式，这样以后新建的文件也是新设置的编码格式。 Eclipse->window->preferences->General->workspace-
javascript中return的设计缺陷 bijian1013 JavaScript AngularJS
代码1： <script> var gisService = (function(window) { return { name:function () { alert(1); } }; })(this); gisService.name(); &l
【持久化框架MyBatis3八】Spring集成MyBatis3 bit1129 Mybatis3
pom.xml配置 Maven的pom中主要包括： MyBatis MyBatis-Spring Spring MySQL-Connector-Java Druid applicationContext.xml配置 <?xml version="1.0" encoding="UTF-8"?> &
java web项目启动时自动加载自定义properties文件 bitray java Web 监听器相对路径
创建一个类 public class ContextInitListener implements ServletContextListener 使得该类成为一个监听器。用于监听整个容器生命周期的，主要是初始化和销毁的。类创建后要在web.xml配置文件中增加一个简单的监听器配置，即刚才我们定义的类。 <listener> <des
用nginx区分文件大小做出不同响应 ronin47
昨晚和前21v的同事聊天，说到我离职后一些技术上的更新。其中有个给某大客户(游戏下载类)的特殊需求设计，因为文件大小差距很大——估计是大版本和补丁的区别——又走的是同一个域名，而squid在响应比较大的文件时，尤其是初次下载的时候，性能比较差，所以拆成两组服务器，squid服务于较小的文件，通过pull方式从peer层获取，nginx服务于较大的文件，通过push方式由peer层分发同步。外部发布
java-67-扑克牌的顺子.从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的.2-10为数字本身，A为1，J为11，Q为12，K为13，而大 bylijinnan java
package com.ljn.base; import java.util.Arrays; import java.util.Random; public class ContinuousPoker { /** * Q67 扑克牌的顺子从扑克牌中随机抽5张牌，判断是不是一个顺子，即这5张牌是不是连续的。 * 2-10为数字本身，A为1，J为1
翟鸿燊老师语录 ccii 翟鸿燊
一、国学应用智慧TAT之亮剑精神A 1. 角色就是人格就像你一回家的时候，你一进屋里面，你已经是儿子，是姑娘啦，给老爸老妈倒怀水吧，你还觉得你是老总呢？还拿派呢？就像今天一样，你们往这儿一坐，你们之间是什么，同学，是朋友。还有下属最忌讳的就是领导向他询问情况的时候，什么我不知道，我不清楚，该你知道的你凭什么不知道
[光速与宇宙]进行光速飞行的一些问题 comsci 问题
在人类整体进入宇宙时代，即将开展深空宇宙探索之前，我有几个猜想想告诉大家仅仅是猜想。。。未经官方证实 1：要在宇宙中进行光速飞行，必须首先获得宇宙中的航行通行证，而这个航行通行证并不是我们平常认为的那种带钢印的证书，是什么呢？下面我来告诉
oracle undo解析 cwqcwqmax9 oracle
oracle undo解析2012-09-24 09:02:01 我来说两句作者：虫师收藏我要投稿 Undo是干嘛用的？ &nb
java中各种集合的详细介绍 dashuaifu java 集合
一，java中各种集合的关系图 Collection 接口的接口对象的集合 ├ List 子接口 &n
卸载windows服务的方法 dcj3sjt126com windows service
卸载Windows服务的方法在Windows中，有一类程序称为服务，在操作系统内核加载完成后就开始加载。这里程序往往运行在操作系统的底层，因此资源占用比较大、执行效率比较高，比较有代表性的就是杀毒软件。但是一旦因为特殊原因不能正确卸载这些程序了，其加载在Windows内的服务就不容易删除了。即便是删除注册表中的相应项目，虽然不启动了，但是系统中仍然存在此项服务，只是没有加载而已。如果安装其他
Warning: The Copy Bundle Resources build phase contains this target's Info.plist dcj3sjt126com ios xcode
http://developer.apple.com/iphone/library/qa/qa2009/qa1649.html Excerpt: You are getting this warning because you probably added your Info.plist file to your Copy Bundle
2014之C++学习笔记（一） Etwo C++Etwo Etwo iterator 迭代器
已经有很长一段时间没有写博客了，可能大家已经淡忘了Etwo这个人的存在，这一年多以来，本人从事了AS的相关开发工作，但最近一段时间，AS在天朝的没落，相信有很多码农也都清楚，现在的页游基本上达到饱和，手机上的游戏基本被unity3D与cocos占据，AS基本没有容身之处。so。。。最近我并不打算直接转型
js跨越获取数据问题记录 haifengwuch jsonp json Ajax
js的跨越问题，普通的ajax无法获取服务器返回的值。第一种解决方案，通过getson，后台配合方式，实现。 Java后台代码： protected void doPost(HttpServletRequest req, HttpServletResponse resp) throws ServletException, IOException { String ca
蓝色jQuery导航条 ini JavaScript html jquery Web html5
效果体验：http://keleyi.com/keleyi/phtml/jqtexiao/39.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery鼠标悬停上下滑动导航条 - 柯乐义<
linux部署jdk,tomcat,mysql kerryg jdk tomcat linux mysql
1、安装java环境jdk: 一般系统都会默认自带的JDK,但是不太好用，都会卸载了，然后重新安装。 1.1）、卸载：（rpm -qa :查询已经安装哪些软件包； rmp -q 软件包：查询指定包是否已
DOMContentLoaded VS onload VS onreadystatechange mutongwu jquery js
1. DOMContentLoaded 在页面html、script、style加载完毕即可触发，无需等待所有资源（image/iframe）加载完毕。（IE9+） 2. onload是最早支持的事件，要求所有资源加载完毕触发。 3. onreadystatechange 开始在IE引入，后来其它浏览器也有一定的实现。涉及以下 document , applet, embed, fra
sql批量插入数据 qifeifei 批量插入
hi，自己在做工程的时候，遇到批量插入数据的数据修复场景。我的思路是在插入前准备一个临时表，临时表的整理就看当时的选择条件了，临时表就是要插入的数据集，最后再批量插入到数据库中。 WITH tempT AS ( SELECT item_id AS combo_id, item_id, now() AS create_date FROM a
log4j打印日志文件如何实现相对路径到项目工程下 thinkfreer Web log4j 应用服务器日志
最近为了实现统计一个网站的访问量，记录用户的登录信息，以方便站长实时了解自己网站的访问情况，选择了Apache 的log4j,但是在选择相对路径那块卡主了，X度了好多方法(其实大多都是一样的内用，还一个字都不差的)，都没有能解决问题，无奈搞了2天终于解决了，与大家分享一下需求：用户登录该网站时，把用户的登录名,ip,时间。统计到一个txt文档里，以方便其他系统调用此txt。项目名
linux下mysql-5.6.23.tar.gz安装与配置笑我痴狂 mysql linux unix
1.卸载系统默认的mysql [root@localhost ~]# rpm -qa | grep mysql mysql-libs-5.1.66-2.el6_3.x86_64 mysql-devel-5.1.66-2.el6_3.x86_64 mysql-5.1.66-2.el6_3.x86_64 [root@localhost ~]# rpm -e mysql-libs-5.1

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他