fasta 第4页

fasta

awk: 从格式化的fasta中提取部分id的序列

看两个fasta的格式，一个是单行的序列，一个是格式化后的序列#test.fa>id1_1ATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCGATCG

Amy_Cui·2023-04-14 22:24

2020-12-08

概念[编辑](javascript:;)FastQ格式是序列格式中常见的一种，FASTQ格式的序列一般都包含有四行，第一行由'@'开始，后面跟着序列的描述信息，这点跟FASTA

凉风倒影·2023-04-13 16:50

Multi-omics Hammer软件之fasta序列基因(转录本/染色体)重命名

Multi-omicsHammer软件的Genome_relate工具箱的ptree_rename功能进行对进化树进行重命名，本篇就接着上一篇推文继续介绍Multi-omicsHammer软件的Genome_relate工具箱的fasta_rename

WJ的生信小院·2023-04-13 03:38

生信流程搭建（二）Ensembl数据库下载常用参考序列与对应的gtf文件、MT文件

在下载参考序列的时候遇到了很多大坑，对于一些不理解的版本信息，极力推荐去官网的ftp下载目录中查看Readme文档一、下载参考序列fasta及注释文件gtf、线粒体MT人类基因组版本对应关系NCBIEnsemblUCSCGRCh36release

Geekero·2023-04-12 02:00

bam 可视化：samtools tview 详细解释

话不多说直接上命令行：samtoolstview-pchr1:3128088NA12878.bamhg38.fasta-p指定染色体的位置，tview从指定的位置开始显示NA12878.bam比对结果bam

心如止水-WTF·2023-04-11 21:07

生信中常用的文件格式认识(一)-----fasta和fastQ

一.fasta格式fasta格式是一种基于文本用于表示核酸序列或多肽序列的格式。其中核酸或氨基酸均以单个字母来表示，且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。

生信小工厂·2023-04-11 14:13

fasta和fastq格式文件的shell小练习 http://www.bio-info-trainee.com/3575.html

fasta和fastq格式文件的shell小练习原文链接这个是有机结合生物信息学的linux和数据格式的练习题：下载bowtie2软件后拿到示例数据：mkdir-p~/biosoftcd~/biosoftwgethttps

天涯清水·2023-04-11 11:42

选择压力（dn/ds）计算

将fasta格式的序列文件导入MAGA,然后选择Distance——computeroveral

Cady_duan·2023-04-09 12:16

2020-06-25 线粒体基因组组装软件 MitoZ

这个软件在组装单个体基因组测序数据中的MG的时候很不错，基本上可以完成所以的分析流程可以用于注释我们自己的MG，但是一定要注意fasta的sequenceid不可以太长，会运行失败。

热爱大自然的小和尚·2023-04-09 09:31

SnpHub搭建 | 数据处理中可能出现的问题

bcftoolssortxxx.vcf-Oz-oxxx.sorted.vcf.gz2.bcftools在写文件时，因为contig未出现在header中而报错使用bcftoolsreheader的-f参数，将参照基因组fasta

esctrionsit·2023-04-08 14:12

生物信息学常见数据格式

生物信息学上常见的数据格式主要有fasta，fastq，gff/gtf。1FASTAFASTA是一种基于文本用于表示核酸序列或蛋白质的氨基酸序列的格式。

小汪Waud·2023-04-08 00:35

Biopython之序列输入

这使您可以执行以下操作：fromBioimportSeqIOforrecordinSeqIO.parse("example.fasta","fasta"):print(record.id)orusingahandle

多啦A梦的时光机_648d·2023-04-07 17:52

Rust第二课:为什么我的Rust比Python慢！

在我的Rust第一课,我写了一个程序对fasta中的ATCG进行计数。

xuzhougeng·2023-04-06 22:53

将某一多行的fasta文件转换为单行的fasta文件

处理数据的时候经常遇到将多行fasta转换为单行，或者将很多行fasta串联起来合并为一行，下面是一些方法。

今天没回家·2023-04-06 07:55

如何根据染色体坐标批量提取对应的DNA序列（bedtools）

比如现在：你需查找一段序列，比如说小鼠的chr10:105280000-105280550，我相信学生物的童鞋应该都知道应该怎么获得DNA序列，但是如果当我有上千条序列需要获得并把它们放在同一个fasta

生信start_site·2023-04-05 10:17

fasta和fastq文件格式详解

1.fasta格式fasta格式是一种非常简单的储存序列的格式（主要是把序列储存到数据库中的一种形式），可以储存核酸序列（RNA/DNA）和氨基酸序列(AA)，主要包括2个部分。

熊猫人和熊猫猫·2023-04-05 01:48

66.《Bioinformatics Data Skills》之比对结果可视化

数据地址：NA12891_CEU_sample.bamhuman_g1k_v37.fasta命令行工具使用samtoolstview工具可以对bam文件在命令行进行可视化。

DataScience·2023-04-04 17:52

2021-04-24 分析Reads比对基因组后5和3端的序列情况

采用的斑马鱼线粒体基因组为标准序列将去掉接头的序列文件fq.gz变为fasta文件格式2.由于fasta文件过大，可以切割为多个文件下载blast软件，构建标准数据库4.对多个文件进行本地blast（构建的标准数据库

zebra_mito·2023-04-04 09:20

当小白遇到：参考基因组和基因组注释

后续人们逐步完善了基因组序列信息，并写在Fasta格式的文本文件“天书”中，这本天书就叫做参

笺牒九州的怪咖·2023-04-04 04:45

fasta的几种index方法

1.bowtie2：bowtie2-buildgenome.fastagenome2.bwa:bwaindexgenome.fasta-pgenome3.hisat2第一步：转录本的index：extract_exons.pygencode.vM19

苏牧传媒·2023-04-03 00:38

Fasta与Fastq格式文件

FASTA文件格式FASTA格式是一种用于表示核苷酸序列或多肽序列的文本格式。其中碱基对或氨基酸用单个字母来表示，且允许在序列前添加序列名及注释。该格式已成为生物信息学领域的一项标准。

Nemo_53e9·2023-04-02 19:43

perl实战练习-计算fastq文件中每条序列的GC含量

计算FASTA文件中每条序列的长度输入文件fasta.txt>con1GTTCATAACTTACCATTGACTGTTCATGATTTAAACTGTGTCTTCCTGTTCTTTTAGTTGCTTTGGATACTATAAGGTCAGAACTAGAA

下午三点的闲暇·2023-04-02 16:18

如何构建fasta文件及其index索引文件

需要准备的文件是序列信息bed格式文件或者GRanges格式文件比如有一个bed文件：$cattest.bedchr110000101000020chr210000211000030chr310000311000040我习惯保存为GR格式：>test=read.table("test.bed")>gr=toGR(test)>grGRangesobjectwith3rangesand0metadat

正经昵称征集中·2023-04-02 12:57

fasta文件更改header

把它转化为data.frame后面问题就迎刃而解gtf文件是为了提取chr，start，end等信息，gtf文件读取需要安装rtracklayer包rm(list=ls())modify_fa%filter(type=="transcript")gtf_df$new_strand%select(seq_name,new_name)fa%left_join(gtf_df,by="seq_name")

落寞的橙子·2023-04-02 04:20

2021-03-04 blast+ 比对两个denovo RNAseq序列

他需要两个fasta中的交叉序列。因此我觉得用BLAST应该可以达到他的要求。以下为解决步骤方便以后再遇到类似情况：1.安装blast+sudoaptinstallblast2

hopi_bai·2023-04-01 14:23

AlphaFold/run_alphafold.py代码阅读理解

list为参数数据类型，为listflags.DEFINE_string（）：参数类型为String字符串翻译：FASTA文件的路径，每个路径包含一个预测目标，该目标将被一个接一个地折叠。

cv一段代码交差·2023-04-01 07:25

常见物种参考基因组及注释下载地址汇总

UCSC:http://hgdownload.cse.ucsc.edu/downloads.htmlNCBI:ftp://ftp.ncbi.nih.gov/genomes/一般来说，需要下载的文件包括：fasta

chengchengSY·2023-03-31 17:18

perl处理fasta文件

在perl处理fasta文件是，需要每次读入一个完整的序列头+序列，需要利用到local$/=">"将perl默认的行分隔符切换为">"。

qujingtao·2023-03-31 02:17

本地blast

建立比对数据库makeblastdb-inMs.Unigene.fa-dbtypenucl-parse_seqids-outMsrna'##建立比对数据库-in数据来源fasta格式，-dbtype数据库类型

茶思饭·2023-03-30 13:36

[生信媛]练习题：如何根据FASTA的ID拆分数据

[生信媛]练习题：如何根据FASTA的ID拆分数据[生信媛]公众号给定一个FASTA文件，他以多行形式存放数据，如下所示请根据每个序列的ID中的染色体编号拆分数据，例如上面两个数据，需要新建两个文件，分别是

茶思饭·2023-03-30 07:27

WGDI安装和使用

基因组序列信息文件fasta基因组蛋白序列信息文件fastawgdi需要三种信息，分别是BLAST,基因的位置信息和染色体长度信息，要求格式如下1gffwgdi自己定义的gff，注意提取最长。

徒唤奈何_c5f0·2023-03-29 11:42

从EBI下载ENA数据

2019独角兽企业重金招聘Python工程师标准>>>接了任务，要从http://www.ebi.ac.uk/ena/下载序列数据，本来直接全部导出fasta就好了，可惜网络不好，老是下到一半就挂掉。

weixin_33928137·2023-03-28 20:37

VEP

variation/vep运行命令行：vep-iexamples/homo_sapiens_GRCh37.vcf--formatvcf-otest.out--cache--offline--hgvs--fasta

小七玩数据·2023-03-27 14:49

2018-06-25(生信第五题）

继续上个题目的下一个小题目：序列长度的分布统计意思就是，将所有序列的长度以及对应长度出现的次数统计一下所以，只需要将序列的长度读出来，然后存入字典即可，如下：然后继续下一问，即：将fastq格式转换成fasta

天秤座的机器狗·2023-03-26 12:47

【Linux blast比对】fastq转fasta比对到参考序列

/sample-1_L3_2.fasta&比对$virun_blast1.shblastn\-querysample-1_L3_2.fasta\-dbartificial.blast

Geekero·2023-03-26 08:07

用clustalX和ESPrint对未知三维结构蛋白序列比对

未知三维结构蛋白的多重序列比对分析：1、多重序列比对:将需要比对的文件以FASTA格式保存在同一个文档中，建议扩展名保存为fas格式（txt也可以），最好保存在桌面（或者保存在英文目录的文件夹，不然有汉字的文件夹

天明豆豆·2023-03-26 05:44

SRA数据(2)------SRA数据处理

SRA（SequenceReadArchive）数据库是用于存储二代测序的原始数据，这种数据格式不能直接进行处理，需要转换成fastq或fasta文件格式才能进行质控以及去adapt等处理。

护旗小能手·2023-03-25 12:24

用MrBayes构建系统发育树操作步骤整理总结

一、比对序列格式转换将fasta格式的序列先在MEGA软件里进行比对，然后导出比对结果为PAUPformat（图1），用

沉_0cb2·2023-03-25 04:17

制作fasta文件(标准化)

该教材是如何制作固定每行70碱基的fasta文件，主要设计如何将特别长的碱基序列均匀切割成每行70个碱基的文件。

落寞的橙子·2023-03-24 14:33

Bioedit 使用

（1）首先下载FASTA格式序列信息，保存到Myod1.txt文档中（2）File,Open打开Myod1.t

韩建刚（CAAS-UCD）·2023-03-24 14:03

蛋白保守结构域和进化树

准备文件：fasta格式的蛋白序列文件，去mega多序

kkkkkkang·2023-03-24 05:20

关于人参考基因组的一些总结

人参考基因组fasta文件的组成部分说明chr1chr2...chr22chrXchrYchrM线粒体chr1_KI27...v1_random表示知道在哪条染色体上，但是不知道方向和顺序chrUn_KI27

花色匆匆·2023-03-22 22:06

利用bedtools提取基因组指定区域序列

1.Example：bedtoolsgetfasta-fiexample_genome.fasta-bedexample.bed-foexample.fa-name文件说明example_genome.fasta

qujingtao·2023-03-21 17:52

Linux根据基因ID提取fasta序列

提取出符合条件的20行序列grep-A20+GeneID+fastagrep-A20'GeneID'Chr_genome_final_gene_without_dot.gff3.pep

煮梦斋_bioinfo·2023-03-20 02:54

2018-06-29（生信第7题目）

本次题目来自Rosalind对于多行的fasta序列，计算GC含量，并将最大的GC含量打印出来。

天秤座的机器狗·2023-03-19 14:30

Biostar handbook学习笔记四

目前学习到的关于生物数据及数据库的基本知识有：常用数据格式:fasta,fastq,gff,GenBank常用序列数据库:美国国立生物技术信息中心(NCBI)欧洲生物信息学中心(EBI)DDBJ常用基因功能数据库

简书蚕账号·2023-03-18 17:06

fasta/fastq序列长度分布统计

首先得到每条序列的长度，在这里使用seqkit软件。seqkit软件是一个强大的序列处理工具，安装方法参见官方网站.代码如下：#-j是线程数seqkitfx2tab-j30-l-n-i-Hfile.fastq.gz|cut-f4>Length.txt#查看Length.txtheadLength.txt结果如下所示：Length.txt将Length.txt导入到R中绘制序列长度分布图，代码如下：

超人立志做国王·2023-03-18 12:24

fasta文件根据ID提取序列

把要提取的序列ID写入id.txt，一行一个ID1.seqkitseqkitgrep-fid.txtinput.fa>output.fa2.seqtkseqtksubseqinput.faid.txt>output.fa

ayunga·2023-03-16 01:23

生物技能树--fasta和fastq格式文件的shell小练习

这个是有机结合生物信息学的linux和数据格式的练习题：下载bowtie2软件后拿到示例数据：mkdir-p~/biosoftcd~/biosoftwgethttps://sourceforge.net/projects/bowtie-bio/files/bowtie2/2.3.4.3/bowtie2-2.3.4.3-linux-x86_64.zipunzipbowtie2-2.3.4.3-lin

Hannahhao·2023-03-14 13:18

《学习小组Day7笔记--于多多》

第一行：由‘@’开始，后面跟着序列ID和可选的描述，序列ID是唯一的；第二行：碱基序列；第三行：由‘+’开始，后面是序列的描述信息；第四行：第二行序列的质量评价(qualityvalue)Fasta格式

独角兽_0da0·2023-03-13 09:56

上一页 1 2 3 4 5 6 7 8 下一页

推荐频道