Valkla

C语言基因序列比对,转录组入门（5）：序列比对

比对软件很多，首先大家去收集一下，因为我们是带大家入门，请统一用hisat2，并且搞懂它的用法。

直接去hisat2的主页下载index文件即可，然后把fastq格式的reads比对上去得到sam文件。

接着用samtools把它转为bam文件，并且排序(注意N和P两种排序区别)索引好，载入IGV，再截图几个基因看看！

顺便对bam文件进行简单QC，参考直播我的基因组系列。

前面四篇基本都算是准备工作，从这一篇开始才算进入了RNA-Seq数据分析的核心部分。

比对

比对还是不比对

在比对之前，我们得了解比对的目的是什么？RNA-Seq数据比对和DNA-Seq数据比对有什么差异？

RNA-Seq数据分析分为很多种，比如说找差异表达基因或寻找新的可变剪切。如果找差异表达基因单纯只需要确定不同的read计数就行的话，我们可以用bowtie, bwa这类比对工具，或者是salmon这类align-free工具，并且后者的速度更快。

但是如果你需要找到新的isoform，或者RNA的可变剪切，看看外显子使用差异的话，你就需要TopHat, HISAT2或者是STAR这类工具用于找到剪切位点。因为RNA-Seq不同于DNA-Seq，DNA在转录成mRNA的时候会把内含子部分去掉。所以mRNA反转的cDNA如果比对不到参考序列，会被分开，重新比对一次，判断中间是否有内含子。

工具抉择

在2016年的一篇综述A survey of best practices for RNA-seq data analysis，提到目前有三种RNA数据分析的策略。那个时候的工具也主要用的是TopHat,STAR和Bowtie.其中TopHat目前已经被它的作者推荐改用HISAT进行替代。

最近的Nature Communication发表了一篇题为的Gaining comprehensive biological insight into the transcriptome by performing a broad-spectrum RNA-seq analysis的文章--被称之为史上最全RNA-Seq数据分析流程，也是我一直以来想做的事情，只不过他们做的超乎我的想象。文章中在基于参考基因组的转录本分析中所用的工具，是TopHat,HISAT2和STAR，结论就是HISAT2找到junction正确率最高，但是在总数上却比TopHat和STAR少。从这里可以看出HISAT2的二类错误(纳伪)比较少，但是一类错误(弃真)就高起来。

就唯一比对而言，STAR是三者最佳的，主要是因为它不会像TopHat和HISAT2一样在PE比对不上的情况还强行把SE也比对到基因组上。而且在处理较长的read和较短read的不同情况，STAR的稳定性也是最佳的。

就速度而言，HISAT2比STAR和TopHat2平均快上2.5~100倍。

如果学习RNA-Seq数据分析，上面提到的两篇文献是必须要看上3遍以上的，而且建议每隔一段时间回顾一下。但是如果就比对工具而言，基本上就是HISAT2和STAR选一个就行。

下载index

首先，问自己一个问题，为什么比对的时候需要用到index？这里强烈建议大家去看Jimmy写的bowtie算法原理探究bowtie算法原理探究。但是只是建议，你不需要真的去看，反正你也看不懂。

高通量测序遇到的第一个问题就是，成千上万甚至上几亿条read如果在合理的时间内比对到参考基因组上，并且保证错误率在接受范围内。为了提高比对速度，就需要根据参考基因组序列，经过BWT算法转换成index，而我们比对的序列其实是index的一个子集。当然转录组比对还要考虑到可变剪切的情况，所以更加复杂。

因此我门不是直接把read回贴到基因组上，而是把read和index进行比较。人类的index一般都是有现成的，我建议大家下载现成的，我曾经尝试过用服务器自己创建index，花的时间让我怀疑人生。

cd referece && mkdir index && cd index

wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/data/hg19.tar.gz

tar -zxvf hg19.tar.gz

觉得电脑配置还行的，或者是没有现成index的，可以通过HISAT2的方法进行创建

# 其实hisat2-buld在运行的时候也会自己寻找exons和splice_sites，但是先做的目的是为了提高运行效率

extract_exons.py gencode.v26lift37.annotation.sorted.gtf > hg19.exons.gtf &

extract_splice_sites.py gencode.v26lift37.annotation.gtf > hg19.splice_sites.gtf &

# 建立index，必须选项是基因组所在文件路径和输出的前缀

hisat2-build --ss hg19.splice_sites.gtf --exon hg19.exons.gtf genome/hg19/hg19.fa hg19

我的是i7-7700处理器，内存是64G，运行的资源效率如下：

正式比对

hisat2基本用法就是hisat2 [options]* -x {-1 -2 | -U } [-S ]，基本就是提供index的位置，PE数据或者是SE数据存放位置。然而其他可选参数却是进阶的一大名堂。新手就用默认参数呗。

因为RNA-Seq数据是从 SRR3589957 ~ SRR3589962，6个样本的PE数据，也就是有6次循环，可以写脚本，也可以直接在命令行里运行

如下命令运行所在目录为/mnt/f/Data/，我的参考基因组的index数据存放在/mnt/f/Data/reference/index/hg19/，而RNA-seq数据存放在/mnt/f/Data/RNA-Seq下。比对结果会存放在/mnt/f/Data/RNA-Seq/aligned

mkdir -p RNA-Seq/aligned

for i in `seq 57 62`

hisat2 -t -x reference/index/hg19/genome -1 RNA-Seq/SRR35899${i}_1.fastq.gz -2 SRR35899${i}_2.fastq.gz -S RNA-Seq/aligned/SRR35899${i}.sam &

done

&会把任务丢到后台，所以会同时执行这3个比对程序，如果CPU和内存承受不住，去掉&一个个来。比对这一步是非常消耗内存资源的，这是比对工具要将索引数据放入内存引起的。我有64G内存，理论上可以同时处理20个PE数据。在我的电脑配置下，大致花了2个小时同时才完成这一步.

基本参数说明

在数据比对的时候，可以安静一下读读HISAT2的额外选项，主要分为如下几块

主要参数，一定要填写的内容

输入选项，对结果影响不大

比对选项，主要是--n-ceil决定模糊字符的数量

得分选项，当一个read比对到不同部位时，确定那个才是最优的。基于mismatch, soft-cliping, gap得分。

可变剪切比对选项，你要决定exon，intron的长度，GT/AG的得分，还可以提供已知的可变剪切和外显子gtf文件，

报告选项，确定要找多少的位置

PE选项，与gap有关的参数

输出选项，建议加上-t记录时间，其他就是压缩格式，不影响比对

SAM选项，主要是决定SAM的header应该添加哪些内容

性能选项和其他选项不考虑

注: soft clipping 指的是比对的read只有部分匹配到参考序列上，还有部分没有匹配上。也就是一个100bp的read，就匹配上前面20 bp或者是后面20bp，或者是后面20bp比对的效果不太好。

因此影响比对结果就是比对选项，得分选项，可变剪切选项和PE选项，在有生之年我应该会写一片文章介绍这些选项对结果的影响。

HISAT2输出结果

比对之后会输出如下结果，解读一下就是全部数据都是100%的，96.68%的配对数据一次都没有比对，1.23%的数据比是唯一比对，2.09%是多个比对。然后96.68%一次都没有比对的数据，如果不按照顺序来，有0.05%的比对。之后把剩下的部分用单端数据进行比对的话，95.20%数据没比对上，3.60%的数据比对一次，1.20%比对超过一次。零零总总的加起来是8%的比对！！！

这个总体比对率让我开始怀疑人生，怎么可能呀，我翻了翻输出记录，发现有几个结果的比对率超过90%呀。我思索了片刻，惊醒这个实验好像是用人类和小鼠都做了一遍。于是又去GEO上查了一下记录，恍然大悟，差点翻车。

Samples 9-15 are mRNA-seq to determine effect of AKAP95 knockdown in human 293 cells (9-11) or mouse ES cells (12-15).

同时我反思了一下出错的原因，我默认这个实验是KO和非KO各3个重复，其实文章的实验设计并不是如此，可见理解实验设计很重要，于是我把数据下载这一部分进行了完善。

mkdir -p RNA-Seq/aligned

for i in `seq 56 58`

hisat2 -t -x reference/index/hg19/genome -1 RNA-Seq/SRR35899${i}_1.fastq.gz -2 SRR35899${i}_2.fastq.gz -S RNA-Seq/SRR35899${i}.sam &

done

如上是修改后的代码

SAMtools三板斧

SAM(sequence Alignment/mapping)数据格式是目前高通量测序中存放比对数据的标准格式，当然他可以用于存放未比对的数据。所以，SAM的格式说明

而目前处理SAM格式的工具主要是SAMTools，这是Heng Li大神写的.除了C语言版本，还有Java的Picard，Python的Pysam，Common lisp的cl-sam等其他版本。SAMTools的主要功能如下：

view: BAM-SAM/SAM-BAM 转换和提取部分比对

sort: 比对排序

merge: 聚合多个排序比对

index: 索引排序比对

faidx: 建立FASTA索引，提取部分序列

tview: 文本格式查看序列

最常用的三板斧就是格式转换，排序，索引。而进阶教程就是看文档提高。

for i in `seq 56 58`

samtools view -S SRR35899${i}.sam -b > SRR35899${i}.bam

samtools sort SRR35899${i}.bam -o SRR35899${i}_sorted.bam

samtools index SRR35899${i}_sorted.bam

done

注

-S是最新版samtools为了兼容以前版本写的，所以可以省去

0.1.19版本和最新版有比较大差别，请注意版本

Jimmy说样我们仔细判断sam排序两种方式的不同，因此我截取前面100行数据，分别排序然后查看结果。

head -1000 SRR3589957.sam > test.sam

samtools view -b test.sam > test.bam

samtools view test.bam | head

默认排序是根据染色体位置

samtools sort test.bam default

samtools view default.bam | head

Sort alignments by leftmost coordinates, or by read name when -n is used

samtools sort -n test.bam sort_left

samtools view sort_left.bam | head

也就说说默认按照染色体位置进行排序，而-n参数则是根据read名进行排序。当然还有一个-t 根据TAG进行排序。

说说samtools view

三板斧的view是一个非常实用的子命令，除了之前的格式转换以外，还能进行数据提取和提取。

比如说提取1号染色体1234-123456区域的比对read

samtools view SRR3589957_sorted.bam chr1:1234-123456 | head

在比如搭配flag(0.1.19版本没有)和flagstat，使用-f或-F参数提取不同匹配情况的read。

flag是一种描述read比对情况的标记，一种12种，可以搭配使用。

0x1 PAIRED paired-end (or multiple-segment) sequencing technology

0x2 PROPER_PAIR each segment properly aligned according to the aligner

0x4 UNMAP segment unmapped

0x8 MUNMAP next segment in the template unmapped

0x10 REVERSE SEQ is reverse complemented

0x20 MREVERSE SEQ of the next segment in the template is reverse complemented

0x40 READ1 the first segment in the template

0x80 READ2 the last segment in the template

0x100 SECONDARY secondary alignment

0x200 QCFAIL not passing quality controls

0x400 DUP PCR or optical duplicate

0x800 SUPPLEMENTARY supplementary alignment

可以先用flagstat看下总体情况

samtools flagstat SRR3589957_sorted.bam

也就是说如果我想用samtools筛选恰好配对的read,就需要用0x10

samtools view -b -f 0x10 SRR3589957_sorted.bam chr1:1234-123456 > flag.bam

samtools flagstat flag.bam

我应该会在有生之年写一篇文章好好介绍samtools。

比对质控(QC)

还是在A survey of best practices for RNA-seq data analysis里面，提到了人类基因组应该有70%~90%的比对率，并且多比对read(multi-mapping reads)数量要少。另外比对在外显子和所比对链(uniformity of read coverage on exons and the mapped strand)的覆盖度要保持一致。

常用工具有

我们就用RSeQC吧，毕竟使用python写的工具，天生的亲切感，而且安装非常方便。

# Python2.7环境下

pip install RSeQC

一共有如下几个文件，根据命名就知道功能是啥了。

先对bam文件进行统计分析，从结果上看是符合70~90的比对率要求。

bam_stat.py -i SRR3589956_sorted.bam

基因组覆盖率的QC需要提供bed文件，可以直接RSeQC的网站下载，或者可以用gtf转换

read_distribution.py -i RNA-Seq/aligned/SRR3589956_sorted.bam -r reference/hg19_RefSeq.bed

IGV查看

载入参考序列，注释和BAM文件，随便看看吧。

[Python] -基础篇5-玩转Python内置数据结构：列表、元组、字典与集合踏雪无痕老爷子 Python python 开发语言
Python是一门以简洁优雅著称的编程语言，其中内置的数据结构为日常编程提供了强大支持。本文将系统介绍Python中四大核心数据结构：列表（list）、元组（tuple）、字典（dict）与集合（set），并配以实用示例，帮助读者全面掌握其用法及适用场景。一、列表（List）：可变序列的代表列表是最常用的Python数据结构之一，支持动态增删改查。1.1基本操作fruits=['apple','b
HTML之常用基础标签 AA-代码批发V哥 HTML html 前端
HTML之常用基础标签一、HTML文档基本结构标签1.``标签2.``标签3.``标签二、文本相关基础标签1.标题标签（``-``）2.段落标签（``）3.换行标签（``）4.强调标签（``和``）5.代码标签（``、``等）三、链接相关基础标签1.超链接标签（``）2.图像标签（``）四、列表相关基础标签1.无序列表（``和``）2.有序列表（``和``）3.自定义列表（``、``和``）五、表
markdown语法教学 7忆--栅 markdown vscode 笔记 visual studio code 其他
目录1.文章前面的目录生成2.标题3.字体3.1、字体的斜体/粗体/...3.2、字体的颜色3.3、字体的格式3.4、字体的大小3.5、文本注音3.6、文本高亮显示3.7、添加背景颜色附1：颜色+格式+大小+高亮+注音合体附2：颜色+格式+大小+背景颜色+注音合体4.引用5.分割线6.删除线7.下划线8.代码块9.公式块10.列表10.1、有序列表10.2、无序列表11.待办事项12.特殊符号13
自然语言处理之文本生成：Recurrent Neural Networks (RNN)：序列模型与语言模型 zhubeibei168 自然语言处理自然语言处理 rnn 语言模型人工智能机器翻译生成对抗网络
自然语言处理之文本生成：RecurrentNeuralNetworks(RNN)：序列模型与语言模型自然语言处理简介NLP的基本概念自然语言处理（NaturalLanguageProcessing，简称NLP）是人工智能领域的一个重要分支&#
Typora用法是小崔啊其他编程知识 typora
Typora用法文章目录Typora用法一：typora快捷键1：任务列表2：文字常用修饰3：文本语法3.1：标题层级3.2：水平分割线3.3：表情3.4：超链接3.5：插入图片3.6：代码3.7：引用3.8：表注3.9：参考链接3.10：有序无序列表3.11：表格二：typora作图1：流程图2：时序图3：状态图4：类图5：饼状图6：甘特图三：数学公式1：分数和乘法2：开根号3：上下标4：向量点
C++ STL常用二分查找算法 basketball616 C++基础算法 c++数据结构
lower_boundlower_bound是C++标准库算法，通常用于有序序列中查找第一个不小于给定值的元素。它属于头文件，并且是基于二分查找实现的，因此要求输入序列必须是有序的。基本语法#include//引入算法库Iteratorlower_bound(Iteratorfirst,Iteratorlast,constT&value);first和last是迭代器，分别表示容器的起始位置和结束
最长公共子序列长度的四种解法小菜鸟派大星 C语言算法算法 c语言
一.题目：求两个字符序列的最长公共字符子序列。给定两个字符串，求解这两个字符串的最长公共子序列（LongestCommonSequence）。比如字符串1：BDCABA；字符串2：ABCBDAB，则这两个字符串的最长公共子序列长度为4。二.解法1：递归解法1.设计思路：分析两个字符串的比较规律，可以发现字符串在进行比较的时候有三种情况：A.str1[i+1]与str2[j]比较；B.str1[i]
CSS 列表 froginwe11 开发语言
CSS列表引言CSS列表是网页设计中常用的一种布局方式，它能够帮助我们以更灵活、更美观的方式展示数据。本文将详细介绍CSS列表的创建、样式设置以及常用技巧，帮助您更好地掌握这一重要技能。CSS列表概述CSS列表主要包括两种类型：无序列表（unorderedlist）和有序列表（orderedlist）。无序列表通常用于表示一组无序的元素，如目录、菜单等；有序列表则用于表示一组有序的元素，如步骤、排
数字累加序列求和伊欧温 C语言刷题记录算法 c语言
题目描述求s=a+aa+aaa+aaaa+aa…a的值，其中a是一个数字，例如：2+22+222+2222+22222(此时共有5个数相加)，几个数相加由键盘控制。程序分析：关键是计算出每一项的值输入输入每一项的基础数字及相加的项数，中间用空格隔开输出输出序列和样例输入25样例输出24690源代码#includeintmain(){intsum=0;//存储结果的变量intbase,terms;/
Java 解析JSON的 6 种方案奔向理想的星辰大海 Java研发实用技巧 java json 数据库
1.使用Jackson：业界标配功能特点强大的序列化和反序列化：支持将JSON字符串转为Java对象，也支持将Java对象转换为JSON。支持复杂结构：处理嵌套对象、数组、泛型等场景非常轻松。支持注解：如@JsonIgnore、@JsonProperty等，能精细控制序列化与反序列化的行为。性能高：Jackson的性能非常出色，是很多企业级项目的首选。代码示例1.JSON转对象（反序列化）impo
机电一体化c语言程序设计,机电一体化专业《C语言程序设计》课程标准爱吃糖的果子狸机电一体化c语言程序设计
山东海事职业学院机电一体化专业《C语言程序设计》课程标准一、课程性质与任务《C语言程序设计》是机电一体化专业的职业能力素质课程之一，并且是本专业的核心专业课程之一，理论性和实践性均较强，既要掌握理论概念，又要动手编程，还要上机调试运行。通过本课程的学习，使学生掌握基本的程序设计过程和技巧，熟练应用MicrosoftVisualC6.0集成环境进行C语言的编写、编译与调试，培养学生的逻辑思维能力、抽
I.MX6ULL ARM裸机开发---C语言LED实验一盆电子 ARM裸机开发 arm c语言驱动开发
一、引言考虑到工作效率，嵌入式驱动开发很少用汇编，大部分是用C语言进行开发。嵌入式驱动开发开始部分就可以用C语言吗？当然不是！在开始部分用汇编来初始化一下C语言环境，比如初始化DDR、设置堆栈指针SP等等，当这些工作都做完以后就可以进入C语言环境，也就是运行C语言代码，一般都是进入main函数。有两部分文件需要完成： 1、汇编文件汇编文件用来完成C语言环境搭建。 2、C语言文件
Java IO流文件读写详解 Y1_again_0_again Java java 开发语言
IO流的概念与分类IO（Input/Output）流是Java中用于处理输入输出操作的抽象概念。流可以看作一个数据序列的管道，数据像水流一样在程序与数据源之间传输。JavaIO流主要分为两大类：按流向分类：输入流（InputStream/Reader）：用于读取数据输出流（OutputStream/Writer）：用于写入数据按数据类型分类：字节流：以字节为单位传输数据（8位）字符流：以字符为单位
数据结构循环队列C++实现只需倾听数据结构C++实现 c++数据结构
1.队列的概念队列只允许在表的一端插入，另一端删除。允许插入的一端叫做队尾，允许删除的一端叫做对首。队列的特性叫“先进先出”。和栈一样，队列的存储形式也有两种，基于数组的存储表示和基于链表的存储表示。本文先实现基于数组的存储队列，也叫顺序队列。在顺序队列中设置两个指针，front和rear，front指示队头的位置，rear指示队尾的位置（说是指针，实际仍不是c语言的指针*，而是类似下标或索引的作
LeetCode 2302.统计得分小于K的子数组数目吃着火锅x唱着歌 LeetCode leetcode 算法数据结构
一个数组的分数定义为数组之和乘以数组的长度。比方说，[1,2,3,4,5]的分数为(1+2+3+4+5)*5=75。给你一个正整数数组nums和一个整数k，请你返回nums中分数严格小于k的非空整数子数组数目。子数组是数组中的一个连续元素序列。示例1：输入：nums=[2,1,4,3,5],k=10输出：6解释：有6个子数组的分数小于10：[2]分数为2*1=2。[1]分数为1*1=1。[4]分数
双指针几种常见用法小李不秃头♛ java 数据结构算法双指针
双指针的常见用法及适用场景详解双指针是算法中一种高效且灵活的解题技巧，通过两个指针的协同操作降低时间复杂度和空间复杂度。以下是双指针的核心用法及适用场景分析：一、对撞指针（反向双指针）核心思想：两个指针分别从序列的两端向中间移动，适用于有序数组或可通过排序转化为有序的问题。在反向双指针里面right指向的是数组的长度，在循环的时候直接while(left
时序数据库IoTDB可实现的基本操作及命令汇总时序数据说时序数据库 iotdb 数据库物联网大数据开源
一、数据写入、删除与导出1.1数据写入在物联网场景下，元件产生的数据通常会自动写入。但有时，需要修改过去的数据，可以使用INSERT语句插入修改后的值，覆盖原数据。‌示例‌：INSERTINTOroot.BHSFC.Q1.W003(timestamp,speed)VALUES(1657472400000,2);1.2数据删除1.2.1SQL语句删除‌删除整个时间序列‌：DELETEFROMroot
memcpy与memcpy_toio：深入解析两大数据传输神器 jghhh01 c++c语言
在软件开发中，数据的高效传输是确保程序性能和稳定性的关键。C语言作为一种广泛应用于系统编程和嵌入式开发的语言，提供了多种用于数据复制和传输的函数。其中，memcpy和memcpy_toio是两个备受关注的数据传输函数，它们各自在特定场景下发挥着不可替代的作用。本文将深入解析这两个函数，探讨它们的用途、区别以及在实际应用中的最佳实践。一、memcpy：内存复制的基础工具memcpy是C标准库中的一个
PyEcharts教程（010）：天猫订单数据可视化项目文理棵 Python数据分析信息可视化 python 数据分析
文章目录1、读取数据2、数据处理3、重复值查看4、缺失值查看5、PyEcharts可视化5.1各个省份的订单量5.2时间序列分析5.3每天订单量统计可视化6、数据下载1、读取数据1️⃣读取数据：importpandasaspdfrompyechartsimportoptionsasoptsfrompyecharts.chartsimportMap,Timeline,Bar,Line,Piedata
OneMessage：打造高效跨平台消息框架蒋闯中Errol
OneMessage：打造高效跨平台消息框架OneMessage一个基于发布-订阅模型的多线程消息框架，用于嵌入式平台，纯C实现，性能和灵活性极高项目地址:https://gitcode.com/gh_mirrors/on/OneMessage项目介绍OneMessage是一个基于发布-订阅模型的跨平台消息框架，使用纯C语言编写，以其卓越的性能和高度灵活性而著称。它集成了红黑树、链表、队列、CRC
继 Evo 2 之后，Arc Institute 发布首个虚拟细胞模型 STATE，训练数据涉及 70 种不同细胞系 hyperai
众所周知，人体由不同类型的细胞组成——免疫细胞在感染发生时可引发炎症反应以抵御病原体；干细胞具有分化潜能，可生成多种组织类型；而癌细胞则通过逃避生长调控信号，实现异常增殖。尽管这些细胞在功能和形态上差异巨大，但它们几乎都拥有相同的基因组。细胞的独特性并非来自DNA序列本身的差异，而是源于它们如何调控和使用相同的基因信息。换言之，细胞的特性源于基因表达的差异，而一个细胞的基因表达模式不仅决定了它属于
【C++】— c++入门基础孙同学_ C++c++
1.C++的第一个程序首先C++兼容C语言的大多数语法，所以用C语言实现Helloworld！同样也可以运行。用C语言实现Helloworld！#includeintmain(){printf("Helloworld！\n");return0;}用C++实现Helloworld！#includeusingnamespacestd;intmain(){coutnamespace的作用namespac
数据结构进阶 - 第二章线性表 an_胺数据结构进阶数据结构
第二章线性表408考研大纲线性表的基本概念线性表的实现顺序存储链式存储线性表的应用概念区分基本概念线性结构：一种元素间的逻辑关系，一对一线性表：一种抽象数据类型，其元素的逻辑结构为线性结构顺序表：线性表的顺序存储链表：线性表的链式存储重点提醒顺序表是有序表。该说法是错误的。顺序表指的是存储方式，与元素是否有序无关。2.1线性表的定义线性表为n(n≥0)个相同数据元素的有限序列，其特点为：存在唯一首
C语言的未来：C23标准的崭新篇章步子哥【软考】系统架构设计师 c语言开发语言
在编程语言的浩瀚星空中，C语言无疑是一颗璀璨的恒星。自1972年诞生以来，它以其简洁、高效的特性，成为无数程序员的心头好。从操作系统到嵌入式设备，C语言的身影无处不在。而如今，C语言迎来了它的最新标准——C23（ISO/IEC9899:2024）。这次更新不仅是一次技术上的革新，更是对现代编程需求的深刻回应。从过去到未来：C语言的演化之路C语言的标准化始于1989年（C89），随后经历了多次更新：
R语言与C语言混合编程：在R语言中调用C语言函数数据探索 r语言 c语言开发语言 R语言
R语言与C语言混合编程：在R语言中调用C语言函数介绍：R语言是一种用于统计分析和数据可视化的高级编程语言，而C语言是一种通用的、强大的编程语言。在某些情况下，我们可能需要在R语言中调用C语言函数以提高性能或实现特定的功能。本文将介绍如何在R语言中调用C语言函数的方法，并提供相应的源代码示例。步骤：为了在R语言中调用C语言函数，我们需要执行以下步骤：编写C语言函数：首先，我们需要编写我们想要在R中调
java 签名 ecdsa_Java数字签名——ECDSA算法随缘惜情 java 签名 ecdsa
ECDSA例如微软产品的序列号的验证算法。EllipticCurveDigitalSignatureAlgorithm，椭圆曲线数字签名算法。速度快，强度高，签名短——————————————————————————————————密钥长度112～571默认256——————————————————————————————————NONEwithECDSA签名长度：128实现方：JDK/BCRIP
CNN-GRU混合模型学习笔记 weixin_54372988 cnn gru 学习
GRU学习笔记CNN：卷积神经网络GRU（GateRecurrentUnit），门控循环单元CNN：卷积神经网络3个组成部分：1.卷积层——提取图像局部特征2.池化层——降维（防止过拟合）3.全连接层——输出结果一个卷积核扫完整张图片，得到每个小区域的特征值具体应用中通常有多个卷积核CNN可能有多层结构，如LeNet-5：卷积层–池化层–卷积层–池化层–卷积层–全连接层处理时间序列（1D序列）：（
银行家算法后会无期77 算法算法
文章目录银行家算法概述银行贷款案例A再次申请50万，能批准吗？B再次申请40万，能批准吗？或者C申请20万，能批准吗？安全序列和不安全序列多维度资源分配操作系统资源分配银行家算法总结数据结构银行家算法的步骤安全性算法步骤死锁的避免银行家算法概述银行家算法（Banker’sAlgorithm）是一个避免死锁（Deadlock）的著名算法，是由艾兹格·迪杰斯特拉在1965年为T.H.E系统设计的一种避
TVFEMD-CPO-TCN-BiLSTM多输入单输出模型微光-沫年 matlab 回归机器学习
47-TVFEMD-CPO-TCN-BiLSTM多输入单输出模型适合单变量，多变量时间序列预测模型（可改进，加入各种优化算法）时变滤波的经验模态分解TVFEMD时域卷积TCN双向长短期记忆网络BiLSTM时间序列预测模型另外以及有TCN-BILSTMTCN-LSTMTCN-BiLSTM-ATTENTION等！（此不包含在内，另算的！）Matlab代码！
从用户日志到智能宏：我的BFS寻宝奇遇记（2014. 重复 K 次的最长子序列）满分观察网友z 算法解构与应用算法
从用户日志到智能宏：我的BFS寻宝奇遇记大家好，我是一个在代码世界里摸爬滚打了N年的老兵。今天想和大家聊聊最近在项目中遇到的一个棘手问题，以及我是如何用一个看似“学院派”的算法——广度优先搜索（BFS）——漂亮地解决它的。这趟旅程有“踩坑”的窘迫，也有“恍然大悟”的喜悦，希望能给同在路上的你带来一些启发。一、我遇到了什么问题？一个“善解人意”的功能我所在的团队正在开发一款面向设计师的创意软件。为了
遍历dom 并且存储（将每一层的DOM元素存在数组中）换个号韩国红果果 JavaScript html
数组从0开始！！ var a=[],i=0; for(var j=0;j<30;j++){ a[j]=[];//数组里套数组，且第i层存储在第a[i]中 } function walkDOM(n){ do{ if(n.nodeType!==3)//筛选去除#text类型 a[i].push(n); //con
Android+Jquery Mobile学习系列(9)-总结和代码分享白糖_ JQuery Mobile
目录导航经过一个多月的边学习边练手，学会了Android基于Web开发的毛皮，其实开发过程中用Android原生API不是很多，更多的是HTML/Javascript/Css。个人觉得基于WebView的Jquery Mobile开发有以下优点： 1、对于刚从Java Web转型过来的同学非常适合，只要懂得HTML开发就可以上手做事。 2、jquerym
impala参考资料 dayutianfei impala
记录一些有用的Impala资料 1. 入门资料 >>官网翻译： http://my.oschina.net/weiqingbin/blog?catalog=423691 2. 实用进阶 >>代码&架构分析： Impala/Hive现状分析与前景展望：http
JAVA 静态变量与非静态变量初始化顺序之新解周凡杨 java 静态非静态顺序
今天和同事争论一问题，关于静态变量与非静态变量的初始化顺序，谁先谁后，最终想整理出来！测试代码： import java.util.Map; public class T { public static T t = new T(); private Map map = new HashMap(); public T(){ System.out.println(&quo
跳出iframe返回外层页面 g21121 iframe
在web开发过程中难免要用到iframe，但当连接超时或跳转到公共页面时就会出现超时页面显示在iframe中，这时我们就需要跳出这个iframe到达一个公共页面去。首先跳转到一个中间页，这个页面用于判断是否在iframe中，在页面加载的过程中调用如下代码： <script type="text/javascript"> //<!-- function
JAVA多线程监听JMS、MQ队列 510888780 java多线程
背景：消息队列中有非常多的消息需要处理，并且监听器onMessage（）方法中的业务逻辑也相对比较复杂，为了加快队列消息的读取、处理速度。可以通过加快读取速度和加快处理速度来考虑。因此从这两个方面都使用多线程来处理。对于消息处理的业务处理逻辑用线程池来做。对于加快消息监听读取速度可以使用1.使用多个监听器监听一个队列；2.使用一个监听器开启多线程监听。对于上面提到的方法2使用一个监听器开启多线
第一个SpringMvc例子布衣凌宇 spring mvc
第一步：导入需要的包；第二步：配置web.xml文件 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee" xmlns:xsi=
我的spring学习笔记15-容器扩展点之PropertyOverrideConfigurer aijuans Spring3
PropertyOverrideConfigurer类似于PropertyPlaceholderConfigurer，但是与后者相比，前者对于bean属性可以有缺省值或者根本没有值。也就是说如果properties文件中没有某个bean属性的内容，那么将使用上下文（配置的xml文件）中相应定义的值。如果properties文件中有bean属性的内容，那么就用properties文件中的值来代替上下
通过XSD验证XML antlove xml schema xsd validation SchemaFactory
1. XmlValidation.java package xml.validation; import java.io.InputStream; import javax.xml.XMLConstants; import javax.xml.transform.stream.StreamSource; import javax.xml.validation.Schem
文本流与字符集百合不是茶 PrintWrite()的使用字符集名字别名获取
文本数据的输入输出; 输入;数据流,缓冲流输出;介绍向文本打印格式化的输出PrintWrite(); package 文本流; import java.io.FileNotFound
ibatis模糊查询sqlmap-mapping-**.xml配置 bijian1013 ibatis
正常我们写ibatis的sqlmap-mapping-*.xml文件时，传入的参数都用##标识，如下所示： <resultMap id="personInfo" class="com.bijian.study.dto.PersonDTO"> <res
java jvm常用命令工具——jdb命令(The Java Debugger) bijian1013 java jvm jdb
用来对core文件和正在运行的Java进程进行实时地调试，里面包含了丰富的命令帮助您进行调试，它的功能和Sun studio里面所带的dbx非常相似，但 jdb是专门用来针对Java应用程序的。现在应该说日常的开发中很少用到JDB了，因为现在的IDE已经帮我们封装好了，如使用ECLI
【Spring框架二】Spring常用注解之Component、Repository、Service和Controller注解 bit1129 controller
在Spring常用注解第一步部分【Spring框架一】Spring常用注解之Autowired和Resource注解（http://bit1129.iteye.com/blog/2114084）中介绍了Autowired和Resource两个注解的功能，它们用于将依赖根据名称或者类型进行自动的注入，这简化了在XML中，依赖注入部分的XML的编写，但是UserDao和UserService两个bea
cxf wsdl2java生成代码super出错,构造函数不匹配 bitray super
由于过去对于soap协议的cxf接触的不是很多,所以遇到了也是迷糊了一会.后来经过查找资料才得以解决. 初始原因一般是由于jaxws2.2规范和jdk6及以上不兼容导致的.所以要强制降为jaxws2.1进行编译生成.我们需要少量的修改: 我们原来的代码 wsdl2java com.test.xxx -client http://..... 修改后的代
动态页面正文部分中文乱码排障一例 ronin47
公司网站一部分动态页面，早先使用apache+resin的架构运行，考虑到高并发访问下的响应性能问题，在前不久逐步开始用nginx替换掉了apache。不过随后发现了一个问题，随意进入某一有分页的网页，第一页是正常的（因为静态化过了）；点“下一页”，出来的页面两边正常，中间部分的标题、关键字等也正常，唯独每个标题下的正文无法正常显示。因为有做过系统调整，所以第一反应就是新上
java-54- 调整数组顺序使奇数位于偶数前面 bylijinnan java
import java.util.Arrays; import java.util.Random; import ljn.help.Helper; public class OddBeforeEven { /** * Q 54 调整数组顺序使奇数位于偶数前面 * 输入一个整数数组，调整数组中数字的顺序，使得所有奇数位于数组的前半部分，所有偶数位于数组的后半
从100PV到1亿级PV网站架构演变 cfyme 网站架构
一个网站就像一个人，存在一个从小到大的过程。养一个网站和养一个人一样，不同时期需要不同的方法，不同的方法下有共同的原则。本文结合我自已14年网站人的经历记录一些架构演变中的体会。 1：积累是必不可少的架构师不是一天练成的。 1999年，我作了一个个人主页，在学校内的虚拟空间，参加了一次主页大赛，几个DREAMWEAVER的页面，几个TABLE作布局，一个DB连接，几行PHP的代码嵌入在HTM
[宇宙时代]宇宙时代的GIS是什么？ comsci Gis
我们都知道一个事实，在行星内部的时候，因为地理信息的坐标都是相对固定的，所以我们获取一组GIS数据之后，就可以存储到硬盘中，长久使用。。。但是，请注意，这种经验在宇宙时代是不能够被继续使用的宇宙是一个高维时空
详解create database命令 czmmiao database
完整命令 CREATE DATABASE mynewdb USER SYS IDENTIFIED BY sys_password USER SYSTEM IDENTIFIED BY system_password LOGFILE GROUP 1 ('/u01/logs/my/redo01a.log','/u02/logs/m
几句不中听却不得不认可的话 datageek
1、人丑就该多读书。 2、你不快乐是因为：你可以像猪一样懒，却无法像只猪一样懒得心安理得。 3、如果你太在意别人的看法，那么你的生活将变成一件裤衩，别人放什么屁，你都得接着。 4、你的问题主要在于：读书不多而买书太多，读书太少又特爱思考，还他妈话痨。 5、与禽兽搏斗的三种结局：(1)、赢了，比禽兽还禽兽。(2)、输了，禽兽不如。(3)、平了，跟禽兽没两样。结论：选择正确的对手很重要。 6
1 14:00 PHP中的“syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM”错误 dcj3sjt126com PHP
原文地址：http://www.kafka0102.com/2010/08/281.html 因为需要，今天晚些在本机使用PHP做些测试，PHP脚本依赖了一堆我也不清楚做什么用的库。结果一跑起来，就报出类似下面的错误：“Parse error: syntax error, unexpected T_PAAMAYIM_NEKUDOTAYIM in /home/kafka/test/
xcode6 Auto layout and size classes dcj3sjt126com ios
官方GUI https://developer.apple.com/library/ios/documentation/UserExperience/Conceptual/AutolayoutPG/Introduction/Introduction.html iOS中使用自动布局（一） http://www.cocoachina.com/ind
通过PreparedStatement批量执行sql语句【sql语句相同，值不同】梦见x光 sql 事务批量执行
比如说：我有一个List需要添加到数据库中，那么我该如何通过PreparedStatement来操作呢？ public void addCustomerByCommit(Connection conn , List<Customer> customerList) { String sql = "inseret into customer(id
程序员必知必会----linux常用命令之十【系统相关】 hanqunfeng Linux常用命令
一.linux快捷键 Ctrl+C : 终止当前命令 Ctrl+S : 暂停屏幕输出 Ctrl+Q : 恢复屏幕输出 Ctrl+U : 删除当前行光标前的所有字符 Ctrl+Z : 挂起当前正在执行的进程 Ctrl+L : 清除终端屏幕，相当于clear 二.终端命令 clear : 清除终端屏幕 reset : 重置视窗，当屏幕编码混乱时使用 time com
NGINX IXHONG nginx
pcre 编译安装 nginx conf/vhost/test.conf upstream admin { server 127.0.0.1:8080; } server { listen 80; &
设计模式--工厂模式 kerryg 设计模式
工厂方式模式分为三种： 1、普通工厂模式：建立一个工厂类，对实现了同一个接口的一些类进行实例的创建。 2、多个工厂方法的模式：就是对普通工厂方法模式的改进，在普通工厂方法模式中，如果传递的字符串出错，则不能正确创建对象，而多个工厂方法模式就是提供多个工厂方法，分别创建对象。 3、静态工厂方法模式：就是将上面的多个工厂方法模式里的方法置为静态，
Spring InitializingBean/init-method和DisposableBean/destroy-method mx_xiehd java spring bean xml
1.initializingBean/init-method 实现org.springframework.beans.factory.InitializingBean接口允许一个bean在它的所有必须属性被BeanFactory设置后，来执行初始化的工作，InitialzingBean仅仅指定了一个方法。通常InitializingBean接口的使用是能够被避免的，（不鼓励使用，因为没有必要
解决Centos下vim粘贴内容格式混乱问题 qindongliang1922 centos vim
有时候，我们在向vim打开的一个xml，或者任意文件中，拷贝粘贴的代码时，格式莫名其毛的就混乱了，然后自己一个个再重新，把格式排列好，非常耗时，而且很不爽，那么有没有办法避免呢？答案是肯定的，设置下缩进格式就可以了，非常简单：在用户的根目录下直接vi ~/.vimrc文件然后将set pastetoggle=<F9> 写入这个文件中，保存退出，重新登录，
netty大并发请求问题 tianzhihehe netty
多线程并发使用同一个channel java.nio.BufferOverflowException: null at java.nio.HeapByteBuffer.put(HeapByteBuffer.java:183) ~[na:1.7.0_60-ea] at java.nio.ByteBuffer.put(ByteBuffer.java:832) ~[na:1.7.0_60-ea]
Hadoop NameNode单点问题解决方案之一 AvatarNode wyz2009107220 NameNode
我们遇到的情况 Hadoop NameNode存在单点问题。这个问题会影响分布式平台24*7运行。先说说我们的情况吧。我们的团队负责管理一个1200节点的集群(总大小12PB)，目前是运行版本为Hadoop 0.20，transaction logs写入一个共享的NFS filer(注：NetApp NFS Filer)。经常遇到需要中断服务的问题是给hadoop打补丁。 DataNod

C语言基因序列比对,转录组入门（5）： 序列比对

你可能感兴趣的:(C语言基因序列比对)

C语言基因序列比对,转录组入门（5）：序列比对