ccArtermices

生信学习笔记：利用GATK call SNP

SNP是指在基因组上单个核苷酸的变异,包括置换、颠换、缺失和插入。SNP在基因组中分布相当广泛，近来的研究表明在很多物种基因组中每300bp就出现一次。大量存在的SNP位点，使人们有机会发现与各种疾病，包括肿瘤相关的基因组突变。既然SNP那么广泛存在，获得SNP就变成一项重要的任务。在经历了样本收集、测序、质控和mapping后，我们输出了bam格式的数据。之后，我们就要尝试利用GATK call SNP了。

安装GATK

GATK提供多种方法安装，初学者容易陷入混乱，这里提供一张较为便捷的方法，后面附录在介绍其他安装办法。

配置要求

GATK官网有明确说明，有以下要求：

支持Linux和MacOS系统，不支持Windows系统（本文用的centos7环境）
需要java8环境
需要python2.6或以上版本，以及python3.6.2的版本，可以用conda切换python版本。两者都用于运行一些python脚本。
需要R 3.2.5，用于画一些图

注意这只是运行要求，GATK安装分为直接解压运行版和build版，这里介绍规范的build过程，直接解压运行的在附录中会提到。

配置java环境

这个很多同学都会配置，但是鉴于有部分同学还是不是很会配置，这里我们将介绍。

有些同学不知道自己的系统有没有安装适合的java版本，可以用以下命令查看：

$ java -version

如果是1.8就跳过这一步骤，不过比这个版本低的话就继续阅读本步骤的内容。

首先到官网下载jdk到本地，先用浏览器到官网上寻找自己要的版本，然后获得链接，在centos上用wget下载（如果下载得很慢的话可以试试先下载的Windows上，然后用传输工具传输到centos机子上），如要下载jdk-8u171-linux-x64.tar.gz，则在合适的文件夹下面用wget下载：

$ wget https://download.oracle.com/otn/java/jdk/8u221-b11/230deb18db3e4014bb8e3e8324f81b43/jdk-8u221-linux-x64.tar.gz

需要注意的是无论从Windows浏览器下载还是利用centos命令行下载都需要接受它们的license。因此应当用以下的指令，否则可能出现错误。

$ wget --no-check-certificate --no-cookies --header "Cookie: oraclelicense=accept-securebackup-cookie" http://download.oracle.com/otn-pub/java/jdk/8u171-b11/512cd62ec5174c3487ac17c61aaa89e8/jdk-8u171-linux-x64.tar.gz

此外还要注意自己的目标系统的版本，是64位还是32位的，以及下载rpm包安装还是下载压缩包解压安装，这里演示利用压缩包安装的步骤。

$ tar -zxvf jdk-8u221-linux-x64.tar.gz # 具体版本以自己下载为准

$ cd jdk-8u221-linux-x64

# 配置环境变量

$ vim /etc/profile # 这种不是很安全，可以用以下更多安全的方法

或

$ vim ~/.bash_profile

在上面其中一个文件末尾加入下列内容（根据自己的情况修改）：

export JAVA_HOME=（你自己的jdk路径）

export PATH=$JAVA_HOME/bin:$PATH

export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

最后记得检查下是否按照jdk8成功

$ java -version

另外我想到一个更加简单的办法，可以直接在有管理员权限的前提下，使用yum安装。

$ sudo yum list java-1.8*

$ yum install java-1.8.0-openjdk* -y

$ java -version

配置gradle环境

安装gradle的方法其实和按照java的方法一样，在官网下载安装包，解压后设置环境变量。

传统的按照方法当然也可以，但是这里推荐一个更加简单的办法，那就是用sdkman安装。

这个sdkman很有意思，编写人估计想给它赋予类似人的智商，所以help、安装过程和网站都与众不同。在官网也有介绍便捷的安装方式，这里简单说一下：

$ curl -s "https://get.sdkman.io" | bash

在打入这个指令之后会冒出一段话，同学们应当根据这段话最后的指令执行。执行完成后就算安装了。

$ source "$HOME/.sdkman/bin/sdkman-init.sh"

检查安装

$ sdk version

如果出现版本的话就算安装成功了，然后就可以直接输入指令：

$ sdk java gradle

就可以安装最新版的gradle了，安装完后记得检查一下是否安装成功：

$ gradle -version

还有人说python和java也都可以用这个sdkman安装，大家可以试试看。

下载python2.6或以上版本

Centos7自带python 2.7，所以本身已经达到2.6的要求无需再升级。但是GATK要求安装python 3.6.2或以上，所以我们可以再安装python3.7，如果需要切换的话，可以手动切换，或者用conda切换。Python3.7的安装方法这个博主已经说得很清楚了，大家按照他的方法安装就可以了。地址：

https://www.cnblogs.com/cosiray/p/9946401.html

下载R 3.2.5或以上版本

R的安装也十分方便，直接用yum和EPEL安装就可以了。

首先安装EPEL:

$ sudo yum install epel-release # 如果安装了就无需再安装

然后安装R

$ sudo yum install R

然后就可以输入R直接查看版本了。

下载git-lfs 1.0或以上版本

这是个很坑的东西，如果要build GATK就需要这个东西，而这个东西用在GATK下对资源（CPU和网络）占用要求比较高，所以容易build失败。

安装很简单，直接用yum安装：

$ sudo yum install git-lfs

开始bulid GATK

Build过程简单但是异常漫长，因为你需要下载很多东西。

找到一个空的文件夹，然后输入以下指令：

$ git clone https://github.com/broadinstitute/gatk

请准备至少15G的空间，良好的网络，以及不要占用太多线程的环境，这个指令是将花费同学们较多时间。

在clone过程中由于种种原因，容易导致终止，这个时候，如果报错信息中有代码提示，则根据代码操作，如果没有，则看看停在了什么地方，如果停在了安装一个东西（20Mb的）就无视之，直接继续，否则，只能自认倒霉，重新下载（重新下载前记得清空之前下载的文件）。

在进行完git clone之后，根据官网的提示，进入生成的gatk文件夹，观察是否有有gradlew执行文件，若没有，则进入官网（git clone的那个网址），找到gradlew文件放进该文件夹，然后，输入：

$ ./gradlew

注意，如果这个时候提示，缺什么，就直接到网上（上面的网站）下载那个东西。最后如果build成功，就可以运行了。

GATK测试运行

如果以下指令都可以正常运行，就说明OK了。

$ ./gatk --help

$ ./gatk --list

通过这两个指令，同学们也可以大概知道gatk可以干些什么，至于具体怎么做，可以上网查某个具体的步骤或指令，也可以继续观看本文。

利用GATK call SNP ——以一个例子展开

我们所使用的文件为52个mapping好的文件（将52个个体的），包含1个maternal的mapping bam文件、3个high coverage的offsprings文件和48个low coverage的offsprings文件。~~在利用GATK call SNP前，我们先检查一下bam的头文件。我们使用samtools查看这些文件：~~

~~$ samtools view -H /mappingxx.bam > viewH_mappingxx.txt~~

~~通过查看输出的txt文件，我们知道了@HD、@RG和@PG的内容。从@PG我们得知在上一步的map当中我们在参考序列的5’和3’段都加入100kbp的buffer片段。~~

以上是GATK变异检测的完整流程，但是我们暂时不做那么多不做那么细，我们这次主要来学习一下如何call SNP。

Duplicates Marking（optional）

网上说，在制备文库的过程中，由于PCR扩增过程中会存在一些偏差，也就是说有的序列会被过量扩增。这样，在比对的时候，这些过量扩增出来的完全相同的序列就会比对到基因组的相同位置。而这些过量扩增的reads并不是基因组自身固有序列，不能作为变异检测的证据，因此，要尽量去除这些由PCR扩增所形成的duplicates。

这个步骤用以下命令：

$ ./gatk MarkDuplicates REMOVE_DUPLICATES= false /

MAX_FILE_HANDLES_FOR_READ_ENDS_MAP=8000 /

INPUT=<自己的bam文件> /

OUTPUT=<自己定义> /

METRICS_FILE=<自己的metrics文件>

Local realignment around indels（optional）

这一步的目的就是将比对到indel附近的reads进行局部重新比对，将比对的错误率降到最低。一般来说，绝大部分需要进行重新比对的基因组区域，都是因为插入/缺失的存在，因为在indel附近的比对会出现大量的碱基错配，这些碱基的错配很容易被误认为SNP。还有，在比对过程中，比对算法对于每一条read的处理都是独立的，不可能同时把多条reads与参考基因组比对来排错。因此，即使有一些reads能够正确的比对到indel，但那些恰恰比对到indel开始或者结束位置的read也会有很高的比对错误率，这都是需要重新比对的。Local realignment就是将由indel导致错配的区域进行重新比对，将indel附近的比对错误率降到最低。

~~主要分为两步：~~

~~确定要进行重新比对的区域~~

由于该命令已经不再支持，如果需要使用，请用gatk3。

Base quality score recalibration（BQSR，optional）

这一步是对bam文件里reads的碱基质量值进行重新校正，使最后输出的bam文件中reads中碱基的质量值能够更加接近真实的与参考基因组之间错配的概率。这一步适用于多种数据类型，包括illunima、solid、454、CG等数据格式。在GATK2.0以上版本中还可以对indel的质量值进行校正，这一步对indel calling非常有帮助。

第一步：利用工具BaseRecalibrator，根据一些known sites，生成一个校正质量值所需要的数据文件，GATK以“.grp”为后缀命名：

$ ./gatk BaseRecalibrator /

-R <参考序列> /

-I <自己的bam文件> /

-o <自己定义> /

第二步：利用第一步生成的.grp来生成校正后的数据文件，也是以“.grp”命名，这一步主要是为了与校正之前的数据进行比较，最后生成碱基质量值校正前后的比较图，如果不想生成最后BQSR比较图，这一步可以省略。

$ ./gatk BaseRecalibrator /

-R <参考序列> /

-I <输入的bam文件> /

-BQSR <上一步的.grp> /

-o <输出的.grp文件>

第三步：利用工具PrintReads将经过质量值校正的数据输出到新的bam文件中，用于后续的变异检测。

$ ./gatk PrintReads /

-R <.fa> /

-I <.bam> /

-BQSR <.grp> /

-o <.bam> /

Call SNP

这一步算是最重要的步骤。用指令HaplotypeCaller：

$ HaplotypeCaller \

-R reference.fasta \

-I sample1.bam [-I sample2.bam ...] \

[--dbsnp dbSNP.vcf] \

[-stand_call_conf 30] \

[-L targets.interval_list] \

-o output.raw.snps.indels.vcf

对原始变异检测结果进行过滤

这一步就是filter了，方法太多了，可以用GATK进行filter，也可以用其他软件进行filter，这里说下用GATK初步filter的方法。

可以用VariantFiltration，这个指令可以基于vcf文件的INFO和/或FORMAT注释进行filter：

$ ./gatk VariantFiltration \

-V in.vcf \

-O out.vcf \

--genotype-filter-expression <…> \

--genotype-filter-name <…>

更加详细的过滤方法可以参考官网给的piplines：

https://software.broadinstitute.org/gatk/documentation/article?id=23216

附录

另外的几种安装方法：

最简单的方法：下载直接解压（这种方法在官网的quick start也可以找到）

GATK官网有许多不同版本的GATK包，进入release选取自己喜欢的版本，然后下载压缩包（有些地方网速不好，下载得比较慢）解压之后。可以找到一个gatk-package-[版本]-local.jar和gatk的执行文件。将所有文件放置到自己喜欢的目录，就可以使用了。

$ ./gatk --help

$ ./gatk --java-options "-Xmx8G" HaplotypeCaller -R reference.fasta -I input.bam -O output.vcf

用conda下载安装

由于gatk的一些脚本需要使用到不同的python环境，所以同学们也可以选择安装在conda中，不过据小编所知这个conda比较坑，所以大家使用这种方法的时候最好谨慎一点。首先进入conda的官网，安装步骤进行安装，下载地址官网有，请耐心查找，肯定可以找到的：

https://docs.conda.io/projects/conda/en/latest/

需要注意的是conda其实是一个目录，安装gatk的方法参考前文即可，安装完毕之后就可以使用，如果要切换python环境，就用conda切换到之前搭建的环境即可。

sam格式解析：

SAM的全称是sequence alignment/map format，而BAM就是SAM的二进制文件。SAM文件由两个部分组成：

头部区：以’@'开始，体现了比对的一些总体信息。比如比对的SAM格式版本，比对的参考序列，比对使用的软件等。

主体区：比对结果，每一个比对结果是一行，有11个主列和一个可选列。

头部区简要介绍

@HD VN:1.0 SO:unsorted（排序类型）

头部区第一行：VN是格式版本；SO表示比对排序的类型，有unknown（default），unsorted，queryname和coordinate几种。samtools软件在进行行排序后不能自动更新bam文件的SO值，而picard却可以。

@SQ SN:contig1 LN:9401（序列ID及长度）

参考序列名，这些参考序列决定了比对结果sort的顺序，SN是参考序列名；LN是参考序列长度；每个参考序列为一行。

例如：@SQ SN:NC_000067.6 LN:195471971

@RG ID:sample01 （样品基本信息）

Read Group。1个sample的测序结果为1个Read Group；该sample可以有多个library的测序结果，可以利用bwa mem -R 加上去这些信息。

例如：@RG ID:ZX1_ID SM:ZX1 LB:PE400 PU:Illumina PL:Miseq

ID：样品的ID号 SM：样品名 LB：文库名 PU：测序以 PL：测序平台

这些信息可以在形成sam文件时加入，ID是必须要有的后面是否添加看分析要求。

@PG ID:bowtie2 PN:bowtie2 VN:2.0.0-beta7 （比对所使用的软件及版本）

例如：@PG ID:bwa PN:bwa VN:0.7.12-r1039 CL:bwa sampe -a 400 -f ZX1.sam -r @RG ID:ZX1_ID SM:ZX1 LB:PE400 PU:Illumina PL:Miseq …/0_Reference/Reference_Sequence.fa ZX_HQ_clean_R1.fq.sai ZX_HQ_clean_R2.fq.sai …/2_HQData/ZX_HQ_clean_R1.fq …/2_HQData/ZX_HQ_clean_R2.fq

这里的ID是bwa，PN是bwa，VN是0.7.12-r1039版本。CL可以认为是运行程序@RG是上面RG表示的内容，后面是程序内容，这里的@GR内容是可以自己在运行程序是加入的

主体部分介绍

主体部分有11个主列和1个可选列（如果某一列为“0”或“*”表示这一列没有信息）：

QNAME

比对的序列名称。根据比对的结果（同一read比对不同的其他序列或这条read比对到同一序列的不同位置）可能出现多次。

例如：M04650:84:000000000-B837R:1:1101:22699:1759（一条测序reads的名称）

FLAG

Bwise FLAG（表明比对类型：paring，strand，mate strand等）不同数值代表不同的数值组合，不同的数值可以通过samtools的flags指令查看具体含义。

例如：99

RENAME

比对上的参考序列名。名称与头部的@SQ相对应，如果这列是“*”，可以认为这条read没有比对上的序列，则这一行的第四，五，八，九列是“0”，第六，七列与该列是相同的表示方法。

例如：NC_000075.6

POS

1-Based的比对上的最左边的定位。

例如：124057649

MAPQ

比对质量。如果值为255表示mapping值是不可用的，如果是unmapped read则MAPQ为0。

例如：60

CIGAR

Extended CIGAR string（操作符：MIDNSHP）比对结果信息；匹配碱基数，可变剪接等。

M：alignment match (can be a sequence match or mismatch)

表示read可mapping到第三列的序列上，则read的碱基序列与第三列的序列碱基相同，表示正常的mapping结果，M表示完全匹配，但是无论reads与序列的正确匹配或是错误匹配该位置都显示为M

I：insertion to the reference

表示read的碱基序列相对于第三列的RNAME序列，有碱基的插入

D：deletion from the reference

表示read的碱基序列相对于第三列的RNAME序列，有碱基的删除

N：skipped region from the reference

表示可变剪接位置

P：padding (silent deletion from padded reference)

S：soft clipping (clipped sequences present in SEQ)

H：hard clipping (clipped sequences NOT present in SEQ)

clipped均表示一条read的序列被分开，之所以被分开，是因为read的一部分序列能匹配到第三列的RNAME序列上，而被分开的那部分不能匹配到RNAME序列上。S可以单独出现，而H必须有与之对应的S出现时才可能出现，不可在相同第一列的情况下单独出现。

"="表示正确匹配到序列上

"X"表示错误匹配到序列上

N：如果是mRNA-to-genome，N出现的位置代表内含子，其它比对形式出现N时则没有具体解释。

M/I/S/=/X：这些数值的加和等于第10列SEQ的长度

例如：3S6M1P1I4M

前三个碱基被剪切去除了，然后6个比对上了，然后打开了一个缺口，有一个碱基插入，最后是4个比对上了。

RNEXT

双端测序中下一个reads比对的参考系列的名称。“＊”是完全没有比对上，“＝”代表完全比对。

例如：= 意味着双端测序的另一条read也比对上，并且是比对到同一个片段

PNEXT

如果是双端测序，是指另一端匹配到参考基因组的位置，如果设置为0，那么该列不可用。

例如：124057667

ISIZE

插入片段长度。最左边得为正，最右边的为负，中间的不用定义正负，不分区段（single-segment)的比对上，或者不可用时，此处为0。区别于第6列和第10列是对应测出来的序列的长度。这里第9列的长度是对应插入片段的长度，insert size，也就是建库时，将DNA片段打断成的长度。

例如：200

SEQ

和参考序列在同一个链上比对的序列（若比对结果在负义链上，则序列是其反向重复序列，反向互补序列）。

例如：ATTACTTGGCTGCT

QUAL

比对序列的质量（ASCII-33=Phred base quality）reads碱基质量值。

例如：-8CCCGFCCCF7@E-

可选的列

以TAG：TYPE：VALUE的形式提供额外的信息。

samtools命令解析

略

GATK中的resource bundle

The GATK resource bundle is a collection of standard files for working with human resequencing data with the GATK. We provide several versions of the bundle corresponding to the various reference builds, but be aware that we no longer actively support very old versions (b36/hg18). In addition, we are currently transitioning to support the Grch38/hg38 reference build, but we have not yet generated all of the files necessary for all use cases (in particular we are still missing the Hg38 version of the Broad's exome intervals).

参考

SNP用作遗传标记的优点：

https://max.book118.com/html/2019/0305/7061113065002012.shtm

GATK官网：

https://software.broadinstitute.org/gatk/

SAM格式文件解读

https://blog.csdn.net/genome_denovo/article/details/78712972

GATK中文readme

https://www.helplib.com/GitHub/article_123523

常用生物信息学格式介绍

https://www.jianshu.com/p/1e273cb25c20?utm_campaign=haruki&utm_content=note&utm_medium=reader_share&utm_source=qq

sam格式的简单了解

https://www.jianshu.com/p/2aad7fc4f14a

samtools常用命令详解

https://blog.csdn.net/luobailian/article/details/50316627

CentOS Java环境搭建

https://www.cnblogs.com/krockey/p/9044735.html

sdkman的安装

https://sdkman.io/install

使用sdkman安装java、gradle环境

https://blog.csdn.net/sheng_Mu555/article/details/82527439

在CentOS上安装Python3的三种方法

https://www.cnblogs.com/cosiray/p/9946401.html

centos上按照R

https://blog.csdn.net/bodybo/article/details/79999136

GATK call SNP流程

https://www.jianshu.com/p/938d362fc48d

GATK初步安装

https://www.jianshu.com/p/e8370c550717

conda官网

https://docs.conda.io/projects/conda/en/latest/

GATK使用方法详解

http://blog.sina.com.cn/s/blog_12d5e3d3c0101qu6e.html

GATK之HaplotypeCaller

http://biotrainee.com/thread-1417-1-1.html

你可能感兴趣的:(生信笔记)

Windows使用Browser Use笔记人工智能ai开发
相关文档：https://docs.browser-use.com/quickstart首先安装UV命令行cmdpowershell-ExecutionPolicyByPass-c"irmhttps://astral.sh/uv/install.ps1|iex"设置环境变量setPath=C:\xx\.local\bin;%Path%查看版本uv-V查看可用和已安装的Python版本uvpytho
使用spring data MongoDB对MongoDB进行简单CURD操作示例其实我就是个萌新 spring mongodb java
本文章为作者个人学习笔记，仅作参考。1.application.properties配置spring.data.mongodb.database=[数据库名]spring.data.mongodb.host=localhost[主机名,本机：localhost]spring.data.mongodb.port=[数据库端口，默认:27017]2.根据数据库文档定义实体类：@RequiredArgs
【Vue3笔记01】如何使用Vue3和Vite搭建前端项目的基础开发环境 Mr.小朱同学 Web前端笔记前端笔记 vue.js Vue3 Vite 搭建项目环境
这篇文章，主要介绍如何使用Vue3和Vite搭建前端项目的基础开发环境【知识星球】。目录一、搭建项目环境1.1、前提条件1.2、开始搭建1.3、下载依赖1.4、启动工程一、搭建项目环境目前前端开发中，使用最多的就是Vue.js框架，目前Vue.js框架常用的有Vue2、Vue3两个版本，Vue3和Vue2在语法上还是存在很大的差异的，这里我将介绍如何搭建Vue3开发环境。1.1、前提条件在创建Vu
【自学笔记】NFT基础知识点总览-持续更新 Long_poem 笔记区块链
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录NFT（非同质化代币）基础知识点总览1.NFT简介2.NFT的应用场景3.NFT的工作原理4.NFT的创建和发行5.代码示例代码解释总结NFT（非同质化代币）基础知识点总览1.NFT简介NFT（Non-FungibleToken，非同质化代币）是一种基于区块链技术的独特数字资产，每个NFT都是唯一的、不可互换的。与同质化代币（
《算法笔记》9.2小节——数据结构专题(2)-＞二叉树的遍历问题 A: 复原二叉树（同问题 C: 二叉树遍历）圣保罗的大教堂《算法笔记》算法
题目描述小明在做数据结构的作业，其中一题是给你一棵二叉树的前序遍历和中序遍历结果，要求你写出这棵二叉树的后序遍历结果。输入输入包含多组测试数据。每组输入包含两个字符串，分别表示二叉树的前序遍历和中序遍历结果。每个字符串由不重复的大写字母组成。输出对于每组输入，输出对应的二叉树的后续遍历结果。样例输入DBACEGFABCDEFGBCADCBAD样例输出ACBFGEDCDAB分析：不建树直接找的方法。
数据结构复习笔记5.2：二叉树 SGCGYU_Tan 数据结构笔记数据结构笔记 c++
1.二叉树的概念⼆叉树是每个结点最多有两个⼦树的树结构。也就是说⼆叉树不允许存在度⼤于2的树。它有五种最基本的形态：⼆叉树可以是空集。根可以有空的左⼦树或者右⼦树；或者左右⼦树都是空。其中只有左⼦树或者右子树的叫做斜树。为何要重点研究每结点最多只有两个“叉”的树？二叉树的结构最简单，规律性最强；可以证明，所有树都能转为唯一对应的二叉树，不失一般性。普通树（多叉树）若不转化为二叉树，则运算很难实现。
数学建模清风课程笔记——第二章 TOPSIS法 minpengyuanBITer 数学建模数学建模笔记
TOPSIS(TechniqueforOrderPreferencebySimilaritytoIdealSolution)可翻译为逼近理想解排序法，国内简称为优劣解距离法。TOPSIS法是一种常用的综合评价方法，其能充分利用原始数据的信息，其结果能够精确地反映各评价方案之间的差距。评价类问题1TOPSIS法TOPSIS法概念：TOPSIS法是一种常用的综合评价方法，能充分利用原始数据的信息，其结
JDK8 Stream 数据流效率分析，Java开发你需要了解的那些事气质大叔程序员后端面试 java
此外还有一系列特化流，如IntStream，LongStream，DoubleStream等），Java8引入的的Stream主要用于取代部分Collection的操作，每个流代表一个值序列，流提供一系列常用的聚集操作，可以便捷的在它上面进行各种运算。集合类库也提供了便捷的方式使我们可以以操作流的方式使用集合、数组以及其它数据结构；作为阅读福利，小编也整理了一些Java学习笔记（包含面试真题+脑图
计算机网络笔记、面试八股（二）—— HTTP协议 Your_Raymond 计算机网络 http 计算机网络面试
本章目录2.HTTP协议2.1HTTP协议简介2.2HTTP协议的优点2.3HTTP协议的缺点2.4HTTP协议属于哪一层2.5HTTP通信过程2.6常见请求方法2.7GET和POST的区别2.8请求报文与响应报文2.8.1HTTP请求报文2.8.2HTTP响应报文2.9响应状态码2.10HTTP1.0和1.1的区别2.10.1长连接2.10.2错误响应码2.10.3缓存处理2.10.4带宽的优化
linuxcentos6笔记 lnes， linux centos vim
目录Linux笔记11目录结构51.1基本指令51.2Ls指令：51.3Pwd指令：61.4Cd指令：71.5mkdir指令：71.6touch指令：71.7cp指令：71.8mv指令：81.9rm指令：81.10vim指令：91.11输出重定向：91.12cat指令：102进阶指令102.1Df指令：102.2free指令：102.3head指令：112.4tail指令：112.5less指令：
【考研计算机网络】课堂笔记1 第一章概述刘鑫磊up #操作系统计算机网络计算机网络
文章目录：一：计算机网络的概述1.计算机网络的基本概念2.计算机网络的组成3.计算机网络的功能4.计算机网络的分类4.1分布范围分类4.2传输技术分类4.3按照拓扑结构分类4.4按照使用者分类4.5按照传输介质分类二：计算机网络的标准化工作及相关组织三：计算机网络的性能指标速率kb千Mb兆Gb吉Tb太的单位换算存储容量KBMBGBTB的单位换数四：网络分层五：计算机网络协议、接口、服务的概念1.协
常用的pdf技术有哪些？--笔记我不是彭于晏灬 pdf 笔记
常用的pdf技术有哪些？1.iTextPDF：iText是著名的开放项目，是用于生成PDF文档的一个java类库。通过iText不仅可以生成PDF或rtf的文档，而且可以将XML、Html文件转化为PDF文件。Openoffice：openoffice是开源软件且能在windows和linux平台下运行，可以灵活的将word或者Excel转化为PDF文档。JasperReport：是一个强大、灵活
计算机网络笔记再战——理解几个经典的协议HTTP章4 charlie114514191 计算机网络学习计算机网络笔记 http 学习网络协议网络
计算机网络笔记再战——理解几个经典的协议10HTTP章4确保Web安全的HTTPSHTTP是不安全的，它使用的是明文传递，这意味着潜在的报文纂改。这里我们将学习更加安全的HTTPS协议通信使用明文（不加密），内容可能会被窃听不验证通信方的身份，因此有可能遭遇伪装无法证明报文的完整性，所以有可能已遭篡改HTTP本身没有办法加密，但是可以跟SSL（SecureSocketLayer）或者是TLS（Tr
C++ 结构型设计模式十七12138 C++c++设计模式
C++设计模式自己理解整理笔记结构型-适配器模式适配器模式（AdapterPattern）是一种结构型设计模式，它的主要作用是将一个类的接口转换成客户希望的另一个接口，使得原本由于接口不兼容而不能一起工作的那些类可以一起工作。适配器模式主要有两种实现方式：类适配器模式和对象适配器模式。类适配器类适配器通过多重继承实现，这种方式利用了继承优点直接调用：由于适配器类继承了被适配类，所以可以直接调用被适
numpy学习笔记3：三维数组 np.ones((2, 3, 4)) 的详细解释宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记3：三维数组np.ones((2,3,4))的详细解释以下是关于三维数组np.ones((2,3,4))的详细解释：1.三维数组的形状形状(2,3,4)表示：最外层维度：2个“层”（或“块”）；中间维度：每个层有3行；最内层维度：每行有4个元素。可以类比为：2本书（外层），每本书有3页（中间层），每页有4行文字（内层）。2.创建全1三维数组代码示例：importnumpyasnp
Ts学习笔记初学者7. 学习笔记 typescript
一、Ts与Js区别TsJsJavaScript的超集，用于解决大型项目的代码复杂性一种脚本语言，用于创建动态网页。强类型，支持静态和动态类型动态弱类型语言可以在编译期间发现并纠正错误只能在运行时发现错误不允许改变变量的数据类型变量可以被赋予不同类型的值二、Ts基础类型：boolean,number,string,undefined,null,any,unknown,void，neverany,un
Qt爬坑笔记 klzed_ qt c++后端 ui
1.自定义一个QWidget的派生类，将其作为子部件并设置样式表时，需要重写paintEvent事件，否则样式表可能无效，如下所示：voidCustomWidget::paintEvent(QPaintEvent*){QStyleOptionopt;opt.init(this);QPainterp(this);
LeetCode刷题笔记小李李李李腊八 leetcode 算法 java
leetcode_01两数之和斐波那契数列三个数最大乘积反转链表x的平方根环形列表LeetCode随笔两数之和给定一个整数数组nums和一个整数目标值target，请你在该数组中找出和为目标值target的那两个整数，并返回它们的数组下标。你可以假设每种输入只会对应一个答案。但是，数组中同一个元素在答案里不能重复出现。你可以按任意顺序返回答案。暴力法记录下数组第一个数值，对数组进行循环，将之后的值
numpy学习笔记2：ones = np.ones((2, 4)) 的详解宁宁可可 #机器学习 #Python基础与进阶 numpy python 开发语言
numpy学习笔记2：ones=np.ones((2,4))的详解np.ones()是NumPy中用于创建全1数组的核心函数，其用法和参数与np.zeros()类似，但生成的数组元素值全部为1。以下是详细解释：1、语法numpy.ones(shape,dtype=float,order='C')作用：生成一个指定形状和数据类型的全1数组。参数：shape：数组的形状，以元组形式传递（如(2,4)表
软考中级软件设计师考点知识点笔记总结 day05 莫问alicia 软考中级软件设计师笔记算法
文章目录4、栈和队列4.1、栈的定义4.2、队列定义5、串、数组、矩阵和广义表5.1、串5.2、数组5.3、稀疏矩阵5.4、广义表4、栈和队列4.1、栈的定义线性表是具有相同数据类型的n个数据元素的有限序列，n为表厂。n=0时线性表是一个空表L=（a1,a2,a3,…an）栈是只允许在一端进行插入或删除操作的线性表栈顶允许插入和删除的一端栈顶进栈顶出栈底不允许插入和删除的一端4.2、队列定义队列是
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
小黑笔记本，写的todolist效果，增删效果，显示隐藏，全部清除效果。 YangHuan3 html
先说一下总的大致要去实现的效果：1.新增2.删除3.统计4.清除5.隐藏给大家看一下todoList的大致样式吧！第一个效果：新增1.生成列表结构（v-for数组）2.获取用户输入（v-model）3.回车获取数据（v-on，enter添加数据）第二个效果：删除1.点击删除指定的内容（v-onsplice索引）通过对应的下标删除指定的元素，并且v-for指定的内部是可以获取到当前循环元素下标的，这
HPC综合-心得与笔记【19】 sakura_sea HPC and 3D Graphics Engine 线性规划
Dijkstra算法【2】基础距离数组dist，设置起点距离为0，其他节点距离为无穷大（∞）用最小堆创建优先队列，将起点放入队列。从队列中取出当前距离最小的节点u。遍历u的每个邻接节点v，计算从起点到v的路径长度：alt=dist[u]+weight(u,v)。如果altdist[u]:continue#遍历邻接节点forv,weightingraph[u].items():alt=dist[u]
《算法笔记》9.4小节——数据结构专题(2)-＞二叉查找树（BST）问题 A: 二叉排序树圣保罗的大教堂《算法笔记》算法
题目描述输入一系列整数，建立二叉排序数，并进行前序，中序，后序遍历。输入输入第一行包括一个整数n(1#include#include#include#include#include#include#include#include#include#include#include#include#include#defineINF0x3f3f3f3f#definedb1(x)coutleft);Fre
小红书app复制链接转换为直接可访问链接，网页版链接，小红书短链转长链（最新版）才华是浅浅的耐心 python 爬虫开发语言
简介：小红书手机app分享的链接需要点击才能获取完成链接，本文教大家如何通过代码的方式将xhs的短连接转化为长链接。1.正常我们分享的链接是这样的：44小猪吃宵夜发布了一篇小红书笔记，快来看吧！KeA1GIGiSMXGWy7http://xhslink.com/a/sT7omKb6ijX6，复制本条信息，打开【小红书】App查看精彩内容！转换后是这样的：https://www.xiaohongsh
C# 技术使用笔记：如何高效处理字符串 caifox菜狐狸 C#技术使用笔记 c#笔记 string StringBuilder Substring Replace Split
1.C#字符串基础概念1.1字符串不可变性在C#中，字符串具有不可变性，这意味着一旦创建了一个字符串对象，其内容就不能被修改。例如，当我们执行以下代码时：stringstr="Hello";str=str+"World";实际上，str+"World"并是修改了原来的"Hello"字符串，而是创建了一个全新的字符串对象"HelloWorld"，并将str的引用指向了这个新对象，原来的"Hello"
TCP/IP学习笔记(5) --IP选路 ox0080 Linux 网络 linux网络
静态IP选路一个简单的路由表选路是IP层最重要的一个功能之一。前面的部分已经简单的讲过路由器是通过何种规则来根据IP数据包的IP地址来选择路由。这里就不重复了。首先来看看一个简单的系统路由表。命令:routeprint|more对于一个给定的路由器，可以打印出五种不同的flag。U表明该路由可用。G表明该路由是到一个网关。如果没有这个标志，说明和Destination是直连的，而相应的Gatewa
大众文艺杂志社大众文艺杂志大众文艺编辑部2025年第3期目录 QQ296078736 人工智能
公共文化服务研究提高基层群众音乐鉴赏水平的策略研究罗婉琳;1-3文艺评论《增广贤文》：深入剖析其中的人学智慧姚志清;4-6当代战争视阈下近20年军旅戏剧军事文化观的嬗变研究（2000～2023年）邱远望;7-9从奥威尔的《射象》看分裂的自我与身份认同何玉蔚;10-12南宋都市笔记中的临安园林及其美学意义张凯歌;13-15文博与数字化研究数字时代与媒介史视域下的多模态图书馆系统及新质书香社会建设鹿钦
Dom 周华华 JavaScript html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
【Spark九十六】RDD API之combineByKey bit1129 spark
1. combineByKey函数的运行机制 RDD提供了很多针对元素类型为(K,V)的API，这些API封装在PairRDDFunctions类中，通过Scala隐式转换使用。这些API实现上是借助于combineByKey实现的。combineByKey函数本身也是RDD开放给Spark开发人员使用的API之一首先看一下combineByKey的方法说明：
msyql设置密码报错：ERROR 1372 (HY000): 解决方法详解 daizj mysql 设置密码
MySql给用户设置权限同时指定访问密码时，会提示如下错误： ERROR 1372 (HY000): Password hash should be a 41-digit hexadecimal number；问题原因：你输入的密码是明文。不允许这么输入。解决办法：用select password('你想输入的密码');查询出你的密码对应的字符串，然后
路漫漫其修远兮吾将上下而求索周凡杨学习思索
王国维在他的《人间词话》中曾经概括了为学的三种境界古今之成大事业、大学问者，罔不经过三种之境界。“昨夜西风凋碧树。独上高楼，望尽天涯路。”此第一境界也。“衣带渐宽终不悔，为伊消得人憔悴。”此第二境界也。“众里寻他千百度，蓦然回首，那人却在灯火阑珊处。”此第三境界也。学习技术，这也是你必须经历的三种境界。第一层境界是说，学习的路是漫漫的，你必须做好充分的思想准备，如果半途而废还不如不要开始。这里，注
Hadoop(二)对话单的操作朱辉辉33 hadoop
Debug： 1、 A = LOAD '/user/hue/task.txt' USING PigStorage(' ') AS (col1,col2,col3); DUMP A; //输出结果前几行示例： (>ggsnPDPRecord(21),,) (-->recordType(0),,) (-->networkInitiation(1),,)
web报表工具FineReport常用函数的用法总结（日期和时间函数）老A不折腾 finereport 报表工具 web开发
web报表工具FineReport常用函数的用法总结（日期和时间函数）说明：凡函数中以日期作为参数因子的，其中日期的形式都必须是yy/mm/dd。而且必须用英文环境下双引号(" ")引用。 DATE DATE(year,month,day):返回一个表示某一特定日期的系列数。 Year:代表年，可为一到四位数。 Month:代表月份。
c++ 宏定义中的##操作符墙头上一根草 C++
#与##在宏定义中的--宏展开 #include <stdio.h> #define f(a,b) a##b #define g(a) #a #define h(a) g(a) int main() { &nbs
分析Spring源代码之，DI的实现 aijuans spring DI 现源代码
(转) 分析Spring源代码之，DI的实现 2012/1/3 by tony 接着上次的讲，以下这个sample [java] view plain copy print
for循环的进化 alxw4616 JavaScript
// for循环的进化 // 菜鸟 for (var i = 0; i < Things.length ; i++) { // Things[i] } // 老鸟 for (var i = 0, len = Things.length; i < len; i++) { // Things[i] } // 大师 for (var i = Things.le
网络编程Socket和ServerSocket简单的使用百合不是茶网络编程基础 IP地址端口
网络编程;TCP/IP协议网络:实现计算机之间的信息共享,数据资源的交换协议:数据交换需要遵守的一种协议,按照约定的数据格式等写出去端口:用于计算机之间的通信每运行一个程序，系统会分配一个编号给该程序，作为和外界交换数据的唯一标识 0~65535 查看被使用的
JDK1.5 生产消费者 bijian1013 java thread 生产消费者 java多线程
ArrayBlockingQueue：一个由数组支持的有界阻塞队列。此队列按 FIFO（先进先出）原则对元素进行排序。队列的头部是在队列中存在时间最长的元素。队列的尾部是在队列中存在时间最短的元素。新元素插入到队列的尾部，队列检索操作则是从队列头部开始获得元素。 ArrayBlockingQueue的常用方法：
JAVA版身份证获取性别、出生日期及年龄 bijian1013 java 性别出生日期年龄
工作中需要根据身份证获取性别、出生日期及年龄，且要还要支持15位长度的身份证号码，网上搜索了一下，经过测试好像多少存在点问题，干脆自已写一个。 CertificateNo.java package com.bijian.study; import java.util.Calendar; import
【Java范型六】范型与枚举 bit1129 java
首先，枚举类型的定义不能带有类型参数，所以，不能把枚举类型定义为范型枚举类，例如下面的枚举类定义是有编译错的 public enum EnumGenerics<T> { //编译错，提示枚举不能带有范型参数 OK, ERROR; public <T> T get(T type) { return null;
【Nginx五】Nginx常用日志格式含义 bit1129 nginx
1. log_format 1.1 log_format指令用于指定日志的格式，格式： log_format name(格式名称) type(格式样式) 1.2 如下是一个常用的Nginx日志格式： log_format main '[$time_local]|$request_time|$status|$body_bytes
Lua 语言 15 分钟快速入门 ronin47 lua 基础
- - 单行注释 - - [[ [多行注释] - - ]] - - - - - - - - - - - 1. 变量 & 控制流 - - - - - - - - - - num = 23 - - 数字都是双精度 str = 'aspythonstring'
java-35.求一个矩阵中最大的二维矩阵 ( 元素和最大 ) bylijinnan java
the idea is from: http://blog.csdn.net/zhanxinhang/article/details/6731134 public class MaxSubMatrix { /**see http://blog.csdn.net/zhanxinhang/article/details/6731134 * Q35 求一个矩阵中最大的二维
mongoDB文档型数据库特点开窍的石头 mongoDB文档型数据库特点
MongoDD: 文档型数据库存储的是Bson文档-->json的二进制特点：内部是执行引擎是js解释器，把文档转成Bson结构，在查询时转换成js对象。 mongoDB传统型数据库对比传统类型数据库：结构化数据，定好了表结构后每一个内容符合表结构的。也就是说每一行每一列的数据都是一样的文档型数据库：不用定好数据结构，
[毕业季节]欢迎广大毕业生加入JAVA程序员的行列 comsci java
一年一度的毕业季来临了。。。。。。。。正在投简历的学弟学妹们。。。如果觉得学校推荐的单位和公司不适合自己的兴趣和专业，可以考虑来我们软件行业，做一名职业程序员。。。软件行业的开发工具中，对初学者最友好的就是JAVA语言了，网络上不仅仅有大量的
PHP操作Excel – PHPExcel 基本用法详解 cuiyadll PHP Excel
导出excel属性设置//Include classrequire_once('Classes/PHPExcel.php');require_once('Classes/PHPExcel/Writer/Excel2007.php');$objPHPExcel = new PHPExcel();//Set properties 设置文件属性$objPHPExcel->getProperties
IBM Webshpere MQ Client User Issue (MCAUSER) darrenzhu IBM jms user MQ MCAUSER
IBM MQ JMS Client去连接远端MQ Server的时候，需要提供User和Password吗？答案是根据情况而定，取决于所定义的Channel里面的属性Message channel agent user identifier (MCAUSER)的设置。 http://stackoverflow.com/questions/20209429/how-mca-user-i
网线的接法 dcj3sjt126com
一、PC连HUB (直连线)A端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。 B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。二、PC连PC （交叉线）A端：(568A)：白绿，绿，白橙，蓝，白蓝，橙，白棕，棕； B端：（标准568B）：白橙，橙，白绿，蓝，白蓝，绿，白棕，棕。三、HUB连HUB&nb
Vimium插件让键盘党像操作Vim一样操作Chrome dcj3sjt126com chrome vim
什么是键盘党？键盘党是指尽可能将所有电脑操作用键盘来完成，而不去动鼠标的人。鼠标应该说是新手们的最爱，很直观，指哪点哪，很听话！不过常常使用电脑的人，如果一直使用鼠标的话，手会发酸，因为操作鼠标的时候，手臂不是在一个自然的状态，臂肌会处于绷紧状态。而使用键盘则双手是放松状态，只有手指在动。而且尽量少的从鼠标移动到键盘来回操作，也省不少事。在chrome里安装 vimium 插件
MongoDB查询（2）——数组查询[六] eksliang mongodb MongoDB查询数组
MongoDB查询数组转载请出自出处：http://eksliang.iteye.com/blog/2177292 一、概述 MongoDB查询数组与查询标量值是一样的，例如，有一个水果列表，如下所示： > db.food.find() { "_id" : "001", "fruits" : [ "苹
cordova读写文件（1） gundumw100 JavaScript Cordova
使用cordova可以很方便的在手机sdcard中读写文件。首先需要安装cordova插件：file 命令为： cordova plugin add org.apache.cordova.file 然后就可以读写文件了，这里我先是写入一个文件，具体的JS代码为： var datas=null;//datas need write var directory=&
HTML5 FormData 进行文件jquery ajax 上传到又拍云 ileson jquery Ajax html5 FormData
html5 新东西：FormData 可以提交二进制数据。页面test.html <!DOCTYPE> <html> <head> <title> formdata file jquery ajax upload</title> </head> <body> <
swift appearanceWhenContainedIn:(version1.2 xcode6.4) 啸笑天 version
swift1.2中没有oc中对应的方法： + (instancetype)appearanceWhenContainedIn:(Class <UIAppearanceContainer>)ContainerClass, ... NS_REQUIRES_NIL_TERMINATION; 解决方法：在swift项目中新建oc类如下： #import &
java实现SMTP邮件服务器 macroli java 编程
电子邮件传递可以由多种协议来实现。目前，在Internet 网上最流行的三种电子邮件协议是SMTP、POP3 和 IMAP，下面分别简单介绍。　　◆ SMTP 协议　　简单邮件传输协议(Simple Mail Transfer Protocol,SMTP)是一个运行在TCP/IP之上的协议，用它发送和接收电子邮件。SMTP 服务器在默认端口25上监听。SMTP客户使用一组简单的、基于文本的
mongodb group by having where 查询sql qiaolevip 每天进步一点点学习永无止境 mongo 纵观千象
SELECT cust_id, SUM(price) as total FROM orders WHERE status = 'A' GROUP BY cust_id HAVING total > 250 db.orders.aggregate( [ { $match: { status: 'A' } }, { $group: {
Struts2 Pojo（六） Luob. POJO strust2
注意：附件中有完整案例 1.采用POJO对象的方法进行赋值和传值 2.web配置 <?xml version="1.0" encoding="UTF-8"?> <web-app version="2.5" xmlns="http://java.sun.com/xml/ns/javaee&q
struts2步骤 wuai struts
1、添加jar包 2、在web.xml中配置过滤器 <filter> <filter-name>struts2</filter-name> <filter-class>org.apache.st