你真的不能替我学吗

RNAseq分析全过程

本次实操数据来自下面的文章，是量化环境葡萄糖对转录组的影响，比较低糖和高糖环境下胰岛转录组的变化，胰岛来源小鼠。
SRR1374921 LoGlu_Rep1
SRR1374922 LoGlu_Rep2
SRR1374923 HiGlu_Rep1
SRR1374924 HiGlu_Rep2
该数据已发表文章：
The transcriptional landscape of mouse beta cells compared to human beta cells reveals notable species differences in long non-coding RNA and protein-coding gene expression
DOI: 10.1186/1471-2164-15-62

详细分析过程

1 安装conda及RNA-seq所需要的工具
- 1.1 conda安装
- 1.2 SRA-toolkit
- 1.3 fastqc
- 1.4 fastp
- 1.5 hisat2
- 1.6 samtools
- 1.7 htseq
2 下载原始数据参考基因组及其注释
- 2.1 原始数据
- 2.2 参考基因组及其注释
3 sra到fastq格式转换并进行质量控制
- 3.1 格式转换
- 3.2 质量控制
4 序列比对 Hisat2
5 reads计数合并矩阵并进行注释
- 5.1 reads计数
- 5.2 合并矩阵并进行注释
6 DEseq2筛选差异表达基因并用bioMart注释
- 6.1 DEseq2筛选差异表达基因
- 6.2 用bioMart对差异表达基因进行注释
7 数据可视化绘图
- 7.1 MA图
- 7.2 Plot counts
- 7.3 PCA
- 7.4 热图
- 7.5 火山图
8 富集分析功能注释
9 KEGG通路可视化

1 安装conda及RNA-seq所需要的工具

1.1 conda安装

安装

#下载压缩包
wget https://repo.anaconda.com/archive/Anaconda3-2021.05-Linux-x86_64.sh
#安装
bash Anaconda3-2021.05-Linux-x86_64.sh
#配置环境变量
vim ~/.bashrc
export PATH="/root/weirdo/anaconda3/bin:$PATH"
#激活环境变量
source /etc/bash.bashrc
#测试是否安装成功 如果成功安装会出现conda的版本
conda --version

#如果第一次安装没有成功 第二次安装的时候需要在ENTER那一步修改安装路径 否则会因为安装路径被占用而无法安装成功

一些相关命令

查看变量 echo $PATH
用户配置文件 ~ /.bshrc
启动环境：source activate
添加镜像源：onda config -add conda config --show
查看已有环境：conda env -info
搜索：conda search
创建新环境：conda create -n env_name -prefix python=2 bwa
删除环境：conda remove -n env_name -all

配置python环境

#查看当前python版本号
python --version
#创建一个名为python27的环境 指定Python版本是2.7（不用管是2.7.x conda会为我们自动寻找2.7.x中的最新版本）
conda create --name python27 python=2.7 -y
#激活python环境 两种方式
conda activate python2
source activate pythion2
#查看当前python版本号
python --version
#列举当前所有环境
conda info -e

所需要的软件可以到生信技能树RNA-seq基础传送门里查看，(需要复制链接到浏览器中查看): http://www.biotrainee.com/thread-1750-1-1.html

1.2 SRA-toolkit

官网链接: https://ccb.jhu.edu/software/hisat2/index.shtml，有详细的使用说明。

1 预编译安装

#进入shares目录 这里是因为我的shares目录里已经下载好了 就直接切换进入解压缩
ll ../shares
#创建Biosofts目录
mkdir ~/Biosofts/
#解压文件 -C指定解压缩的目录文件
tar zxvf /disk1/shares/sratoolkit.2.11.1-ubuntu64.tar.gz -C ~/Biosofts/
#测试安装是否成功
~/Biosofts/sratoolkit.2.11.1-ubuntu64/bin/fastq-dump -h
#添加环境变量
echo 'export PATH=~/Biosofts/sratoolkit.2.11.1-ubuntu64/bin:$PATH' >>~/.bashrc
#使环境变量生效
source ~/.bashrc
#再次测试安装情况 两个都可以 如果成功会出现软件使用说明
fastq-dump
prefetch -h

#如果服务器里没有下载 则用wget下载 选择和电脑匹配的版本
wget  https://ftp-trace.ncbi.nlm.nih.gov/sra/sdk/2.9.2/sratoolkit.2.9.2-centos_linux64.tar.gz

2 root用户apt-get安装

sudo apt install sra-toolkit
prefetch -h

1.3 fastqc

FastQC是一款基于Java的软件，它可以快速地对测序数据进行质量评估，其官网为：链接：Babraham Bioinformatics - FastQC A Quality Control tool for High Throughput Sequence Data

1 安装java环境

#创建文件目录
sudo mkdir /usr/java
mkdir /usr/java
#下载jdk压缩包
wget https://repo.huaweicloud.com/java/jdk/10.0.1+10/jdk-10.0.1_linux-x64_bin.tar.gz
#给相关目录创建软连接
sudo ln -s jdk1.8.0_172 latest
sudo ln -s /usr/java/latest default 
#进入文件修改环境变量
sudo vi /etc/profile
#添加环境变量
export JAVA_HOME=/usr/java/latest
export PATH=JAVA_HOME/bin:JAVA_HOME/jre/bin:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:JAVA_HOME/lib/tools.jar
#使修改的环境变量生效
source /etc/profile
#测试是否安装成功
java -version

2 安装fastqc

#切换到指定目录
cd ~/Biosofts
#下载fastq压缩包
wget http://www.bioinformatics.babraham.ac.uk/projects/fastqc/fastqc_v0.11.7.zip
#创建下一级目录
mkdir ~/Biosofts/fastqc
#解压文件到指定目录
unzip /disk1/shares/fastqc_v0.11.7.zip -d ~/Biosofts/
#给目录加上执行权限
chmod +x ~/Biosofts/FastQC/fastqc
#fastqc默认安装
~/Biosofts/FastQC/fastqc  -h
#加入环境变量 就不用再输入路径了
echo 'export PATH=~/Biosofts/FastQC:$PATH'>>~/.bashrc
#使环境变量生效
source ~/.bashrc
#测试是否安装成功 如果成功会出现使用说明
fastqc -h

1.4 fastp

fastp是用于处理fastq文件，基于C++，支持多线程，包含fastQC和Trimmomatic的一些功能，运行速度比Trimmomatic快，并且可以同时过滤和质控，比较方便。

fastp功能

去接头
碱基矫正
滑动窗口质量值剪切
切ployG/ployX尾巴
处理分子标签(UMI)
分割输出结果
duplicate率的评估
过表达序列分析
质控结果报告

fastp常用参数详细说明可参考：https://blog.csdn.net/sinat_32872729/article/details/94440265

conda安装

conda install fastp

1.5 hisat2

主要用于序列比对，一般用在RNA-seq里，使用方法: https://blog.csdn.net/narutodzx/article/details/126471422
1 源代码安装

#后台运行 就算界面卡住也能继续运行
screen
#拷贝文件 没有的话用wget下载
cp /disk1/shares/hisat2-2.2.0-source.zip ./
#解压文件
unzip hisat2-2.2.0-source.zip
#切换到hisat2-2.2.0目录
cd hisat2-2.2.0
#运行
make

2 预编译安装

#下载压缩包
wget ftp://ftp.ccb.jhu.edu/pub/infphilo/hisat2/downloads/hisat2-2.1.0-Linux_x86_64.zip
#解压压缩文件
unzip hisat2-2.1.0-Linux_x86_64.zip
#进入文件夹
cd hisat2-2.2.0/
#运行hisat2命令
./hisat2
#设置环境变量 使其生效
echo 'export PATH=~/hisat2-2.2.0:$PATH' >> ~/.bashrc
source ~/.bashrc
#运行
hisat2

1.6 samtools

官方手册: http://www.htslib.org/doc/samtools.html
使用链接: http://quinlanlab.org/tutorials/samtools/samtools.html

sudo apt install samtools
samtools
samtools view

1.7 htseq

# 安装htseq
conda install htseq
htseq-count --v

2 下载原始数据参考基因组及其注释

2.1 原始数据

原始数据一般是sra文件，后面再转换为fastq文件或sam文件，一般有三种下载方式：

ascp下载(推荐数据较大时使用)
sra-toolkit中prefetch下载
wget下载

理论上下载方式推荐ascp>prefetch>wget，但因为目前NCBI网站不再提供ftp地址，需要到EBI-ENA数据库去寻找ftp地址，所以一般数据不是特别特别大的时候选择prefetch下载，wget下载可能会下载不全且花费时间较多。

SRA数据库相关知识可以看这个: https://blog.csdn.net/qq_22253901/article/details/120069582

ascp下载

1.在EBI-ENA数据库找到对应ftp地址
在搜索框输入检索号SRR*，点击Show Column Selection，选择run-accession，fastq-aspera，sra-aspera这三列，然后点击Down report的TSV格式，本地查看下载得到的filereport-read-run-SRR*-tsv.txt文件，会看到ftp地址，这个地址是ascp下载必须地址。

2.Linux里下载
这里的数据不是本次分析的数据，是为了举例说明ascp的使用，如采用此种办法，需要去寻找ftp地址，然后替换掉命令里的地址就可以。

mkdir SRX532741_sra/
screen
ascp -v -QT -l 400m -P33001 -k1 -i /root/.aspera/connect/etc/asperaweb_id_dsa.openssh --mode recv --host fasp.sra.ebi.ac.uk --user era-fasp --file-list ENA_SRX5327410_sra_aspera.txt /data/SRX5327410_sra/ 

#这里的root/.aspera/connect/etc/asperaweb_id_dsa.openssh是自己该文件的路径
#/data/SRX5327410_sra/ 下载文件存储路径
#ENA_SRX5327410_sra_aspera.txt 若该文件在其他位置 必须是全路径
#-k1 断点续传
#-T 取消加密 否则有时候数据下载不了
#-l 设置最大传输速度 200~500m
#-Q 用于自适应流量控制 磁盘限制所需
#-i 提供私钥文件的地址 免密从SRA和ENA下载 此选项每次命令都需要加入 一般为~/.aspera/connect/etc/asperaweb_id_dsa.openssh（即-i参数后直接加此文件）
#-P 用于SSH身份验证的TCP端口 一般是33001
#--user 指定用户名 era-fasp是aspera在ENA下的用户名
#--host 跟的是固定下载地址asp.sra.ebi.ac.uk

prefetch下载

这里下载的数据是我分析所用的数据，一共有四个。

#下载单个文件
prefetch SRR1374921

#批量下载
mkdir data
cd data
touch data_download.sh
vim data_download.sh
#!/bin/bash
for i in 1 2 3 4
do
prefetch SRR137492${i}
done
#Esc : wq! 保存并退出编辑
chmod 777 data_download.sh
./data_download.sh

#fastq-dump下载 可直接得到fastq文件
fastq-dump --split-files SRR1374921.sra
fastq-dump --split-files SRR1374921 
fastq-dump --gzip --split-3 SRR1374921
#--split-spot: 将双端测序分为两份 但是都放在同一个文件中
#--split-files: 将双端测序分为两份 放在不同的文件 但是对于一方有而一方没有的reads直接丢弃
#--split-3: 将双端测序分为两份 放在不同的文件 但是对于一方有而一方没有的reads会单独放在一个文件夹里
#--gzip: 输出文件为gzip压缩格式

wget下载

这个就比较简单直接在NCBI官网的搜索框输入SRR1374921，可以看到该菌的目前研究以及进展，在最下面Runs点击SRR1374921，在跳转界面点击Data access，会看到一个网址，复制网址，然后wget跟网址就可以，不过这种下载速度比较慢，所以最好放在screen窗口运行。

2.2 参考基因组及其注释

参考基因组下载
常用的三大网站：

NCBI
UCSC
Ensemble

#UCSC官网下载小鼠参考基因组文件 mm39.fa 最后生成fai文件 sam转bam时用
#gencode官网下载小鼠基因组注释文件 gtf文件
#下载索引

cd ../
mkdir genome
cd genome
wget https://hgdownload.soe.ucsc.edu/goldenPath/mm39/bigZips/mm39.fa.gz #参考基因组文件
wget https://ftp.ebi.ac.uk/pub/databases/gencode/Gencode_mouse/release_M31/gencode.vM31.annotation.gtf.gz #基因组注释文件
wget https://cloud.biohpc.swmed.edu/index.php/s/grcm38_tran #索引文件
gunzip mm39.fa.gz
gunzip gencode.vM31.annotation.gtf.gz
tar -zxvf grcm38_tran.tar.gz

参考基因组文件：测序得到的是几百bp的短read，相当于把拼图打散了给你。如果没有参考基因组，从头(de novo)组装等于是重走人类基因组计划的老路，也就是打散了拼图，却不告诉你原来是什么样子，那么任务将会及其艰巨，所以需要用到参考基因组。
基因组注释文件：相当于基因的说明书，告诉哪些是编码蛋白的基因，哪些是非编码基因，外显子，内含子，UTR位置等等，上面的三个网站都有注释文件，常用的是gencode数据库下载，在数据框选择小鼠复制对应版本的网址然后用wget下载。

参考文章:
https://www.jianshu.com/p/3e545b9a3c68
https://www.jianshu.com/p/849f8ada0ab7

3 sra到fastq格式转换并进行质量控制

3.1 格式转换

利用samtools中的fastq-dump将sra转换为fastq，fastq-dump中间没有空格，具体用法参考官网: https://trace.ncbi.nlm.nih.gov/Traces/sra/sra.cgi?view=toolkit_doc&f=fastq-dump

cd data #切换到数据存放的目录
touch fastq_dump.sh
vim fastq_dump.sh
#!/bin/bash
for i in 1 2 3 4
do
echo SRR137492${i} #打印输出文件名
fastq-dump --gzip SRR137492${i}/SRR137492${i}.sra
#可根据数据需要选择--spilt-files/--spilt-3/--spilt-spot
done
#Esc : wq! 保存并退出
chmod 777 fastq_dump.sh
screen
./fastq_dump.sh

3.2 质量控制

我选择的是fastp质控，也可以选择fastqc质控，再用multiQC批量查看质控结果，fastqc的操作可以看着一篇: https://www.jianshu.com/p/facb4a1e5927

touch fastp.sh
vim fastp.sh
#!/bin/bash
for i in 1 2 3 4
do
fastp -i SRR137492${i}.fastq.gz -o SRR137492${i}.fq.gz
done
#Esc : wq! 保存并退出
chmod 777 fastp.sh
screen
./fastp.sh

#结果只看到一个fastp.html文件，可能前面的几个被覆盖了，可以设置参数解决
# -h --html 设置输出 html 格式的质控结果文件名 不设置则默认 html 文件名为 fastp.html 
# -j --json 设置输出 html 格式的质控结果文件名 不设置则默认 json 文件名为 fastp.json

这里直接看最后一个质控结果，能够看到过滤前后的一些数据，也可以直观地看出很多指标，如过滤前后的 reads 数、bases 数、碱基质量、插入片段长度、碱基组成、GC 含量、接头类别等，具体意义可参考链接: https://blog.csdn.net/twocanis/article/details/109681242

4 序列比对 Hisat2

序列比对有很多软件，bwa，bowtie2，hisat2等，这里选择了hisat2，可以在这几篇文章找寻答案:
https://www.jianshu.com/p/681e02e7f9af
https://zhuanlan.zhihu.com/p/26506787
https://www.jianshu.com/p/849f8ada0ab7

#在data目录下
samtools faidx mm39.fa
touch hisat2_samtools.sh
vim  hisat2_samtools.sh
#!/bin/bash
for i in 1 2 3 4;do
{
hisat2 -t -x /disk1/202031107010114/RNAseq/genome_index/mm10/genome -U /disk1/202031107010114/RNAseq/data/SRR137492${i}.fq.gz -S SRR137492${i}.sam;
samtools view -bhS -t /disk1/202031107010114/RNAseq/genome/mm39.fa.fai -o SRR137492${i}.bam SRR137492${i}.sam;
samtools sort SRR137492${i}.bam -o SRR137492${i}.sorted.bam;
samtools index SRR137492${i}.sorted.bam;}
done
#Esc : wq! 保存并退出
chmod 777 hisat2_samtools.sh

hisat2使用方法

Usage:
  hisat2 [options]* -x  {-1  -2  | -U  | --sra-acc } [-S ]

    Index filename prefix (minus trailing .X.ht2).
         Files with #1 mates, paired with files in .
             Could be gzip'ed (extension: .gz) or bzip2'ed (extension: .bz2).
         Files with #2 mates, paired with files in .
             Could be gzip'ed (extension: .gz) or bzip2'ed (extension: .bz2).
          Files with unpaired reads.
             Could be gzip'ed (extension: .gz) or bzip2'ed (extension: .bz2).
          Comma-separated list of SRA accession numbers, e.g. --sra-acc SRR353653,SRR353654.
        File for SAM output (default: stdout)

  , ,  can be comma-separated lists (no whitespace) and can be
  specified many times.  E.g. '-U file1.fq,file2.fq -U file3.fq'.

-x ：参考基因组索引文件的前缀
-1 ：双端测序结果的第一个文件 若有多组数据 使用逗号将文件分隔 Reads的长度可以不一致
-2 ：双端测序结果的第二个文件 若有多组数据 使用逗号将文件分隔 并且文件顺序要和-1参数对应 Reads的长度可以不一致
-U ：单端数据文件 若有多组数据 使用逗号将文件分隔 可以和-1 -2参数同时使用 Reads的长度可以不一致 
–sra-acc ：输入SRA登录号 比如SRR353653 多组数据之间使用逗号分隔 HISAT将自动下载并识别数据类型 进行比对
-S ：指定输出的SAM文件

samtools用法
官方说明和使用手册见前面安装部分的链接，这里说明samtools功能和参数意义。

view: BAM-SAM/SAM-BAM 转换和提取部分比对
sort: 比对排序
merge: 聚合多个排序比对
index: 索引排序比对
faidx: 建立FASTA索引 提取部分序列
tview: 文本格式查看序列
pileup: 产生基于位置的结果和 consensus/indel calling

-b：output BAM默认输出是SAM文件格式文件 该参数设置输出BAM格式
-h：默认输出文件不带header 设置后但header信息
-S：输入文件是SAM 加上避免报错
-t：使用list文件作为输入

5 reads计数合并矩阵并进行注释

5.1 reads计数

# 首先将bam文件按reads名称进行排序(前期是按照默认的染色体位置进行排序的，所以要重新进行排序)
for i in 1 2 3 4;do samtools sort -n SRR137492${i}.bam -o SRR137492${i}.nsorted.bam;done
# htseq-count计数 用的是前面在genome里下载的注释文件 得到count文件
for i in 1 2 3 4;do htseq-count -r name -f bam /disk1/202031107010114/RNAseq/data/SRR137492${i}.nsorted.bam /disk1/202031107010114/RNAseq/genome_index/gencode.vM31.annotation.gtf > SRR137492${i}.count;done 
# 计数
wc -l *.count
# 查看前几行和后几行
head -n 4 *.count
tail -n 4 *.count

5.2 合并矩阵并进行注释

做到这里前面已经完成了大部分啦，最煎熬地等待命令运行的过程也过去了，后面的操作基本都是在R中完成了，将上一步得到的四个count文件下载到本地，最好是直接放在RStudio的工作路径下，这样就不用专门再加绝对路径。

合并矩阵

#合并表达矩阵并进行注释(miomart)

#不需要变成因子
options(stringsAsFactors=FALSE)

#导入数据设置分隔符行名 设置分割符是\t 行名是gene.id和实验对应名称
LoGlu_Rep1<-read.table("D:/Users/hemiao/Desktop/shiyan/SRR1374921.count",sep="\t",col.names=c("gene_id","LoGlu_Rep1"))
head(control1)
LoGlu_Rep2<-read.table("D:/Users/hemiao/Desktop/shiyan/SRR1374922.count",sep="\t",col.names=c("gene_id","LoGlu_Rep2"))
HiGlu_Rep1<-read.table("D:/Users/hemiao/Desktop/shiyan/SRR1374923.count",sep="\t",col.names=c("gene_id","HiGlu_Rep1"))
HiGlu_Rep2<-read.table("D:/Users/hemiao/Desktop/shiyan/SRR1374924.count",sep="\t",col.names=c("gene_id","HiGlu_Rep2"))

#数据整合 merge函数 以gene_id将四组数据合并到一起
raw_count<-merge(merge(LoGlu_Rep1,LoGlu_Rep2,by="gene_id"),merge(HiGlu_Rep1,HiGlu_Rep2,by="gene_id"))

#删除前五行无关的 删除之前先查看一下是哪几行
raw_count_filt<-raw_count[-1:-5,]

#EBI数据库无法识别到小数点后的 所以需要把小数点后的替换为空 使其成为整数
#gsub函数将小数点后的替换为空后赋值给ENSEMBL
ENSEMBL<-gsub("\\.\\d*","",raw_count_filt$gene_id)

#将ENSEMBL重新添加到raw_count_filt矩阵 因为只是加了进去 并不是以矩阵的形式 所以加之后raw_count_filt的第一列依旧有小数点 
row.names(raw_count_filt)<-ENSEMBL

#合并矩阵ENSEMBL和raw_count_filt 合并后看起来有七列 实则只有六列 最前面的一列是前面的步骤直接加进去的
raw_count_filt1<-cbind(ENSEMBL,raw_count_filt)
colnames(raw_count_filt1)<-c("ensembl_gene_id","gene_id","LoGlu_Rep1","LoGlu_Rep2","HiGlu_Rep1","HiGlu_Rep2")

注释

#对基因进行注释获取gene_symbol
#用bioMart对ensembl_id转换成gene_symbol

#安装以及载入包
install.packages('BiocManager')
BiocFileCache::install("biomaRt")
library('biomaRt')
library("curl")

#选择物种 mmusculus_gene_ensembl是老鼠 hsapiens_gene_ensembl是人
mart<-useDataset("mmusculus_gene_ensembl",useMart("ensembl"))

#待输入的基因ID是数据的行名
my_ensembl_gene_id<-row.names(raw_count_filt1)

提高连接时间
options(timeout=4000000)

#利用getBM函数获取gene_symbol 如果是小鼠用external_gene_name 人用hgnc_symbol
mms_symbols<-getBM(attributes=c('ensembl_gene_id',
                               'external_gene_name',
                               'chromosome_name',
                               'start_position',
                               'end_position',
                               'band'),
                  filters='ensembl_gene_id',
                  values=my_ensembl_gene_id,
                  mart=mart)

#将合并后的表达数据矩阵raw_count_filt1整合为一
readcount<-merge(raw_count_filt1,mms_symbols,by="ensembl_gene_id")

#网页版
#https://biodbnet-abcc.ncifcrf.gov/db/db2db.php 这个转换的不全 不知道原因
#https://www.biotools.fr/mouse/ensembl_symbol_converter 这个是全的 但是最后的一些数据没有
readcount<-read.table("D:/Users/hemiao/Desktop/shiyan/raw_count_filt.txt",sep="\t",header=TRUE)

#输出count文件
write.csv(readcount,file='readcount.csv')

查看readcount文件

6 DEseq2筛选差异表达基因并用bioMart注释

6.1 DEseq2筛选差异表达基因

开始之前需要准备两个矩阵：
countData表示的是count矩阵，行代表gene，列代表样品，中间的数字代表对应count数；
colData表示sample的元数据，因为这个表提供了sample的元数据。

#1载入数据(countData和colData)
install.packages("tidyverse")
BiocManager::install("DESeq2")
library(tidyverse)
library(DESeq2)

#读取readcount.csv文件 文件在当前工作路径 所以没有写绝对地址 mycounts没有gene_symbol这一列 只有四列
mycounts<-read.csv("readcount.csv")
head(mycounts)

#多了一个x需要去除 先把第一列当作行名来处理 此时x那一列数值是空 就可以删除 行不属于列
rownames(mycounts)<-mycounts[,1]
mycounts<-mycounts[,-1]
mycounts<-mycounts[,-1]

#condition是因子 不是样本名称 小鼠数据有对照和处理组 各两个
condition<-factor(c(rep("LoGlu_Rep",2),rep("HiGlu_Rep",2)),levels=c("LoGlu_Rep","HiGlu_Rep"))

#coldData也可以自己在excel做好在导入
colData<-data.frame(row.names=colnames(mycounts),condition)

#2构建dds对象 开始DESeq流程

#dds=DESeqDataSet Object并标准化 对原始数据进行normalize
dds<-DESeqDataSetFromMatrix(mycounts,colData,design=~condition)
#进行差异表达分析
dds<-DESeq(dds)
dds

#3总体结果查看

#查看treat versus control的总体结果 并根据p-value进行重新排序 利用summary命令统计显示一共多少个genes上调和下调(FDR0.1)
#contrast参数有三个元素时依次代表数据中作为treat/control标签的列的名称 fold change的分子 以及fold change的分母 fold一般算的是treat/control(处理/控制)
res=results(dds,contrast=c("condition","LoGlu_Rep","HiGlu_Rep"))
res=res[order(res$pvalue),]
head(res)
summary(res)

#4提取差异表达基因(DEGs)并进行gene symbol注释

#查看符合阈值的差异基因有多少个 获取padj(p值经过多重校验校正后的值)小于0.05 表达倍数取以2为对数后大于1或者小于-1的差异表达基因
diff_gene_deseq2<-subset(res,padj<0.05&abs(log2FoldChange)>1)
diff_gene_deseq2<-subset(res,padj<0.05&(log2FoldChange>1|log2FoldChange<1))

#展示diff_gene_deseq2的维度和前几列
dim(diff_gene_deseq2)
head(diff_gene_deseq2)
write.csv(diff_gene_deseq2,file="DEG_treat_vs_control.csv")

查看mycounts和colData

查看dds
能够看到dds的类型，维度，行名，colnames等等。

查看res
能够看到每个基因的pvalue,padj等信息，在summary中得知上调基因471个，下调基因468个，没有离群值。

查看diff_gene_seq2

6.2 用bioMart对差异表达基因进行注释

#5用bioMart对差异表达基因进行注释
library('biomaRt')
library("curl")
mart <- useDataset("mmusculus_gene_ensembl", useMart("ensembl"))
my_ensembl_gene_id<-row.names(diff_gene_deseq2)
mms_symbol<- getBM(attributes=c('ensembl_gene_id','external_gene_name',"description"),
                    filters = 'ensembl_gene_id', values = my_ensembl_gene_id, mart = mart)
head(mms_symbol)

#6合并数据 res结果和mms_symbol合并成一个文件
#查看数据后两个文件没有相同的列名 所以要给diff_gene_deseq2添加一个ensembl_gene_id的列名
#cbind增加新属性 也就是增加列 把原本的行名变成了列名
ensembl_gene_id<-rownames(diff_gene_deseq2)
diff_gene_deseq2<-cbind(ensembl_gene_id,diff_gene_deseq2)
colnames(diff_gene_deseq2)[1]<-c("ensembl_gene_id")
diff_name<-merge(diff_gene_deseq2,mms_symbol,by="ensembl_gene_id")

查看mms_symbol
mms_symbol和mms_symbols行名都是ensembl_gene_id，展示的内容不一样，前者的数据是后者的子集，经过padj筛选的。
注释后得到了每个ensembl_gene_id对应的gene_symbol也就是external_gene_name.

7 数据可视化绘图

7.1 MA图

#没有经过statistical moderation平缓log2 fold changes的情况
#padj越小表达量越高
plotMA(res,ylim=c(-2,2))
topGene <- rownames(res)[which.min(res$padj)]
with(res[topGene, ], {
  points(baseMean, log2FoldChange, col="dodgerblue", cex=6, lwd=2)
  text(baseMean, log2FoldChange, topGene, pos=2, col="dodgerblue")
})

#经过lfcShrink收缩log2 fold change
#前面res结果已经按padj排序了 所以这次要按照行名升序再排列回来 否则和dds不一致
res_order<-res[order(row.names(res)),]
res = res_order
res.shrink <- lfcShrink(dds, contrast = c("condition","LoGlu_Rep","HiGlu_Rep"), res=res)
plotMA(res.shrink,ylim=c(-5,5))

#但结果提示Error in lfcShrink(dds, contrast = c("condition", "treat", "control"),  :   type='apeglm' shrinkage only for use with 'coef' 目前不确定原因 采取了下面的方式

#以apeglm包中的收缩估计量 成功
resApe <-lfcShrink(dds, coef=2,type="apeglm")
plotMA(resApe, ylim = c(-5,5),main="apeglm")

#以DESeq包中默认收缩估计值也成功 但是和Ape没什么区别
resLFC <- lfcShrink(dds, coef=2)
plotMA(resLFC, ylim = c(-5,5),main="normal")
topGene <- rownames(res)[which.min(res$padj)]
with(res[topGene, ], {
  points(baseMean, log2FoldChange, col="dodgerblue", cex=2, lwd=2)
  text(baseMean, log2FoldChange, topGene, pos=2, col="dodgerblue")
})

#比较三种收缩方式 Ash有差别
resApe <-lfcShrink(dds, coef=2,type="apeglm")
resAsh <-lfcShrink(dds, coef=2,type="ashr")
par(mfrow=c(1,3), mar=c(4,4,2,1))
xlim <- c(1,1e5); ylim<-c(-3,3)
plotMA(resLFC, xlim=xlim, ylim=ylim, main="normal")
plotMA(resApe, xlim=xlim, ylim=ylim, main="apeglm")
plotMA(resAsh, xlim=xlim, ylim=ylim, main="ashr")
par(opar)

查看MA图
MA 图可以用于展示数据表达是否异常的。MA 图上，一般是上下对称，离散的基因一般就是上调或者下调的基因，我觉得这个和看火山图很像。但是相较于火山图，用 MA判断整个数据的表达会更好，MA 图上，左侧大右侧小，某一个组织，某一个时期，少数基因高表达，多数基因低表达。这张图上，灰色的是正常表达基因，上方的蓝色是表达上调的基因，下方的蓝色是表达下调的基因。

7.2 Plot counts

#DESeq2提供了一个plotCounts()函数来查看某一个感兴趣的gene在组间的差别 counts会根据groups分组

#不画图 只显示数据
plotCounts(dds, gene=which.min(res$padj), intgroup="condition", returnData=TRUE)
#只画图 不显示数据
plotCounts(dds, gene="ENSMUSG00000120788", intgroup="condition", returnData=FALSE)

7.3 PCA

vsdata<-vst(dds, blind=FALSE)
plotPCA(vsdata, intgroup="condition")

7.4 热图

更多使用方法可参考: https://blog.csdn.net/qq_35294674/article/details/122112145

library("pheatmap")
select<-order(rowMeans(counts(dds, normalized = TRUE)),
              decreasing = TRUE)[1:20]
df <- as.data.frame(colData(dds)[,c("condition","sizeFactor")])

ntd <- normTransform(dds)

pheatmap(assay(ntd)[select,], cluster_rows=FALSE, show_rownames=FALSE,
         cluster_cols=FALSE, annotation_col=df)

7.5 火山图

具体使用方法可参考: https://blog.csdn.net/qazplm12_3/article/details/93330560

BiocManager::install("EnhancedVolcano")
library(EnhancedVolcano)
EnhancedVolcano(res,
                lab = rownames(res),
                x = 'log2FoldChange',
                y = 'pvalue',
                xlim = c(-8, 8),
                title = 'LoGlu_Rep versus HiGlu_Rep',
                pCutoff = 10e-16,
                FCcutoff = 1.5,
                col=c('black','blue','green','red1'),
                colAlpha=1,
                )

8 富集分析功能注释

9 KEGG通路可视化

以上大部分参考这一篇文章: https://www.jianshu.com/p/e8cd62ba14fe

你可能感兴趣的:(实操练习,python,linux,开发语言)

Linux 的解压命令第七原色
解压tar–xvffile.tar解压tar包tar-xzvffile.tar.gz解压tar.gztar-xjvffile.tar.bz2解压tar.bz2tar–xZvffile.tar.Z解压tar.Zunrarefile.rar解压rarunzipfile.zip解压zip
python里class转换_python实现class对象转换成json/字典的方法八决子 python里class转换
python实现class对象转换成json/字典的方法发布于2016-03-2808:05:44|153次阅读|评论:0|来源:网友投递Python编程语言Python是一种面向对象、解释型计算机程序设计语言，由GuidovanRossum于1989年底发明，第一个公开发行版发行于1991年。Python语法简洁而清晰，具有丰富和强大的类库。它常被昵称为胶水语言，它能够把用其他语言制作的各种模块
Linux下防御DDOS攻击的操作梳理寰宇001
DDOS介绍DDOS的全称是DistributedDenialofService，即"分布式拒绝服务攻击"，是指击者利用大量“肉鸡”对攻击目标发动大量的正常或非正常请求、耗尽目标主机资源或网络资源，从而使被攻击的主机不能为合法用户提供服务。DDOS攻击的本质是：利用木桶原理，寻找利用系统应用的瓶颈；阻塞和耗尽；当前问题：用户的带宽小于攻击的规模，噪声访问带宽成为木桶的短板。可以参考下面的例子理解下
粘的ScalersTalk第七轮新概念朗读持续力训练Day 76 211229 粘_NIAN
练习材料：Lesson76AprilFoolsDay'Toendourspecialnewsbulletin,'saidthevoiceofthetelevisionannouncer,'wearegoingovertothemacaronifieldsofCalabria.Macaronihasbeengrowninthisareaforoversixhundredyears.Twoofthel
【深度学习】softmax 回归的从零开始实现与简洁实现 Douglassssssss 深度学习深度学习回归人工智能 softmax回归交叉熵损失函数
前言小时候听过一个小孩练琴的故事，老师让他先弹最简单的第一小节，小孩练了两天后弹不出。接着，老师让他直接去练更难的第二小节，小孩练习了几天后还是弹不出，开始感觉到挫败和烦躁了。小孩以为老师之后会让他从简单的开始练，谁知老师直接让他开始练最难的一小节。小孩不干了，问老师是不是故意刁难他。老师笑笑，让他现在弹弹第一小节试试。神奇的是，小孩竟然发现自己已经能完整弹出来了。这有点像我现在的学习状况，前些天
uni-app跨平台开发知识点总结
uni-app简介uni-app概述：uni-app是一个使用Vue.js开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序（微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝）、快应用等多个平台。uni-app由来：是为了解决跨平台开发的问题。在移动应用开发中，不同平台（如iOS、Android）有不同的开发语言和技术栈，这导致开发者
解密 Python 的 MRO：C3 线性化如何优雅解决多重继承的菱形难题》
《解密Python的MRO：C3线性化如何优雅解决多重继承的菱形难题》引言：继承的优雅与复杂在Python的面向对象编程中，继承是一种强大的机制，它让我们能够复用代码、构建抽象层次、实现多态行为。然而，当我们引入多重继承时，继承体系的复杂性也随之而来，尤其是著名的“菱形继承问题”。Python通过一种称为C3线性化（C3Linearization）的算法来解决方法解析顺序（MethodResolu
《深入理解 Python 的对象构造机制：__new__ 与 __init__ 的本质区别与实战应用》清水白石008 开发语言学习笔记课程教程 python 开发语言
《深入理解Python的对象构造机制：new与init的本质区别与实战应用》引言：对象的诞生之谜在Python的面向对象编程中，我们习惯于使用__init__方法来初始化对象。但你是否曾注意到，还有一个鲜为人知却至关重要的魔法方法——__new__？它是对象构造过程的起点，掌控着类实例的真正创建。理解__new__与__init__的区别，不仅能帮助你掌握Python的对象模型，还能在构建不可变类
HoRain云--Docker容器迁移全攻略：4种方法详解与实战避坑指南 HoRain云小助手 arm开发
HoRain云小助手：个人主页个人专栏:《Linux系列教程》《c语言教程》⛺️生活的理想，就是为了理想的生活!⛳️推荐前些天发现了一个超棒的服务器购买网站，性价比超高，大内存超划算！忍不住分享一下给大家。点击跳转到网站。专栏介绍专栏名称专栏介绍《C语言》本专栏主要撰写C干货内容和编程技巧，让大家从底层了解C，把更多的知识由抽象到简单通俗易懂。《网络协议》本专栏主要是注重从底层来给大家一步步剖析网
Linux测速脚本 ljwheyxy
Linux服务器测速脚本：第一步：wgethttps://raw.githubusercontent.com/sivel/speedtest-cli/master/speedtest.py第二步：chmoda+rxspeedtest.py第三步：sudomvspeedtest.py/usr/local/bin/speedtest第四步：sudochownroot:root/usr/local/bi
Day9: OpenCV学习（一）—— 图像基础
系列文章目录上一篇：Day8：Python工程化——模块、包文章目录系列文章目录前言一、安装和导入1.安装二、图像认识1.图像2.图像分类三、基础图像操作1.图像读取2.图像显示3.图像裁剪4.图形尺寸修改5.图像保存6.图像绘制7.视频捕获即显示总结前言OpenCV（OpenSourceComputerVisionLibrary）是一个开源的计算机视觉和机器学习软件库。由一系列C++类和函数构成
python基础语法复习04——函数洛华363 python python
python基础语法目录python基础语法01——基本类型python基础语法02——复合类型python基础语法03——语句构成文章目录python基础语法目录一、初识函数1.定义2.调用二、函数的传参1.位置传参2.关键词传参3.参数默认值4.可变位置参数5.可变关键词参数6.参数解包7.值传递与引用传递总结一、初识函数函数是Python中可重复使用的代码块，用于执行特定任务。通过将代码封装
ubuntu18.04安装geemap 阿西是有梦想的咸鱼 python编程之路遥感影像处理可视化可视化 python ubuntu
文章目录安装测试GEE提供了JavaScript和PythonAPI，可以向EarthEngine服务器发出计算请求。与GEEJavaScriptAPI相比，PythonAPI缺乏易于理解的操作文档和交互式可视化结果的功能。由此，geemap诞生并填补了这一空白[1]。这里给大家介绍下我折腾了一晚上才搞定的geemap的安装及测试过程。这里是geemap的GitHub参考链接。安装如Github中
python进行geeMap环境安装箭梭_ python
近期需要利用geemap搭建一个界面，试了一下相应环境的配置，踏了挺多坑，下面我给大家具体介绍一下geemap的环境搭建：（1）geemap是基于googleearthengine的接口进行开发的，在安装geemap之前，需要先进行earthengie包的安装，参考链接如下：https://zhuanlan.zhihu.com/p/29186942#comment-549701602?notifi
Ubuntu的apt、apt-get和snap闲聊（2025年3月28日）
为什么Ubuntu中有了APT、APT-GET还要加上Snap？在Ubuntu系统中，软件管理工具的多样性（如APT、APT-GET和Snap）常常让人疑惑：既然已经有了成熟的APT和APT-GET，为什么还要引入Snap？本文将从不同角度解析这一问题，探讨Snap的独特价值及其与传统工具的共存意义。这份笔记适用于Linux用户、开发者以及对软件生态感兴趣的读者，内容将随技术演进保持更新。QA：解
API开发全攻略：从入门到精通的企业级API架构与实战 Android洋芋架构 API设计 RESTful API 微服务架构实战案例
简介API开发已成为现代软件架构的核心能力，掌握API设计与实现技术能显著提升开发效率和系统可扩展性。本文将从零开始，全面解析API的基础概念、架构设计、安全认证、性能优化等关键技术点，并提供完整的Python和Go语言代码实战示例，帮助开发者构建高性能、可扩展的企业级API系统。本文旨在为初学者和进阶开发者提供一份全面的API开发指南。内容涵盖API的基础概念、类型分类、架构设计、安全认证、性能
2023年NOC大赛创客智慧编程赛项Python 复赛模拟题（二）青少儿编程课堂少儿编程资料大全付费专栏 python numpy 开发语言 noc大赛真题 noc试题
题目来自：NOC大赛创客智慧编程赛项Python复赛模拟题(二)NOC大赛创客智慧编程赛项Python复赛模拟题（二）第一题：编写一个成绩评价系统，当输入语文、数学和英语三门课程成绩时，输出三门课程总成绩及其等级。(1)程序提示用户输入三个数字，数字分别表示语文、数学、英语分数，对应的变量名称是Chinese、Math、English,并计算三个分数的和(score)进行输出。注：input()函
【RS】GEE(Python)：大规模分析与导出数据
在前面的章节中，我们探讨了如何在GoogleEarthEngine(GEE)上进行数据加载、处理、分析和可视化。现在，我们将进一步扩展，探索如何处理大规模的数据集和执行复杂的分析任务。通过GEE的云计算能力，用户可以在全球范围内执行大规模的时空分析，并高效地将处理结果导出为所需的格式。大规模分析的基本原则在GEE中，大规模分析是通过ImageCollection和FeatureCollection
【Python篇】Python基础——08day.面向对象编程中类和对象的基本概念及属性和方法的常见分类和使用场景 WXX_s python基础篇 python 分类开发语言学习
目录前言一、类和对象1.类→Class1.1概念1.2创建2.对象→Object2.1概念2.2创建二、属性和方法1.实例属性2.实例方法3.类属性4.类方法5.静态方法5.1综合应用6.构造方法7.初始化方法8.魔术方法8.1常用方法8.2案例参考总结前言这章讲的面向对象编程（Object-OrientedProgramming，简称OOP）是一种通过组织对象来设计程序的编程方法。为什么需要类和
【Python篇】Python基础——04day.Python中运算（简单部分，如果会的可以直接跳过）
文章目录前言一.运算符1.1算术运算符1.2比较运算符1.3逻辑运算符1.4赋值运算符1.5位运算符1.6身份运算符1.7成员运算符1.8三目运算符1.9优先级二.表达式2.1算术表达式2.2比较表达式2.3逻辑表达式2.4赋值表达式2.5成员表达式2.6身份表达式2.7三元表达式2.8函数调用表达式三.推导式3.1列表推导式3.2字典推导式3.3集合推导式总结前言这一章写的是在python中会用
太棒了！8月最美的“熟女感穿搭”赏析在此：基本款式真给力！泰安秋子
夏末秋初，早晚的凉爽与正午时分的艳阳高照相互交替，形成了尴尬的时间段：穿的太多，中午就显得闷热难当；而少穿一点，一早一晚的时刻又难以抵挡住略带寒意的秋风……在这个温度高低不定的时节里，中年女性如何顺应着气温来进行穿搭，成为了每日必须思考的难题！如果，你正为此而烦恼的话，不妨参考一下下面时尚博主们的换季穿搭示范，我们可以借鉴她们的搭配实操，帮助自己轻松打造好衣品。一般情况下，女人过了40岁之后，身材
Python 现代时间序列预测第二版（五）绝不原创的飞龙默认分类默认分类
原文：annas-archive.org/md5/22eab741fce9c15dfad894ecf37bdd51译者：飞龙协议：CCBY-NC-SA4.0第十七章：概率预测及更多在整本书中，我们学习了生成预测的不同技术，包括一些经典方法，使用机器学习以及一些深度学习架构。但我们一直在关注一种典型的预测问题——为连续时间序列生成点预测，并且没有层级关系且历史数据足够丰富。我们之所以这样做，是因为这
linux内核驱动第一课（基于RK3568)
学习Linux驱动需要以下基础知识：C语言编程：掌握C语言是开发Linux驱动程序的基本要求。操作系统原理：了解操作系统的基本概念和原理，如进程管理、内存管理、中断处理等。Linux内核：熟悉Linux内核的结构和工作机制，了解内核模块的编写和加载方法。硬件知识：了解目标硬件平台的基本结构和工作原理。（学习过stm32更佳）学习路径1、搭建环境（交叉编译，VIM,tftp，nfs，下载工具）2、驱
linux正则提取字符串,正则表达式 – shell脚本如何使用正则表达式提取字符串... weixin_39747577 linux正则提取字符串
使用bashregularexpressions：re="http://([^/]+)/"if[[$name=~$re]];thenecho${BASH_REMATCH[1]};fi编辑–OP要求解释语法。Regularexpressionsyntax是一个很大的话题，我无法在这里全面解释，但我会尝试解释足够的理解这个例子。re="http://([^/]+)/"这是存储在bash变量中的正则表达
linux git 命令补全,linux命令自动补全工具bash-completion，自动补全git、Docker、kubenetes等命令...
什么是命令自动补全在Linux命令行中，当输入字符后，按Tab键，Shell就会列出以这些字符开头的所有可用命令，如果只有一个命令匹配到，按一次Tab键就自动将这个命令补全。如果输入pass，此时按Tab键，因为以pass开头的命令只有passwd这个命令，Shell就会自动补全passwd命令。另外如果输入的字符匹配多个命令则会列出所有可用的命令，比如，如果输入do，此时按Tab键Shell就会
bash-completion使linux下命令自动补全
有时我们会遇到较长的linux命令,难以记住例如centos8的nmcli命令,不同于centos7的systemd重启网卡即可,命令冗长.这时就轮到bash-completion登场了bash-completion这个包可以帮我们快速补全linux命令安装并生效[root@vm1~]#dnf-yinstallbash-completion#安装包[root@vm1~]#source/etc/pr
自动化测试中，测试数据如何管理？鱼鱼说测试 java linux 服务器
今晚在某个测试群，看到有人问了一个问题：把测试数据放配置文件读取和放文件通过函数调用读取有什么区别？Python接口自动化测试零基础入门到精通（2025最新版）当时我下意识的这么回答：数据量越大，配置文件越臃肿，放在专门的数据文件（比如excel，csv），方便针对性的维护。乍看没毛病，但回头和人讨论这个问题的时候，就认真思考了一下这个问题，下面是我的一些思考和讨论的一些结果，仅供参考。。。自动化
基于selenium的pyse自动化测试框架鱼鱼说测试 selenium 测试工具
Python接口自动化测试零基础入门到精通（2025最新版）介绍：pyse基于selenium（webdriver）进行了简单的二次封装，比selenium所提供的方法操作更简洁。特点：默认使用CSS定位，同时支持多种定位方法（id\name\class\link_text\xpath\css）。本框架只是对selenium（webdriver）原生方法进行了简单的封装，精简为大约30个方法，这些
自动化测试准备鱼鱼说测试自动化测试
什么是自动化测？Python接口自动化测试零基础入门到精通（2025最新版）首先理清自动化测试的概念，广义上来讲，自动化包括一切通过工具（程序）的方式来代替或辅助手工测试的行为都可以看做自动化，包括性能测试工具（loadrunner、jmeter）,或自己所写的一段程序，用于生成1到100个测试数据。狭义上来讲，通工具记录或编写脚本的方式模拟手工测试的过程，通过回放或运行脚本来执行测试用例，从而代
重塑未来：AI如何重新定义全栈开发熊猫钓鱼>_> 人工智能
在传统认知中，全栈开发者被誉为技术界的“全能选手”。——他们需要精通前端界面构建（HTML/CSS/JavaScript）、后端业务逻辑实现（Python/Java/Node.js）、数据库设计优化（MySQL/MongoDB）以及服务器部署运维（Linux/Docker）。这种“一人包打天下”的能力模型长期被视为高效开发的黄金标准，尤其受到创业公司和小型团队的青睐，因为它能大幅减少沟通成本，加速
VMware Workstation 11 或者 VMware Player 7安装MAC OS X 10.10 Yosemite iwindyforest vmware mac os 10.10 workstation player
最近尝试了下VMware下安装MacOS 系统，安装过程中发现网上可供参考的文章都是VMware Workstation 10以下， MacOS X 10.9以下的文章，只能提供大概的思路，但是实际安装起来由于版本问题，走了不少弯路，所以我尝试写以下总结，希望能给有兴趣安装OSX的人提供一点帮助。写在前面的话：其实安装好后发现，由于我的th
关于《基于模型驱动的B/S在线开发平台》源代码开源的疑虑？ deathwknight JavaScript java 框架
本人从学习Java开发到现在已有10年整，从一个要自学 java买成javascript的小菜鸟，成长为只会java和javascript语言的老菜鸟（个人邮箱：[email protected]）一路走来，跌跌撞撞。用自己的三年多业余时间，瞎搞一个小东西（基于模型驱动的B/S在线开发平台，非MVC框架、非代码生成）。希望与大家一起分享，同时有许些疑虑，希望有人可以交流下平台
如何把maven项目转成web项目 Kai_Ge maven MyEclipse
创建Web工程，使用eclipse ee创建maven web工程 1.右键项目,选择Project Facets,点击Convert to faceted from 2.更改Dynamic Web Module的Version为2.5.(3.0为Java7的,Tomcat6不支持). 如果提示错误,可能需要在Java Compiler设置Compiler compl
主管？？？ Array_06 工作
转载：http://www.blogjava.net/fastzch/archive/2010/11/25/339054.html 很久以前跟同事参加的培训，同事整理得很详细，必须得转！前段时间，公司有组织中高阶主管及其培养干部进行了为期三天的管理训练培训。三天的课程下来，虽然内容较多，因对老师三天来的课程内容深有感触，故借着整理学习心得的机会，将三天来的培训课程做了一个
python内置函数大全 2002wmj python
最近一直在看python的document，打算在基础方面重点看一下python的keyword、Build-in Function、Build-in Constants、Build-in Types、Build-in Exception这四个方面，其实在看的时候发现整个《The Python Standard Library》章节都是很不错的，其中描述了很多不错的主题。先把Build-in Fu
JSP页面通过JQUERY合并行 357029540 JavaScript jquery
在写程序的过程中我们难免会遇到在页面上合并单元行的情况，如图所示如果对于会的同学可能很简单，但是对没有思路的同学来说还是比较麻烦的，提供一下用JQUERY实现的参考代码 function mergeCell(){ var trs = $("#table tr"); &nb
Java基础冰天百华 java基础
学习函数式编程 package base; import java.text.DecimalFormat; public class Main { public static void main(String[] args) { // Integer a = 4; // Double aa = (double)a / 100000; // Decimal
unix时间戳相互转换 adminjun 转换 unix 时间戳
如何在不同编程语言中获取现在的Unix时间戳(Unix timestamp)？ Java time JavaScript Math.round(new Date().getTime()/1000) getTime()返回数值的单位是毫秒 Microsoft .NET / C# epoch = (DateTime.Now.ToUniversalTime().Ticks - 62135
作为一个合格程序员该做的事 aijuans 程序员
作为一个合格程序员每天该做的事 1、总结自己一天任务的完成情况最好的方式是写工作日志，把自己今天完成了什么事情，遇见了什么问题都记录下来，日后翻看好处多多 2、考虑自己明天应该做的主要工作把明天要做的事情列出来，并按照优先级排列，第二天应该把自己效率最高的时间分配给最重要的工作 3、考虑自己一天工作中失误的地方，并想出避免下一次再犯的方法出错不要紧，最重
由html5视频播放引发的总结 ayaoxinchao html5 视频 video
前言项目中存在视频播放的功能，前期设计是以flash播放器播放视频的。但是现在由于需要兼容苹果的设备，必须采用html5的方式来播放视频。我就出于兴趣对html5播放视频做了简单的了解，不了解不知道，水真是很深。本文所记录的知识一些浅尝辄止的知识，说起来很惭愧。视频结构本该直接介绍html5的<video>的，但鉴于本人对视频
解决httpclient访问自签名https报javax.net.ssl.SSLHandshakeException: sun.security.validat bewithme httpclient
如果你构建了一个https协议的站点，而此站点的安全证书并不是合法的第三方证书颁发机构所签发，那么你用httpclient去访问此站点会报如下错误 javax.net.ssl.SSLHandshakeException: sun.security.validator.ValidatorException: PKIX path bu
Jedis连接池的入门级使用 bijian1013 redis redis数据库 jedis
Jedis连接池操作步骤如下： a.获取Jedis实例需要从JedisPool中获取； b.用完Jedis实例需要返还给JedisPool； c.如果Jedis在使用过程中出错，则也需要还给JedisPool； packag
变与不变 bingyingao 不变变亲情永恒
变与不变周末骑车转到了五年前租住的小区，曾经最爱吃的西北面馆、江西水饺、手工拉面早已不在，各种店铺都换了好几茬，这些是变的。三年前还很流行的一款手机在今天看起来已经落后的不像样子。三年前还运行的好好的一家公司，今天也已经不复存在。一座座高楼拔地而起，
【Scala十】Scala核心四：集合框架之List bit1129 scala
Spark的RDD作为一个分布式不可变的数据集合，它提供的转换操作，很多是借鉴于Scala的集合框架提供的一些函数，因此，有必要对Scala的集合进行详细的了解 1. 泛型集合都是协变的，对于List而言，如果B是A的子类，那么List[B]也是List[A]的子类，即可以把List[B]的实例赋值给List[A]变量 2. 给变量赋值(注意val关键字，a，b
Nested Functions in C bookjovi c closure
Nested Functions 又称closure，属于functional language中的概念，一直以为C中是不支持closure的，现在看来我错了，不过C标准中是不支持的，而GCC支持。既然GCC支持了closure，那么 lexical scoping自然也支持了，同时在C中label也是可以在nested functions中自由跳转的
Java-Collections Framework学习与总结-WeakHashMap BrokenDreams Collections
总结这个类之前，首先看一下Java引用的相关知识。Java的引用分为四种：强引用、软引用、弱引用和虚引用。强引用：就是常见的代码中的引用，如Object o = new Object();存在强引用的对象不会被垃圾收集
读《研磨设计模式》-代码笔记-解释器模式-Interpret bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ package design.pattern; /* * 解释器（Interpreter）模式的意图是可以按照自己定义的组合规则集合来组合可执行对象 * * 代码示例实现XML里面1.读取单个元素的值 2.读取单个属性的值 * 多
After Effects操作&快捷键 cherishLC After Effects
1、快捷键官方文档中文版：https://helpx.adobe.com/cn/after-effects/using/keyboard-shortcuts-reference.html 英文版：https://helpx.adobe.com/after-effects/using/keyboard-shortcuts-reference.html 2、常用快捷键
Maven 常用命令 crabdave maven
Maven 常用命令 mvn archetype:generate mvn install mvn clean mvn clean complie mvn clean test mvn clean install mvn clean package mvn test mvn package mvn site mvn dependency:res
shell bad substitution daizj shell 脚本
#!/bin/sh /data/script/common/run_cmd.exp 192.168.13.168 "impala-shell -islave4 -q 'insert OVERWRITE table imeis.${tableName} select ${selectFields}, ds, fnv_hash(concat(cast(ds as string), im
Java SE 第二讲（原生数据类型 Primitive Data Type） dcj3sjt126com java
Java SE 第二讲： 1. Windows: notepad, editplus, ultraedit, gvim Linux: vi, vim, gedit 2. Java 中的数据类型分为两大类： 1）原生数据类型（Primitive Data Type） 2）引用类型（对象类型）（R
CGridView中实现批量删除 dcj3sjt126com PHP yii
1，CGridView中的columns添加 array( 'selectableRows' => 2, 'footer' => '<button type="button" onclick="GetCheckbox();" style=&
Java中泛型的各种使用 dyy_gusi java 泛型
Java中的泛型的使用：1.普通的泛型使用在使用类的时候后面的<>中的类型就是我们确定的类型。 public class MyClass1<T> {//此处定义的泛型是T private T var; public T getVar() { return var; } public void setVa
Web开发技术十年发展历程 gcq511120594 Web 浏览器数据挖掘
回顾web开发技术这十年发展历程： Ajax 03年的时候我上六年级，那时候网吧刚在小县城的角落萌生。传奇，大话西游第一代网游一时风靡。我抱着试一试的心态给了网吧老板两块钱想申请个号玩玩，然后接下来的一个小时我一直在，注，册，账，号。彼时网吧用的512k的带宽，注册的时候，填了一堆信息，提交，页面跳转，嘣，”您填写的信息有误，请重填”。然后跳转回注册页面，以此循环。我现在时常想，如果当时a
openSession()与getCurrentSession()区别： hetongfei java DAO Hibernate
来自 http://blog.csdn.net/dy511/article/details/6166134 1.getCurrentSession创建的session会和绑定到当前线程,而openSession不会。 2. getCurrentSession创建的线程会在事务回滚或事物提交后自动关闭,而openSession必须手动关闭。这里getCurrentSession本地事务(本地
第一章安装Nginx+Lua开发环境 jinnianshilongnian nginx lua openresty
首先我们选择使用OpenResty，其是由Nginx核心加很多第三方模块组成，其最大的亮点是默认集成了Lua开发环境，使得Nginx可以作为一个Web Server使用。借助于Nginx的事件驱动模型和非阻塞IO，可以实现高性能的Web应用程序。而且OpenResty提供了大量组件如Mysql、Redis、Memcached等等，使在Nginx上开发Web应用更方便更简单。目前在京东如实时价格、秒
HSQLDB In-Process方式访问内存数据库 liyonghui160com
HSQLDB一大特色就是能够在内存中建立数据库，当然它也能将这些内存数据库保存到文件中以便实现真正的持久化。先睹为快！下面是一个In-Process方式访问内存数据库的代码示例：下面代码需要引入hsqldb.jar包（hsqldb-2.2.8） import java.s
Java线程的5个使用技巧 pda158 java 数据结构
Java线程有哪些不太为人所知的技巧与用法？　　萝卜白菜各有所爱。像我就喜欢Java。学无止境，这也是我喜欢它的一个原因。日常工作中你所用到的工具，通常都有些你从来没有了解过的东西，比方说某个方法或者是一些有趣的用法。比如说线程。没错，就是线程。或者确切说是Thread这个类。当我们在构建高可扩展性系统的时候，通常会面临各种各样的并发编程的问题，不过我们现在所要讲的可能会略有不同。
开发资源大整合：编程语言篇——JavaScript（1） shoothao JavaScript
概述：本系列的资源整合来自于github中各个领域的大牛，来收藏你感兴趣的东西吧。程序包管理器管理javascript库并提供对这些库的快速使用与打包的服务。 Bower - 用于web的程序包管理。 component - 用于客户端的程序包管理，构建更好的web应用程序。 spm - 全新的静态的文件包管
避免使用终结函数 vahoa.ma java jvm C++
终结函数（finalizer）通常是不可预测的，常常也是很危险的，一般情况下不是必要的。使用终结函数会导致不稳定的行为、更差的性能，以及带来移植性问题。不要把终结函数当做C++中的析构函数（destructors）的对应物。我自己总结了一下这一条的综合性结论是这样的： 1）在涉及使用资源，使用完毕后要释放资源的情形下，首先要用一个显示的方