请你喝好果汁641

Samtools手册中文版

软件手册：Samtools 手册翻译
Samtools 是一个用于处理和分析 SAM（Sequence Alignment/Map）和 BAM（Binary Alignment/Map）格式文件的工具集。它提供了多种命令用于序列比对、格式转换、索引创建和统计分析等。

接下来我们翻译这一部分的命令说明：

常用 `samtools` 命令列表

好的，我们将这39条命令拆分为三部分进行说明，并为每个部分提供举例。

1. `添加或替换读取组信息`：

samtools addreplacerg -r 'ID:fish' -r 'LB:1334' -r 'SM:alpha' -o output.bam input.bam

解释：将读取组信息（ID、Library、Sample等）添加到 BAM 文件中。
示例：如果你有一个 BAM 文件 input.bam，想为其添加样本信息 alpha，并将结果保存为 output.bam，可以使用此命令。

2. 裁剪扩增子：

samtools ampliconclip -b bed.file input.bam

解释：基于 BED 文件中的位置信息，对 BAM 文件中的扩增子进行裁剪。
示例：将 input.bam 中的序列根据 bed.file 中定义的区域进行裁剪，生成更新后的 BAM 文件。

3. 生成扩增子统计数据：

samtools ampliconstats primers.bed in.bam

解释：根据引物 BED 文件，生成扩增子统计信息。
示例：通过 primers.bed 中定义的引物区域，统计 in.bam 文件中的数据，常用于分析扩增子测序数据。

4. `计算基因组覆盖范围`：

samtools bedcov aln.sorted.bam

解释：计算 BAM 文件中的覆盖范围。
示例：统计 aln.sorted.bam 中每个区域的读取覆盖数，用于了解基因组覆盖情况。

5. 校正 MD 标签：

samtools calmd in.sorted.bam ref.fasta

解释：基于参考基因组文件，更新或校正 BAM 文件中的 MD 标签。
示例：使用 ref.fasta 作为参考，修复或校正 in.sorted.bam 文件中的 MD 标签。

6. `连接 BAM 文件`：

samtools cat out.bam in1.bam in2.bam in3.bam

解释：将多个 BAM 文件合并为一个。
示例：将 in1.bam、in2.bam 和 in3.bam 合并为一个新的 BAM 文件 out.bam。

7. 按名称整理 BAM 文件：

samtools collate -o aln.name_collated.bam aln.sorted.bam

解释：按读取名称整理 BAM 文件中的读取序列。
示例：将 aln.sorted.bam 按读取名称进行整理，输出为 aln.name_collated.bam。

8. `生成共识序列`：

samtools consensus -o out.fasta in.bam

解释：从 BAM 文件生成共识序列。
示例：从 in.bam 文件中提取共识序列，并将其保存为 out.fasta。

9. `计算覆盖率`：

samtools coverage aln.sorted.bam

解释：计算 BAM 文件的覆盖率。
示例：统计 aln.sorted.bam 中的每个基因组区域的覆盖率。

10. 计算 CRAM 文件大小：

samtools cram-size -v -o out.size in.cram

解释：计算 CRAM 文件大小的摘要信息。
示例：生成 in.cram 文件的大小摘要，并输出为 out.size。

11. 去除插入位点的 BAM 文件：

samtools depad input.bam

解释：去除 BAM 文件中的插入位点，生成去插入位点的 BAM 文件。
示例：对 input.bam 进行处理，去除插入的位点信息。

12. `计算读取深度`：

samtools depth aln.sorted.bam

解释：计算 BAM 文件中每个位置的读取深度。
示例：统计 aln.sorted.bam 文件中每个位点的深度，常用于覆盖率分析。

13. 生成字典文件：

samtools dict -a GRCh38 -s "Homo sapiens" ref.fasta

解释：基于参考基因组文件生成序列字典文件。
示例：生成 ref.fasta 的字典文件，包含注释信息。

14. `生成参考基因组索引`：

samtools faidx ref.fasta

解释：对参考基因组文件进行索引，生成一个 .fai 文件，方便后续快速查找。
示例：为 ref.fasta 生成索引文件 ref.fasta.fai，便于快速检索序列。

15. 将 BAM 转换为 FASTA：

samtools fasta input.bam > output.fasta

解释：从 BAM 文件中提取序列，并将其转换为 FASTA 格式。
示例：将 input.bam 中的序列提取并保存为 output.fasta 文件。

16. 将 BAM 转换为 FASTQ：

samtools fastq input.bam > output.fastq

解释：从 BAM 文件中提取序列，并将其转换为 FASTQ 格式。
示例：将 input.bam 文件中的序列提取并保存为 output.fastq 文件。

17. `修复配对信息`：

samtools fixmate in.namesorted.sam out.bam

解释：修复 BAM 文件中成对读取的配对信息。
示例：对按名称排序的 SAM 文件 in.namesorted.sam 进行处理，修复配对信息并输出为 BAM 文件 out.bam。

18. 解释 FLAG 字段：

samtools flags PAIRED,UNMAP,MUNMAP

解释：解释 BAM 文件中的 FLAG 字段，将其转换为可读形式或数值形式。
示例：解释 PAIRED（成对读取）、UNMAP（未比对的读取）和 MUNMAP（下一个片段未比对）这些 FLAG 的含义。

19. 统计 FLAG 信息：

samtools flagstat aln.sorted.bam

解释：生成 BAM 文件中的 FLAG 字段的统计信息。
示例：统计 aln.sorted.bam 文件中每个 FLAG 的数量，如成对读取、未比对读取等。

20. 生成 FASTQ 索引：

samtools fqidx ref.fastq

解释：为 FASTQ 文件生成索引。
示例：为 ref.fastq 文件生成一个 .fai 索引文件，以便快速检索序列。

21. `打印 BAM 文件头`：

samtools head in.bam

解释：打印 BAM 文件的头部信息，通常包含文件的元数据信息。
示例：打印 in.bam 文件的头部信息，用于检查文件格式或验证元数据。

22. 获取 BAM 文件索引信息：

samtools idxstats aln.sorted.bam

解释：从 BAM 文件的索引中获取统计信息。
示例：打印 aln.sorted.bam 文件的索引统计信息，如参考序列的长度、映射读取的数量等。

23. 导入 FASTQ 文件：

samtools import input.fastq > output.bam

解释：将 FASTQ 文件转换为未比对的 BAM 文件。
示例：将 input.fastq 文件转换为 BAM 格式并保存为 output.bam。

24. 为 BAM 文件生成索引：

samtools index aln.sorted.bam

解释：为排序后的 BAM 文件生成索引，便于快速检索特定区域的读取。
示例：为 aln.sorted.bam 生成 .bai 索引文件，允许通过参考序列位置快速查找读取。

25. 标记重复读取：

samtools markdup in.algnsorted.bam out.bam

解释：在 BAM 文件中标记 PCR 或光学重复的读取。
示例：将 in.algnsorted.bam 文件中的重复读取标记，并将结果输出为 out.bam。

26. 合并 BAM 文件：

samtools merge out.bam in1.bam in2.bam in3.bam

解释：将多个 BAM 文件合并为一个文件。
示例：将 in1.bam、in2.bam 和 in3.bam 合并为一个 out.bam 文件，通常用于将多个样本数据合并。

27. 生成 pileup 文件：

samtools mpileup -f ref.fasta -r chr3:1,000-2,000 in1.bam in2.bam

解释：生成 pileup 格式的输出文件，显示指定区域内的每个碱基的覆盖情况。
示例：在 in1.bam 和 in2.bam 文件中生成参考序列 ref.fasta 的第3号染色体1,000到2,000碱基的 pileup 信息。

28. 处理相位信息：

samtools phase input.bam

解释：处理 BAM 文件中的相位信息，将成对读取的相位信息区分开。
示例：为 input.bam 文件中的成对读取处理相位信息，帮助确定各个片段的父母来源。

29. 快速检查文件完整性：

samtools quickcheck in1.bam in2.cram

解释：快速检查 BAM 或 CRAM 文件是否完整，是否包含有效的头部和 EOF。
示例：快速检查 in1.bam 和 in2.cram 是否包含有效的头部和结尾标记，以确认文件完整性。

30. 生成参考文件：

samtools reference -o ref.fa in.cram

解释：从 CRAM 文件中提取参考序列信息，生成一个参考基因组文件。
示例：从 in.cram 中提取参考序列，输出为 ref.fa。

31. 替换 BAM 文件头：

samtools reheader in.header.sam in.bam > out.bam

解释：用新的头部信息替换 BAM 文件的原始头部信息。
示例：用 in.header.sam 中的头部信息替换 in.bam 的头部，并将结果保存为 out.bam。

32. 重置 BAM 文件：

samtools reset -o /tmp/reset.bam processed.bam

解释：重置 BAM 文件，移除比对信息和标志，生成未比对的 BAM 文件。
示例：重置 processed.bam 中的比对信息，并将结果保存到 /tmp/reset.bam。

33. 列出样本信息：

samtools samples input.bam

解释：列出 BAM 文件中的样本信息。
示例：显示 input.bam 文件中的所有样本名称和相关信息。

34. 排序 BAM 文件：

samtools sort -T /tmp/aln.sorted -o aln.sorted.bam aln.bam

解释：对 BAM 文件按照左端坐标进行排序，并输出排序后的 BAM 文件。
示例：将 aln.bam 按照坐标排序，结果保存为 aln.sorted.bam，临时文件保存路径为 /tmp/aln.sorted。

35. 拆分 BAM 文件：

samtools split merged.bam

解释：根据读取组（Read Group）信息将 BAM 文件拆分成多个文件。
示例：将 merged.bam 文件按读取组信息拆分为多个 BAM 文件。

36. `统计 BAM 文件`：

samtools stats aln.sorted.bam

解释：生成 BAM 文件的统计数据，结果包括映射质量、读取长度分布等。
示例：生成 aln.sorted.bam 的统计信息，用于分析读取质量、覆盖率等。

37. 剪切目标区域：

samtools targetcut input.bam

解释：基于读取的覆盖连续性剪切 BAM 文件中的目标区域。
示例：对 input.bam 进行剪切，生成剪切后的 BAM 文件，适用于特定的克隆或扩增子测序数据。

38. 查看比对信息：

samtools tview aln.sorted.bam ref.fasta

解释：使用基于 ncurses 的文本查看器，显示 BAM 文件中的比对信息。
示例：在终端中查看 aln.sorted.bam 中比对到参考基因组 ref.fasta 的结果，交互式查看对齐情况。

39. `转换 SAM/BAM/CRAM 格式`：

samtools view -bt ref_list.txt -o aln.bam aln.sam.gz

解释：将 SAM、BAM 或 CRAM 文件转换为另一种格式，如 BAM 转 SAM，SAM 转 BAM。
示例：将 aln.sam.gz 转换为 BAM 格式 aln.bam，使用 ref_list.txt 文件作为参考。
好的，接下来是这段 DESCRIPTION（描述） 和 COMMANDS（命令） 部分的翻译。

DESCRIPTION（描述）

Samtools 是一组用于操作 SAM（序列比对/映射）、BAM 和 CRAM 格式文件的工具。它可以在这些格式之间进行转换，还能够对文件进行排序、合并和索引，并且能够快速检索任意区域的读取信息。

Samtools 被设计为流式处理工具，它将输入文件 - 视为标准输入（stdin），将输出文件 - 视为标准输出（stdout）。因此，多个命令可以通过 Unix 管道（pipes）组合使用。Samtools 始终将警告和错误消息输出到标准错误输出（stderr）。

Samtools 还可以打开远程 FTP 或 HTTP(S) 服务器上的文件（如果文件名以 ftp://、http:// 等开头）。Samtools 会在当前工作目录中查找索引文件，若索引文件不存在，则会自动下载索引文件。除非特别要求，Samtools 不会检索整个比对文件。

如果需要索引，Samtools 会寻找附加在文件名上的索引后缀（如 in.bam.bai），如果找不到，它会再次尝试使用没有文件名后缀的文件（如 in.bai）。不过，如果索引位于完全不同的位置或具有不同的名称，则数据文件名和索引文件名可以通过 ##idx## 语法组合在一起。例如，/data/in.bam##idx##/indices/in.bam.bai 可明确指定数据和索引文件的位置。

COMMANDS（命令）

每个命令都有单独的手册页面，可以通过如 man samtools-view 或使用较新的 GNU 手册页工具 man samtools view 来查看。以下是各子命令的简要语法和描述。

常见选项在**GLOBAL COMMAND OPTIONS（全局命令选项）**部分有说明。

`view`

samtools view [选项] in.sam|in.bam|in.cram [region...]

如果未指定选项或区域，将会输出指定输入文件（SAM、BAM 或 CRAM 格式）中的所有比对数据，并以 SAM 格式输出（默认不含头部）。
要查看 SAM、BAM 或 CRAM 文件的头部信息（header），可以使用 samtools view 命令的-H选项。这个选项只会输出文件的头部部分，而不会输出比对数据。

samtools view -h 6463-1t.bam|head -n 10
@HD	VN:1.0	SO:unsorted
@SQ	SN:1	LN:308452471
@SQ	SN:2	LN:243675191
@SQ	SN:3	LN:238017767
@SQ	SN:4	LN:250330460
@SQ	SN:5	LN:226353449
@SQ	SN:6	LN:181357234
@SQ	SN:7	LN:185808916
@SQ	SN:8	LN:182411202
@SQ	SN:9	LN:163004744
#@HD VN:1.0 SO:unsorted：头部信息，表示文件是 SAM 格式的版本 1.0，且数据未排序。
#@SQ SN:1 LN:308452471：染色体 1 的名称是 "1"，长度是 308,452,471 个碱基对。
#@SQ SN:2 LN:243675191：染色体 2 的名称是 "2"，长度是 243,675,191 个碱基对。

示例 1：查看所有比对数据
假设你有一个 in.bam 文件，想要查看其中所有的比对数据：

samtools view in.bam

这条命令会将 in.bam 中的所有比对信息以 SAM 格式 输出到终端。

你可以在输入文件名后指定一个或多个空格分隔的区域，以限制输出只包含那些与指定区域重叠的比对。指定区域要求输入文件已按坐标排序并生成索引。
示例 2：指定区域输出比对数据
你可以指定某个区域，比如染色体 1 的 1000 到 2000 碱基区域：

samtools view in.bam chr1:1000-2000

这条命令只会输出位于 chr1 染色体上 1000 到 2000 碱基范围内的比对信息。前提是 in.bam 文件已经按坐标排序并生成了索引文件（通常是 .bai 文件）。

此命令还可以将输出格式从 SAM 转换为 BAM 或 CRAM，因此也可以作为文件格式转换工具。不做演示

tview

samtools tview [-p chr:pos] [-s STR] [-d display] <in.sorted.bam> [ref.fasta]

需要有索引文件
基于 ncurses 库的文本比对查看器。在查看器中，按 ? 可以查看帮助，按 g 可以从某个区域开始查看比对，例如 chr10:10,000,000 或 =10,000,000（在查看同一参考序列时使用）。

quickcheck

samtools quickcheck [选项] in.sam|in.bam|in.cram [ ... ]

#例
samtools quickcheck *.bam || echo "Some files are corrupted or incomplete"

快速检查输入文件是否完整。检查文件开头是否包含有效头部（适用于所有格式），并检查文件末尾是否有完整的文件结束标记（EOF，仅适用于 BAM 格式）。

该命令不会读取文件中间的数据，因为这样会非常耗时，因此该命令无法检测到文件内部的损坏，但它可以用于在执行更复杂的任务之前检查文件是否被截断。

如果任何输入文件没有有效头部或缺少 EOF 块，该命令将以非零退出代码退出。否则，将成功退出（退出代码为 0）。

head

samtools head [选项] in.sam|in.bam|in.cram

打印输入文件的头部信息，且可选地输出文件的前几条比对记录。此命令始终按原样显示文件中的头部信息，且不会添加额外的 @PG 头部。

index

samtools index [-bc] [-m INT] aln.sam.gz|aln.bam|aln.cram [out.index]

为按坐标排序的 SAM、BAM 或 CRAM 文件生成索引，以便快速随机访问。注意，若为 SAM 文件，必须先进行 BGZF 压缩（block gzip file）。

从 Samtools 1.16 版本开始，此命令也可以接受多个比对文件名，并为它们单独生成索引。

该索引在使用 samtools view 和其他类似命令时，通过指定区域参数限制操作区域时是必需的。

如果提供了输出文件名，索引文件将保存为 out.index。否则，对于 CRAM 文件 aln.cram，索引文件将生成为 aln.cram.crai；对于 BAM 或 SAM 文件，索引文件可能为 aln.bam.bai 或 aln.bam.csi，具体取决于选择的索引格式。

`sort`

samtools sort [-l level] [-m maxMem] [-o out.bam] [-O format] [-n] [-t tag] [-T tmpprefix] [-@ threads] [in.sam|in.bam|in.cram]
总结：
默认情况下，samtools sort 会按坐标排序。
-n 选项用于按名称排序。
-o 选项指定输出文件。
-m 控制最大内存使用量。
-@ 选项允许使用多线程。

将比对结果按照最左端坐标进行排序，或者在使用 -n 选项时按读段名称进行排序。如果需要，会自动添加或更新适当的 @HD-SO 排序标签到头部信息中。

排序后的输出默认写入标准输出，或者在使用 -o 选项时写入指定的文件（如 out.bam）。当比对数据不能完全放入内存时（可通过 -m 选项控制内存大小），该命令还会创建临时文件，如 tmpprefix.%d.bam。

如果你需要按名称分组而不需要完全按字典顺序排序，可以考虑使用 samtools collate。

需要注意的是，如果排序后的文件要用 samtools index 生成索引，必须使用默认的坐标排序，因此 -n 和 -t 选项与 samtools index 不兼容。

collate

samtools collate [options] in.sam|in.bam|in.cram [<prefix>]

collate 命令将读段按照名称分组并打乱顺序，这是一个比完全按名称排序更快的替代方案。collate 确保具有相同名称的读段被分组在一起，但不保证组与组之间的名称顺序。

该命令输出的文件适用于任何需要将同一个模板的所有读段分组在一起的操作。

idxstats

samtools idxstats in.sam|in.bam|in.cram

#$ samtools idxstats 6463-1t_reo_sort_GR.bam
1	308452471	2942955	162522
2	243675191	3234974	124714
3	238017767	1518091	40625
4	250330460	20289517	201084
5	226353449	1965540	48470
6	181357234	8769111	48916
7	185808916	13011480	218949
8	182411202	1634882	24605
9	163004744	2381199	29917
10	152435371	1000139	36766

idxstats 命令用于从输入文件的索引文件中检索并打印统计信息。输入文件应该是 BAM 文件，并且事先已经用 samtools index 命令生成了索引。

如果你运行这个命令用于 SAM 文件、CRAM 文件，或未索引的 BAM 文件，idxstats 仍然可以生成相同的统计摘要，但它会通过遍历整个文件实现，因此速度较慢。

输出为 TAB 分隔，每一行包括以下信息：

参考序列名称
参考序列长度
已比对的读取数
未比对的读取数

输出结果会写到标准输出。

flagstat

samtools flagstat in.sam|in.bam|in.cram
#例子
srun -A 2022099 -p Debug -n 1 -N 1 samtools flagstat 6463-1t_sort_GR.bam
srun: job 1271776 queued and waiting for resources
srun: job 1271776 has been allocated resources
srun -A 2022099 -p Debug -n 1 -N 1 samtools flagstat 6463-1t_sort_GR.bam

# 输出结果：
# 65154635 + 0 in total (QC-passed reads + QC-failed reads)
# 总读取数，其中包括通过和未通过质量控制（QC）的读取数。

# 46718598 + 0 primary
# 主比对读取数，即比对到参考基因组的主要读取数。

# 18436037 + 0 secondary
# 次级比对数，这些读取不是最优比对，而是比对到其他位置的读取。

# 0 + 0 supplementary
# 补充比对数，通常指比对的一部分在其他地方映射的读取片段。

# 0 + 0 duplicates
# 标记为重复的读取数（可能是 PCR 或光学重复）。

# 0 + 0 primary duplicates
# 主比对中的重复读取数。

# 63203357 + 0 mapped (97.01% : N/A)
# 映射到参考基因组的读取数，占总读取数的 97.01%。

# 44767320 + 0 primary mapped (95.82% : N/A)
# 主比对映射的读取数，占总主比对读取数的 95.82%。

# 46718598 + 0 paired in sequencing
# 成对的测序读取数。

# 23359299 + 0 read1
# 第一个读段的读取数。

# 23359299 + 0 read2
# 第二个读段的读取数。

# 42967232 + 0 properly paired (91.97% : N/A)
# 正确配对的成对读取数，占成对测序的 91.97%。

# 43825644 + 0 with itself and mate mapped
# 自身和配对读段均映射到参考序列的读取数。

# 941676 + 0 singletons (2.02% : N/A)
# 仅自身映射的单端读取数，占比 2.02%。

# 69172 + 0 with mate mapped to a different chr
# 配对的另一端映射到不同染色体的读取数。

# 48034 + 0 with mate mapped to a different chr (mapQ>=5)
# 配对的另一端映射到不同染色体且映射质量值大于等于 5 的读取数。

flagstat 命令会完整地遍历输入文件，计算并打印统计信息到标准输出。它主要基于 FLAG 字段 中的位标志来对读取进行分类和统计。

输出包括 13 类的统计数据，每一类的结果都被分为 QC 通过 和 QC 未通过，并以 #PASS + #FAIL 的形式展示，后面附有类别描述。这些统计信息包括：

总的读取数
已比对的读取数
多次比对的读取数
不同 FLAG 标志对应的读取数

flags

samtools flags INT|STR[,...]

#提取bam文件中的列，之后使用samtools flags
samtools view ../6463-1z_reo_sort_GR.bam | awk '{print $2}' > flags.txt

head -n 3 flags.txt 
#133
#89
#99

cat flags.txt | while read flag; do samtools flags $flag; done
#0x85	133	PAIRED,UNMAP,READ2
#0x59	89	PAIRED,MUNMAP,REVERSE,READ1
#0x63	99	PAIRED,PROPER_PAIR,MREVERSE,READ1

flags 命令用于在 数字表示 和 文本表示 之间进行 FLAG 标志的转换。

常见的 FLAG 标志如下：

数值	文本表示	描述
0x1	PAIRED	该片段属于成对的（或多片段）测序技术
0x2	PROPER_PAIR	每个片段都正确比对，符合比对程序的标准
0x4	UNMAP	该片段未比对
0x8	MUNMAP	模板中的下一个片段未比对
0x10	REVERSE	序列是反向互补的
0x20	MREVERSE	模板中下一个片段的序列是反向互补的
0x40	READ1	模板中的第一个片段
0x80	READ2	模板中的最后一个片段
0x100	SECONDARY	次级比对（不用于主比对）
0x200	QCFAIL	不通过质量控制的片段
0x400	DUP	PCR 或光学重复片段
0x800	SUPPLEMENTARY	补充比对（多次比对中的额外片段）

这个命令可以用来将 FLAG 的数值转换为对应的文本描述，或者将 FLAG 的文本描述转换为对应的数值。

`stats`

samtools stats [options] in.sam|in.bam|in.cram [region...]

samtools stats 用于从 BAM 文件中收集统计信息，并以文本格式输出。这些统计信息可以通过 plot-bamstats 命令生成图形化的可视化结果。

示例 1：收集 BAM 文件的统计信息
假设你有一个 BAM 文件 sample.bam，你可以使用以下命令收集其统计信息：

samtools stats sample.bam

这些信息对于评估比对文件的质量非常有帮助。

示例 2：指定基因组区域
如果你只想查看特定区域的统计信息，可以在命令中指定区域：

samtools stats sample.bam chr1:100000-200000

这条命令会只针对 chr1 染色体上 100,000 到 200,000 位置之间的比对数据生成统计结果。

输出结果解析
samtools stats 的输出是一个文本文件，包含了详细的统计信息，比如：

Total reads：总读取数。
Mapped reads：成功比对到参考基因组的读取数。
Insert size：插入片段长度分布。
GC content：GC 含量分布。

这些统计信息可以帮助你了解比对的覆盖度、碱基分布、质量评分等。

结合 plot-bamstats 使用
生成的统计信息可以使用 plot-bamstats 命令生成图形化展示：

plot-bamstats stats_out.txt

这将根据 samtools stats 的输出生成各种图表，直观展示比对文件的质量。

你对这些示例和解释是否清楚？如果理解了，我们可以继续探讨更多选项或其他相关命令的内容。

bedcov

samtools bedcov [options] region.bed in1.sam|in1.bam|in1.cram[...]

bedcov 命令用于报告每个由 BED 文件指定的基因组区域的总读取碱基计数（即每个碱基读取深度的总和）。输出的区域按照 BED 文件中的顺序，且为 0-based（基于零的坐标系）。每个输入文件的读取计数会输出在不同的列中。

depth

samtools depth [options] [in1.sam|in1.bam|in1.cram [in2.sam|in2.bam|in2.cram] [...]]

depth 命令计算每个位点或区域的读取深度（read depth）。可以用于查看比对文件中每个碱基位置的覆盖深度。

ampliconstats

samtools ampliconstats [options] primers.bed in.sam|in.bam|in.cram[...]

ampliconstats 命令从一个或多个输入的比对文件中收集统计信息，并生成文本格式的表格。输出可以通过 plot-ampliconstats 图形化展示。比对文件应事先经过引物序列的剪切处理，例如通过 samtools ampliconclip，并且这些引物的位点需要通过 BED 文件指定。

mpileup

samtools mpileup [-EB] [-C capQcoef] [-r reg] [-f in.fa] [-l list] [-Q minBaseQ] [-q minMapQ] in.bam [in2.bam [...]]

mpileup 命令生成一个或多个 BAM 文件的文本格式 pileup 输出。如果需要生成 VCF 或 BCF 格式的输出，请使用 bcftools mpileup 命令。比对记录按 @RG 头部行中的样本标识符（SM）进行分组。如果没有样本标识符，每个输入文件将被视为一个单独的样本。

可以查看 samtools-mpileup 手册页，了解 pileup 格式及其选项的详细说明。

consensus

samtools consensus [options] in.bam

consensus 命令基于比对记录内容，从 SAM、BAM 或 CRAM 文件中生成共识序列。共识序列可以输出为 FASTA、FASTQ 或 pileup 形式。

默认情况下，FASTA 和 FASTQ 格式的输出会为每个非缺口的共识生成一个碱基，因此相对于参考序列的插入会包含，而缺失会被移除。这种行为可以根据需要进行调整。

提供了两种共识调用算法：

默认算法以 贝叶斯方法 计算杂合共识，该方法来源于 Gap5 共识算法。
另一种方法是基于碱基频率的简单计数。

我们继续翻译这些命令的相关内容。

reference

samtools reference [options] in.bam

samtools reference 命令基于 SAM、BAM 或 CRAM 文件中的 SEQuence 字段 和 MD:Z: 辅助标签 生成参考序列。对于 CRAM 文件，还可以从嵌入的参考序列块中生成参考序列（前提是该 CRAM 文件是在使用 embed_ref=1 选项时构建的）。

`coverage`

samtools coverage [options] [in1.sam|in1.bam|in1.cram [in2.sam|in2.bam|in2.cram] [...]]

samtools coverage 命令根据输入文件生成每条染色体的覆盖度直方图或表格，适用于查看不同染色体的覆盖情况。

`merge`

samtools merge [-nur1f] [-h inh.sam] [-t tag] [-R reg] [-b list] out.bam in1.bam [in2.bam in3.bam ... inN.bam]

samtools merge 用于合并多个已排序的比对文件，生成包含所有输入记录的单个排序输出文件，且保持原有的排序顺序。如果指定了 -h 选项，输入文件的 @SQ 头部信息将被合并到指定的头部文件中，否则这些头部信息将合并为一个复合头部文件。如果 @SQ 头部的顺序不同，输出文件可能需要在合并后重新排序。

输入文件的记录顺序必须与 -n 和 -t 选项的使用一致，否则输出顺序将是不确定的。

split

samtools split [options] merged.sam|merged.bam|merged.cram

samtools split 命令根据读取组（read group）将文件拆分，生成一个或多个输出文件，每个文件包含一个读取组。输出文件的前缀可以自定义，默认是基于输入文件名的前缀。

cat

samtools cat [-b list] [-h header.sam] [-o out.bam] in1.bam in2.bam [ ... ]

samtools cat 用于连接多个 BAM 或 CRAM 文件。虽然该命令适用于 BAM 或 CRAM 文件，但所有输入文件必须使用相同的格式。输入文件的序列字典必须相同，但该命令不会进行检查。该命令使用与 reheader 类似的技巧，以实现快速的 BAM 文件连接。

import

samtools import [options] in.fastq [ ... ]

samtools import 将一个或多个 FASTQ 文件 转换为未比对的 SAM、BAM 或 CRAM 格式。这些格式提供了更丰富的能力来跟踪样本元数据（通过 SAM 头部）和每个读取的元数据（通过辅助标签）。你可以使用 samtools fastq 命令来逆转这个转换。

fastq/a

samtools fastq [options] in.bam
samtools fasta [options] in.bam

samtools fastq 和 samtools fasta 命令分别将 BAM 或 CRAM 文件转换为 FASTQ 或 FASTA 格式。根据所使用的命令生成相应格式的输出文件。如果文件名以 .gz、.bgz 或 .bgzf 结尾，文件将自动压缩。

这些命令要求输入文件已按名称整理。你可以使用 samtools collate 或 samtools sort -n 来确保文件已按名称排列。

faidx

samtools faidx <ref.fasta> [region1 [...]]

samtools faidx 命令用于索引 FASTA 格式的参考序列，或者从已索引的参考序列中提取子序列。如果未指定区域，该命令会为文件生成索引，并在磁盘上创建 .fai 文件。如果指定了区域，则会提取子序列并以 FASTA 格式输出到标准输出。

输入文件可以采用 BGZF 格式压缩。该命令也可以读取和索引 FASTQ 文件，如果不使用 --fastq 选项，提取的子序列将以 FASTA 格式输出。

fqidx

samtools fqidx <ref.fastq> [region1 [...]]

samtools fqidx 命令用于索引 FASTQ 格式的参考序列，或者从已索引的参考序列中提取子序列。如果未指定区域，该命令将索引文件并在磁盘上创建 .fai 文件。如果指定了区域，则提取的子序列会以 FASTQ 格式打印到标准输出。

输入文件可以采用 BGZF 格式压缩。该命令适用于包含少量条目的 FASTQ 文件，因为如果文件包含数百万短测序读取，生成的索引几乎与原始文件一样大，并且索引搜索会非常慢且占用大量内存。

`dict`

samtools dict ref.fasta|ref.fasta.gz

samtools dict 命令用于从 FASTA 文件创建序列字典文件。

calmd

samtools calmd [-Eeubr] [-C capQcoef] aln.bam ref.fasta

samtools calmd 用于生成 MD 标签。如果 MD 标签已经存在，命令会发出警告，提示生成的 MD 标签与现有标签不同。默认情况下，输出为 SAM 格式。

虽然 calmd 可以读取和写入 CRAM 文件，但在大多数情况下没有必要，因为 CRAM 会动态重新计算 MD 和 NM 标签。唯一的例外是输入和输出 CRAM 文件使用了 no_ref 选项时。

`fixmate`

samtools fixmate [-rpcm] [-O format] in.nameSrt.bam out.bam

samtools fixmate 命令用于填充基于名称排序的比对文件中的配对坐标、ISIZE 和 配对相关标志。

`markdup`

samtools markdup [-l length] [-r] [-s] [-T] [-S] in.algsort.bam out.bam

samtools markdup 命令从已经通过 samtools fixmate 处理且坐标排序的文件中标记重复比对。该命令依赖于 MC 和 ms 标签，这些标签是 fixmate 提供的。

rmdup

samtools rmdup [-sS] <input.srt.bam> <out.bam>

samtools rmdup 命令已经过时，建议使用 samtools markdup 代替。

`addreplacerg`

samtools addreplacerg [-r rg-line | -R rg-ID] [-m mode] [-l level] [-o out.bam] in.bam

samtools addreplacerg 命令用于在文件中添加或替换读取组（read group）标签。

reheader

samtools reheader [-iP] in.header.sam in.bam

samtools reheader 命令将 in.bam 文件中的头部替换为 in.header.sam 中的头部。该命令比使用 BAM→SAM→BAM 转换来替换头部要快得多。

默认情况下，该命令将 BAM 或 CRAM 文件输出到标准输出（stdout），但对于 CRAM 格式文件，可以选择进行就地编辑，直接读取和写入同一文件。此命令不对头部的有效性进行检查，也不检查它是否适合用于与序列数据一起使用。

targetcut

samtools targetcut [-Q minBaseQ] [-i inPenalty] [-0 em0] [-1 em1] [-2 em2] [-f ref] in.bam

samtools targetcut 命令通过检查读取深度的连续性来识别目标区域，计算目标的单倍体共识序列，并输出每个序列对应于目标的 SAM 文件。当使用 -f 选项时，BAQ 将被应用。该命令仅设计用于从 fosmid pool sequencing 切割 fosmid 克隆。

phase

samtools phase [-AF] [-k len] [-b prefix] [-q minLOD] [-Q minBaseQ] in.bam

samtools phase 命令用于调用和定位异位 SNPs。

depad

samtools depad [-SsCu1] [-T ref.fa] [-o output] in.bam

samtools depad 命令将相对于填充参考比对的 BAM 转换为相对于未填充参考的 BAM。

ampliconclip

samtools ampliconclip [-o out.file] [-f stat.file] [--soft-clip] [--hard-clip] [--both-ends] [--strand] [--clipped] [--fail] [--no-PG] -b bed.file in.file

samtools ampliconclip 命令基于 BED 文件的数据在 SAM 兼容文件中剪切读取。

samples

samtools samples [-o out.file] [-i] [-T TAG] [-f refs.fasta] [-F refs_list] [-X]

samtools samples 命令从比对文件中打印样本信息。

reset

samtools reset [-o FILE] [-x/--remove-tag tag_list] [--keep-tag tag_list] [--reject-PG pgid] [--no-RG] [--no-PG] [...]

samtools reset 命令从记录中删除比对信息，生成未比对的 SAM、BAM 或 CRAM 文件。标志被重置，头部标签根据需要更新或删除，辅助标签根据指定的选项进行删除或保留。需要注意的是，排序顺序不会更改。

你可能感兴趣的:(linux,生信,linux)

Hadoop入门案例WordCount 码喵喵 hadoop mapreduce 大数据
wordcount可以说是hadoop的入门案例，也是基础案例主要体现思想就是mapreduce核心思想原始文件为hadoop.txt，内容如下：hello,javahello,java,linux,hadoophadoop,java,linuxhello,java,linuxlinux,c,javac,php,java在整个文件中单词所出现的次数Hadoop思维：Mapreduce-----》M
Linux 基础IO xuanzdhc Linux linux 服务器运维
标准库IO接口操作句柄：FILE*文件流指针系统调用接口操作句柄：文件描述符接口操作：详情点击接口操作文件描述符内核为每个打开的文件或I/O资源分配的唯一整数表示定义文件描述符是一个非负整数，用于表示进程已打开的文件、套接字、管道等资源每个进程维护一个文件描述符表，记录已打开资源标准文件描述符：每个进程默认有三个预打开的文件描述符012工作原理三层抽象文件描述符表：每个进程独有的数组，索引为文件描
Linux 系统管理：高效运维与性能优化代码老y 运维 linux 性能优化
一、Linux系统管理基础（一）用户与权限管理用户和权限管理是Linux系统管理的基础。通过合理配置用户和权限，可以确保系统的安全性和稳定性。用户管理使用useradd、usermod和userdel命令管理用户账户。使用passwd命令设置用户密码。使用groups和gpasswd命令管理用户组。权限管理使用chmod命令设置文件和目录的权限。使用chown和chgrp命令更改文件和目录的所有者
iOS 上架效率提升指南：五个团队角色与工具链协同实践 2501_91590906 http udp https websocket 网络安全网络协议 tcp/ip
在一个主要用Flutter开发的零售SaaS项目中，我们有5个关键岗位：移动开发、后端、产品经理、UI设计、运维。大多数成员日常工作环境是Windows或Linux，团队里仅有一台远程Mac可用于iOS构建。以下按角色顺序，复盘一次iOSApp上架过程中他们如何分工，以及各自使用到的工具，如无Mac用appuploader上架，真实记录从打包到审核的全链路。①移动开发工程师：编写功能、调试构建任务
GtkSharp跨平台WinForm实现
文章目录跨平台架构设计跨平台项目配置GtkSharp串口通讯实现跨平台部署配置Linux系统配置macOS系统配置相关学习资源GTK#跨平台开发跨平台.NET开发Linux开发环境macOS开发环境跨平台UI框架对比容器化部署开源项目参考性能优化与调试跨平台架构设计基于GTKSystem.Windows.Forms框架，我们可以实现真正的跨平台WinForm串口通讯应用：共享代码层macOS环境L
linux 分区 4k对齐,分区4K对齐那些事，你想知道的都在这里
在对磁盘进行分区时，有一个很重要的注意事项，就是要将分区对齐，不对齐可能会造成磁盘性能的下降。尤其是固态硬盘SSD，基本上都要求4K对齐。磁盘读写速度慢还找不到原因？可能就是4K对齐的锅。那么分区对齐究竟是怎么回事？为什么要对齐？如何才能对齐？如何检测是否对齐呢？今天，我们就来说说分区4K对齐这些事。你想知道的都在这里了。物理扇区的概念分区对齐，是指将分区起始位置对齐到一定的扇区。我们要先了解对齐
gpt分区 linux 4k对齐,磁盘对齐与4K对齐童广 gpt分区 linux 4k对齐
什么是磁盘分区对齐(DiskAlignment、PartitionAlignment):Windows的磁盘有一种结构叫做MasterBootRecord(MBR),它的默认大小为63个Block(每个大小为512字节)。它的存在使得磁盘的初始位置和的磁盘上第一个分区的初始位置有63个Block的错位。如果磁盘的单个Track大于63个Block的话。这就会导致默认的初始的位置是从第64个开始。使
android原生睡死,Android消息推送关键技术之休眠唤醒
为了节省电量，Android系统在一段时间不操作后，会进入休眠状态，Android6.0之后更是引入了Doze和Standby两种省电模式，达到进一步省电的目的。在这些省电模式下，会挂起一些设备的电源，限制网络访问和一些其它的后台操作，因此休眠自然也会影响到后台的推送服务。Android休眠机制由于Android系统是基于Linux内核的，所以Android系统地休眠机制也继承自Linux，并且在
ssd 分区4k对齐 linux,Debian SSD ext4 4K对齐张锦云 ssd 分区4k对齐 linux
新入手了一台thinkpad,原来的机械硬盘是500G的,于是购入一块镁光的MX200250G的SSD来新装debianstable(jessie)1,安装系统的之前按住F1进入bios后把模式改为AHCI.2,用U盘做的启动盘.版本是debian8.1AMD643,安装系统的时候选择默认推荐分区,也就是一整块4,debian8默认是ext4文件系统.5,装完后fdisk-lu发现已经是4K对齐了
Android 关闭SE权限后编译user版本无法开机，开机直接进入FastBoot模式顾北川_野服务器 linux 运维
问题描述：debug版本可以正常开机，user版本无法正常开机，进入fastboot模式出现原因：关闭了SE权限即system\core\init\selinux.cppboolIsEnforcing(){returnfalse;办法：添加宏控：CONFIG_SECURITY_SELINUX_DEVELOP=y到config文件下============经验证有效！！！！根据谷歌要求如此有些时候我
Linux c/c++ 串口编程静止了所有的花开 linux c++物联网
封装了一下Linux下的串口操作serial.h：#ifndef_SERIAL_H_#define_SERIAL_H_#include#includeclassSerial{public:Serial();intopenPort(constchar*path);intset(speed_tspeed);intsend(constvoid*buf,size_tsize,intsec,intmsec,
Linux SSD 4k对齐 frank0060071 linux 运维服务器
简介：固态硬盘（SSD）在现代计算机中扮演关键角色，4K对齐是优化SSD性能和延长其寿命的重要步骤。本文介绍了4K对齐的概念、重要性、检查方法及对齐工具的使用。4K对齐涉及将数据扇区调整到4KB边界，以便提升读写速度和减少磨损。使用专门的磁盘管理工具和SSD对齐工具为什么SSD必须4K对齐？1.物理结构与读写机制擦除机制：SSD写入前需先擦除整个块（Block）（由多个页组成，如128页=512K
Linux——内核——设备驱动 newbie_Joe linux概念 linux内核
Linux设备驱动是操作系统与硬件之间的桥梁，它允许内核与硬件设备进行通信，管理硬件资源，并为上层应用提供标准化的接口。以下从基本概念、分类、架构、开发流程及关键机制等方面，系统梳理Linux设备驱动的核心知识：一、设备驱动的基本概念作用抽象硬件细节：将硬件操作封装为标准接口（如open()、read()、write()），使应用无需直接操作寄存器。资源管理：分配/释放硬件资源（如内存、I/O端口
Linux——内核——网络协议
Linux网络协议栈是Linux内核中实现网络通信的核心组件，其设计遵循分层架构，支持多种网络协议和功能。以下从协议栈的分层结构、关键组件、工作流程、数据包处理机制、优化与调试等方面进行详尽阐述：一、协议栈的分层结构Linux网络协议栈基于TCP/IP模型，分为四层：应用层提供用户接口，支持HTTP、FTP、SSH等协议。通过SocketAPI与传输层交互，实现数据收发。传输层TCP：面向连接，提
select、poll和epoll的区别 pigfu linux基础 linux select linux poll linux epoll select和epoll区别
文章目录概要一、多路复用I/O模型的诞生1.1多线程或进程方式1.2通过数组，链表等方式保存socketfd，不断轮询二、select三、poll四、epoll五、小结六、参考概要在Unix五种I/O模型一文中，提到了I/O多路复用模型，其在Linux下有3种实现方式：select、poll、epoll，本文主要深入介绍下它们各自特点。事先说明：I/O多路复用模型，select和poll核心就是【
玄机-linux实战-挖矿无中生章 linux 运维服务器
玄机-linux实战-挖矿一，前言应急响应工程师在内网服务器发现有台主机cpu占用过高，猜测可能是中了挖矿病毒，请溯源分析，提交对应的报告给应急小组虚拟机账号密码rootwebsecyjxyweb端口为8081二，介绍1、黑客的IP是？flag格式：flag{黑客的ip地址}，如：flag{127.0.0.1}2、黑客攻陷网站的具体时间是？flag格式：flag{年-月-日时:分:秒}，如：fla
Linux编程——Makefile 使用
在先前的文章中，我们已经学习了gcc和gdb的使用。本节，我们将介绍Makefile的使用。Makefile带来的好处就是——“自动化编译”，一但写好，只需要一个make命令，整个工程便可以完全编译，极大的提高了软件的开发效率（特别是对于那些项目较大、文件较多的工程）。make是一个命令工具，最主要也是最基本的功能就是根据makefile文件中描述的源程序至今的相互关系来完成自动编译、维护多个源文
【Java基础】一次编译，随处运行的简单原理秃然想通了 java基础入门 java 开发语言
【Java基础】一次编译，随处运行的简单原理一句话解释：Java程序就像一个多变的机器人，能根据不同的环境变换外形，但核心始终不变！在Windows上变成.exe在Mac上变成.app在手机上变成.apk但无论它的外形如何变化，它的核心始终是同一个机器人！在我们的计算机中，存在着多种操作系统（如：Windows、Linux、MacOS等）。为了让Java程序能够在不同的操作系统上运行，Java内置
linux系统编程——Makefile、GDB调试舒克起飞了 linux 运维服务器
Makefilemakefile定义了一系列的规则来指定哪些文件需要先编译，哪些文件需要后编译，哪些文件需要重新编译，甚至于进行更复杂的功能操作，因为makefile文件就像一个shell脚本一样，也可以执行操作系统的命令。自动化编译，只要一个make命令，整个工程完全自动编译。规则一个makefile文件中可以有一个或者多个规则目标...:依赖...命令（shell命令）...目标：最终要生成的
【网络编程】EPOLL 事件触发机制的服务器啟明起鸣网络服务器运维
文章目录业务拆解EPOLL机制介绍EPOLL的核心变量和函数EPOLL程序流程图C代码实现准备工作服务器代码代码运行效果总结推荐一个零声教育学习教程，个人觉得老师讲得不错，分享给大家：[Linux，Nginx，ZeroMQ，MySQL，Redis，fastdfs，MongoDB，ZK，流媒体，CDN，P2P，K8S，Docker，TCP/IP，协程，DPDK等技术内容，点击立即学习:https:/
【jdk】使用wget下载jdk8 催化开天地 java 开发语言
因为在oracle官网下载jdk需要如果直接在linux中使用wget命令下载，实际下载是一个html文件，所以需要通过一下命令wget--no-check-certificate--no-cookies--header"Cookie:oraclelicense=accept-securebackup-cookie"http://download.oracle.com/otn-pub/java/j
linux音视频采集技术: v4l2
简介在Linux系统中，视频设备的支持和管理离不开V4L2（VideoforLinux2）。作为Linux内核的一部分，V4L2提供了一套统一的接口，允许开发者与视频设备（如摄像头、视频采集卡等）进行交互。无论是视频采集、处理，还是编码和显示，V4L2都提供了强大的支持。当有设备插入时，在/dev下会出现/dev/video0、/dev/video1这些设备节点，使用它们可以支持采集、输出、设备控
Linux系统JDK 8下载与安装指南丹力
本文还有配套的精品资源，点击获取简介：JavaDevelopmentKit（JDK）8是Java编程语言的重要开发工具包，包含了必要的工具和库以编译、调试和运行Java应用程序。JDK8在2014年发布，引入了Lambda表达式、StreamAPI、新的日期和时间API以及方法引用等特性，提升了开发效率和代码可读性。本文将指导读者如何在Linux系统上下载和安装JDK8，包括下载步骤、解压文件、移
在mac下手动编译迁移的android版webrtc组件 jwybobo2007 WebRTC webrtc android
我原先使用的android版webrtc是在linux下编译的，现在因为某些原因需要把整个库迁移到mac下编译。把代码迁移完后，正常是需要通过gclientsync重新构建编译环境，但是由于网络限制等方面原因，会导致完成的比较慢。在摸索一阵后，找到了一种方式可以快速的编译出webrtc，步骤如下：假设已经有NDK、depot_tools、ninja，并且可以正常使用了1.修改src/build/c
在 Windows 上运行 Linux 程序 shanql windows linux
要在Windows上运行Linux程序，您有以下选项：在适用于Linux的Windows子系统（WSL）上按原样运行程序。在WSL中，程序直接在计算机硬件上执行，而不是在虚拟机中执行。WSL还支持在Windows和Linux系统之间直接调用文件系统，无需SSL传输。WSL设计为命令行环境，不建议用于图形密集型应用程序。有关更多信息，请参阅适用于Linux的Windows子系统文档。在本地计算机或A
Linux-线程池风君子吖 Linux系统编程 linux 运维服务器
文章目录前言一、线程池是什么？二、示例代码前言线程池主要是对之前内容的一个巩固，并且初步了解池化概念。一、线程池是什么？线程池就是提前开辟好一块空间，随时准备创造新线程来完成任务，可以理解为用空间来换时间，具体实现看以下示例代码。二、示例代码#include#include#include#include"lockGuard.hpp"#include"log.hpp"constintdefault
Docker 跨平台支持：从 Linux 到 macOS 的容器化开发实践 you的日常容器技术 Docker 性能优化实践 docker linux macos 容器运维
Docker容器的理念是“一次构建，处处运行”，旨在解决应用程序在不同环境中部署的兼容性问题。然而，这一承诺的实现，在非原生Linux系统（如macOS和Windows）上，需要巧妙的底层机制来支撑。对于开发者而言，理解DockerDesktop在这些操作系统上的工作原理，特别是其虚拟机机制和文件共享策略，对于优化开发体验和解决潜在性能问题至关重要。本文将深入探讨Docker如何在macOS和Wi
FinalShell 4：Linux系统SSH连接与远程管理工具应用指南虾仁芝麻卷
本文还有配套的精品资源，点击获取简介：FinalShell4是专为Linux系统打造的集成化远程管理工具，以其强大的SSH连接功能著称，支持多种操作系统平台。该软件集成了丰富的终端模拟、会话管理、文件传输和性能优化等特性，提高了IT运维的效率和安全性。其内置的脚本支持和实时监控功能进一步加强了服务器管理的自动化和便捷性，使其成为IT专业人员的得力助手。1.SSH连接与安全远程操作SSH（Secur
【网络】Linux 内核优化实战 - net.core.busy_read
目录核心功能工作原理与优势配置方式1.临时配置（重启失效）2.永久配置（重启生效）与`net.core.busy_poll`的协同作用适用场景与注意事项适用场景：注意事项：总结net.core.busy_read是Linux内核中与网络性能优化相关的参数，主要用于控制socket层的忙轮询（BusyPolling）行为，与net.core.busy_poll配合使用，共同优化网络数据包的处理效率。
【Linux】进程间多种通信方式对比青铜发条 Linux linux 运维服务器网络
本文比较了多种进程间通信方式的关键特性，包括同步/异步、阻塞/非阻塞、通信方向、速度等维度。所有方式在优先级、可靠性和事务支持方面存在显著差异，实际选择需根据具体场景权衡性能、可靠性和功能需求。注意：表格仅为通信方式的典型值，部分属性可能高依赖具体实现方式。通信方式同\异步阻塞/非阻塞通信方向通信速度消息格式消息大小存储位置匿名管道同步阻塞/非阻塞单工较低自定义有限制内核缓冲区命名管道同步阻塞/非
redis学习笔记——不仅仅是存取数据 Everyday都不同 returnSource expire/del incr/lpush 数据库分区 redis
最近项目中用到比较多redis，感觉之前对它一直局限于get/set数据的层面。其实作为一个强大的NoSql数据库产品，如果好好利用它，会带来很多意想不到的效果。（因为我搞java，所以就从jedis的角度来补充一点东西吧。PS：不一定全，只是个人理解，不喜勿喷） 1、关于JedisPool.returnSource(Jedis jeids) 这个方法是从red
SQL性能优化-持续更新中。。。。。。 atongyeye oracle sql
1 通过ROWID访问表--索引你可以采用基于ROWID的访问方式情况,提高访问表的效率, , ROWID包含了表中记录的物理位置信息..ORACLE采用索引(INDEX)实现了数据和存放数据的物理位置(ROWID)之间的联系. 通常索引提供了快速访问ROWID的方法,因此那些基于索引列的查询就可以得到性能上的提高. 2 共享SQL语句--相同的sql放入缓存 3 选择最有效率的表
[JAVA语言]JAVA虚拟机对底层硬件的操控还不完善 comsci JAVA虚拟机
如果我们用汇编语言编写一个直接读写CPU寄存器的代码段，然后利用这个代码段去控制被操作系统屏蔽的硬件资源，这对于JVM虚拟机显然是不合法的，对操作系统来讲，这样也是不合法的，但是如果是一个工程项目的确需要这样做，合同已经签了，我们又不能够这样做，怎么办呢？那么一个精通汇编语言的那种X客，是否在这个时候就会发生某种至关重要的作用呢？ &n
lvs- real 男人50 LVS
#!/bin/bash # # Script to start LVS DR real server. # description: LVS DR real server # #. /etc/rc.d/init.d/functions VIP=10.10.6.252 host='/bin/hostname' case "$1" in sta
生成公钥和私钥 oloz DSA 安全加密
package com.msserver.core.util; import java.security.KeyPair; import java.security.PrivateKey; import java.security.PublicKey; import java.security.SecureRandom; public class SecurityUtil {
UIView 中加入的cocos2d，背景透明 374016526 cocos2d glClearColor
要点是首先pixelFormat:kEAGLColorFormatRGBA8，必须有alpha层才能透明。然后view设置为透明glView.opaque = NO;[director setOpenGLView:glView];[self.viewController.view setBackgroundColor:[UIColor clearColor]];[self.viewControll
mysql常用命令香水浓 mysql
连接数据库 mysql -u troy -ptroy 备份表 mysqldump -u troy -ptroy mm_database mm_user_tbl > user.sql 恢复表（与恢复数据库命令相同） mysql -u troy -ptroy mm_database < user.sql 备份数据库 mysqldump -u troy -ptroy
我的架构经验系列文章 - 后端架构 - 系统层面 agevs JavaScript jquery css html5
系统层面：高可用性所谓高可用性也就是通过避免单独故障加上快速故障转移实现一旦某台物理服务器出现故障能实现故障快速恢复。一般来说，可以采用两种方式，如果可以做业务可以做负载均衡则通过负载均衡实现集群，然后针对每一台服务器进行监控，一旦发生故障则从集群中移除；如果业务只能有单点入口那么可以通过实现Standby机加上虚拟IP机制，实现Active机在出现故障之后虚拟IP转移到Standby的快速
利用ant进行远程tomcat部署 aijuans tomcat
在javaEE项目中，需要将工程部署到远程服务器上，如果部署的频率比较高，手动部署的方式就比较麻烦，可以利用Ant工具实现快捷的部署。这篇博文详细介绍了ant配置的步骤（http://www.cnblogs.com/GloriousOnion/archive/2012/12/18/2822817.html），但是在tomcat7以上不适用，需要修改配置，具体如下： 1.配置tomcat的用户角色
获取复利总收入 baalwolf 获取
public static void main(String args[]){ int money=200; int year=1; double rate=0.1; &
eclipse.ini解释 BigBird2012 eclipse
大多数java开发者使用的都是eclipse，今天感兴趣去eclipse官网搜了一下eclipse.ini的配置，供大家参考，我会把关键的部分给大家用中文解释一下。还是推荐有问题不会直接搜谷歌，看官方文档，这样我们会知道问题的真面目是什么，对问题也有一个全面清晰的认识。 Overview 1、Eclipse.ini的作用 Eclipse startup is controlled by th
AngularJS实现分页功能 bijian1013 JavaScript AngularJS 分页
对于大多数web应用来说显示项目列表是一种很常见的任务。通常情况下，我们的数据会比较多，无法很好地显示在单个页面中。在这种情况下，我们需要把数据以页的方式来展示，同时带有转到上一页和下一页的功能。既然在整个应用中这是一种很常见的需求，那么把这一功能抽象成一个通用的、可复用的分页（Paginator）服务是很有意义的。 &nbs
[Maven学习笔记三]Maven archetype bit1129 ArcheType
archetype的英文意思是原型，Maven archetype表示创建Maven模块的模版，比如创建web项目，创建Spring项目等等. mvn archetype提供了一种命令行交互式创建Maven项目或者模块的方式， mvn archetype 1.在LearnMaven-ch03目录下，执行命令mvn archetype:gener
【Java命令三】jps bit1129 Java命令
jps很简单，用于显示当前运行的Java进程，也可以连接到远程服务器去查看 [hadoop@hadoop bin]$ jps -help usage: jps [-help] jps [-q] [-mlvV] [<hostid>] Definitions: <hostid>: <hostname>[:
ZABBIX2.2 2.4 等各版本之间的兼容性 ronin47
zabbix更新很快，从2009年到现在已经更新多个版本，为了使用更多zabbix的新特性，随之而来的便是升级版本，zabbix版本兼容性是必须优先考虑的一点客户端AGENT兼容 zabbix1.x到zabbix2.x的所有agent都兼容zabbix server2.4：如果你升级zabbix server，客户端是可以不做任何改变，除非你想使用agent的一些新特性。 Zabbix代理（p
unity 3d还是cocos2dx哪个适合游戏？ brotherlamp unity自学 unity教程 unity视频 unity资料 unity
unity 3d还是cocos2dx哪个适合游戏？问：unity 3d还是cocos2dx哪个适合游戏？答：首先目前来看unity视频教程因为是3d引擎，目前对2d支持并不完善，unity 3d 目前做2d普遍两种思路，一种是正交相机，3d画面2d视角，另一种是通过一些插件，动态创建mesh来绘制图形单元目前用的较多的是2d toolkit，ex2d，smooth moves，sm2，
百度笔试题：一个已经排序好的很大的数组，现在给它划分成m段，每段长度不定，段长最长为k，然后段内打乱顺序，请设计一个算法对其进行重新排序 bylijinnan java 算法面试百度招聘
import java.util.Arrays; /** * 最早是在陈利人老师的微博看到这道题： * #面试题#An array with n elements which is K most sorted，就是每个element的初始位置和它最终的排序后的位置的距离不超过常数K * 设计一个排序算法。It should be faster than O(n*lgn)。
获取checkbox复选框的值 chiangfai checkbox
<title>CheckBox</title> <script type = "text/javascript"> doGetVal: function doGetVal() { //var fruitName = document.getElementById("apple").value;//根据
MySQLdb用户指南 chenchao051 mysqldb
原网页被墙，放这里备用。 MySQLdb User's Guide Contents Introduction Installation _mysql MySQL C API translation MySQL C API function mapping Some _mysql examples MySQLdb
HIVE 窗口及分析函数 daizj hive 窗口函数分析函数
窗口函数应用场景：（1）用于分区排序（2）动态Group By （3）Top N （4）累计计算（5）层次查询一、分析函数用于等级、百分点、n分片等。函数说明 RANK() &nbs
PHP ZipArchive 实现压缩解压Zip文件 dcj3sjt126com PHP zip
PHP ZipArchive 是PHP自带的扩展类，可以轻松实现ZIP文件的压缩和解压，使用前首先要确保PHP ZIP 扩展已经开启，具体开启方法就不说了，不同的平台开启PHP扩增的方法网上都有，如有疑问欢迎交流。这里整理一下常用的示例供参考。一、解压缩zip文件 01 02 03 04 05 06 07 08 09 10 11
精彩英语贺词 dcj3sjt126com 英语
I'm always here 我会一直在这里支持你 &nb
基于Java注解的Spring的IoC功能 e200702084 java spring bean IOC Office
java模拟post请求 geeksun java
一般API接收客户端（比如网页、APP或其他应用服务）的请求，但在测试时需要模拟来自外界的请求，经探索，使用HttpComponentshttpClient可模拟Post提交请求。此处用HttpComponents的httpclient来完成使命。 import org.apache.http.HttpEntity ; import org.apache.http.HttpRespon
Swift语法之 ---- ?和!区别 hongtoushizi ?swift !
转载自： http://blog.sina.com.cn/s/blog_71715bf80102ux3v.html Swift语言使用var定义变量，但和别的语言不同，Swift里不会自动给变量赋初始值，也就是说变量不会有默认值，所以要求使用变量之前必须要对其初始化。如果在使用变量之前不进行初始化就会报错： var stringValue : String //
centos7安装jdk1.7 jisonami jdk centos
安装JDK1.7 步骤1、解压tar包在当前目录 [root@localhost usr]#tar -xzvf jdk-7u75-linux-x64.tar.gz 步骤2：配置环境变量在etc/profile文件下添加 export JAVA_HOME=/usr/java/jdk1.7.0_75 export CLASSPATH=/usr/java/jdk1.7.0_75/lib
数据源架构模式之数据映射器 home198979 PHP 架构数据映射器 datamapper
前面分别介绍了数据源架构模式之表数据入口、数据源架构模式之行和数据入口数据源架构模式之活动记录，相较于这三种数据源架构模式，数据映射器显得更加“高大上”。一、概念数据映射器（Data Mapper）：在保持对象和数据库（以及映射器本身）彼此独立的情况下，在二者之间移动数据的一个映射器层。概念永远都是抽象的，简单的说，数据映射器就是一个负责将数据映射到对象的类数据。 &nb
在Python中使用MYSQL pda158 mysql python
缘由　　近期在折腾一个小东西须要抓取网上的页面。然后进行解析。将结果放到数据库中。　　了解到 Python在这方面有优势，便选用之。　　由于我有台 server上面安装有 mysql，自然使用之。在进行数据库的这个操作过程中遇到了不少问题，这里记录一下，大家共勉。　　 python中mysql的调用　　百度之后能够通过MySQLdb进行数据库操作。
单例模式 hxl1988_0311 java 单例设计模式单件
package com.sosop.designpattern.singleton; /* * 单件模式：保证一个类必须只有一个实例，并提供全局的访问点 * * 所以单例模式必须有私有的构造器，没有私有构造器根本不用谈单件 * * 必须考虑到并发情况下创建了多个实例对象 * */ /** * 虽然有锁，但是只在第一次创建对象的时候加锁，并发时不会存在效率
27种迹象显示你应该辞掉程序员的工作 vipshichg 工作
1、你仍然在等待老板在2010年答应的要提拔你的暗示。 2、你的上级近10年没有开发过任何代码。 3、老板假装懂你说的这些技术，但实际上他完全不知道你在说什么。 4、你干完的项目6个月后才部署到现场服务器上。 5、时不时的，老板在检查你刚刚完成的工作时，要求按新想法重新开发。 6、而最终这个软件只有12个用户。 7、时间全浪费在办公室政治中，而不是用在开发好的软件上。 8、部署前5分钟才开始测试。