进一寸有一寸的欢喜077

【转载生信课程】03-序列比较-山东大学-生物信息学

序列比较

认识序列

FASTA 格式，第一行是一个大于号“>”开头，后面紧接注释信息

序列相似性

相似的序列》相似的结构》相似的功能

一致度
如果两个序列长度相同，那么它们的一致度可以暂时定义为它们对应位置上相同的残基数目占总长度的百分比。
例：上下相同的碱基为2，序列长度为4，则一致度为：2/4=2

相似度
如果两个序列长度相同，那么它们的相似度可以暂时定义为他们对应位置上相似的残基
与相同的残基的数目和占总长度的百分比。
例：判断K 和 L 是否相似，需要替换记分矩阵

核酸序列的替换记分矩阵

替换记分矩阵是反映残基之间相互替换率的矩阵。根据各氨基酸分值，可以知道各氨基酸的相似程度。
分类：

DNA替换替换记分矩阵
蛋白质替换记分矩阵

DNA替换替换记分矩阵

等价矩阵按碱基是否相同
转换-颠换矩阵按是否同为嘌呤、嘧啶；环数不变则为转换，环数变化则为颠换
BLAST矩阵核苷酸相同为+5，不同为-4

蛋白质序列的替换记分矩阵

等价矩阵
PAM 矩阵
BLOSUM 矩阵

BLOSUM 矩阵的相似性是根据真实数据产生的，而 PAM 矩阵是通过矩阵自乘外推而来的。

PAM 矩阵
我们需要根据要比较的序列之间的亲缘关系远近，来选择适合的 PAM 矩阵。如果序列亲缘关系远，也就是说序列间会有很多突变，那就选 PAM 后面跟一个大数字的矩阵。如果亲缘关系近，也就是突变比较少，
序列间大多数地方都是一样的，那就选 PAM 后面跟一个小数字的矩阵。

图是 PAM250 矩阵。对角线上的数值为匹配氨基酸的得分。其他位置上≥0 的得分代
表对应的一对氨基酸为相似氨基酸，<0 的是不相似的氨基酸。

BLOSUM 矩阵
BLOSUM 后面跟一个小数字的矩阵适合用于比较相似度低的序列，也就是亲缘关系远的序列；而 BLOSUM 后面跟一个大数字的矩阵适合比较相似度高的序列，也就是亲缘关系近的序列。

图是 BLOSUM 62 矩阵.样子和 PAM 矩阵差不多，但是里面的数值是不一样的。同样，≥0 的得分代表对应的一对氨基酸为相似氨基酸，<0 的是不相似的氨基酸。

image.png

PAM 和BLOSUM对应关系

PAM 后面的数体现的是序列的差异度，但不直接等于差异度，只是成对应关系而已；BLOSUM 后面的数体现是的序列的相似度并且直接等于相似度。所以我们看到，随着差异度的增大，适用的 PAM 矩阵后面的编号是增大的，而 BLOSUM 矩阵后面的编号是减小的。

PAM数值——对应差距程度 path 举例
BLOSUM 数值——对应相似程度 bin逼近

默认未知序列用 BLOSUM 62

image.png

蛋白质序列的替换记分矩阵

image.png

遗传密码矩阵

image.png

疏水矩阵
在这个矩阵里，氨基酸按照亲疏水性排列。前边是亲水的，后面是疏水的。

image.png

示例：

image.png

C=Cys
L=Leu
H=His
I=Ile
K=Lys

L和I得2分，相似
K和L得-2分，不相似

相似度=（2个相同+1个相似）/4个碱基长度=（2+1）/4=75%

如果两个序列的长度不相同怎样计算一致度与相似度？
CLHKA CIHL

序列两两比较之打点法：打点法的用途

打点法——找重复出现的片段次数

image.png

相似的序列存在呈现长对角线

image.png

不相似的序列不出现对角线，呈散乱状

单序列打点

image.png

串联重复序列

image.png

序列两两比较之打点法：Dotlet 界面介绍

最常用的 Dotlet 软件
http://myhits.isb-sib.ch/cgi-bin/dotlet

示例：

一条序列打点
从input按钮输入蛋白质fasta序列，只能输入纯序列部分，不要输入“>标题行”。
他不能识别fasta的名字，需要手动输入英文名字
参数设置为，水平seq1 ,垂直seq1 ,只身打点。
选择BLOSUM62,
长度选择15，表示，比较前15个字母，与选择1的比较单元长度不一样而已，打点次数一次，不影响。
原始显示比例1：1
最后，提交

image.png

两条序列打点
水平seq2 ,垂直seq3

3，单条重复串联序列打点
水平和垂直选择seq4
5+0=-3

序列两两比较之序列比对法：什么是序列比对

序列比对就是运用特定的算法找出两个或者多个序列之间产生最大相似度
得分的空格插入和序列排列方案。

通过插入空位，让上下两行中尽可能多的一致的和相似的字符对在一起。

image.png

序列两两比较之序列比对法：双序列全局比对

image.png

开始赋值：
第0行，0列，

image.png

第0行，
考虑整行都为gap匹配的最差得分

image.png

第0列，
考虑整列都为gap匹配的最差得分

image.png

第s(1,1)
比较三个数值，找最大。

上方位的值s(i,j-1) + gap
左方位的值s(i-1,j) + gap
斜对角s(i-1,j-1) + 本位字母对字母的替换记分矩阵的值 w(i,j)

并用箭头记录得分的来源位置

image.png

第s（1,2）

image.png

第s(2,1)
当两个分值相同时，箭头指向两个方向

image.png

所有值的图

image.png

补充箭头，
第一行的数值来源于行的第一个，所有补上整行向左箭头，
第一列的数值来源于行的第一个，所有补上整列向上箭头，

image.png

右下角的分数为全局比对的最终得分，从右下角出发，追溯指向最前的路径s(0,0)，就是最优的比对序列。

image.png

根据箭头写出字符的比对结果
字符对字符

image.png

字符对空位

image.png

字符对字符

image.png

字符对字符

image.png

字符对字符

image.png

写到右下角，全局比对，结果出现，这样比分最高。每一个都是在上一步最优的情况下，得到下一步最优。

序列两两比较之序列比对法：双序列局部比对

image.png

s(1,1)
比较数值：
0
0+-3
0+-5
0+-5

最大为0分，由于0分来源于公式，不用写箭头。

image.png

0值来自于斜上角，有箭头

image.png

局部比对得分，最大值，在整个矩阵中找，最大值为16，从最大值开始，追溯到没有箭头为止。追溯箭头终止的位置也可以是得分矩阵中的任何一个位置。

image.png

局部比对的两端空位（没有箭头的地方）就全部忽略掉。

image.png

一致度和相似度

image.png

在线双序列比对工具：EMBL 全局双序列比对工具

使用率最高的是 EMBL 网站的双序列比对工具
http://www.ebi.ac.uk/Tools/psa

示例

全局比对》蛋白质比对工具
https://www.ebi.ac.uk/Tools/psa/emboss_needle/

image.png

默认选择
BLOSUM-62
其他默认参数

image.png

结果页面：

# Length: 196
# Identity:      40/196 (20.4%)
# Similarity:    69/196 (35.2%)
# Gaps:          65/196 (33.2%)
# Score: 88.5

https://www.ebi.ac.uk/Tools/services/web/toolresult.ebi?jobId=emboss_needle-I20171230-070211-0300-21009296-p2m

在线双序列比对工具：Gap 的类型及分值设置

gap 开头（GAP OPEN）
gap延长（GAP EXTEND）

gap 开头就是连续的一串 gap 里面打头的那一个，可以当它是队长。

gap 延长就是剩下的那些 gap，也就是队长后面跟着的小兵。

第一个gap 是 gap 开头，后面的都是 gap 延长。单独的一个 gap 按 gap 开头算。

gap 开头和 gap 延长可以分别定义不同的罚分。默认情况下，gap 开头罚分多，gap 延长罚分少。

示例
这次我们反过来试试，让 gap 开头罚分少，让 gap 延长罚分多。比如 gap 开头选罚 1 分，gap 延长选罚 5 分，其他参数不变，再作一次看看结果发生了什么变化。

image.png

结果：

# Length: 201
# Identity:      46/201 (22.9%)
# Similarity:    78/201 (38.8%)
# Gaps:          75/201 (37.3%)
# Score: 210.0

image.png

总结：
在第一次做的结果里，也就是 gap 开头大，gap 延长小的时候，gap 很集中，有很多成
长串出现的 gap。

1）当 gap 开头大，gap 延长小的时候，说明在连
续的字母里插入一个 gap 打开一个缺口要付出很大的代价，因为 gap 开头罚分大。但是这个
缺口一旦打开了，也就是一旦有了第一个 gap，后面再接更多的 gap 就容易了，因为 gap 延
长罚分小。所以这种情况下，gap 都集中连成长串出现。

2）而反过来，当 gap 开头小，gap 延长大的时候，说明在连续的字母里插入一个 gap 打开
一个缺口很容易，并不需要付出太大代价，因为 gap 开头罚分小。但是想在第一个 gap 后面
再接一个 gap 就难了，因为 gap 延长罚分大。所以这种情况下很难有长串的 gap 出现，gap
每延长一个都要付出巨大代价。因此在第二次我们做的结果里（图 2-A）都是分散的 gap。
除了开头一段因两条序列长短不同而不得已出现的长串 gap 外，没有其他的长串 gap 了。

通过调整 gap 开头和 gap 延长，我们可以把序列比对做成我们期待的样子。

image.png

第一个例子，你知道要比对的两条序列很相似，是同源序列，所以它们的结构和功能也应该都差不多。其中一条序列的结构已知，另一条未知。你想把它们很好的比对在一起，用其中已知结构的序列做模板，来预测另一个序列的结构。
答案：选择分散的，gap开头小，延伸大。

另一例子，你知道要比对的两条序列绝大部分区域都很相似，但是其中一条序列的一个功能区在另一条序列中是缺失的。你想要通过序列比对把这个功能区找出来。这时候我们要怎么设置 gap 开头和 gap延长呢？
答案：选择长串的，gap开头大，延伸小

如果你对结果没有什么预期，那就请保持默认的参数。
除此之外，结尾的 gap 也可以划分出不同的种类并赋予不同的罚分，如果把 END GAPPENALTY 选成true，就可以设置结尾的 gap 罚分了。结尾 gap 不太常用，特别是在做亲缘关系较近的序列比对时，是否设置结尾 gap，比对结果差别不大。

在线双序列比对工具：EMBL 局部双序列比对工具

https://www.ebi.ac.uk/Tools/psa/emboss_water/

示例

局部比对，默认参数

# Length: 130
# Identity:     103/130 (79.2%)
# Similarity:   103/130 (79.2%)
# Gaps:          27/130 (20.8%)
# Score: 551.0

image.png

将两条序列相近的序列，进行局部比对，gap开头和延长调到最大。

image.png

在线双序列比对工具：其他在线双序列比对工具

image.png

BLAST 搜索：BLAST 是怎么样工作的？

BLAST 搜索：BLAST 的种类

Blastn 核酸搜核酸

Blastp 蛋白搜蛋白

在无法得知翻译起始位点在情况下，翻译可能是从第一个碱基开始，三个三个的往后翻译，也可能是从第 2 个碱基开始，也可能从第 3 个碱基开始。另外还有可能是从这条链的互补链上开始，这样又有三个可能的开始位置，加起来一共会产生 6 条可能被翻译出来的蛋白质序列。这 6 条中有些是真实存在的，有些是不存在，但是谁真谁假我们无从知晓，所以 6 条序列都要到数据库中去搜索一下试试。

Blastx 通过核酸计算机翻译成注释或未注释的蛋白质后，搜索匹配蛋白质数据库。

tBlastn 通过蛋白质找核酸数据库，并将核酸序列计算机翻译成蛋白质后进行匹配蛋白质数据库。可以查找已注释或未注释的蛋白。

tBlastx 核酸序列计算机翻译成蛋白质后，搜索核酸序列数据库，然后再将核酸序列翻译成蛋白质后，搜索蛋白质数据库。

核酸翻译成蛋白后，找蛋白。

image.png

问答：要在核酸数据库查询一段与某DNA序列编码蛋白质最相似的序列，应选择：tBlastx
核酸翻译成蛋白后，找核酸。

BLAST 搜索：NCBI BLASTp

Blast官网：https://blast.ncbi.nlm.nih.gov/Blast.cgi

image.png

示例

搜索蛋白序列搜索蛋白序列，Blastp

image.png

跨平台搜索Swissport数据库

image.png

选择标准匹配

image.png

搜索结果

image.png

搜索序列按E值从小到达排列

image.png

BLAST 搜索：NCBI PSI-BLAST

搜索算法分类：

Algorithm blastp (protein-protein BLAST) 标准Blast，搜索最少，最精确
Algorithm PSI-BLAST (Position-Specific Iterated BLAST) 位点特异性迭代Blast，标准搜索不到的，可以使用此扩展搜索。
Algorithm PHI-BLAST (Pattern Hit Initiated BLAST)
Algorithm DELTA-BLAST (Domain Enhanced Lookup Time Accelerated BLAST

PSI-BLAST，根据上一次搜索结果，根据权重，搜索下一层结果。

image.png

第一轮搜索，的搜索结果，打勾，用于GO第二轮的搜索，第二轮新产生的用黄色标记（被标准blast漏掉的序列）。

image.png

BLAST 搜索：NCBI PHI-BLAST

PHI-BLAST 则是精准搜
索。PHI 是 Pattern-Hit Initiated 首字母缩写，中文是模式识别。PHI-BLAST 能找到与输入序
列相似的并符合某种特征模式的蛋白质序列。模式 Pattern 是对特征的描述。

image.png

模式范围
PSI-Blast 扩展匹配》标准Blast》PHI-Blast 模式匹配

image.png

BLAST 搜索：其他 BLAST

image.png

SMARTBLAST 聪明的Blast ，只需要输入序列就行。
https://blast.ncbi.nlm.nih.gov/smartblast/?LINK_LOC=BlastHomeLink

示例

image.png

在国外睡觉的时候，选择对应搜索引擎，如美国睡觉的时候，选择NCBI

image.png

多序列比对介绍：用途和算法

多序列比对的作用

image.png

从多序列比对中看趋势

image.png

多序列比对介绍：注意事项

image.png

在线多序列比对工具：EMBL - Clustal Omega

image.png

EBI多序列比对网站
http://www.ebi.ac.uk/Tools/msa

示例

image.png

选择Download Aligment File进行比对
比对结果：
https://www.ebi.ac.uk/Tools/services/web/toolresult.ebi?jobId=clustalo-I20171230-133045-0811-8947437-p1m

image.png

文件下载

image.png

此生成的树，不能作为系统发生树，没有经过进行距离校正。

image.png

如果想要根据多序列比对结果构建系统发生树，可以在 Alignments 标签下，点击“Send toClustalW2_Phylogeny”链接，把做好的多序列比对发送给专门做系统发生树的工具。

在线多序列比对工具：TCOFFEE - Expresso

官网：http://tcoffee.crg.cat

image.png

通过结构数据，辅助，提高比对结果准确度

image.png

示例
使用网站的示例序列，直接比对。
勾选自动搜索PDB数据库，填写邮箱等待结果。
Automatically fetch pdb templates MODE_PDB

image.png

TCOFFEE高质量比对结果

image.png

普通比对结果

image.png

在线多序列比对工具：多序列比对的保存格式

image.png

fmtseq 工具（http://www.bioinformatics.org/JaMBW/1/2）

image.png

多序列比对的编辑和发布：Jalview 的介绍和操作

对比对结果进行美化，加颜色
Jalview 官网（http://www.jalview.org）

image.png

全功能桌面版

image.png

展示窗口

上传clust文件

image.png

查看保守区序列

image.png

添加颜色方案

image.png

papper常用的方案

image.png

多序列比对的编辑和发布：Jalview 的编辑和发布

移动空位gap

image.png

换行

image.png

注释行的打开与关闭

image.png

序列排序和双序列全局比对

image.png

计算系统发生树

image.png

预测蛋白质二级结构

image.png

导出编辑后的多序列比对

image.png

多序列比对编辑工具

名称网址特点
JalView http://www.jalview.org JAVA，可嵌入网页
Boxshade http://www.ch.embnet.org/software/BOX_form.html 擅长黑白作图
ESPript http://espript.ibcp.fr/ESPript/ESPript 功能强大
MView http://bio-mview.sourceforge.net 擅长转换成 HTML 源码

发大文章彩图贵，黑白图免费
可以插入网页，可以网页打开，换行

寻找保守区域：序列标识图 WebLogo

做多序列比对，就是为了找保守区域，找* ：多的区域

“*”代表这一列残基完全相同；
“:”代表这一列残基或者相同或者相似；
“.”代表这一列残基有相似的但也有不相似的；

序列标识图就是序列的 logo，它是以图形的方式依次绘出序列比对中各个位置上出现的残基，每个位置上残基的累积可以反应出该位置上残基的一致性。每个残基对应图形字符的大小与残基在该位置上出现的频率成正比。但图形字符的大小并不等于频率百分比，而是经过简单统计计算后转化的结果。

image.png

保守会看到单一高字母，和出现频率成正比。有熵值，杂变矮，

image.png

WebLogo 是一款在线创建序列标识图的软件（http://weblogo.threeplusone.com/）。

软件界面

image.png

结果显示

image.png

寻找保守区域：序列基序 MEME

MEME 是 The MEME Suite 在线软件套装中的一员（http://meme-suite.org/）

image.png

进入软件
http://meme-suite.org/tools/meme

MEME HTML 结果页面

image.png

More 链接查看基序详情

image.png

提交基序给 FIMO 进行数据库相似性搜索

image.png

寻找保守区域：PRINTS 指纹图谱数据库

PRINTS 蛋白质序列指纹图谱数据库（http://www.bioinf.manchester.ac.uk/dbbrowser/PRINTS/）

image.png

关键词搜索转铁蛋白家族图谱

image.png

9人点赞

【生信课程】

leadingsci

拥有4钻 (约0.88元)

你可能感兴趣的:(文本相似度计算,序列比对)

LLM 词汇表落难Coder LLMs NLP 大语言模型大模型 llama 人工智能
Contextwindow“上下文窗口”是指语言模型在生成新文本时能够回溯和参考的文本量。这不同于语言模型训练时所使用的大量数据集，而是代表了模型的“工作记忆”。较大的上下文窗口可以让模型理解和响应更复杂和更长的提示，而较小的上下文窗口可能会限制模型处理较长提示或在长时间对话中保持连贯性的能力。Fine-tuning微调是使用额外的数据进一步训练预训练语言模型的过程。这使得模型开始表示和模仿微调数
将cmd中命令输出保存为txt文本文件落难Coder Windows cmd window
最近深度学习本地的训练中我们常常要在命令行中运行自己的代码，无可厚非，我们有必要保存我们的炼丹结果，但是复制命令行输出到txt是非常麻烦的，其实Windows下的命令行为我们提供了相应的操作。其基本的调用格式就是：运行指令>输出到的文件名称或者具体保存路径测试下，我打开cmd并且ping一下百度：pingwww.baidu.com>./data.txt看下相同目录下data.txt的输出：如果你再
509. 斐波那契数(每日一题) lzyprime
lzyprime博客(github)创建时间：2021.01.04qq及邮箱：2383518170leetcode笔记题目描述斐波那契数，通常用F(n)表示，形成的序列称为斐波那契数列。该数列由0和1开始，后面的每一项数字都是前面两项数字的和。也就是：F(0)=0，F(1)=1F(n)=F(n-1)+F(n-2)，其中n>1给你n，请计算F(n)。示例1：输入：2输出：1解释：F(2)=F(1)+
【华为OD技术面试真题 - 技术面】-测试八股文真题题库（1）算法大师华为od 面试 python 算法前端
华为OD面试真题精选专栏：华为OD面试真题精选目录:2024华为OD面试手撕代码真题目录以及八股文真题目录文章目录华为OD面试真题精选1.黑盒测试和白盒测试的区别2.假设我们公司现在开发一个类似于微信的软件1.0版本，现在要你测试这个功能：打开聊天窗口，输入文本，限制字数在200字以内。问你怎么提取测试点。功能测试性能测试安全性测试可用性测试跨平台兼容性测试网络环境测试3.接口测试的工具你了解哪些
日常演播练习0822 开阳春天
日常演播练习0822一、绕口令练习司小四和史小世，四月十四日十四时四十上集市，司小四买了四十四斤四两西红柿，史小世买了十四斤四两细蚕丝。司小四要拿四十四斤四两西红柿换史小世十四斤四两细蚕丝。史小世十四斤四两细蚕丝不换司小四四十四斤四两西红柿。司小四说我四十四斤四两西红柿可以增加营养防近视，史小世说我十四斤四两细蚕丝可以织绸织缎又抽丝。二、文本练习狗熊是动物街有名的美食家，它吃得多所以长得胖，它能吃
一文掌握python面向对象魔术方法（二）程序员neil python python 开发语言
接上篇：一文掌握python面向对象魔术方法（一）-CSDN博客目录六、迭代和序列化：1、__iter__(self):定义迭代器，使得类可以被for循环迭代。2、__getitem__(self,key):定义索引操作，如obj[key]。3、__setitem__(self,key,value):定义赋值操作，如obj[key]=value。4、__delitem__(self,key):定义
BART&BERT Ambition_LAO 深度学习
BART和BERT都是基于Transformer架构的预训练语言模型。模型架构：BERT(BidirectionalEncoderRepresentationsfromTransformers)主要是一个编码器（Encoder）模型，它使用了Transformer的编码器部分来处理输入的文本，并生成文本的表示。BERT特别擅长理解语言的上下文，因为它在预训练阶段使用了掩码语言模型（MLM）任务，即
语文主题教学学习笔记之87 东哥杂谈
“语文主题教学”学习笔记之八十七（0125）今天继续学习小学语文主题教学的实践样态。板块三：教学中体现“书艺”味道。作为四大名著之一的《水浒传》，堪称我国文学宝库之经典。对从《水浒传》中摘选的单元，教师就要了解其原生态，即评书体特点。这也要求教师要了解一些常用的评书行话术语，然后在教学时适时地加入一些，让学生体味其文本中原有的特色。学生也要尽可能地通过朗读的方式，而不单是分析讲解的方式进行学习。细
如何用matlab灵活控制feko的求解 NingrLi matlab 开发语言
https://bbs.rfeda.cn/read.php?tid=3778Feko中的模型和求解设置等都可以通过editfeko进行设置，其文件存储为.pre文件，该文件可以用文本打开，因此，我们可以通过VB、VC、matlab等工具对.pre文件进行读写操作，以达到更灵活的使用feko。同样，对于.out文件，我们也可以进行读操作。熟练使用对.pre文件和.out文件的操作后，我们可以方便的计
JAVA·一个简单的登录窗口 MortalTom java 开发语言学习
文章目录概要整体架构流程技术名词解释技术细节资源概要JavaSwing是Java基础类库的一部分，主要用于开发图形用户界面（GUI）程序整体架构流程新建项目，导入sql.jar包（链接放在了文末），编译项目并运行技术名词解释一、特点丰富的组件提供了多种可视化组件，如按钮（JButton）、文本框（JTextField）、标签（JLabel）、下拉列表（JComboBox）等，可以满足不同的界面设计
2024春节微信红包封面序列号大全一览帮忙赚赏金
2024微信红包封面序列号哪里领取红包封面领取微信搜索公众号：【艺间封面】千万红包封面等你领取2024微信红包封面免费序列号如何设置微信红包封面？1.打开微信，点击好友选择红包。2.单击红包封面。3.单击“添加红包封面”。4.输入接收序列号。来一波免费的微信红包封面序列号微信红包封面序列号红包封面领取微信搜索公众号：艺间封面千万红包封面等你领取微信红包封面序列号kGnkrbw5a7N微信红包封面序
2022-05-22光印随思60学习要与现实打通无名之米8
20220522光印随思60学习要与现实打通今天在匆忙中完成了新网师课程的第七次预习作业。每次完成预习作业的过程都是一次艰难的学习，先要学习相关的文本和文件，了解作业需要的理论知识，之后需要把理论知识运用于实际工作和生活中。这也是学习的真正价值所在。在很多时候，会有这样的感觉，读了很多书为什么没有啥长进？现在回想应该就是，当只有阅读和感受，没有把阅读心得转化为文字，没有把阅读的知识运用到实际的场景
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
AI论文题目生成器怎么用？9款论文写作网站简单3步搞定小猪包333 写论文人工智能深度学习计算机视觉
在当今信息爆炸的时代，AI写作工具的出现极大地提高了写作效率和质量。本文将详细介绍9款优秀的论文写作网站，并重点推荐千笔-AIPassPaper。一、千笔-AIPassPaper千笔-AIPassPaper是一款功能强大的AI论文生成器，基于最新的自然语言处理技术，能够一键生成高质量的毕业论文、开题报告等文本内容。它不仅提供智能选题、文献推荐和论文润色等功能，还具有较高的用户评价。其文献综述生成功
每日OJ_牛客_马戏团（模拟最长上升子序列） GR鲸鱼 c++算法开发语言牛客数据结构
目录牛客_马戏团（模拟最长上升子序列）解析代码牛客_马戏团（模拟最长上升子序列）马戏团__牛客网搜狐员工小王最近利用假期在外地旅游，在某个小镇碰到一个马戏团表演，精彩的表演结束后发现团长正和大伙在帐篷前激烈讨论，小王打听了下了解到，马戏团正打算出一个新节目“最高罗汉塔”，即马戏团员叠罗汉表演。考虑到安全因素，要求叠罗汉过程中，站在某个人肩上的人应该既比自己矮又比自己瘦，或相等。团长想要本次节目中的
2024微信红包封面怎么领取免费的？（红包封面序列号获取方法）帮忙赚赏金
2024微信红包封面怎么领取免费的？（红包封面序列号获取方法）在中国，微信几乎成为了人们生活中不可或缺的一部分，而微信红包更是成为了人们表达祝福和送礼的一种形式。微信红包不仅方便快捷，还能够增添节日气氛和人与人之间的情感交流。然而，有时候我们想要定制一个特殊的微信红包封面，以更好地展现自己的个性和情感，但又担心定制费用过高。那么，如何才能免费获取2024微信红包封面的序列号呢？下面将为您详细介绍一
Python 推导式(Comprehensions) 戒灵
1,列表推导式num=[1,2,-5,10,-7,5,7,-1]filtered_and_squared=[x**2forxinnumifx>0]print(filtered_and_squared)迭代器(iterator)遍历输入序列num的每个成员x断言式判断每个成员是否大于零如果成员大于零，则被交给输出表达式，平方之后成为输出列表的成员。列表推导式被封装在一个列表中，所以很明显它能够立即生
Dockerfile FROM 两个 redDelta
Docker相关视频讲解：什么是容器Docker介绍实现"DockerfileFROM两个"的步骤步骤表格步骤操作1创建一个Dockerfile文件2写入FROM指令3构建第一个镜像4创建第二个Dockerfile文件5写入FROM指令6构建第二个镜像7合并两个镜像操作步骤说明步骤1：创建一个Dockerfile文件使用任意文本编辑器创建一个名为Dockerfile的文件。登录后复制#Docker
Shell脚本中sed使用 jcrhl321 linux
目录一、sed编辑器1、sed概述2、sed的工作流程3、sed命令的常见格式4、sed命令常用操作二、sed常用命令使用1、sed打印2、sed删除3、sed替换4、sed插入与增加4、sed剪切粘贴与复制粘贴一、sed编辑器sed（StreamEDitor）是一个强大而简单的文本解析转换工具，可以读取文本，并根据指定的条件对文本内容进行编辑（删除、替换、添加、移动等），最后输出所有行或者仅输出
处理标签包裹的字符串，并取出前250字符周bro 前端 javascript 开发语言
//假设这是你的HTML字符串varhtmlString=`这是一个段落。这是一个标题这是另一个段落，包含一些链接。`;//解析HTML字符串并提取文本functionextractTextFromHTML(html){varparser=newDOMParser();vardoc=parser.parseFromString(html,"text/html");vartextContent=do
vue2实现复制,粘贴功能周bro vue.js javascript 前端
一、需求说明在项目中点击按钮复制某行文本是很常见的应用场景，在Vue项目中实现复制功能需要借助vue-clipboard2插件。二、代码实现1、安装vue-clipboard2依赖（出现错误的话，可以试试切换成淘宝镜像源npmconfigsetregistryhttps://registry.npm.taobao.org）npminstall--savevue-clipboard22、在main.
css设置当字数超过限制后以省略号（...）显示周bro css 前端 vue css3 html 经验分享
1、文字超出一行，省略超出部分，显示’…’用text-overflow:ellipsis属性来，当然还需要加宽度width属来兼容部分浏览。overflow:hidden;text-overflow:ellipsis;white-space:nowrap;2、多行文本溢出显示省略号display:-webkit-box;-webkit-box-orient:vertical;-webkit-lin
Codeforces Round 972 (Div. 2) A-C 题解 AKDreamer_HeXY Codeforces 比赛题解 c++算法动态规划数据结构贪心算法
本来以为B2难度会1900什么的，结果感觉1200还没有，先做的B1，后悔了QwQ关于我现场没切出C这件事……现场排名：A.SimplePalindrome题意构造一个长度为nnn的字符串，只包含aeiou五种字母，需要使得构造出来的字符串所包含的回文子序列数量最小思路当n≤5n\le5n≤5时，只要555个字母不重复出现都是最优情况当n>5n>5n>5时，可以证明：把相同字母放在一起是最优情况：
【Python】tkinter及组件如何使用小九不懂SAP 我的Python日记 python 开发语言 tkinter
一、tkinter的应用场景tkinter是Python的标准GUI（图形用户界面）库，它提供了丰富的控件和工具，使得开发者能够轻松创建跨平台的桌面应用程序。以下是一些tkinter的常见应用场景：桌面应用程序开发：开发者可以使用tkinter来创建各种桌面应用程序，如文本编辑器、计算器、图片查看器、游戏等。这些应用程序可以具有复杂的用户界面，包括窗口、按钮、文本框、下拉菜单、滚动条等。数据可视化
大模型训练数据库Common Crawl WindyChanChan 数据集语言模型数据库
CommonCrawl介绍‌‌CommonCrawl是一个非营利组织，致力于通过大规模分布式爬虫系统定期抓取整个Web并将其存储在一个可公开访问的数据库中。CommonCrawl的数据收集和处理过程包括使用Python开源爬虫工具收集全球范围内的网站数据，并将其上传到‌CommonCrawl基金会的数据仓库中。该项目从2008年开始，至今已经积累了大量的原始网页数据、元数据和文本提取数据。这些数据
算法刷题：300. 最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组、1143. 最长公共子序列哆来咪咪咪算法
300.最长递增子序列1.dp定义：dp[i]表示i之前包括i的以nums[i]结尾的最长递增子序列的长度2.递推公式：if(nums[i]>nums[j])dp[i]=max(dp[i],dp[j]+1);注意这里不是要dp[i]与dp[j]+1进行比较，而是我们要取dp[j]+1的最大值。3.初始化：每一个i，对应的dp[i]（即最长递增子序列）起始大小至少都是1.classSolution{
Python精选200Tips：121-125 AnFany Python200+Tips python 开发语言
Spendyourtimeonself-improvement121Requests-简化的HTTP请求处理发送GET请求发送POST请求发送PUT请求发送DELETE请求会话管理处理超时文件上传122BeautifulSoup-网页解析和抓取解析HTML和XML文档查找单个标签查找多个标签使用CSS选择器查找标签提取文本修改文档内容删除标签处理XML文档123Scrapy-强大的网络爬虫框架示例
FlagEmbedding 吉小雨 python库 python
FlagEmbedding教程FlagEmbedding是一个用于生成文本嵌入（textembeddings）的库，适合处理自然语言处理（NLP）中的各种任务。嵌入（embeddings）是将文本表示为连续向量，能够捕捉语义上的相似性，常用于文本分类、聚类、信息检索等场景。官方文档链接：FlagEmbedding官方GitHub一、FlagEmbedding库概述1.1什么是FlagEmbeddi
python中的迭代器有什么用 hakesashou python基础知识 python 开发语言
什么是Python迭代器？迭代器（Iterator）：迭代器可以看作是一个特殊的对象，每次调用该对象时会返回自身的下一个元素，从实现上来看，一个迭代器对象必须是定义了__iter__()方法和next()方法的对象。1、Python的Iterator对象表示的是一个数据流，可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度，所以Iterator的计算是惰性的，只有在需要返回下一个数
【JS】前端文件读取FileReader操作总结程序员-张师傅前端前端 javascript 开发语言
前端文件读取FileReader操作总结FileReader是JavaScript中的一个WebAPI，它允许web应用程序异步读取用户计算机上的文件（或原始数据缓冲区）的内容，例如读取文件以获取其内容，并在不将文件发送到服务器的情况下在客户端使用它。这对于处理图片、文本文件等非常有用，尤其是当你想要在用户界面中即时显示文件内容或进行文件预览时。创建FileReader对象首先，你需要创建一个Fi
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

【转载 生信课程】03-序列比较-山东大学-生物信息学

序列比较

认识序列

序列相似性

核酸序列的替换记分矩阵

蛋白质序列的替换记分矩阵

蛋白质序列的替换记分矩阵

序列两两比较之打点法：打点法的用途

序列两两比较之打点法：Dotlet 界面介绍

序列两两比较之序列比对法：什么是序列比对

序列两两比较之序列比对法：双序列全局比对

序列两两比较之序列比对法：双序列局部比对

一致度和相似度

在线双序列比对工具：EMBL 全局双序列比对工具

在线双序列比对工具：Gap 的类型及分值设置

在线双序列比对工具：EMBL 局部双序列比对工具

在线双序列比对工具：其他在线双序列比对工具

BLAST 搜索：BLAST 是怎么样工作的？

BLAST 搜索：BLAST 的种类

BLAST 搜索：NCBI BLASTp

BLAST 搜索：NCBI PSI-BLAST

BLAST 搜索：NCBI PHI-BLAST

BLAST 搜索：其他 BLAST

多序列比对介绍：用途和算法

多序列比对介绍：注意事项

在线多序列比对工具：EMBL - Clustal Omega

在线多序列比对工具：TCOFFEE - Expresso

在线多序列比对工具：多序列比对的保存格式

多序列比对的编辑和发布：Jalview 的介绍和操作

多序列比对的编辑和发布：Jalview 的编辑和发布

寻找保守区域：序列标识图 WebLogo

寻找保守区域：序列基序 MEME

寻找保守区域：PRINTS 指纹图谱数据库

你可能感兴趣的:(文本相似度计算,序列比对)

【转载生信课程】03-序列比较-山东大学-生物信息学