CAAS_IFR_zp

使用Diamond比对NR数据库获取物种注释

之前用Kraken2注释宏基因组的contig，发现只有30%左右可以被Kraken2注释

Kraken2+Bracken：宏基因组物种注释-CSDN博客

不信邪，再用NR库试试

参考：

将NR数据库diamond比对结果做物种注释_diamond 物种注释-CSDN博客

NR下载

nohup wget -t 0 -c -b https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz &
wget -c https://ftp.ncbi.nlm.nih.gov/blast/db/FASTA/nr.gz.md5
#检查下载的完整性（一样的话就是完整了）
md5sum nr.gz  ### 899ac219cac213c60fede9c3d9ef8f7b  nr.gz
cat nr.gz.md5 ### 899ac219cac213c60fede9c3d9ef8f7b  nr.gz
nohup gunzip  nr.gz  &
mv nr  nr.fa

###下载NR物种相关信息和taxid信息
wget -t 0 -c -b https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz
wget -t 0 -c -b https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/accession2taxid/prot.accession2taxid.gz.md5
wget -t 0 -c -b https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz
wget -t 0 -c -b https://ftp.ncbi.nlm.nih.gov/pub/taxonomy/taxdump.tar.gz.md5
#检查完整性
md5sum prot.accession2taxid.gz  #32b8ca7ea712e161c72af69135fc938e
cat prot.accession2taxid.gz.md5 #32b8ca7ea712e161c72af69135fc938e
md5sum taxdump.tar.gz           #26558b800bc1b3795c25d1f0ead65412
cat taxdump.tar.gz.md5          #26558b800bc1b3795c25d1f0ead65412  
#解压
tar -zxvf taxdump.tar.gz
gunzip prot.accession2taxid.gz
#移动需要的文件
cd ~
mkdir .taxonkit
cp *.dmp ~/.taxonkit

必要软件下载

conda create -n NR_database_search
conda activate NR_database_search
conda install -c bioconda taxonkit=0.15.0
conda install -c bioconda diamond=2.1.8
conda install -c bioconda csvtk=0.28.0

diamond建库

nohup diamond makedb --threads 180 --in nr.fa --db NR_2023_07_23 &

diamond比对

diamond blastx --db NR_2023_07_23.dmnd --query nucleic_reads.fna\
-o nucleic_matches_fmt6.txt --threads 180 --evalue 0.00001 \
--max-target-seqs 5 --outfmt 6

diamond blastp --db NR_2023_07_23.dmnd --query protein_reads.fna\
-o protein_matches_fmt6.txt --threads 180 --evalue 0.00001 \
--max-target-seqs 5 --outfmt 6
## --outfmt 6 最好别改变

这些参数可以调整diamond比对的速度or准确性

这几个参数可以调整比对的coverage，identity，score

结果如下！！！（这个表头后面python会加）

taxonkit获得物种分类信息表

感谢大佬：一文完成nt库序列快速下载及blast结果注释物种 (qq.com)

得到seqid注释之后，可以搜索注释

## 一些主要的物种编号
# 2     bacteria
# 2157  archaea
# 4751  fungi
# 10239 virus
# 2759 Eukaryota

#看taxnokit安好了么
taxonkit -h

#创建目录
cd /home/zhongpei/database/NR_2023_07_23
mkdir /home/zhongpei/database/NR_2023_07_23/NCBI_Main_tax
cd NCBI_Main_tax

#开始
taxonkit list -j 4 --ids 2,2157,4751,10239,2759 --indent "" > NCBI_Main.taxid.txt
# -j 是线程，软件说4个够了；--ids 是需要的物种编号，用逗号分隔
wc -l NCBI_Main.taxid.txt # 2708739 NCBI_Main.taxid.txt
head -n 5 NCBI_Main.taxid.txt #查看内容

# 提取taxid和taxonomy（界门纲目科属种）的对应信息到NCBI_Main.taxid.txt
less NCBI_Main.taxid.txt | taxonkit reformat -I 1 -r Unassigned -f "{k}\t{p}\t{c}\t{o}\t{f}\t{g}\t{s}\t{t}"| sed '1i\Taxid\tKingdom\tPhylum\tClass\tOrder\tFamily\tGenus\tSpecies\tStrain' > NCBI_Main.taxid_new.txt
# -I 1 一个制表符分隔；-r 没有找到的用什么字符去填充，这里用的“Unassigned” 
# -f 输出的格式；1i表示在第行之前插入文本(sed用法，不太会)

完成！

vim NCBI_Main.taxid_new.txt

把第一个Taxid改成小写

seqid和taxid的对应

还记不记得第一步下载过一个 "prot.accession2taxid" ，现在要派上用场了

其实python也能做，csvtk太不熟悉了，先来学习一下吧，感觉还挺方便（这一步比较慢）

cat prot.accession2taxid | csvtk -t grep -f taxid -P NCBI_Main.taxid.txt | csvtk -t cut -f accession.version,taxid > NCBI_seqid_taxid.txt
# "cat prot.accession2taxid |" 把 prot.accession2taxid 的内容到下面的 csvtk
# -t 输入内容是制表符分隔；grep 这是csvtk的1个子命令，用于在文件中搜索匹配的行
# -P 搜索那些"taxid"字段的值出现在"NCBI_Main.taxid.txt"文件中的行
# cut 这是csvtk的1个子命令，用于从输入中选择特定的字段

NCBI_seqid_taxid.txt 就是目标文件

diamond seqid和taxid对应，再和界门纲目科属种对应

把diamond结果文件与NCBI_seqid_taxid.txt对应

#!/home/zhongpei/miniconda3/envs/py39/bin/python3.9
# ##########################################################
# match diamond blast NR result.txt and NCBI_seqid_taxid.txt
# written by PeiZhong in IFR of CAAS

import os
import argparse

parser = argparse.ArgumentParser(description='match diamond blast NR result.txt and NCBI_seqid_taxid.txt. '
'!!! all the file should end will .txt !!!')
parser.add_argument('diamond_result_folder_path',help='full Path of the folder that contain your diamond result txt')
parser.add_argument('result_files_mark',help='mark=The name of the mark specific to '
'your two-column diamond results file in this folder, e.g., clean, '
'for example,the mark of result file SY10_NR_diamond_clean_fmt6_taxid.txt is clean')
parser.add_argument('NCBI_acc_taxid',help='full Path that contain NCBI_seqid_taxid.txt')
args = parser.parse_args()

result_file_folder_path = args.diamond_result_folder_path
NCBI_file = args.NCBI_acc_taxid
file_mark = args.result_files_mark

os.chdir(result_file_folder_path)
files = os.listdir(result_file_folder_path)
print(files)

db={}

print("start db read")
f_table = open("%s" % (NCBI_file), 'r')
print("start db build")
for line in f_table.readlines():
    line=line.split('\t')
    acc_num = line[0].strip()
    tax_num = line[1].strip()
    db[acc_num] = tax_num
print("finish db build")

file_ls = []
for result_file in files:
    if file_mark in result_file:
        file_ls.append(result_file)
file_ls.sort()
print(file_ls)

header = "qseqid\taccession.version\tpident\tlength\tmismatch\tgapopen\tqstart\tqend\tsstart\tsend\tevalue\tbitscore"

for result_file in file_ls:
    print(result_file)
    f_result = open("%s" % (result_file), 'r+')
    content = f_result.read()
    f_result.seek(0, 0)
    f_result.write(header.rstrip('\r\n') + '\n' + content)
    f_result.close()
    out_name = str(result_file).strip('txt')
    out_name = out_name+'_taxid.txt'
    f_result = open("%s" % (result_file), 'r')
    f_out = open("%s" % (out_name), 'a')
    for line in f_result.readlines():
        line = line.split('\t')
        query_num = line[0].strip()
        acc_q_num = line[1].strip()
        if acc_q_num in db:
            print(query_num,end="\t",file=f_out)
            print(acc_q_num, end="\t", file=f_out)
            print(db[acc_q_num], file=f_out)
    f_out.close()
    f_result.close()
f_table.close()

chmod +x diamond_NR_tax.py(完整地址)
diamond_NR_tax.py(完整地址) -h
diamond_NR_tax.py(完整地址) diamond_result_folder_path result_files_mark NCBI_acc_taxid
diamond_result_folder_path：你存放上面处理完的diamond比对文件，txt结尾的文件，的目录（完整地址）
result_files_mark：这个地址中，你的这些文件独有的标识字符串
#for example,the mark of result file 'SY10_clean.txt' and 'SY11_clean.txt' is 'clean'
NCBI_acc_taxid：你的NCBI_seqid_taxid.txt文件的完整地址

做完结果是这样的

接下来再写个python代码根据taxid把这个文件和界门纲目科属种联系起来就行(不好意思只会python，我检讨。。。。但是python简单呀)

#!/home/zhongpei/miniconda3/envs/py39/bin/python3.9
# ##########################################################
# match diamond blast NR taxid result.txt and NCBI_Main.taxid_new.txt
# written by PeiZhong in IFR of CAAS

import os
import argparse

parser = argparse.ArgumentParser(description='match diamond blast NR taxid result.txt and NCBI_Main.taxid_new.txt. '
'!!! all the file should end will .txt !!!')
parser.add_argument('diamond_result_folder_path',help='full Path of the folder that contain your result txt')
parser.add_argument('result_files_mark',help='mark=The name of the mark specific to '
'your two-column diamond results file in this folder, e.g., clean, '
'for example,the mark of result file SY10_NR_diamond_clean_fmt6_taxid.txt is clean')
parser.add_argument('NCBI_taxid_tax',help='full Path that contain NCBI_Main.taxid_new.txt')
args = parser.parse_args()

result_file_folder_path = args.diamond_result_folder_path
NCBI_file = args.NCBI_taxid_tax
file_mark = args.result_files_mark

os.chdir(result_file_folder_path)
files = os.listdir(result_file_folder_path)
print(files)

db={}

print("start db read")
f_table = open("%s" % (NCBI_file), 'r')
print("start db build")
for line in f_table.readlines():
    line=line.split('\t')
    taxid = line[0].strip()
    tax_anno = line[1:8]
    db[taxid] = tax_anno
print("finish db build")

file_ls = []
for result_file in files:
    if file_mark in result_file:
        file_ls.append(result_file)
file_ls.sort()
print(file_ls)

for result_file in file_ls:
    print(result_file)
    out_name = str(result_file).strip('txt')
    out_name = out_name+'_tax.txt'
    f_result = open("%s" % (result_file), 'r')
    f_out = open("%s" % (out_name), 'a')
    for line in f_result.readlines():
        line = line.split('\t')
        query_num = line[0].strip()
        acc_q_num = line[1].strip()
        taxid_1 = line[2].strip()
        if taxid_1 in db:
            print(query_num,end="\t",file=f_out)
            print(acc_q_num, end="\t", file=f_out)
            print(taxid_1, end="\t", file=f_out)
            tax_in_db = db[taxid_1]
            str_ls = map(str, tax_in_db)
            tax = '\t'.join(str_ls)
            print(tax, file=f_out)
    f_out.close()
    f_result.close()
f_table.close()

和上面一样也需要给权限

好了，可以交差了！我宣布python是我们初学者的yyds

再把多个样本的结果结合到一起成为表格

#!/home/zhongpei/miniconda3/envs/py39/bin/python3.9
# ##########################################################
# match diamond blast NR result.txt and NCBI_seqid_taxid.txt
# written by PeiZhong in IFR of CAAS
import argparse
import os
import pandas as pd
import csv

parser = argparse.ArgumentParser(description='tax files combine')
parser.add_argument('tax_result_folder_path',help='full Path of the folder that contain your tax result txt')
parser.add_argument('result_files_mark',help='mark=The name of the mark specific to '
'your two-column diamond results file in this folder, e.g., clean, '
'for example,the mark of result file SY10_NR_diamond_clean_fmt6_taxid.txt is clean')
args = parser.parse_args()

result_file_folder_path = args.tax_result_folder_path
file_mark = args.result_files_mark

path = os.chdir(result_file_folder_path)
files = os.listdir(result_file_folder_path)

file_ls = []
for file in files:
    if file_mark in file:
        file_ls.append(file)
file_ls.sort()
print(file_ls)

for file in file_ls:
    df = pd.read_csv('%s' % (file),sep='\t')
    df.drop_duplicates(subset='qseqid', keep='first', inplace=True)
    outname = str(file).rsplit(".", 1)[0]
    df.to_csv(outname+'_only1.txt', index=False, sep='\t')

path = os.chdir(result_file_folder_path)
files = os.listdir(result_file_folder_path)
file2_ls = []
for file2 in files:
    if "only1" in file2:
        file2_ls.append(file2)
file2_ls.sort()
print(file2_ls)

def tax_finder(file):
    tax_ls = []
    with open(file, 'r') as f:
        for line in f.readlines():
            if "qseqid" not in line:
                tax = ';'.join(line.split('\t')[3:9])
                tax_ls.append(tax)
    db = {}
    for i in tax_ls:
        if i in db:
            db[i] += 1
        if i not in db:
            db[i] = 1
    output = str(file).rsplit(".",1)[0]+"_count1.txt"
    with open(output,"a") as f3:
        for key, value in db.items():
            key = key.strip()
            print(key, end="\t", file=f3)
            print(value, file=f3)

for file in file2_ls:
    tax_finder(file)

path = os.chdir(result_file_folder_path)
files = os.listdir(result_file_folder_path)
file3_ls = []
for file3 in files:
    if "count1" in file3:
        file3_ls.append(file3)
file3_ls.sort()
print(file3_ls)

all_tax = {}

for file in file3_ls:
    with open("%s" % (file),"r") as f4:
        for line in f4.readlines():
            tax = line.split('\t')[0]
            all_tax[tax] = 0
print(all_tax)

ls_db_result = []

for file in file3_ls:
    with open("%s" % (file),"r") as f5:
        db_name = str(file)
        db_name = all_tax.copy()
        for line in f5.readlines():
            tax = line.split('\t')[0]
            count = line.strip("\n").split('\t')[1]
            if tax in db_name:
                db_name[tax] = count
    ls_db_result.append(db_name)

header=[]
for key in all_tax.keys():
    header.append(key)

with open('merge_overview_2.csv', 'a', encoding='utf-8', newline='') as f7:
    dictWriter = csv.DictWriter(f7,header)
    dictWriter.writeheader()
    dictWriter.writerows(ls_db_result)
f7_rows=[]
with open('merge_overview_2.csv',"r") as f7:
    for line in f7.readlines():
        f7_rows.append(line)

with open('merge_overview_3.csv',"a") as f8:
    print("",end=",",file=f8)
    print(f7_rows[0].strip("\n"),file=f8)
    row_count=0
    for i in file3_ls:
        row_count += 1
        print(i,end=",",file=f8)
        print(f7_rows[row_count].strip("\n"),file=f8)

Redis 分区奇点一氪
分区是分割数据到多个Redis实例的处理过程，因此每个实例只保存key的一个子集。分区的优势通过利用多台计算机内存的和值，允许我们构造更大的数据库。通过多核和多台计算机，允许我们扩展计算能力；通过多台计算机和网络适配器，允许我们扩展网络带宽。分区的不足redis的一些特性在分区方面表现的不是很好：涉及多个key的操作通常是不被支持的。举例来说，当两个set映射到不同的redis实例上时，你就不能对
2018-11-8 yl柠檬草的味道
六项精进日打卡2018年11月8日姓名：袁丽公司：上海缘缀包装材料有限公司【日精进打卡第104天】【知～学习】《六项精进》1遍共41遍《大学》1遍共37遍阅读《活法》若干章【经典名句分享】【行～实践】一、修身：（对自己个人）1、俯卧撑0个2、步行10000二、齐家：（对家庭和家人）问候家人！三、建功：（对工作）1、接受订单，沟通交期！今天接单数量还不错！催款！3、录入采购数据库，请款，沟通原料到货
一文掌握oracle19c之离线情况下命令行安装和建库（上）运维家
声明：本文乃“运维家”原创，转载请注明出处，更多内容请关注公众号“运维家”。主旨oracle作为主流数据库之一，身为IT人员，怎么能不会搭建呢？我不允许哈，下来看看如何一步一步的搭建起来吧。建议收藏，不然一会儿就找不见了，哈哈哈。环境linux环境oracle软件根目录下磁盘空间最少4G软件下载官网下载太慢，而且需要注册，这里直接从公众号“运维家”后台回复“oracle”即可获取软件包，即取即用。
运维技术干货 — 不仅是 Linux 运维最佳实践 python算法小白 Linux
附Java/C/C++/机器学习/算法与数据结构/前端/安卓/Python/程序员必读书籍书单大全：书单导航页（点击右侧极客侠栈即可打开个人博客）：极客侠栈①【Java】学习之路吐血整理技术书从入门到进阶最全50+本（珍藏版)②【算法数据结构+acm】从入门到进阶吐血整理书单50+本（珍藏版)③【数据库】从入门到进阶必读18本技术书籍网盘吐血整理网盘(珍藏版)④【Web前端】从HTML到JS到AJ
医疗AI与融合数据库的整合：挑战、架构与未来展望（下） Allen_Lyb 数智化教程（第二期）人工智能数据库架构
解决方案：引入融合数据库（Multi-modalDataFusionDB）医院引入一款支持图、向量、表、流的融合数据库（如OracleADW、Milvus+PostgreSQL、或某国产平台），完成了以下集成：数据类型来源系统格式/模型示例内容基因组数据NGS平台VCF/JSON/图EGFR突变、ALK融合等医学影像特征CT影像AI平台向量肿瘤体积、位置、边界清晰度等临床病历HIS/EMR结构化表
Django数据库迁移番茄码 django 数据库 django oracle
在Django中进行数据库迁移的命令是`pythonmanage.pymigrate`。下面是一些常用的数据库迁移命令及其用途：1.`pythonmanage.pymakemigrations`：生成数据库迁移文件。当你修改了模型（Model）或创建了新的模型时，需要运行该命令来生成一个包含最新更改的迁移文件。2.`pythonmanage.pymigrate`：应用数据库迁移。运行该命令会将生成
Django基础(一)———创建与启动【本人】 PythonWeb django python 后端
前言从这篇文章开始，我将给大家介绍Python中的一个框架Django我将从基础开始一步一步带领大家深入了解Django框架并完成实战案例一、Django是什么？Django是一个免费、开源、高级的PythonWeb框架。它的核心目标是使开发复杂的、数据库驱动的网站变得快速、简单和安全。Django遵循“Don'tRepeatYourself”的设计哲学，强调代码复用和组件化。它奉行“包含电池”的
Django 实战：静态文件与媒体文件从开发配置到生产部署明明可爱多 django python 后端
合集-Django从入门到实战(11)1.Django实战：I18N国际化与本地化配置、翻译与切换一步到位07-182.Django数据库配置避坑指南：从初始化到生产环境的实战优化06-303.Django实战：自定义中间件实现全链路操作日志记录06-274.Django实战：HTTP状态码与业务状态码的分层设计与实战应用07-025.Django+DRF实战：从异常捕获到自定义错误信息07-04
Django 实战：Celery 异步任务从环境搭建到调用全掌握
合集-Django从入门到实战(11)1.Django实战：I18N国际化与本地化配置、翻译与切换一步到位07-182.Django数据库配置避坑指南：从初始化到生产环境的实战优化06-303.Django实战：自定义中间件实现全链路操作日志记录06-274.Django实战：HTTP状态码与业务状态码的分层设计与实战应用07-025.Django+DRF实战：从异常捕获到自定义错误信息07-04
Django母婴商城项目实践（二）- 商城项目环境配置 ITB业生 Django django 数据库 python
2、母婴商城项目环境配置环境配置：Python3.12解释器PycharmProfessional2025.1编辑器Django4.2（或Django5.x）MySQL8.0.28数据库1、Django框架介绍Django是一个高级的PythonWeb应用框架，可以快速开发安全和可维护的网站。由经验丰富的开发者构建，Django负责处理网站开发中麻烦的部分，可以专注于编写应用程序，而无需重新开发。
【Django备忘录】Django数据库的迁移
目录Contents一、确认信息二、生成迁移文件三、迁移数据库定义某个应用的数据模型后，就要执行数据库迁移了，具体步骤如下：一、确认信息先确认你的应用是否在项目名/setting.py的INSTALLED_APPS列表中激活，激活完成后才可使用迁移。没有激活完成会检测不到数据模型修改项，导致迁移后没有数据模型。二、生成迁移文件打开CMD，cd到你的项目的目录（注意是manage.py的同级目录），
Ubuntu 22.04.3 LTS 安装 MySQL mixboot mysql ubuntu mysql
更新系统包索引sudoaptupdatesudoaptupgrade-y安装MySQLsudoaptinstallmysql-server-y检查MySQL服务状态sudosystemctlstatusmysql运行MySQL安全配置脚本sudomysql_secure_installation设置root密码删除匿名用户容许root远程登录删除测试数据库重新加载权限表sudomysql_secu
MySQL高可用集群架构：主从复制、MGR与读写分离实战软考和人工智能学堂 PHP和MySQL php程序设计 MySQL经验与技巧数据库 mysql 架构
1.MySQL高可用架构概述MySQL高可用性(HighAvailability)解决方案旨在确保数据库服务在硬件故障、网络问题等异常情况下仍能持续提供服务。以下是主流的高可用方案对比：方案原理优点缺点适用场景主从复制基于binlog的异步复制简单易用，对性能影响小数据一致性弱，故障切换复杂读写分离、备份MHA监控主库并自动故障转移自动切换，减少停机时间需要VIP管理，配置复杂中小规模业务系统MG
21、数据库设计中的索引使用 garlic Azure数据服务建模指南数据库设计索引使用查询性能优化
数据库设计中的索引使用1.索引的基本概念索引是一种数据结构，旨在加速数据库中的数据检索操作。通过使用索引，数据库引擎可以更快速地定位所需的数据行，从而提高查询性能。索引类似于书籍的目录，通过目录可以快速找到特定页面，而不必逐页翻阅。2.索引的作用索引在数据库设计中起着至关重要的作用，主要包括以下几个方面：加速查询：索引可以帮助数据库引擎更快地找到特定的数据行，特别是在处理大量数据时。例如，当我们需
38、未来展望：C数据库编程的发展趋势与挑战 dog123 C#数据库编程：从入门到精通 C#数据库编程云原生数据库
未来展望：C#数据库编程的发展趋势与挑战1.引言随着信息技术的快速发展，数据库编程已经成为现代软件开发中不可或缺的一部分。C#作为一种强大的编程语言，在数据库编程领域展现出卓越的表现。本文将探讨C#数据库编程的未来发展趋势，分析当前面临的主要挑战，并提出相应的解决方案。通过这些讨论，我们希望能够为开发者提供有价值的见解，帮助他们在未来的项目中更好地应对变化和技术进步。2.数据库编程的新趋势2.1云
菜单权限管理 SXU_TSUKI_JAVA javaee Vue.js java
菜单管理系统的整体架构1.Menu菜单表2.role角色表3.role_menu角色菜单关联表（多对多）要找role_id为3的角色能用哪个菜单:SELECT*FROMsys_menuaLEFTJOINsys_role_menubONa.menu_id=b.menu_idWHERErole_id=3拆分开就是4.user用户表5.user_role用户角色关联表（多对多）前后端数据库是如何交互的A
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
MyBatis深度解析：从原理到实战的ORM框架指南秋秋棠 Java全栈 mybatis java
MyBatis深度解析：从原理到实战的ORM框架指南一、MyBatis核心概念1.1ORM框架的本质对象关系映射（ORM）是连接面向对象编程与关系型数据库的桥梁，它实现了：数据库表↔Java类的映射表记录↔对象实例的映射表字段↔对象属性的映射以用户表为例：idusernamepasswordage1zhangsan123456252lisiabcdef30对应的Java实体类：publicclas
时序数据库选型避坑全攻略：IoTDB性能与成本双杀的秘密！ LCG元数据库时序数据库 iotdb java
文章目录一、架构设计深度解析1.1IoTDB架构图谱1.2核心流程对比二、企业级实战代码2.1Python数据写入示例2.2TypeScript客户端实现2.3集群配置YAML三、性能对比分析四、生产部署方案4.1安全加固配置4.2安全策略实施五、技术前瞻分析5.1云原生演进路径5.2新型存储引擎预测六、技术图谱附录一、架构设计深度解析1.1IoTDB架构图谱数据写入协议适配层内存表管理持久化引擎
探索阿里云DMS：解锁高效数据管理新姿势云资源服务商 oracle 数据库阿里云云计算
一、阿里云DMS是什么阿里云DMS，全称为DataManagementService，即数据管理服务，是一种集数据管理、结构管理、安全管理于一体的全面数据库服务平台。它能够有效地支持各类数据库产品，包括但不限于MySQL、SQLServer、PostgreSQL、PPAS、DRDS、OceanBase、MongoDB、Redis等，对用户的数据库进行全方位的维护和管理，提供了一站式的数据库解决方案
北京-4年功能测试2年空窗-报培训班学测开-第五十四天 amazinging python 学习面试
今天交付的成果是，初版简历虽然只写了项目部分，但用了一整天，期间联系了前司组长，拿到了性能测试报告。然后再看压测脚本，突然能看懂了，对服务端日志也能看懂些了，还找到了客户端日志怎么说呢，现在就是各种拼凑的阶段。我需要回忆几年前工作中可能听过的那些内容，还有结合各种搜集到的信息(从前同事那或其提供的文件），同时通过问ai来拼凑要写的项目的技术栈、架构、接口、数据库、开发逻辑等真的是要命了，以前根本对
Docker应用推荐个人服务器实用有趣的项目推荐牧子与羊 docker 服务器容器
Wallabag：是一个开源的、自托管的文章阅读和保存工具。它允许你保存网页文章并进行离线阅读，去除广告和不必要的内容，以提供更好的阅读体验。Wallabag支持多种导入和导出格式，并提供了一些实用的功能，如标签、阅读列表和文本高亮。phpMyAdmin：是一个基于Web的MySQL数据库管理工具。它提供了一个易于使用的界面，用于管理数据库、执行SQL查询、导入导出数据、创建表格、用户管理等各种数
CentOS 7如何平滑升级 MariaDB 5.5 到 10.x 新版本 Herotwins CentOS centos mariadb mysql
前言自从CentOS7开始，自带的数据库就变成MariaDB了，yum安装之后的默认版本是5.5，但是该版本不能满足Zabbix的需求，需要升级。无论是安装全新的还是升级MariaDB第一步始终是不要忘记备份。备份数据库重要的事情说三遍，备份，备份，备份！#备份数据库，如果升级顺利是不要实施备份还原的mysqldump-uroot-p--all-databases>alldb.sql#如果想保留自
基于 Mockito 框架的 Mock 单元测试
1.什么是Mock测试Mock通常是指，在测试一个对象A时，我们构造一些假的对象（一般是不容易构造或者不容易获取的对象，比如测试类所依赖的实现类、第三方接口、数据库操作对象）来模拟与A之间的交互，这些对象被称为Mock对象，而Mock对象的行为是我们事先设定且符合预期。通过这些Mock对象来测试A在正常逻辑，异常逻辑或压力情况下工作是否正常。下面是一个例子：当我们需要测试OrderService时
GaussDB 分布式部署下创建表方法
1、问题现象分布式集群采用水平分表的方式，将业务数据表的元组/行打散存储到各个节点内。2、技术背景通过全并行数据处理技术和快速定位到数据存储位置等手段可极大提升数据库性能，GaussDB分布式部署下可以创建俩种类型表，在做实际业务系统开发时根据业务场景创建不同表。复制表一般使用在小数量、更新操作少的场景下。分布表：数据会根据函数映射(hash,range,list),将数据打散在不同的DN上存储。
【Oracle】Oracle 11g 中扩展表空间瑞琪姐大数据模块 oracle 数据库
在Oracle11g中扩展表空间是常见的数据库管理任务，通常有以下几种核心方法，操作步骤如下：一、扩展表空间常用方法方法1：调整现有数据文件大小(RESIZE)适用于磁盘空间充足，且当前数据文件未达上限的情况。--查询当前数据文件路径和大小SELECTfile_name,bytes/1024/1024AScurrent_size_mbFROMdba_data_filesWHEREtablespac
【Oracle】ORACLE OMF说明瑞琪姐大数据模块 oracle 数据库
ORACLEOMF(OracleManagedFiles)是Oracle数据库提供的一项自动化文件管理功能。它的核心目的是简化数据库管理员（DBA）对数据库底层操作系统文件的管理工作。以下是OMF的关键要点：核心功能：自动命名和定位文件在创建数据库对象（如表空间、控制文件、在线重做日志文件等）时，DBA不需要手动指定文件在操作系统上的完整路径和文件名。Oracle数据库会根据预先配置的参数和内部规
【Oracle】删除 Oracle 19c 的监听器和数据库实例同时保留数据库软件瑞琪姐大数据模块数据库 oracle
要删除Oracle19c的监听器和数据库实例，同时保留数据库软件，请按以下步骤操作：1.停止监听器lsnrctlstop2.删除监听器配置手动删除配置文件：cd$ORACLE_HOME/network/adminrmlistener.orasqlnet.oratnsnames.ora#删除网络配置文件或使用netca工具：netca选择“Listenerconfiguration”→“Delete
MySQL索引实现原理和索引类型巴里巴气 MySQL高阶知识记录 mysql 数据库
目录索引介绍索引的数据结构哈希表有序数组搜索树(二叉搜索树、N叉搜索树、B+树)索引类型主键索引和非主键索引主键索引数据来源索引叶子节点存储内容主键的选择联合索引最左前缀原则索引下推范围查询会阻断后续列匹配覆盖索引回表避免回表前缀索引前缀索引的局限性总结按数据结构分类按物理存储分类按字段特性分类按字段个数分类索引介绍索引的出现其实就是为了提⾼数据查询的效率，对于数据库的表来说,索引就是它的目录索引
【GaussDB】如何避免Ops巡检-xlog数量异常？小嗑数据库 gaussdb 数据库
告警解释此告警对应指标“xlog数量”超出配置阈值，此指标反映组件保留的xlog数量。告警属性告警ID告警级别告警类型告警归属业务类型是否可自动清除5101339巡检配置业务质量告警租户面云数据库GaussDB节点是告警参数类别参数名称参数含义定位信息云服务产生告警的云服务实例ID产生告警的实例ID节点ID产生告警的节点ID巡检名称产生告警的巡检名称
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><