刘永鑫Adam

中国核酸数据库GSA数据提交指南

文章目录

中国核酸数据库GSA

GSA 数据模型
数据触发机制说明
发布策略和免责声明
如何提交数据到GSA？

第一步：注册账户
第二步：进入GSA数据库创建GSA

1. 创建项目（BioProject）
2. 创建样本（BioSample）
3. 构建GSA数据集

数据追踪
引用格式

附录

计算MD5值

官方推荐不同平台使用的工具
压缩fq文件
提交数据文件如何命名？

ftp提交数据

猜你喜欢
写在后面

中国核酸数据库GSA

https://bigd.big.ac.cn/gsub/

GSA 数据模型

为确保与国际同类数据库系统的兼容性，GSA遵循INSDC联盟的数据标准，GSA元数据类别主要包括项目信息（BioProject，归档于生物项目数据库）、样本信息（BioSample，归档于生物样本数据库）、实验信息（Experiment）、以及测序反应（Run）信息。项目信息是用来描述所开展研究的目的、涉及物种、数据类型、研究思路等信息；样本信息是指本研究涉及的生物样本描述，如样本类型、样本属性等；实验信息包括实验目的、文库构建方式、测序类型等信息；测序反应信息包括测序文件和对应的校验信息。各类数据之间采用线性、一对多的模式进行关联，从而形成“金字塔”式的信息组织与管理模式（图1）。

数据触发机制说明

数据发布时，相关的BioProject、BioSample与GSA数据集遵循以下触发机制（图5）：

BioProject发布不会触发相关联BioSample信息与GSA数据集释放；
GSA数据集发布，会触发相关联BioProject和BioSample信息释放。

因此，请慎重填写BioProject、BioSample与GSA “发布时间”，一旦发布就代表数据或信息可供其他用户公开检索或下载。

发布策略和免责声明

用户可自行设定“发布日期”，在该日期之前，GSA保证数据不公开；
“发布日期”可以在GSA提交系统内进行修改：https://bigd.big.ac.cn/gsub/submit/gsa/[substitute your GSA accession number]/contents
如果引用这些数据和该accession号的文章先于您设定的发布时间而发表，我们将根据文章的发表时间来发布该数据；否则GSA将根据您设定的发布日期而发布该数据；
一旦文章发表，数据可以发布，请把已发表文章的全部信息–作者，题目，期刊，刊号，页数，日期信息发送到该邮箱： [email protected]

如何提交数据到GSA？

注册用户可通过中心生物数据统一汇交入口——生物数据递交系统（BIG Submission，BIG Sub，https://bigd.big.ac.cn/gsub/）进行一站式数据递交，具体步骤请查阅GSA使用说明。

下面我使用自己的数据来演示如何提交二代测序数据

第一步：注册账户

如何开始提交数据？账户注册完成后，您可遵循以下原则进行数据信息录入：

这里没有什么注意的，只是填写的信息比较多，我们选择性的将带有号的信息填写上就可以了，注意全部为英文。

第二步：进入GSA数据库创建GSA

这里主要有三个步骤：

1.创建项目（BioProject）；
2.创建样本（BioSample）；
3.创建GSA数据集；

1. 创建项目（BioProject）

如果您之前没有创建项目（BioProject）请进入 BioProject 数据库完成创建：

按照图示步骤点击：项目（BioProject）的构建分为五个步骤，第一个是提交者信息，这里一般不需要修改，直接点击保存即可；

第二个是基本信息：我们需要指定发布的日期，这里选择日期，不同于NCBI的是在我们公开的日期之前，数据可以随时修改时间，很是方便；其次一次填写图中标记的必填模块，注意6，这里项目批准号如果没有请填写：N/A即可。
第三个是项目类型：这里我们需要操作两个选项，第一个是序列类型，这里我选择的是metagenome，其次是样本范围，选择：env；

第四个出版信息：在出版后在公布数据相信已经很少了，很多出版社都要求在投稿就要长传数据了，所以这里我们也没什么好填写的：

第五个就是概况信息;这里我们检查前面几个填写的内容即可，如果发现前面有内容不对，直接点击这五个模块中的任何一个都可以转到该模块进行更正。很方便。

2. 创建样本（BioSample）

如果您之前没有创建样本（BioSample）请进入 BioSample 数据库完成创建：

第一步都一样，是确认提交者信息，一般不做修改：
第二步选择时间和项目同一个试时间即可，输入项目号，注意项目号就是上面我们填写完成后生成的。
第三步：填写样本类型，选择一个即可，都是中文注解，所以还是很容易明白的；保存进入下一步即可。

第四步也是最重要的一步，填写样本文件：这里有一个示例文件，我们下载：

这里我认为直接看文件的解释就够了，因为都是中文的：但是为了避免大家出问题，我重点说一下这几个列：geographic_location：采样地点，这个一定要按照要求填写，例如：China: Nanjing；还有：latitude_longitude是经纬度例如32.03N 118.84E；样本注解：env_broad_scale，这里我是土壤，所以套入格式：soil [ENVO:00002007]

第五步查看我们填写的信息即可；

3. 构建GSA数据集

完成 GSA数据集中Experiment和Run的元数据信息录入——实现与BioProject、BioSample和数据文件的相互关联。通过FTP完成数据文件上传。

第一步：点击GSA按照图中顺序进行点击，第一个提交者信息和前面两个都是一样的，所以不用动保存进入第二步：

第二步：基本信息需要填写标题，项目号，选择已经建立sample，即可进入下一步
第三步：上传测序数据：

这里重点是填写序列信息，不同于NCBI的是这一步一共有两张sheet，第一张是：试验，第二章是run

首先我们填写第一张sheet：这里需要注意的就没什么了，只要你阅读完填表之前的子基本没什么问题：

其次我们填写第二章sheet：

这里需要注意我们上传的必须是压缩文件；其次必须有MD5值：这里为了保证流程的顺畅，我将这些步骤的操作方法附在后面，大家可以尝试：

第四步：上传数据，这里我选择用ftp服务器上传，具体步骤见附件：

第五步：就可以进行查看前四步的信息了，当然可以随时修改前面的信息；

查看数据

第六步：上传结果修改和追踪
通常状况下，数据信息与文件审核归档约需要 1-2 天（数据量越大相应所需时间越
长），归档成功后您会收到一封通知邮件，并可在 GSA 列表中查找的为您分配的 GSA 编
号（GSA Accession number）；如果归档中数据信息与文件审核归档过程中出现问题，信
息将反馈到您的注册邮箱，因此请您关注邮箱反馈信息。

注：

GSA 提交编号（Submission ID）：sub#，如上图中的 subCRA000595。请仅在
联系 GSA 工作人员时使用，不要在 BIG Search 检索信息时或在文章中使用提交
编号。
请务必在 BIG Search 检索信息时或在文章中使用 GSA 编号（GSA Accession
Number）：CRA#，如上图中的 CRA000532。

数据追踪

由于GSC数据库管理员需要审核数据，所以一般需要等待两三天，我这批项目在过年上传的，所以等待的时间相对较长，在前天，管理员发来邮件告诉我数据MD5值不匹配。一下是邮件内容：

Dear Tao Wen,

NOTE: THIS MAIL IS SENT BY SYSTEM AUTOMATICALLY, PLEASE DO NOT REPLY IT DIRECTLY.
If you have any question, please contact [email protected]
-------------------------------
This email has been sent to inform you that your submission subCRA002580 is waiting for files:

CRR115717:
    A1_F.fq.gz    ef96d3342977e67954ae2643439bdbb3   The MD5 code of the uploaded file does not match the submitted value.
    A1_R.fq.gz    7022033595ed7e415c8321bc30878ddb   The MD5 code of the uploaded file does not match the submitted value.

自己追溯了我的流程，错误是由于计算MD5值的文件是fq，但是上传的是压缩文件，也就是说文件的压缩也会影响MD5值。

所以我删除GSA项目后重新填写上传了一份修改后的文件。

在第二天就确认成功了，发过来邮件

Dear Tao Wen,

Your submission:subCRA002XXX is checked OK. The assigned accession of the submission is: CRA002XX, which can be cited in your publication. Thank you for submitting data to GSA.
GSA DATA ADMIN
2020-02-08 11:01:38

-------------------------------
NOTE: THIS MAIL IS SENT BY SYSTEM AUTOMATICALLY, PLEASE DO NOT REPLY IT DIRECTLY.

引用格式

这一套工作做完后我们就可以引用了，参考刘老师NBT引用格式：

Raw sequence data reported in this paper have been deposited (PRJCA001214)
in the Genome Sequence Archive in the BIG Data Center, Chinese Academy
of Sciences under accession codes CRA001372 for bacterial 16S rRNA gene
sequencing data and CRA001362 for metagenomic sequencing data that are
publicly accessible at http://bigd.big.ac.cn/gsa.

注意：引用如下文章：Members, B. I. G. D. C. Database resources of the BIG Data Center in 2018.
Nucleic Acids Res. 46, D14–D20 (2018).

附录

计算MD5值

官方推荐不同平台使用的工具

Linux 用户请使用 $ md5sum 命令计算；
Mac 用户请使用$ md5 命令计算；
Windows 用户请使用第三方工具进行计算，例如 winmd5free http://www.winmd5.com/。

本来我在win上操作，所以就下载了winmd5free，但是只能一次压缩一个文件，这样我就不想用了。但是在家里没有linux平台，远程还需要传输数据，所以我就选择了xshell，这个工具已经集成进去了，我们可以直接使用，并且可以使用通配符，我们一起搞定啦。

压缩fq文件

中国核酸数据库需要提供压缩文件的fq格式文件上传，此时我继续使用bshell工具，一条命令：gzip -c B80-1.R1.fq > B80-1.R1.fq.gz，但是我有好多，需要写个循环：

for tar in *.fq;do echo ${tar}; gzip -c ${tar} > ./${tar}.gz; done

提交数据文件如何命名？

对于提交FASTQ格式的数据，每一个RUN包含文件数请不要超过两个，即单端测序数据（Fragment）RUN文件数为一个，双端测序数据（Paired-end）RUN文件数为两个（通常单个文件不要超过10GB）。Fragment数据以单个文件上传，务必写全名称（包括文件后缀名），如：DRT_10107_1.clean.fq.gz。对于Paired-end数据，请把两个数据放在同一个Run里面，务必写全名称（包括文件后缀名），并用F和R在文件名中做标记，例如，用F和R在文件名中做标记， DRT_10107_F.clean.fq.gz；DRT_10107_R.clean.fq.gz。

完成之后我看到对文件命名是有要求的，所以我进行文件名的批量修改，这里由于shell我命不熟悉，所以我写了R脚本进行文件名的修改：
这是代码：

# 提取文件夹下的文全部件名称
fl_1 <- dir()

#这里我们提取复合要求的指定文件名称
fl_1 =dir("./", pattern = c("B|L"), full.names = TRUE, ignore.case = TRUE)

fl_2 <- as.character(fl_1)
fl_2  = gsub("-","",fl_2)

fl_2  = gsub(".R1.","_F.",fl_2)
fl_2  = gsub(".R2.","_R.",fl_2)
fl_2
file.rename(fl_1, fl_2) #函数形式为file.rename(from, to)，from为原始文件名向量，to为新的文件名向量

ftp提交数据

如何通过FTP连接到GSA的服务器？

请使用 FTP客户端软件（比如 FileZilla Client）登录 FTP 服务器。请采用二进制模式上传，如果是用FTP软件上传，请参考软件说明进行设置；如果是用FTP指令上传，请在“mput”指令前，先运行“binary”指令。

FTP服务器地址:submit.big.ac.cn

用户账号与BIG sub账号一致。如果不知道是什么？直接到自己的profile下去查看：

注意：用户登录自己的FTP路径后，先cd 到 /GSA目录下再上传文件。
注意地址是：submit.big.ac.cn

撰文：文涛南京农业大学

责编：刘永鑫中科院遗传发育所

写在后面

为鼓励读者交流、快速解决科研困难，我们建立了“宏基因组”专业讨论群，目前己有国内外5000+ 一线科研人员加入。参与讨论，获得专业解答，欢迎分享此文至朋友圈，并扫码加主编好友带你入群，务必备注“姓名-单位-研究方向-职称/年级”。技术问题寻求帮助，首先阅读《如何优雅的提问》学习解决问题思路，仍未解决群内讨论，问题不私聊，帮助同行。

学习扩增子、宏基因组科研思路和分析实战，关注“宏基因组”

点击阅读原文，跳转最新文章目录阅读
https://mp.weixin.qq.com/s/5jQspEvH5_4Xmart22gjMA

Windows10-ltsc-2019 使用 PowerShell 安装安装TranslucentTB教程（不通过微软商店安装） lkm0522 microsoft TranslucentTB 透明任务栏
Windows10-ltsc-2019使用PowerShell安装安装TranslucentTB教程（不通过微软商店安装）下载v2020.4（最后一个兼容1809的版本）：TranslucentTB安装包(下载不了上面有安装包)安装依赖项（如未安装）：#下载并安装x86版本的VCLibsInvoke-WebRequest-Uri"https://aka.ms/Microsoft.VCLibs.x8
Shell脚本-cut工具咖啡の猫 chrome 前端
一、前言在Linux/Unix系统中，cut是一个非常实用的文本处理命令，用于从文件或标准输入中提取特定列的内容。它特别适用于处理结构化文本数据，例如CSV文件、日志文件、配置文件等。无论是做数据分析、系统监控，还是编写自动化脚本，cut都是一个不可或缺的工具。本文将带你全面了解cut工具的使用方式，包括：✅cut的基本语法与常用参数✅如何按字符、字节、字段进行提取✅cut在Shell脚本中的实战
Shell脚本-uniq工具咖啡の猫 java 前端开发语言
一、前言在Linux/Unix系统中，uniq是一个非常实用的文本处理命令，用于对重复的行进行统计、去重和筛选。它通常与sort搭配使用，以实现高效的文本数据清洗与统计分析。无论是做日志分析、访问频率统计，还是编写自动化脚本，uniq都是一个不可或缺的工具。本文将带你全面了解uniq工具的使用方式，包括：✅uniq的基本语法与常用参数✅如何统计重复行、去重输出、查找唯一行✅uniq在Shell脚本
Shell脚本-tee工具
一、前言在Linux/Unix系统中，tee是一个非常实用的命令行工具，它可以帮助我们同时将命令的输出打印到终端，并写入文件。这种“双路输出”机制在脚本调试、日志记录、自动化任务中非常有用。无论是做日志分析、脚本调试，还是编写部署脚本，tee都是一个不可或缺的工具。本文将带你全面了解tee工具的使用方式，包括：✅tee的基本语法与常用参数✅如何将命令输出既显示又保存✅tee在Shell脚本中的实战
Linux——shell 脚本入门基础知识到实战☆☆☆☆（变量、判断、循环、数组和函数、三剑客）渣渣珲一枚 linux 运维服务器
本文目录第一章变量1.前言2.自定义变量3.整数运算4.小数运算5.环境变量5.1位置变量5.2预定义变量第二章判断1.shell条件测试1.1数值比较1.2文件测试1.3字符串比较1.4and和or2.流程控制：if2.1单分支结构2.2双分支结构2.2多分支结构2.3嵌套结构2.4调试脚本2.5.总结（注意）3.模拟匹配：case3.1前言3.2案例1：简单的模式匹配3.3案例2：简单的Jum
zabbix自动发现告警配置 yeahzxw 监控#zabbix 服务器 linux 运维
自动发现告警配置一、目录文件数详细配置1、编写shell自动发现脚本cd/home/yeahzxw/script/discoverdir.sh#!/bin/bashconf=/home/yeahzxw/script/conf/key_dir.cfgINDEX=0echo'{'echo'"data"':[COUNT=`cat$conf|wc-l`cat$conf|whilereadLINEDIRCO
上位机知识篇---Prompt&PowerShell Prompt Atticus-Orion 上位机知识篇 prompt powershell
在Anaconda环境中，AnacondaPrompt和AnacondaPowerShellPrompt是两个常用的命令行工具，它们的核心功能都是为了方便管理Python环境和执行相关命令，但底层依赖的命令行解释器不同，因此在使用场景和语法上存在一些区别。下面详细介绍两者的差异：1.底层依赖的命令行解释器不同这是两者最根本的区别，决定了它们的语法规则和功能范围：AnacondaPrompt基于Wi
linux proc/pid/stat解析虚极静笃13 Linux linux
proc/pid/stat用于获取某一个进程的统计信息，实现过程见fs/proc/array.c的do_task_stat()1.stat数据$adbshellcat/proc/8385/stat1557(system_server)S82382300-11077952832//1~92085481152482003271661141296842630//10~1710-1022102284279
Go 的热重载工具 Air 详解半桶水专家 golang入门 golang 开发语言后端
一、Air安装1.安装Air命令打开终端（PowerShell或CMD）输入：goinstallgithub.com/air-verse/air@latest这会将air.exe安装到你的Gobin目录下，一般是：C:\Users\\go\bin2.设置系统PATH环境变量（如果还没有）将C:\Users\\go\bin添加到系统的环境变量中。步骤如下：打开“系统属性”→“环境变量”；找到“系统变
.NetCore发布到Linux下(Shell脚本控制服务启动) .NetHero c#.netcore linux
一、netcore后端部署1.设置端口号配置文件，指定接口的端口号(*注意不要和已有的服务端口相同!)Program
2022-07-08 linux中文件名带？号的解决方案白告2333
windows中写了一个shell脚本批量mv改名，导致文件名结尾出现？？ls-b显现原形rename方法失败循环+mv方法可用foriin*.log?;doi=${i%.log?}echo$imv${i}.log?${i}.logdone成功
windows下jar包配置为开机自启动
在jar包目录新建一个start.bat文件，然后写入启动命令java-jarX.jar2.仍然在此目录，新建start.vbs文件，然后写入一下命令，命令最后一个0是隐藏窗口运行createobject("wscript.shell").run"D:\start.bat",03.创建run.vbs的快捷方式，移动到开机自启动目录下：C:\ProgramData\Microsoft\Windows
怎么给电脑定时自动关机？不再烦恼电脑一直开了这辈子谁会真的心疼你电脑定时关机电脑定时器
很多时候我们需要给电脑设置自动关机，例如我们需要提前下班的时候，而电脑上正在运行某个任务又不能关机，等任务执行完了我们又不在这边就没办法关机，怎么给电脑设置定时关机呢？几个命令就可以搞定。1、在Windows系统中Windows系统提供了shutdown命令来设置自动关机，你可以通过命令提示符或PowerShell来执行该命令。基本命令格式plaintextshutdown-s-t秒数其中，-s表
Java基础入门（传智）暑期预习笔记（一）7.18 wssgakki Java java
Java的基本语法【修饰符】class类名{程序代码}publicclassHelloword{publicstaticvoidmain(String[]args){System.out.printIn(”你好呀");}注意大小写、排版问题{左大括号里面的第一行代码要有缩进ctrl+shift+F键快速格式化代码一个连续的字符串不能分开在两行中书写即同一个双引号里面的内容不能分两行写。Java中的
Java基础一键通冠位巴萨辛山の翁 java 开发语言学习
以下代码均使用IntelliJIDEA2024.1下运行，代码来源为学习java过程中所写代码。交流学习使用。1-Java入门1.1HellopublicclassHello{/***主函数执行程序的入口点*此函数没有接收任何参数，也没有返回值*它首先打印多次"Hello"，然后调用getCode()方法并打印其返回值*@paramargs命令行参数，本程序中未使用*/publicstaticvo
python基础语法9，用os库实现系统操作并用sys库实现文件操作（简单易上手的python语法教学） AI 嗯啦 python 开发语言
一、os库os.system()是Pythonos库中用于执行操作系统命令的重要方法，它允许在Python程序中直接调用系统shell命令（如Linux的bash命令或Windows的cmd命令）。基本语法importosos.system(command)command：要执行的系统命令字符串（与在终端/命令提示符中输入的命令格式一致）返回值：命令执行的退出状态码（0表示成功，非0表示执行出错）
面试经验分享 | 成都某安全厂商渗透测试工程师
更多大厂面试题看我的主页或者专栏找我免费领取目录：所面试的公司：某安全厂商所在城市：成都面试职位：渗透测试工程师岗位面试过程：面试官的问题：1.平常在学校打CTF嘛，获奖情况讲下，以及你自己的贡献如何？2.内网渗透主要思路说一下吧？3.web打点过程中有没有遇到过waf？怎么绕过的4.现在给你一个站你会怎么做信息搜集？5.如何快速检测定位网站目录下的webshell呢？6.简单讲下反弹shell的
运维打铁: Shell 脚本自动化任务编写与优化懂搬砖运维打铁原力计划运维 ruby 自动化
文章目录思维导图一、基础编写1.变量与数据类型2.控制结构if-else语句for循环3.函数定义二、高级特性1.正则表达式2.文件处理3.远程操作三、性能优化1.代码结构优化2.资源管理3.并发处理总结思维导图Shell脚本自动化任务编写与优化基础编写高级特性性能优化变量与数据类型控制结构函数定义正则表达式文件处理远程操作代码结构优化资源管理并发处理一、基础编写1.变量与数据类型在Shell脚本
Xshell使用可以使用一条命令操作三台虚拟机命令窗口操作 printf200
Xshell6选择查看-->撰写-->撰写栏-->选择全部会话：如下图在这里插入图片描述在这里插入图片描述在这里插入图片描述点击选择全部会话即可
MTK平台--如何查询手机连接的TX速率和带宽专业开发者 WIFI 智能手机
一前言经常我们分析手机连接的状态的时候，需要实时读取手机WiFi的Txrate和带宽，其实可以使用以下ADB指令来读取当前手机WiFi的TX速率和带宽信息二操作命令和对查询WiFi的TX速率和带宽信息解析adbshelliwprivwlan0driverstat执行上述指令后，系统会返回一系列WiFi状态信息，其中包括TX速率和带宽。以下是一个示例输出：wlan0driver:WlanIdx=2-
初识linux（一）：全面了解linux目录结构&基础操作指令详解 whelloworldw linux系统编程 linux 运维服务器
今天小风将带着大家进行有关liunx部分章节的学习，由于是第一节初识linux部分的内容，所以内容理解起来并不会太过困难。在本篇博客中，小风将向大家具体讲解一下内容：初识Linux操作系统初识Xshell登录命令,简单了解一下操作系统基本概念使用常用Linux命令，了解linux系统目录结构和访问方式一、初识linux操作系统1.linux发展史1991年10月5日，赫尔辛基大学的一名研究生Lin
挖矿病毒（基于SMB漏洞传播）分析艾旎米提颉
本文旨在对SMB挖矿病毒传播机制做分析。网络中的计算机出现由SMB漏洞传播的挖矿病毒，基于目前黑客技术上流行的非PE攻击模式。攻击性质较为隐蔽，完全依赖Windows本身的系统组件。攻击目的较为单一，即通过消耗系统资源集中算力挖矿牟利。本次着重分析的基于WindowsPowerShell的挖矿模式，是基于网页挖矿的一种分支。较早的时候还是基于JS。从攻击者的角度分析，JS过度依赖浏览器，相比Pow
CentOS下配置java环境变量classpath 天海华兮 java SE java centos 环境变量 clsspath
CentOS下配置java环境变量classpathhttp://t.zoukankan.com/bincoding-p-6159847.htmlPATH和CLASSPATHPATH环境变量。作用是指定命令搜索路径，在shell下面执行命令时，它会到PATH变量所指定的路径中查找看是否能找到相应的命令程序。我们需要把jdk安装目录下的bin目录增加到现有的PATH变量中，CLASSPATH环境变量
CentOS下配置java环境变量夜雨微澜醉挽清风 CentOS CentOS
CentOS下配置java环境变量一.需要自己配置的环境变量二.三种配置环境变量的方法一.需要自己配置的环境变量PATH环境变量。作用是指定命令搜索路径，在shell下面执行命令时，它会到PATH变量所指定的路径中查找看是否能找到相应的命令程序。我们需要把jdk安装目录下的bin目录增加到现有的PATH变量中，bin目录中包含经常要用到的可执行文件如javac/java/javadoc等待，设置好
CentOS 8：环境变量 duansamve linux centos linux
环境变量环境变量，就是放在当前环境中的变量无论Linux，还是Windows，都有环境变量比如，最常用的环境变量PATH,JAVA_HOME定义环境变量exportJAVA_HOME=/opt/jdk1.8显示环境变量echo$JAVA_HOME查看所有环境变量printenv使用环境变量：在当前命令行窗口里中使用在SHELL脚本中使用注：其实SHELL本身就是命令行的意思用户环境变量用户环境变量
快速入门--Linux常用指令实操（1） small_jimmy 服务器 linux 运维
操作步骤命令示例设置root密码sudopasswdroot创建新目录mkdirproject进入project目录cdproject查看当前路径pwd查看目录内容ls-l创建temp目录mkdirtemp删除空目录temprmdirtemp文件查看相关分页查看文件morehello.txt高级分页查看lesshello.txt查看文件结尾tailhello.txt编辑文件gedithello.t
Linux 系统进阶操作实践：目录管理与系统信息查看指南小任今晚几点睡 RHCSA linux 网络运维
文章摘要本文详细记录了Linux系统中通过Xshell远程管理的核心操作，包括系统信息查询、复杂目录结构创建与树形展示、多级目录快速生成、文件创建与删除、大文件制作等实践步骤。通过命令示例与输出解析，清晰呈现每一步操作的逻辑与效果，帮助读者掌握目录管理、系统信息查看及文件操作的实用技巧，适合Linux实操学习者参考。一、通过Xshell远程登录及系统信息查询使用Xshell通过root账户登录Li
2023-03-15使用BASH SHELL执行命令以及快捷键运维小将
基本命令语法--bashshell执行方式：当准备好命令时，按下键盘上的Enter键。系统就会显示命令输出，然后显示下一个shell提示符[kaier@myhost~]$whoami#显示当前登录系统的用户kaier[kaier@myhost~]$--如果希望一行输入多个命令可以使用分号（;）作为命令分隔符[user@serverb~]$touchtest[user@serverb~]$whoam
windows安装pnpm后报错：pnpm : 无法将“pnpm”项识别为 cmdlet、函数、脚本文件或可运行程序的名称。 Ithao2 Vue npm 前端 node.js
使用npm方式安装pnpm,命令如下：npminstall-gpnpm安装完以后，执行pnpm-v查看版本号：pnpm-v执行完发现报错：pnpm:无法将“pnpm”项识别为cmdlet、函数、脚本文件或可运行程序的名称。尝试配置环境变量，重启后均不生效。解决方案：使用PowerShell进行安装1.以管理员用户打开PowerShell，执行如下命令：iwrhttps://get.pnpm.io/
Mac自定义右键功能东东旭huster macos
mac右键相对于Windows来说功能少很多，市场里也有一些好用的拓展软件，比如赤友，但是用一段时间又要收费了，作为一个白嫖党当然是自己做了。打开自动操作这个应用选择快速操作打开，再从实用工具中选择运行shell脚本这里我们添加一个用vscode打开的功能有几个点需要注意下1、工作流程选择文件或文件夹2、位于访达3、传递输入选择作为自变量编辑好后可以点运行试下，没问题command+S保存一下。在
插入表主键冲突做更新 a-john
有以下场景：用户下了一个订单，订单内的内容较多，且来自多表，首次下单的时候，内容可能会不全（部分内容不是必须，出现有些表根本就没有没有该订单的值）。在以后更改订单时，有些内容会更改，有些内容会新增。问题：如果在sql语句中执行update操作，在没有数据的表中会出错。如果在逻辑代码中先做查询，查询结果有做更新，没有做插入，这样会将代码复杂化。解决： mysql中提供了一个sql语
Android xml资源文件中@、@android:type、@*、？、@+含义和区别 Cb123456 @+@?@*
一.@代表引用资源 1.引用自定义资源。格式：@[package:]type/name android：text="@string/hello" 2.引用系统资源。格式：@android:type/name android:textColor="@android:color/opaque_red"
数据结构的基本介绍天子之骄数据结构散列表树、图线性结构价格标签
数据结构的基本介绍数据结构就是数据的组织形式，用一种提前设计好的框架去存取数据，以便更方便，高效的对数据进行增删查改。正确选择合适的数据结构，对软件程序的高效执行的影响作用不亚于算法的设计。此外，在计算机系统中数据结构的作用也是非同小可。例如常常在编程语言中听到的栈，堆等，就是经典的数据结构。经典的数据结构大致如下：一：线性数据结构 (1)：列表 a
通过二维码开放平台的API快速生成二维码一炮送你回车库 api
现在很多网站都有通过扫二维码用手机连接的功能，联图网(http://www.liantu.com/pingtai/)的二维码开放平台开放了一个生成二维码图片的Api,挺方便使用的。闲着无聊，写了个前台快速生成二维码的方法。 html代码如下:(二维码将生成在这div下) ? 1 &nbs
ImageIO读取一张图片改变大小 3213213333332132 java IO image BufferedImage
package com.demo; import java.awt.image.BufferedImage; import java.io.File; import java.io.IOException; import javax.imageio.ImageIO; /** * @Description 读取一张图片改变大小 * @author FuJianyon
myeclipse集成svn（一针见血） 7454103 eclipse SVN MyEclipse
&n
装箱与拆箱----autoboxing和unboxing darkranger J2SE
4.2　自动装箱和拆箱基本数据(Primitive)类型的自动装箱(autoboxing)、拆箱(unboxing)是自J2SE 5.0开始提供的功能。虽然为您打包基本数据类型提供了方便，但提供方便的同时表示隐藏了细节，建议在能够区分基本数据类型与对象的差别时再使用。 4.2.1　autoboxing和unboxing 在Java中，所有要处理的东西几乎都是对象(Object)
ajax传统的方式制作ajax aijuans Ajax
//这是前台的代码 <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); String basePath = request.getScheme()+
只用jre的eclipse是怎么编译java源文件的？ avords java eclipse jdk tomcat
eclipse只需要jre就可以运行开发java程序了，也能自动编译java源代码，但是jre不是java的运行环境么，难道jre中也带有编译工具？还是eclipse自己实现的？谁能给解释一下呢问题补充：假设系统中没有安装jdk or jre，只在eclipse的目录中有一个jre，那么eclipse会采用该jre，问题是eclipse照样可以编译java源文件，为什么呢？ &nb
前端模块化 bee1314 模块化
背景：前端JavaScript模块化，其实已经不是什么新鲜事了。但是很多的项目还没有真正的使用起来，还处于刀耕火种的野蛮生长阶段。 JavaScript一直缺乏有效的包管理机制，造成了大量的全局变量，大量的方法冲突。我们多么渴望有天能像Java（import），Python (import)，Ruby(require)那样写代码。在没有包管理机制的年代，我们是怎么避免所
处理百万级以上的数据处理 bijian1013 oracle sql 数据库大数据查询
一.处理百万级以上的数据提高查询速度的方法： 1.应尽量避免在 where 子句中使用!=或<>操作符，否则将引擎放弃使用索引而进行全表扫描。 2.对查询进行优化，应尽量避免全表扫描，首先应考虑在 where 及 o
mac 卸载 java 1.7 或更高版本征客丶 java OS
卸载 java 1.7 或更高 sudo rm -rf /Library/Internet\ Plug-Ins/JavaAppletPlugin.plugin 成功执行此命令后，还可以执行 java 与 javac 命令 sudo rm -rf /Library/PreferencePanes/JavaControlPanel.prefPane 成功执行此命令后，还可以执行 java
【Spark六十一】Spark Streaming结合Flume、Kafka进行日志分析 bit1129 Stream
第一步，Flume和Kakfa对接，Flume抓取日志，写到Kafka中第二部，Spark Streaming读取Kafka中的数据，进行实时分析本文首先使用Kakfa自带的消息处理（脚本）来获取消息，走通Flume和Kafka的对接 1. Flume配置 1. 下载Flume和Kafka集成的插件，下载地址：https://github.com/beyondj2ee/f
Erlang vs TNSDL bookjovi erlang
TNSDL是Nokia内部用于开发电信交换软件的私有语言，是在SDL语言的基础上加以修改而成，TNSDL需翻译成C语言得以编译执行，TNSDL语言中实现了异步并行的特点，当然要完整实现异步并行还需要运行时动态库的支持，异步并行类似于Erlang的process（轻量级进程），TNSDL中则称之为hand，Erlang是基于vm(beam)开发，
非常希望有一个预防疲劳的java软件, 预防过劳死和眼睛疲劳,大家一起努力搞一个 ljy325 企业应用
　非常希望有一个预防疲劳的java软件，我看新闻和网站，国防科技大学的科学家累死了，太疲劳，老是加班，不休息，经常吃药，吃药根本就没用，根本原因是疲劳过度。我以前做java,那会公司垃圾，老想赶快学习到东西跳槽离开，搞得超负荷，不明理。深圳做软件开发经常累死人，总有不明理的人，有个软件提醒限制很好，可以挽救很多人的生命。相关新闻：（1）IT行业成五大疾病重灾区：过劳死平均37.9岁
读《研磨设计模式》-代码笔记-原型模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * Effective Java 建议使用copy constructor or copy factory来代替clone()方法： * 1.public Product copy(Product p){} * 2.publi
配置管理---svn工具之权限配置 chenyu19891124 SVN
今天花了大半天的功夫，终于弄懂svn权限配置。下面是今天收获的战绩。安装完svn后就是在svn中建立版本库，比如我本地的是版本库路径是C:\Repositories\pepos。pepos是我的版本库。在pepos的目录结构 pepos component webapps 在conf里面的auth里赋予的权限配置为 [groups]
浅谈程序员的数学修养 comsci 设计模式编程算法面试招聘
浅谈程序员的数学修养
批量执行 bulk collect与forall用法 daizj oracle sql bulk collect forall
BULK COLLECT 子句会批量检索结果，即一次性将结果集绑定到一个集合变量中，并从SQL引擎发送到PL/SQL引擎。通常可以在SELECT INTO、 FETCH INTO以及RETURNING INTO子句中使用BULK COLLECT。本文将逐一描述BULK COLLECT在这几种情形下的用法。有关FORALL语句的用法请参考：批量SQL之 F
Linux下使用rsync最快速删除海量文件的方法 dongwei_6688 OS
1、先安装rsync：yum install rsync 2、建立一个空的文件夹：mkdir /tmp/test 3、用rsync删除目标目录：rsync --delete-before -a -H -v --progress --stats /tmp/test/ log/这样我们要删除的log目录就会被清空了，删除的速度会非常快。rsync实际上用的是替换原理，处理数十万个文件也是秒删。
Yii CModel中rules验证规格 dcj3sjt126com rules yii validate
Yii cValidator主要用法分析： yii验证rulesit 分类： Yii yii的rules验证 cValidator主要属性 attributes ,builtInValidators,enableClientValidation,message,on,safe,skipOnError
基于vagrant的redis主从实验 dcj3sjt126com vagrant
平台: Mac 工具: Vagrant 系统: Centos6.5 实验目的: Redis主从实现思路制作一个基于sentos6.5, 已经安装好reids的box, 添加一个脚本配置从机, 然后作为后面主机从机的基础box 制作sentos6.5+redis的box mkdir vagrant_redis cd vagrant_
Memcached(二)、Centos安装Memcached服务器 frank1234 centos memcached
一、安装gcc rpm和yum安装memcached服务器连接没有找到，所以我使用的是make的方式安装，由于make依赖于gcc，所以要先安装gcc 开始安装，命令如下，[color=red][b]顺序一定不能出错[/b][/color]：建议可以先切换到root用户，不然可能会遇到权限问题：su root 输入密码...... rpm -ivh kernel-head
Remove Duplicates from Sorted List hcx2013 remove
Given a sorted linked list, delete all duplicates such that each element appear only once. For example,Given 1->1->2, return 1->2.Given 1->1->2->3->3, return&
Spring4新特性——JSR310日期时间API的支持 jinnianshilongnian spring4
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
浅谈enum与单例设计模式 247687009 java 单例
在JDK1.5之前的单例实现方式有两种(懒汉式和饿汉式并无设计上的区别故看做一种)，两者同是私有构造器，导出静态成员变量，以便调用者访问。第一种 package singleton; public class Singleton { //导出全局成员 public final static Singleton INSTANCE = new S
使用switch条件语句需要注意的几点 openwrt c break switch
1. 当满足条件的case中没有break，程序将依次执行其后的每种条件（包括default）直到遇到break跳出 int main() { int n = 1; switch(n) { case 1: printf("--1--\n"); default: printf("defa
配置Spring Mybatis JUnit测试环境的应用上下文 schnell18 spring mybatis JUnit
Spring-test模块中的应用上下文和web及spring boot的有很大差异。主要试下来差异有：单元测试的app context不支持从外部properties文件注入属性 @Value注解不能解析带通配符的路径字符串解决第一个问题可以配置一个PropertyPlaceholderConfigurer的bean。第二个问题的具体实例是：
Java 定时任务总结一 tuoni java spring timer quartz timertask
Java定时任务总结一.从技术上分类大概分为以下三种方式： 1.Java自带的java.util.Timer类，这个类允许你调度一个java.util.TimerTask任务; 说明： java.util.Timer定时器，实际上是个线程，定时执行TimerTask类 &
一种防止用户生成内容站点出现商业广告以及非法有害等垃圾信息的方法 yangshangchuan rank 相似度计算文本相似度词袋模型余弦相似度
本文描述了一种在ITEYE博客频道上面出现的新型的商业广告形式及其应对方法，对于其他的用户生成内容站点类型也具有同样的适用性。最近在ITEYE博客频道上面出现了一种新型的商业广告形式，方法如下： 1、注册多个账号（一般10个以上）。 2、从多个账号中选择一个账号，发表1-2篇博文