刘永鑫Adam

2019微生物组—宏基因组分析技术研讨会第五期

在广大粉丝的期待下，《生信宝典》联合《宏基因组》在2019年8月2-4日，北京鼓楼推出《宏基因组分析》专题培训第四期，为大家提供一条走进生信大门的捷径、为同行提供一个宏基因组分析学习和交流的机会、助力学员真正理解分析原理和完成实战分析，独创四段式教学(3天集中授课+自行练习2周+再集中讲解答疑+上课视频回看反复练习)，“教—练—答—用”四个环节统一协调，真正实现独立分析大数据。

关于学习生物信息学分析的重要性，请阅读《生物信息9天速成班—成为团队中不可或缺的人》。生信分析离不开程序写作，这部分没想象的难，只要跟着我们操作下来，就可以理解，具体见《生物信息中的程序学习心得》。

课程简介

请详细阅读课程简介，如果以下内容您全精通，不必参加此培训。

宏基因组/微生物组是当今世界科研最热门的研究领域之一，为加强本领域的技术交流与传播，推动中国微生物组计划发展，中科院青年科研人员创立“宏基因组”公众号，目标为打造本领域纯干货技术及思想交流平台。成立两年，分享专业技术原创文章900+篇，关注人数47,000+，累计阅读量7,000,000+。

为满足广大读者进一步学习的需求，现联合《生信宝典》组织宏基因组学专题培训课程，进一步学习和交流宏基因组学分析技术，手把手带您快速入门、节约宝贵的时间，助力科研成果早日产出。

本课程一共3天，每天6节课，共18节课，全部课程均理论与实战结合(只要课上讲的都是可以学会并自己实现的分析)。从Linux和R基础、宏基因组Linux服务器分析平台搭建、Windows常用统计分析软件、数据分析图表解读和实战、宏基因组有参(Reference-based适合人类、动物肠道等)和无参(De novo适合植物、环境样本等)标准分析流程、Binning(挖掘单菌基因组)、统计分析以及各类高级分析(多基因连接进化树、网络图绘制和美化、网络属性比较、机器学习等)，和CNS级图片修改排版。3天时间，老司机带您完成自学需要3个月甚至是3年的崎岖之路，助力您真正实现宏基因组分析、并根据自己课题的背景优化分析方案。

课程大纲

每节课1小时一个主题，理论结合实战，学懂原理，实战实操，全是老司机多年经验和代码的无私分享。下面是课程安排，如11代表第一天第一节课，26代表第二天第六节课，41为两周后的线上集中视频答疑。

编号	主题	简介
11	Linux基础	简介、远程登陆、文件传输、常用命令
12	Linux软件安装	Conda安装与配置，宏基因组相关软件安装和数据库下载
13	Win软件安装	git、R、Rstudio、R包、STAMP、AI等
14	图表解读	常用分析图表在文章中意义和使用场景
15	R基础	发展史、生物学中应用、ggplot2绘图
16	可视化	16种图表的数据整理和在线绘制
21	宏基因组简介	发展史、常用技术适用范围、分析思路
22	宏基因组有参质控	FastQC、Trimmomatic、 MultiQC]()、KneadData质控、parallel并行计算
23	物种和功能组成	MetaPhlAn2物种组成、HUMAnN2功能组成、功能关联驱动物种
24	物种和功能差异比较和可视化	GraPhlAn、LEfSe、STAMP、R语言统计
25	发表前准备	图片排版、数据释放、代码整理(可选)
26	网络绘制	基础、igraph、Gephi
31	物种注释和可视化	Kraken、Kraken2、GraPhlAn、Krona、microbiomeViz、metacoder
32	拼接、基因注释和定量	MEGAHIT、metaSPAdes、QUAST、Prokka、cd-hit、Salmon
33	基因功能注释	KEEG、COG/EggNOG、CAZy/dbcan2、ARDB/Resfams/CARD、Uniref、VFDB、TCDB
34	分箱Binning	理论、MetaWRAP、VizBin
35	细菌基因组进化	Bins提取保守基因、多基因进化树、一文读懂进化树 Evolview基础进阶 iTOL美化进阶
36	总结串讲	宏基因组分析套路回顾和总结
37	考试50题	自评学习效果、知识点回顾
41	答疑-线上	答疑、考试内容串讲

教程内容简介如下：

一、分析平台搭建

“工欲善其事必先利其器”，没有自己的分析平台，想分析大数据，那怎么能行。宏基因组数据量极大，前期原始下机的大数据想在自己本本上处理还是有难度的。好在现阶段一般的高校、科研院所、课题组都有自己的服务器，即使没有服务器，也可以租用国内的阿里云、腾讯云等服务。现在分析条件拥有了，如何把服务器变成宏基因组分析的利器呢，这是一个非常复杂的专业问题，在这里你马上可以学到！

图1. 宏基因组分析流程的搭建——系统、安装方法和主要软件

服务器推荐使用Ubuntu系统。最低配置32G内存、8核；推荐256G内存，24线程起；配置越高，分析更快更流畅。

没有软件的计算机只是一堆废铁，没有宏基因组分析系统的服务器也和你的数据分析没有半毛钱关系。想要搭建整套的宏基因组分析流程，网上的资源即零散、又稀少。易生信团队将分享多年经验摸索优秀软件和布置技巧，并分享全部源代码，让你在主流Linux服务器系统(Ubuntu 16/18.04，CentOS7等主流发行版)上快速布置宏基因组分析流程依赖的几十款常用软件、几百个依赖的R和Python包，轻松拥有专业分析平台。

图2. 易生信首创基于Win10优化的数据统计分析和可视化流程，笔记本秒变大数据分析平台

推荐使用Windows10系统，8G内存分析更快更流畅。

高通量测序所谓的大数据，都是在原始数据和分析过程中体积大，但结果不大。通常宏基因组分析会获得样品物种组成、功能组成表，这些表格是下游分析、高级分析以及个性分析的起点，绝大部分工作在我们的笔记本上是可以搞定的，只是很多人并不知道如何入手。

其实你的个人电脑就是数据表(丰度矩阵)统计分析的利器。易生信团队独创实现了跨平台的分析流程，在大家的Windows笔记本上可以轻松实现扩增子、宏基因组领域统计、可视化的绝大多数分析，第三节课带你轻松在自己的本本上搭建数据表统计分析与可视化平台，基于目前最主流的Win10进行优化和测试，让笔记本秒变数据分析可视化平台。

我们也会带大家在Linux上配置整个分析可视化平台 (Mac跟Linux类似，无做区别对待，但部分软件可能安装方式不同，未做深入测试，不建议参加培训时使用）。

二、生信基础

有了生信分析平台，如何灵活运用还是要学点独门绝学的。21世纪最重要的是人才，人才最好掌握三门语言，将让你人生立于不败之地，在任何团队中都是不可或缺的人才。这三门语言就是中文、英文和计算机语言。中文每天都在用在学，英文对于博士也至少接触了10年以上并能应用于阅读和写作文献，而编程语言大家大学阶段都学过Visual Basic、Visual Foxpro、或C语言，但能在工作中应用的绝对凤毛麟角。更何况这些语言在生命科学领域是非常低效的，不提倡学习。

生信中最常用的三类语言是Shell + R + Python/Perl，前两门是基础，保证你完成项目分析。我们在课上将同时讲解生物学家必要掌握的Shell和R语言基础知识，保证你高效、稳定的使用宏基因分析平台、保证大数据分析和后期可视化至发表阶段所需的技能。我们在文后提供了学习视频供提前预习。

图3. Shell和R学习大纲，首创Rstuio中鼠标点击可完成Shell脚本和R语言分析，既打开生信的大门，又不会增加生物学家时间成本

当你利用几个小时，走进大数据分析和可视化的大门后，你将发现一个全新的世界。很多人会感觉相见恨晚，爱上分析，从此走向人生的快车道。即使你对编程不感兴趣，这里面用到的理念也定能让你受益终身，在今后相关分析中事半功倍，比别人更胜一筹。再说现在连小学生都学Python了，再不会，孩子都带不好了。

三、图表解读和绘制专题

针对很多老师缺少系统的生信背景，看不懂分析文章图表，更对绘制各式图表手足无措的情况, 我们推出过如下两个系列，共16篇原创文章，对8种图型和R语言绘图进行讲解。

扩增子图表解读-理解文章思路
扩增子统计绘图-冲击高分文章

但这些只是入门，在培训时，我们将结合发表的高水平文章，进一步讲解16种常用分析图的原理和使用范围，让你不仅读懂图，更知道如何应用于自己的研究，并亲自轻松完成绘图。

针对使用R语言绘图学习时间成本较高的问题，易生信团队针对常用16种图开发了免费绘图网站，一键出图，更可鼠标点选参数修改图形的个性样式。

图4. 16种常用图形的表达的意义、使用场景和绘制。可使用我们的在线绘图工具实现。

为了让各种统计图片实现出版级的组图，特开设了一节Adobe Illustrator修图排版课，讲述基本使用技巧，轻松掌握精髓，让你文章图版档次向CNS看齐，轻松成为实验室的修图和拼图达人。

图5. AI排版本子图为CNS出版级组图示例(Science, 2016封面文章)

四、宏基因组学概述

在第一天全面打造科研基础后之，我们将开始宏基因组大数据分析之旅。

作为专业基础知识，我们将学习以下内容。

背景：国际微生物组、中国微生物组计划
研究对象：人、动物、植物、环境
研究方法：培养组学、扩增子、宏基因组、宏转录组、宏蛋白组、宏代谢组、宏基因组关联分析、宏表观组……
宏基因组学的研究热点：培养组、肠菌与疾病、宏基因组关联分析(MWAS)、多组学联合分析……
测序发展史与原理
样品制备、实验重复和测序数据量的选择
宏基因组分析SCI文章的常用套路
宏基因组与扩增子优缺点比较
原始数据评估、组装结果好坏的判断

图6. 宏基因组学常用手段：扩增子、宏基因组、宏转录组所能回答的科学问题

五、宏基因组学有参分析流程

刚上手每个样品几G到几十G的数据，如果无从下手，还是建议立马来一套有参分析，快速获得样品的物种组成和功能组成。有参(Reference-based)方法，顾名思义，是直接使用现在的物种、功能基因注释数据库，数据只通过质控、比对而快速获得相应物种、功能基因的相对丰度矩阵。在本领域第一分析大牛Rob Knight的最新综述中对此方法也很推崇，《Nature综述 | Rob Knight等手把手教你分析菌群数据(全文翻译1.8万字)》。

此法优势明显，步骤少，速度快，省时省力，适合人类肠道、模式生物、海洋等有较好参考数据库的领域。缺点是无法识别未被报导物种的功能基因，对于植物、土壤、极端环境样本分析时，会损失很多信息。

图7. 宏基因组分析基本思路——有参分析流程。主要通过MetaPhlAn2基于己报导的所有微生物基因组获得物种组成，基于UniRef、EggNOG、KEGG等蛋白数据库确定功能组成。16S扩增子数据本身只包含物种组成，可通过PICRUSt获得KEGG/COG的功能组成。

主要知识点：

1. 实验设计的编写原则

2. KneadData流程快速质控和去宿主流程

3. 物种组成定量MetaPhlAn2

4.功能组成定量HUMAnN2

六、宏基因组无参分析流程

宏基因组无参分析，主要有两个目的：一是获得未被注释的物种和基因表达；二是通过Binning挖掘新物种的基因组。看样子很美好，但实际操作起来对计算量要求非常大。分析过程中比有参多了组装、基因预测、非冗余基因集构建和基因注释等步骤。

图8. 宏基因组无参分析流程。

关键步骤及使用软件：

数据质控fastqc, Trimmomatic, MultiQC, khmer
组装拼接MEGAHIT和评估quast
基因注释Prokka
构建非冗余基因集：CD-HIT
基因丰度估计：Salmon等方法快速基因丰度定量，后续可进行PCA、PCoA、CCA等整体组间差异比较；也可进一步使用edgeR、MetaStat、LEfSe进行组间差异基因分析；
物种注释：获得非冗余基因集物种注释信息，也可在reads层面使用Kraken2进行直接物种注释，结合第6步丰度值可进行组间差异物种分析；
基因功能分类注释：代谢通路(KEGG)，同源基因簇(eggNOG)注释，结合6中丰度进行组间差异功能比较；

图9. 宏转录组分析流程。宏转录组较宏基因组多一步去除rRNA基因序列的步骤。此方法缺点是无法获得真实的物种组成，但它体现的是在特定时空条件下有活性的物种和功能基因表达水平组成。

七、高级分析与可视化实战

R语言统计绘图与可重复计算
宏基因组中鉴定单菌(分箱bin)：MetaWRAP
Bin结果评估及可视化：CheckM, VizBin
宏基因组可视化：Circos
在线流程：MEGAN、MG-RAST、EBI-metagenome
网络分析: igraph、WGCNA、Cytoscape
多基因连接树构建：RaxML、fasttree、iTOL
其它常用：Graphlan、Krona

图10. 宏基因组基因组成、丰度、覆盖度等信息可视化

图11. 基于多基因连接的进化树构建和美化(Levy-2018-NatureGenetics)

学习完本课程，你能得到什么？

深彻理解生物测序数据的基本思想

宏基因组分析三种模式全面的解决方案，以及结果的统计分析

16S扩增子数据PICRUST预测宏基因组
宏基因组数据Humann2定量物种和功能
Denovo宏基因组拼接和binning

几十种软件数据库的使用经验

几十款本领域软件的安装、使用教程
常用功能注释数据库的理解和使用

高要求的结果可视化

结果的差异比较
多种可视化方案

主讲教师

主讲老师和助教包括中科院微生物所、遗传发育所、基因组所、生物物理所等多名本领域一线技术专家，在Nature子刊、Science和Cell子刊均发表过重镑级成果。

刘永鑫，博士。2008年毕业于东北农大微生物学专业。2014年中科院遗传发育所获生物信息学博士学位，2016年博士后出站留所工作，任宏基因组学实验室工程师，目前主要研究方向为宏基因组数据分析和植物微生物组。QIIME 2项目参与人，目前在Science、Nature Biotechnology、Genomics Proteomics Bioinformatics、Science China Life Sciences等杂志发表论文十余篇。2017年7月创办“宏基因组”公众号，目前分享宏基因组、扩增子原创文章900余篇，代表博文有《扩增子图表解读、分析流程和统计绘图三部曲(21篇)》、《Nature综述：手把手教你分析菌群数据(1.8万字)》、《QIIME2中文教程(18篇)》等，关注人数4.7万+，累计阅读700万+。

陈同，博士，2015毕业于中科院遗传与发育生物学研究所，生物信息专业博士，在Cell Stem Cell(IF=23.2，第一作者兼封面文章)，Nucleic Acids Research X 2，Stem Cells and Development等高水平杂志以第一作者或主要作者发表文章，运营有数万人关注的《生信宝典》微信公众号，给你不一样的学习生信体验。

陈亮，博士。2010年毕业于鲁东大学生物技术专业，2017年于中国科学院微生物研究所获微生物学博士学位。目前就职于中国科学院微生物研究所病原微生物与免疫学重点实验室，生物信息和计算生物学研究组，任助理研究员，目前主要研究内容为微生物生态学、宏基因组学等方面的数据挖掘和分析。在宏基因组公众号发表《一文学会网络分析》、《Science：肠道菌群揭示你的真实年龄》、《R中赋值符号箭头<-和等号=的区别》等文章。

周欣，中科院微生物硕博连续在读博士生（5年级），曾在加拿大农业与农业食品部-渥太华研究发展中心微生物生物信息研究组联合培养一年。熟悉高通量扩增子和宏基因组数据的处理及下游差异统计分析工作。目前主要研究方向为植物病害（土传病害）相关的微生物组学研究。在宏基因组公众号发表《再这么配培养基，你的细菌都被毒死了！》、《VSEARCH操作实战-免费使用价值万元的USEARCH》、《iTOL快速绘制颜值最高的进化树！》等。

往期课程瞬间

助教团队

十余名中国科学院、清华、北大博士(含在读)，轮值讲师和助教，辅助学员学习和矫正培训过程中不足的点。

授课模式

本课程以讲解流程和实际操作为主，采用独创四段式教学：

第一阶段 3天集中授课；
第二阶段自行练习2周；
第三阶段在线直播答疑；
第四阶段培训视频继续学习；
实现教-练-答-用四个环节的统一协调。

培训时间

2019-8-2 到 2019-8-4 (线下讲解实战)
每天早9点到晚6点，半封闭式教学 (最后1小时为圆桌讨论时间，增加互动交流。最后一天会稍微提前一些，多留出时间讨论，也方便老师乘车返回)
报到时间：上课当天

授课地点

北京市西城区鼓楼明德大厦附近 (北京会议较多，具体位置开课前1周通知)。

课程价格

截止 2019-7-26 4500 元/人
名额有限，每次课程报名满40人后自动关闭报名通道
提供易汉博基因科技实习机会或工作机会

课程福利

座位按报名并缴费（或预缴费）成功顺序从前到后龙摆尾式排序
赠送程序基础课一份 (http://bioinfo.ke.qq.com)
多人 (N，10>N>1) 组团报名并同时缴费，每人还可减免N-1百元 (最高500)
赠送金士顿U盘一个（32G含培训数据和脚本）
附推荐与分享对应的招生信息到朋友圈，截图发到[email protected] 可获得200元生信宝典腾讯课堂课程优惠券（可拆分供多个课程使用）
易生信同时推出多门相关课程，连报优惠——同时选2门课，95折；三门课9折，4门及以上85折。还可与团购同时优惠！扩增子(项目初探)+宏基因组(高精尖)，祝你分析水平更上一层楼。

注意事项 *

需自备笔记本电脑，推荐使用win10系统，4G以上内存(推荐8G)。课程实践根据需要会提供云计算平台
培训班所有数据，文档为内部资料，仅供参阅，未经允许不得翻印外传登刊
上课期间禁止录音，录像
成功付款的学员，若临时有紧急事情不能到来的，可申请延期，更换后续培训班；也可申请退款
若开课2周 (含) 前申请退款可退还85%费用；开课3个工作日 (含) 前申请退款退还70%的费用 (若已开发票需承担相应手续费)
不可先延期再退款
更多课程的详细介绍，请扫描下方二维码。

易生信同时推出多门相关课程，连报优惠——同时选2门课，95折；三门课9折，4门及以上85折。还可与团购同时优惠！扩增子(项目初探)+宏基因组(高精尖)，祝你分析水平更上一层楼。

成为实验中不可或缺的人，复制链接 http://www.ehbio.com/Training/ 或点击阅读原文，赶快报名吧！

融合网络实训室初步建设方案设想武汉唯众智创网络融合网络实训室融合网络融合网络实验室网络融合实训室网络融合实验室
一、引言在数字化浪潮席卷全球的当下，网络技术已然成为推动社会发展和经济增长的关键力量。从日常的生活购物到企业的运营管理，从便捷的社交沟通到前沿的科研探索，网络技术无处不在，深刻地改变着人们的生活与工作方式。随着5G、物联网、云计算、大数据等新兴技术的迅猛发展，网络技术领域对于专业人才的需求呈现出爆发式增长。据权威机构预测，未来几年，网络技术相关岗位的人才缺口将持续扩大。这些岗位不仅要求从业者具备扎
中断向量表 Cold_Johnsnow stm32 arm体系结构与编程驱动 arm开发驱动开发
中断向量表（InterruptVectorTable,IVT）是单片机（或处理器）中实现中断机制的核心数据结构，其作用类似于硬件与中断服务程序（ISR）之间的"导航地图"。它直接决定了系统在中断触发时如何快速定位到对应的处理代码。以下从技术原理、实现机制和应用设计三个层面进行深度解析：硬件级工作原理物理存储结构中断向量表存储在内存的固定起始地址（如ARMCortex-M固定在0x08000000，
国央企AI落地：以智能客服系统为突破口的详细实施方案探讨数商云网络 B2B系统数字化电商平台人工智能大数据架构 java 微服务 spring
一、引言随着人工智能（AI）技术的飞速发展和广泛应用，国央企作为国民经济的重要支柱，正积极探索AI技术在企业管理、业务运营等方面的应用。智能客服系统作为AI技术的一个重要应用领域，具有提升服务效率、增强用户体验、降低运营成本等显著优势，成为国央企AI落地的重要突破口。本文将详细探讨国央企如何以智能客服系统为突破口，实施AI技术的落地应用，并结合数商云在智能客服系统领域的实践经验，为国央企提供一套切
打卡信奥刷题（775）用C++信奥P9945[普及组/提高] [USACO21FEB] Clockwise Fence B Loge编程生活 C++c++算法开发语言数据结构青少年编程
P9945[USACO21FEB]ClockwiseFenceB题目描述围绕FarmerJohn最大的草地的栅栏已经损坏了，如今他终于决定要换一个新的栅栏。不幸的是，当FarmerJohn在铺设新栅栏时，一只巨大的蜜蜂突然出现，在他的草地上追着他跑，导致最后栅栏被沿着一条相当不规则的路径铺设。栅栏可以用一个字符串表示，每个字符为N（north，北）、E（east，东）、S（south，南）、W（w
打卡信奥刷题（641）用C++信奥P8267[普及组/提高] [USACO22OPEN] Counting Liars B Loge编程生活 C++c++开发语言算法青少年编程数据结构
[USACO22OPEN]CountingLiarsB题目描述奶牛Bessie躲在数轴上的某处。FarmerJohn的NNN头奶牛（1≤N≤10001\leN\le10001≤N≤1000）中的每头奶牛都有一条信息要分享：第iii头奶牛说Bessie躲在小于或等于pip_ipi的某个位置，或者说Bessie躲在大于或等于pip_ipi的某个位置（0≤pi≤1090\lep_i\le10^90≤pi
打卡信奥刷题（036）用C++信奥P9950[普及组/提高] [USACO20FEB] Mad Scientist B Loge编程生活 C++c++开发语言算法青少年编程数据结构
[USACO20FEB]MadScientistB题目描述FarmerJohn的远房亲戚Ben是一个疯狂的科学家。通常这会在家庭聚会时造成不小的摩擦，但这偶尔也会带来些好处，尤其是当FarmerJohn发现他正面对一些有关他的奶牛们的独特而不寻常的问题时。FarmerJohn当前正面对一个有关她的奶牛们的独特而不寻常的问题。他最近订购了NNN头奶牛（1≤N≤10001\leN\le10001≤N≤
西安电子科技大学 | 近期官方视频＋文章（涵盖招生＋录取统计）西电研梦西电经验分享考研
今年、明年考研的学弟学妹们可以看看涵盖今年讲课西电录取统计【西安电子科技大学官方】研究生招生宣传你一定值得一看02、计算机科学与技术学院（近期视频＋文章）QQ群：867684593①、西电考研|833、834初+复试第一名许学长经验分享https://www.bilibili.com/video/BV1oE4m1R72a/②、25西电考研|计科院专业课139分学长经验分享https://www.b
国产芯片替代方案：解析沁恒USB桥接芯片转四串/双串/单串口禾川兴 13242400688 沁恒直替系列单片机嵌入式硬件桥接模式
沁恒国产USB桥接芯片：高兼容性方案加速国产化替代随着USB通信接口在工业控制、消费电子、智能设备等领域的广泛应用，国产芯片厂商沁恒微电子（WCH）推出了一系列高性能USB转串口芯片，以高集成度、低成本、全兼容设计实现对国际品牌芯片的完美替代。本文针对沁恒多款USB桥接芯片与国际主流型号进行对比，展现其技术竞争力与国产化价值。‌一、沁恒USB桥接芯片核心优势‌‌全兼容设计‌硬件引脚定义、封装尺寸、
计算机信息安全若水心境软件架构师知识库信息安全
等保2.0与等保1.0区别※等保2.0在2019年12月1日正式实施。等级保护制度2.0在1.0的基础上，注重全方位主动防御、动态防御、整体防控和精准防护，实现对云计算、移动互联网、物联网、工业控制信息系统等保护对象全覆盖。对象范围扩大将云计算、移动互联网、物联网、工业控制系统等技术列入标准中。分类结构统一“基本要求、设计要求和测评要求”分类框架统一，形成了“安全通信网络”、“安全区域边界”、“安
【前端入门】应该了解和知道的几个国内外前端开发资源网站爱上大树的小猪前端
与大家分享一下几个国内外前端开发资源网站国际资源MDNWebDocs(MozillaDeveloperNetwork)用途：MDN是Web技术领域最全面的文档库之一，涵盖了HTML、CSS、JavaScript以及浏览器API等。链接:https://developer.mozilla.orgW3Schools用途：适合初学者学习Web技术，提供从基础到进阶的教程，同时还有在线练习环境。链接:ht
【前端】如何依靠纯前端实现拍照获取/选择文件等文字识别OCR技术爱上大树的小猪前端 ocr 前端框架 react.js
本文仅介绍第三方依赖包Tesseract.js，Tesseract.js是一个基于网页的OCR（光学字符识别）引擎，可以识别图像中的文本并将其转换为可供计算机处理的文本数据。支持多框架编译，如Vue、React等，这里展示步骤为React开发。下面直接进入主题：附Tesseract.js官方（https://github.com/naptha/tesseract.js）下载安装依赖包npminst
【第14届蓝桥杯】软件赛CB组省赛 Guiat 算法竞赛真题题解蓝桥杯
个人主页：Guiat归属专栏：算法竞赛真题题解文章目录A.日期统计B.01串的熵C.冶炼金属D.飞机降落E.接龙数列F.岛屿个数G.子串简写H.整数删除I.景区导游J.砍树正文总共10道题。A.日期统计【题目】日期统计【分析】【答案】235【AC_Code】#include#defineIOSios::sync_with_stdio(0);cin.tie(0);cout.tie(0);usingn
Python（1）Python全方位指南：定义、应用与零基础入门实战一个天蝎座白勺程序猿 Python入门到精通 python 开发语言
背景：为什么Python成为开发者必备技能？‌Python自1991年发布以来，凭借‌“简单高效”‌的设计理念，成为全球增长最快的编程语言。根据TIOBE2023年榜单，Python稳居前三，其核心竞争力包括：‌开发效率高‌：代码量仅为Java的1/5，C++的1/10。‌跨领域通吃‌：从Web开发到AI训练，覆盖90%以上技术场景。‌企业级应用‌：YouTube用Python处理视频推荐，NAS
CSDN社区，到底该不该用DeepSeek AI生成文章？ Small踢倒coffee_氕氘氚 python 经验分享
##引言在当今数字化时代，人工智能（AI）技术正以惊人的速度发展，逐渐渗透到各个行业和领域。作为AI技术的一个重要分支，自然语言处理（NLP）在内容创作、文本生成等方面展现出了巨大的潜力。DeepSeekAI作为一款先进的AI写作工具，能够自动生成高质量的文章，极大地提高了内容创作的效率。然而，随着AI生成内容的普及，CSDN社区中的开发者、技术爱好者和内容创作者们开始思考一个问题：我们到底该不该
鸿蒙开发2024【面试题库】讲解，近期需要面试的可千万别错过！鸿蒙系统小能手Mr.Li 鸿蒙开发 harmonyos 面试鸿蒙 OpenHarmony 鸿蒙系统程序员移动开发
1.请简述鸿蒙OS与AndroidOS的主要区别是什么？设备兼容性：鸿蒙OS是一款面向各种设备的分布式操作系统，支持手机、平板电脑、智能手表、智能家居、汽车等多种设备类型，并能在这些设备之间实现无缝切换和共享数据。而Android系统则主要用于移动设备，如手机和平板电脑。系统架构：鸿蒙OS采用分布式技术架构，通过分布式技术实现多设备间的协作和数据共享，更加灵活、安全、高效。而Android则采用单
[官文翻译]Flutter状态管理库Riverpod - 所有的Provider - StateProvider 2401_84166236 2024年程序员学习 flutter
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新HarmonyOS鸿蒙全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提
AI大模型从入门到精通，2025终极指南！好卷啊，又不能躺平，只能悄悄卷你们了！大模型教程人工智能大模型训练 LLM 知识库大模型大模型入门大模型学习
什么是AI大模型？AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力，可以应用于各种领域，如自然语言处理、图像识别、语音识别等。为什么要学AI大模型？2024人工智能大模型的技术岗位与能力培养随着人工智能技术的迅速发展和应用，大模型作为其中的重要组成部分，正逐渐成为推动人工智能发展的重要引擎。大模型以其强大的数据处理和模式识别能力，广泛应用于
【面经】2025年软件测试面试题，精选100 道（附答案）测试界的路飞软件测试面试面试软件测试职场和发展软件测试面试
测试技术面试题1、我现在有个程序，发现在Windows上运行得很慢，怎么判别是程序存在问题还是软硬件系统存在问题？2、什么是兼容性测试？兼容性测试侧重哪些方面？3、测试的策略有哪些？4、正交表测试用例设计方法的特点是什么？5、描述使用bugzilla缺陷管理工具对软件缺陷（BUG）跟踪的管理的流程？6、描述测试用例设计的完整过程？7、你觉得bugzilla在使用的过程中，有什么问题？8、单元测试的
突破反爬终极指南：如何用Python实现100%隐形数据抓取（附实战代码）煜bart 机器人人工智能 web3.py
引言：当爬虫遭遇铜墙铁壁2023年Q2最新统计显示，全球Top100网站中89%部署了AI驱动的反爬系统，传统爬虫存活率暴跌至17%。本文将揭秘一套基于深度伪装技术的爬虫方案，在最近三个月实测中保持100%成功率，成功突破Cloudflare、Distil等顶级防护系统。---###一、指纹伪装：让爬虫"隐身"的核心科技####1.1浏览器指纹深度克隆（代码实现）```pythonfromsele
如何利用 AI 技术快速定位和修复生产环境问题 pytorch人工智能
摘要生产环境的问题往往难以复现，排查成本高，直接影响用户体验。传统的日志分析、异常监控、APM（应用性能监控）等方法已经被广泛使用，但随着AI技术的发展，我们可以进一步自动化问题检测、智能日志分析、异常根因分析，极大提高生产问题的排查效率。本文将探讨如何利用AI技术优化生产环境的排查流程，并提供实际可运行的示例代码，帮助开发者掌握AI赋能下的智能问题诊断方法。引言生产环境的稳定性是衡量一个系统可靠
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发 harmonyos-next
HarmonyNext实战：基于ArkTS的分布式任务调度系统开发引言在HarmonyNext生态系统中，分布式任务调度是一个核心且复杂的技术领域。随着设备互联的普及，如何在多设备间高效、可靠地分配和执行任务成为开发者面临的重要挑战。本文将深入探讨如何利用ArkTS语言构建一个高性能的分布式任务调度系统，涵盖从架构设计到代码实现的完整过程。分布式任务调度系统概述分布式任务调度系统的核心目标是将任务
HarmonyNext实战：基于ArkTS的高性能区块链应用开发 harmonyos-next
HarmonyNext实战：基于ArkTS的高性能区块链应用开发引言区块链技术以其去中心化、不可篡改和透明性等特点，正在金融、供应链、物联网等领域掀起革命性变革。HarmonyNext作为新一代操作系统，提供了强大的分布式计算和网络通信能力，而ArkTS作为其开发语言，能够帮助开发者高效实现高性能的区块链应用。本文将详细讲解如何在HarmonyNext平台上使用ArkTS开发一个区块链应用。我们将
数据库核心技术面试题深度剖析：主从同步、二级索引与Change Buffer 后端数据库mysql
在数据库相关岗位的面试中，主从同步、二级索引、ChangeBuffer是高频考察点。本文将从面试题角度拆解这三个技术点，覆盖底层原理、性能优化、设计思想，并结合实际场景与高频追问，助你构建系统性回答框架。一、主从同步：高可用架构的灵魂1.基础问题：主从同步的基本流程是什么？答：核心流程：主库将事务写入Binlog（二进制日志）从库的IO线程拉取Binlog到本地RelayLog从库的SQL线程重放
代码签名证书申请指南 ssl证书
1.什么是代码签名？代码签名是为软件、脚本或可执行文件添加数字签名的技术，用于验证开发者身份并确保代码未被篡改。签名后，用户下载时会显示“已验证发布者”，减少安全警告。2.申请前的准备工作确认需求证书类型：选择标准代码签名证书（OV）或增强型证书（EV）。OV：需企业验证，适合常规软件。EV：需严格验证，支持硬件令牌，兼容微软SmartScreen快速信任。选择证书颁发机构（CA）→代码签名证书申
网站可以不安装SSL证书吗 ssl证书
一、SSL证书的作用SSL证书，全称为安全套接层（SecureSocketsLayer）证书，是互联网通信中用于加密数据的一种技术手段。它主要用于在客户端和服务器之间建立一个安全的加密通道，确保数据在传输过程中不被窃取或篡改。同时，SSL证书还能验证网站的真实身份，防止钓鱼网站攻击。SSL证书申请入口直接访问JoySSL，注册一个新账号，并填写特定注册码230931（获得技术支持）二、不安装SSL
AI大模型学习路线：从入门到精通的完整指南【2025最新】 AI大模型-大飞人工智能学习大模型 LLM AI 程序员大模型学习
引言近年来，以GPT、BERT、LLaMA等为代表的AI大模型彻底改变了人工智能领域的技术格局。它们不仅在自然语言处理（NLP）任务中表现卓越，还在计算机视觉、多模态交互等领域展现出巨大潜力。本文旨在为开发者、研究者和技术爱好者提供一条清晰的学习路径，帮助读者逐步掌握大模型的核心技术并实现实际应用。一、基础阶段：构建知识体系数学与理论基础线性代数：矩阵运算、特征值与奇异值分解是大模型参数优化的基础
苹果签名的战略价值：解析六大核心优势与商业赋能逻辑 ios
苹果签名的战略价值：解析六大核心优势与商业赋能逻辑（因篇幅过长所以分为两篇帖子发~）在iOS应用生态中，签名机制既是技术护城河，也是开发者突破分发限制的关键武器。本文将从开发效率、商业变现、安全管控等维度，深度剖析苹果签名体系带来的独特价值。一、突破AppStore审核壁垒，加速产品验证苹果签名最核心的优势在于规避冗长审核流程。根据2023年统计，AppStore平均审核周期为24小时，首次提交通
IP证书如何让企业提升网络信任度 ssl证书ip地址
IP证书，作为一种专门设计用于保护IP地址安全的数字证书，正逐渐成为提升企业网络信任度的关键工具。###IP证书申请入口申请时记得填写注册码230931，获取一对一技术支持一、身份验证与加密通信IP证书的核心在于通过PKI技术实现设备身份与IP地址的强绑定。当企业为服务器或设备部署IP证书后，通信双方通过交换证书验证身份，并协商对称密钥加密数据，确保通信的机密性与完整性。这一机制有效抵御了IP欺骗
深度合成算法备案十大雷区拆解 AI产品备案人工智能算法语言模型 ai
最近后台收到了很多小伙伴的私信，基本上都是在问算法备案被打回了；哪部分的材料有什么问题；不清楚驳回原因等等。今天结合大家最关心的问题，为大家详细剖析一下备案过程中常见的十大难题及解决方法。一、备案主体性质界定不明不少企业在备案过程中往往难以明确自身是否属于备案主体范围，尤其是涉及技术提供与应用服务的交叉领域，无法判断自身是否属于“具有舆论属性或者社会动员能力”主体。解决方案：仔细研读相关政策法规，
【技术实测】单一世界承载数万单位无分片同步！全球低延迟互动DEMO开放测试微网兔子後端技術 c++服务器 unity 后端分布式
核心突破分散式同步引擎`实现三大关键指标：✅无分片架构-全域实体即时同步✅毫秒级延迟-跨洲网路优化✅万级货运-秒登入不排队万人单一世界最新技术测试影片目前，我们已实现一定的技术突破，并希望收集开发者的回馈，以确定下一步的优化方向。为了验证这项技术，我们部署了一个测试环境，具体情况如下：3万名玩家的即时互动3D测试环境(512×512平方米)已部署12,000个模拟客户端，开放18,000个名额给开
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分