笑不语

渐进式学习：如何用R和GO富集可视化捕捉生命的关键信号？

一、引言

生命科学中的数据分析和可视化是一个具有挑战性的领域。随着技术和理论的不断发展，研究人员需要处理越来越复杂和庞大的数据集，以研究生物体在不同尺度上的结构和功能，探索不同生物过程和疾病的机制。在这个领域，GO（Gene Ontology）富集分析已成为一种常见的技术，用于识别在给定的基因集合中与特定生物过程和机制有关的基因集合，是研究生物信息学、基因组学和转录组学的重要方法之一[1,2]。然而，GO富集分析的结果往往是一张庞大的表格，需要通过可视化才能更好地理解和分析。在这方面，R语言作为一个强大的数据分析工具，也是生命科学研究领域中广泛使用的计算统计工具之一[3,4]。因此，本文将介绍GO富集分析技术并重点介绍R语言及其绘图包，如ggplot2和clusterProfiler等，用于可视化GO富集分析结果[5,6,7]。本文还将提供一些使用R和GO富集可视化的基本方法和技巧，并以实例说明如何从生物大数据中捕捉关键信号。最后，我们将讨论GO富集可视化在生物信息学中的未来发展和可能的研究方向。

二、数据集

2.1 数据集导入

该数据集是GOplot自带的数据集，可以用来学习Go富集分析和可视化，接下来我们引入数据集

library(GOplot)
data(EC)

数据集展示：

> # 查看数据
> head(EC$eset)
    Gene_Symbol     Brain_A     Brain_B    Brain_C     Heart_A     Heart_B     Heart_C
1 0610007P14Rik  0.58382130  0.81117820 -0.2480545 -0.67075443 -0.58700850 -0.65176487
2 0610008F07Rik  0.13262606  0.11230135  0.3122339  0.10193062 -0.06617737  0.09765196
3 0610009B22Rik -0.09357643 -0.20074654  0.2505083 -1.02136140 -0.18762684 -0.69150734
4 0610009D07Rik  0.06708336  0.12616920 -0.1234570 -0.74400520 -0.42762280 -0.43724203
5 0610009O20Rik  0.02191877  0.13460398  0.2718530  0.27460957 -0.07751560  0.00000000
6 0610010F05Rik -0.10588837 -0.05568028  0.0115509  0.06084633 -0.18752098  0.01155090

> # 查看数据
> head(EC$genelist)
       ID    logFC   AveExpr        t  P.Value adj.P.Val        B
1 Slco1a4 6.645388 1.2168670 88.65515 1.32e-18  2.73e-14 29.02715
2 Slc19a3 6.281525 1.1600468 69.95094 2.41e-17  2.49e-13 27.62917
3     Ddc 4.483338 0.8365231 65.57836 5.31e-17  3.65e-13 27.18476
4 Slco1c1 6.469384 1.3558865 59.87613 1.62e-16  8.34e-13 26.51242
5  Sema3c 5.515630 2.3252117 58.53141 2.14e-16  8.81e-13 26.33626
6 Slc38a3 4.761755 0.9218670 54.11559 5.58e-16  1.76e-12 25.70308

> # 查看数据
> head(EC$david)
  Category         ID                             Term
1       BP GO:0007507                heart development
2       BP GO:0001944          vasculature development
3       BP GO:0001568         blood vessel development
4       BP GO:0048729             tissue morphogenesis
5       BP GO:0048514       blood vessel morphogenesis
6       BP GO:0051336 regulation of hydrolase activity
                                             Genes
1       DLC1, NRP2, NRP1, EDN1, PDLIM3, GJA1, TTN, GJA5, ZIC3, TGFB2, CERKL, GATA6, COL4A3BP, GAB1, SEMA3C, MKL2, SLC22A5, MB, PTPRJ, RXRA, VANGL2, MYH6, TNNT2, HHEX, MURC, MIB1, FOXC2, FOXC1, ADAM19, MYL2, TCAP, EGLN1, SOX9, ITGB1, CHD7, HEXIM1, PKD2, NFATC4, PCSK5, ACTC1, TGFBR2, NF1, HSPG2, SMAD3, TBX1, TNNI3, CSRP3, FOXP1, KCNJ8, PLN, TSC2, ATP6V0A1, TGFBR3, HDAC9
2 GNA13, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, FOXO1, GJA5, TGFB2, WARS, CERKL, APOE, CXCR4, ANG, SEMA3C, NOS2, MKL2, FGF2, RAPGEF1, PTPRJ, RECK, EFNB2, VASH1, PNPLA6, THY1, MIB1, NUS1, FOXC2, FOXC1, CAV1, CDH2, MEIS1, WT1, CDH5, PTK2, FBXW8, CHD7, PLCD1, PLXND1, FIGF, PPAP2B, MAP2K1, TBX4, TGFBR2, NF1, TBX1, TNNI3, LAMA4, MEOX2, ECSCR, HBEGF, AMOT, TGFBR3, HDAC7
3        GNA13, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, FOXO1, GJA5, TGFB2, WARS, CERKL, APOE, CXCR4, ANG, SEMA3C, NOS2, MKL2, FGF2, RAPGEF1, PTPRJ, RECK, VASH1, PNPLA6, THY1, MIB1, NUS1, FOXC2, FOXC1, CAV1, CDH2, MEIS1, WT1, CDH5, PTK2, FBXW8, CHD7, PLCD1, PLXND1, FIGF, PPAP2B, MAP2K1, TBX4, TGFBR2, NF1, TBX1, TNNI3, LAMA4, MEOX2, ECSCR, HBEGF, AMOT, TGFBR3, HDAC7
4                                   DLC1, ENAH, NRP1, PGF, ZIC2, TGFB2, CD44, ILK, SEMA3C, RET, AR, RXRA, VANGL2, LEF1, TNNT2, HHEX, MIB1, NCOA3, FOXC2, FOXC1, TGFB1I1, WNT5A, COBL, BBS4, FGFR3, TNC, BMPR2, CTNND1, EGLN1, NR3C1, SOX9, TCF7L1, IGF1R, FOXQ1, MACF1, HOXA5, BCL2, PLXND1, CAR2, ACTC1, TBX4, SMAD3, FZD3, SHANK3, FZD6, HOXB4, FREM2, TSC2, ZIC5, TGFBR3, APAF1
5                                                                                            GNA13, CAV1, ACVRL1, NRP1, PGF, IL18, LEPR, EDN1, GJA1, CDH2, MEIS1, WT1, TGFB2, WARS, PTK2, CERKL, APOE, CXCR4, ANG, SEMA3C, PLCD1, NOS2, MKL2, PLXND1, FIGF, FGF2, PTPRJ, TGFBR2, TBX4, NF1, TBX1, TNNI3, PNPLA6, VASH1, THY1, NUS1, MEOX2, ECSCR, AMOT, HBEGF, FOXC2, FOXC1, HDAC7
6                                                                               CAV1, XIAP, AGFG1, ADORA2A, TNNC1, TBC1D9, LEPR, ABHD5, EDN1, ASAP2, ASAP3, SMAP1, TBC1D12, ANG, TBC1D14, MTCH1, TBC1D13, TBC1D4, TBC1D30, DHCR24, HIP1, VAV3, NOS1, NF1, MYH6, RICTOR, TBC1D22A, THY1, PLCE1, RNF7, NDEL1, CHML, IFT57, ACAP2, TSC2, ERN1, APAF1, ARAP3, ARAP2, ARAP1, HTR2A, F2R
     adj_pval
1 0.000002170
2 0.000010400
3 0.000007620
4 0.000119000
5 0.000720000
6 0.001171166

> # 查看数据
> head(EC$genes)
     ID      logFC
1  PTK2 -0.6527904
2 GNA13  0.3711599
3  LEPR  2.6539788
4  APOE  0.8698346
5 CXCR4 -2.5647537
6  RECK  3.6926860

> # 查看数据
> EC$process
[1] "heart development"        "phosphorylation"          "vasculature development"  "blood vessel development" "tissue morphogenesis"     "cell adhesion"           
[7] "plasma membrane"

2.2 数据预处理

使用cirlce_dat函数整合GO注释结果数据和基因差异表达分析数据结合起来，形成作图对象。

circ <- circle_dat(EC$david, EC$genelist)
head(circ)

结果展示：

  category         ID              term count  genes      logFC adj_pval     zscore
1       BP GO:0007507 heart development    54   DLC1 -0.9707875 2.17e-06 -0.8164966
2       BP GO:0007507 heart development    54   NRP2 -1.5153173 2.17e-06 -0.8164966
3       BP GO:0007507 heart development    54   NRP1 -1.1412315 2.17e-06 -0.8164966
4       BP GO:0007507 heart development    54   EDN1  1.3813006 2.17e-06 -0.8164966
5       BP GO:0007507 heart development    54 PDLIM3 -0.8876939 2.17e-06 -0.8164966
6       BP GO:0007507 heart development    54   GJA1 -0.8179480 2.17e-06 -0.8164966

「字段简单介绍」：

category：GO term分为3大类，分别为BP（生物学过程），CC（细胞组分）和MF（分子功能）
ID和term来属于数据库的字段；
count为划分到相应term的基因数目；
logFC为差异表达基因的log标准化的倍数变化； adj_pval为校正过的p-value值，adj_pval < 0.05显著富集；

三、数据可视化

3.1 柱形图

所有种类

GOBar(circ, display = 'multiple', zsc.col = c('blue', 'white', 'red'))

是不是觉得有写不清晰，看不出x坐标的标注。没关系，我们可以选择性展示其中感兴趣的部分。

展示特定种类

GOBar(subset(circ, category == 'MF'))

这样就很清晰了！

3.2 气泡图

GOBubble(circ, labels = 2.8)

labels是一个很重要的参数，表示标记adj_pval负对数大于等于设置值的GO term，气泡的大小表明富集到该GO term的基因数目。我设置成了2.8，可读性还是可以的,但是交叉的气泡很多，我们可以通过reduce_overlap函数过滤一部分数据，减少泡泡的数目，如下：

reduced_circ <- reduce_overlap(circ, overlap = 0.70)
GOBubble(reduced_circ, labels = 2.8)

视觉效果是不是比之前是要好一些！如果还是比较拥挤，我们可以分组绘图，如下：

GOBubble(circ, title = 'Bubble plot', display = 'multiple', labels = 3)

3.3 环形图

GOCircle(circ)

3.4 弦图

数据整理：

chord <- chord_dat(circ, EC$genes, EC$process)
head(chord)

结果展示：

> head(chord)
      heart development phosphorylation vasculature development blood vessel development tissue morphogenesis cell adhesion plasma membrane      logFC
PTK2                  0               1                       1                        1                    0             0               1 -0.6527904
GNA13                 0               0                       1                        1                    0             0               1  0.3711599
LEPR                  0               0                       1                        1                    0             0               1  2.6539788
APOE                  0               0                       1                        1                    0             0               1  0.8698346
CXCR4                 0               0                       1                        1                    0             0               1 -2.5647537
RECK                  0               0                       1                        1                    0             0               1  3.6926860

画图：

GOChord(chord, space = 0.02, gene.order = 'logFC', gene.space = 0.25, gene.size = 5)

弦图展示了感兴趣的基因和某些GO term的关系，以基因差异表达倍数的大小排序。

3.5 热图

GOHeat(chord, nlfc = 1, fill.col = c('red', 'blue', 'green'))

3.6 聚类图

GOCluster(circ, EC$process, clust.by = 'logFC', term.width = 2)

3.7 韦恩图

l1 <- subset(circ, term == 'heart development', c(genes,logFC))
l2 <- subset(circ, term == 'plasma membrane', c(genes,logFC))
l3 <- subset(circ, term == 'tissue morphogenesis', c(genes,logFC))
GOVenn(l1,l2,l3, label = c('heart development', 'plasma membrane', 'tissue morphogenesis'))

四、总结

本文介绍了如何使用R和GO富集可视化技术，分析生物信息学中数据集的复杂性问题。通过R语言和相应的包，如ggplot2，g:Profiler，moduleColor等，可以对生成的结果进行高效而准确的可视化，以帮助研究人员更好地理解和分析复杂数据集。文章还提供了一些使用R和GO富集可视化技术的基本方法和技巧，并以实例说明如何从生物大数据中捕捉关键信号。最后，我们探讨了GO富集可视化的未来趋势和展望，旨在为生命科学研究者提供更好的技术支持，以研究更有意义、有价值的数据。R语言在数据分析和可视化领域的应用将有望为大规模数据集的处理和分析，提供更有效、更快捷、更精确的解决方法。

参考文献:

[1] Ashburner M, Ball C A, Blake J A, et al. Gene ontology: tool for the unification of biology. Nature genetics, 2000, 25(1): 25-29.

[2] Kanehisa M, Goto S. KEGG: kyoto encyclopedia of genes and genomes. Nucleic acids research, 2000, 28(1): 27-30.

[3] Gentleman R C, Carey V J, Bates D M, et al. Bioconductor: open software development for computational biology and bioinformatics. Genome biology, 2004, 5(10): R80.

[4] R Core Team. R: A Language and Environment for Statistical Computing. R Foundation for Statistical Computing, Vienna, Austria (2017). Available online at https://www.R-project.org/.

[5] Yu G, Wang L G, Han Y, et al. clusterProfiler: an R package for comparing biological themes among gene clusters. OMICS: A Journal of Integrative Biology, 2012, 16(5): 284-287.

[6] Wickham H. ggplot2: Elegant Graphics for Data Analysis. New York: Springer, 2016.

[7] Kolde R, Laur S, Adler P, et al. Robust rank aggregation for gene list integration and meta-analysis. Bioinformatics, 2012, 28(4): 573-580.

【数据结构】从位图到布隆过滤器望舒_233 C++数据结构算法 c++
位图的引入在学习位图之前，我想先和大家谈谈我们之前学习过的搜索元素的方式都有哪些，首先肯定是大家学习完基本语法就学会了的暴力查找，通过遍历整个区间来搜索某个元素；然后呢，大家可能还学习过二分查找，对于排过序的数组，使用二分查找的时间复杂度是O(logN)；再然后，可能还学习过搜索树，二叉树在平衡的前提下查找/插入/删除的时间复杂度是O(logN)，但极端情况下（二叉树严重不平衡），这些操作的时间复
2 Redis 字符串(String) 命令大全 Theodore_1022 redis教程 redis nosql nosql数据库
Redis提供了丰富的字符串类型操作命令，支持设置、获取、修改、追加等多种功能。本文整理了常用的Redis字符串命令，并附带详细示例，方便学习和复习。1.SET命令作用：设置指定key的值。示例：SETmykey"Hello,Redis!"GETmykey输出："Hello,Redis!"2.SETNX命令作用：只有在key不存在时才设置key的值。示例：SETNXmykey"Hello"SETN
自然语言模型（NLP）介绍 Liudef06 Stable Diffusion 自然语言处理人工智能
一、自然语言模型概述自然语言模型（NLP）通过模拟人类语言理解和生成能力，已成为人工智能领域的核心技术。近年来，以DeepSeek、GPT-4、Claude等为代表的模型在技术突破和应用场景上展现出显著优势。例如，DeepSeek通过强化学习提升推理能力，其混合专家架构（MoE）显著优化了计算效率‌。二、核心技术解析1.DeepSeek模型架构混合专家模型（MoE）：DeepSeek-V3采用Mo
跟我一起学Python数据处理（117/127）：高级Python环境搭建指南 lilye66 python windows 开发语言
跟我一起学Python数据处理（117/127）：高级Python环境搭建指南在Python数据处理的学习和实践中，基础的Python环境可能无法满足日益复杂的项目需求。就像我们搭建房子，简单的毛坯房能满足基本居住，但想要更舒适、功能更齐全，就需要精心装修一番。今天，我就和大家分享一下高级Python环境搭建的相关知识，希望能和大家一起在技术的道路上共同进步，让我们处理数据时更加得心应手。一、为什
2025-03-01 学习记录--C/C++-PTA 7-35 有理数均值小呀小萝卜儿学习-C/C++学习 c语言
合抱之木，生于毫末；九层之台，起于累土；千里之行，始于足下。一、题目描述⭐️二、代码（C语言）⭐️#include//【关键】计算最大公约数（GCD）longlonggcd(longlonga,longlongb){while(b!=0){//当b不为0时循环longlongtemp=b;//临时变量存储b的值b=a%b;//计算a除以b的余数，赋值给ba=temp;//将之前存储的b的值赋值给a
费曼学习法11 - NumPy 的 “线性代数” 之力：矩阵运算与应用 (应用篇) 修昔底德 Python费曼学习法线性代数学习 numpy python 人工智能深度学习
第六篇：NumPy的“线性代数”之力：矩阵运算与应用(应用篇)开篇提问：考虑一个实际问题：图像的旋转。当你使用图像编辑软件旋转照片时，背后是什么在驱动图像像素的精确移动？答案是线性代数。图像可以表示为数值矩阵，而旋转、缩放、剪切等图像变换，都可以通过矩阵运算来实现。线性代数不仅是图像处理的基石，也在机器学习、物理模拟、工程计算等众多领域扮演着核心角色。它提供了一套强大的数学工具，用于描述和解决多维
人工智能之数学基础：矩阵的秩每天五分钟玩转人工智能机器学习深度学习之数学基础人工智能矩阵机器学习深度学习线性代数秩
本文重点矩阵的秩，作为矩阵理论中的一个核心概念，是连接矩阵性质与应用的重要桥梁。本文我们将学习矩阵秩的概念，通过矩阵的秩可以判断矩阵是否可逆等等，所以矩阵的秩是非常重要的一个概念。矩阵秩的概念秩定义为矩阵A的线性独立的行（或列）的最大数目。也就是说，如果把矩阵看成由行向量或列向量组成，那么矩阵的秩就是这些向量中极大线性无关组所含向量的个数。矩阵的秩定义为矩阵线性无关的行向量或者列向量的最大数量，表
通往 AI 之路：Python 机器学习入门-线性代数一小路一从0开始学习机器学习机器学习人工智能 python 后端开发语言线性代数
2.1线性代数（机器学习的核心）线性代数是机器学习的基础之一，许多核心算法都依赖矩阵运算。本章将介绍线性代数中的基本概念，包括标量、向量、矩阵、矩阵运算、特征值与特征向量，以及奇异值分解（SVD）。2.1.1标量、向量、矩阵1.标量（Scalar）标量是一个单独的数，例如：a=5在Python中：a=5#标量2.向量（Vector）向量是由多个数值组成的一维数组，例如：v=[2,3,5]Pytho
清华出品DeepSeek六版手册，携全套AI资料，带你闯入AI的奇妙世界 2501_90771553 pdf
清华出品DeepSeek六版手册，携全套AI资料，带你闯入AI的奇妙世界在科技飞速发展的时代，人工智能（AI）已然成为引领变革的核心力量。无论是对AI充满好奇的初学者，还是在该领域深耕的专业人士，都在不断探寻着更优质、更全面的学习资源。现在，一份来自清华大学的厚礼——DeepSeek六版手册，带着全套AI资料震撼登场，将引领你走进AI的奇妙世界！DeepSeek系列手册，凭借清华大学深厚的学术底蕴
C语言学习笔记-进阶（1）深入理解指针3 John.Lewis c语言学习笔记
1.字符指针变量在指针的类型中我们知道有⼀种指针类型为字符指针char*;⼀般使用：intmain(){charch='w';char*pc=&ch;*pc='w';return0;}还有⼀种使用方式如下：intmain(){constchar*pstr="hellobit.";//这⾥是把⼀个字符串放到pstr指针变量⾥了吗？printf("%s\n",pstr);return0;}代码cons
(undone) MIT6.S081 2023 学习笔记 (Day9: LAB8 locks) shimly123456 MIT6.S081 学习笔记操作系统
url:https://pdos.csail.mit.edu/6.1810/2023/labs/lock.htmlInthislabyou’llgainexperienceinre-designingcodetoincreaseparallelism.Acommonsymptomofpoorparallelismonmulti-coremachinesishighlockcontention.Im
C语言文件操作学习笔记：从基础到实践共享家9527 c c语言数据结构算法
在C语言的知识体系中，文件操作是极为关键的一环，它赋予了程序存储和读取外部数据的能力，对于开发各类实用程序至关重要。近期，借助课程的学习，我对C语言文件操作进行了系统且深入的学习，下面将我的学习心得和收获进行分享。目录一、文件操作基础概念（一）文件类型（二）文件指针二、文件的打开与关闭三、文件的顺序读写（一）字符读写（二）文本行读写（三）格式化读写（四）二进制读写四、文件的随机读写（一）fseek
数据挖掘校招面经二 Y1nhl 搜广推面经数据挖掘人工智能机器学习深度学习算法 python
得物数据挖掘一、线性回归y=ax中参数a如何计算1.1.a是待学习参数在线性回归中，a是模型的权重（或斜率），需要通过数据来学习其最优值。学习的目标是找到a的值，使得模型的预测值y^=ax\hat{y}=axy^=ax尽可能接近真实值y。1.2.最小二乘法在线性回归中，通常使用最小二乘法来学习a。最小二乘法的目标是最小化误差平方和（即真实值y和预测值y^\hat{y}y^之间的差异）：误差平方和=
Python深度学习实践：神经网络在异常检测中的应用 AI天才研究院 AI大模型企业级应用开发实战 Python实战 DeepSeek R1 &大数据AI人工智能大模型 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
Python深度学习实践：神经网络在异常检测中的应用关键词：深度学习，神经网络，异常检测，Python，TensorFlow，PyTorch，模型优化，实战案例摘要：本文深入探讨了深度学习在异常检测领域的应用。通过Python实现的神经网络，本文介绍了深度学习的基本概念、核心算法、模型优化方法，并提供了详细的实战案例，包括数据预处理、模型训练和评估。读者将了解如何使用深度学习技术检测金融欺诈、网络
各主流厂商抓取modem log的方法终端小蛙 modem android modem
第一次来编辑CSDN，感觉各功能不太熟悉，先试试本文档主要基于自己近期的查看各厂商的MODEMlog时，积累的一些抓取modemofflinelog的经验，发出来一起学习VIVO如何抓log以下是基于VIVONEX35G版本，验证有效a.如何抓取Modemofflinelog:在拨号盘输入*#*#112#*#*->点击更多->点击Modemlog配置->选择所想要的log配置类型->退出然后，*#
golang实践-目录结构与工具 alex_023 golang golang
这个话题确实是老调重弹，但确异常重要。老实说，用go做正式项目之前，写过scala，但那个SBT太折磨人，偶然就上了go。两者语法的差别就不说了，但入坑之后才发现水深：没有模块部署及官方的版本管理工具，会带来很多麻烦。反复折腾了近一年，基本上形成了一点固有的模式，做一般项目还算能够简单支持。没什么特别的技术点，更多只是一点心得。一、目录结构我们的代码以rpc为主，http为辅（调用rpc，也辅助测
Jetpack学习之 Hilt，android应用开发入门答案 m0_64604178 程序员面试移动开发 android
2.5Hilt的内置组件和作用域2.5.1@InstallIn注解2.5.2使注入对象单例2.5.3作用域的包含关系2.6Hilt预置的Qualifier3小结参考文章Git学习地址：传送门1.概述=======================================================================随着Android11的发布，Jetpack家族新添了Hil
Golang项目结构规范权衡77 golang golang
基于Google标准的Golang-Project-Layout标准模板https://github.com/JasonkayZK/Go_Learn/tree/golang-project-layout翻译版https://github.com/golang-standards/project-layout这是Go应用程序项目的基本布局。它不是核心Go开发团队定义的官方标准；然而，它是Go生态系统
急招！【Base石家庄/济南/昆明/贵阳】云和恩墨-GoldenDB/MySQL DBA mysql数据库招聘
岗位职责：1、针对客户的需求或技术问题编写技术方案和技术文档；2、现场或远程采集操作系统和数据库相关的运行数据和日志文件，对采集的信息进行上传归档；3、对客户的数据库及系统进行诊断、优化及故障处理，帮助客户尽快恢复业务正常运行；4、有计划有步骤地推进项目的实施，直到最终效果满足合同或项目计划设定的交付目标；5、根据客户满意度以及服务提供过程中暴露的问题，不断改进、调整和完善工作。有意向者添加小墨（
机器学习校招面经二 Y1nhl 搜广推面经机器学习人工智能算法推荐算法数据挖掘搜索算法 pytorch
快手机器学习算法一、AUC（AreaUndertheROCCurve）怎么计算？AUC接近1可能的原因是什么？见【搜广推校招面经四】AUC是评估分类模型性能的重要指标，用于衡量模型在不同阈值下区分正负样本的能力。它是ROC曲线（ReceiverOperatingCharacteristicCurve）下的面积。1.1.ROC曲线的坐标ROC曲线以真正例率（TruePositiveRate,TPR）
《深度学习实战》第12集：大模型的未来与行业应用带娃的IT创业者深度学习实战深度学习
深度学习实战|第12集：大模型的未来与行业应用随着深度学习技术的快速发展，大模型（如GPT、LLaMA、Bloom等）已经成为人工智能领域的核心驱动力。本篇博客将探讨大模型的发展趋势及其在医疗、金融、教育等行业的实际应用，并通过2个实战项目展示如何使用开源大模型构建问答系统。此外，我们还会分析大模型的前沿技术方向。图示：大模型发展历程与行业应用场景1.大模型发展历程图以下是大模型从早期到现在的关键
华为面试题及答案——机器学习(二) 麦当当MDD 题目挖掘机器学习人工智能数据库开发数据库大数据
21.如何评价分类模型的优劣?（1）模型性能指标准确率（Accuracy）：定义：正确分类的样本数与总样本数之比。适用：当各类样本的数量相对均衡时。精确率（Precision）：定义：预测为正类的样本中实际为正类的比例。适用：当关注假阳性错误的成本较高时（例如垃圾邮件检测）。召回率（Recall）：定义：实际为正类的样本中被正确预测为正类的比例。适用：当关注假阴性错误的成本较高时（例如疾病检测）。
深度学习突破：LLaMA-MoE模型的高效训练策略人工智能大模型讲师培训咨询叶梓深度学习 llama 人工智能 Llama-Moe 大模型语言模型
在人工智能领域，大模型（LLM）的崛起带来了前所未有的进步，但随之而来的是巨大的计算资源需求。为了解决这一问题，Mixture-of-Expert（MoE）模型架构应运而生，而LLaMA-MoE正是这一架构下的重要代表。LLaMA-MoE是一种基于LLaMA系列和SlimPajama的MoE模型，它通过将LLaMA的前馈网络（FFNs）划分为稀疏专家，并为每层专家插入top-K个门，从而显著减小模
golang 内存对齐和填充规则老赵不会写代码 go语言 golang 开发语言后端
内存对齐和填充规则对齐要求：每个数据类型的起始地址必须是其大小的倍数。int8（1字节）：不需要对齐。int16（2字节）：起始地址必须是2的倍数。int32（4字节）：起始地址必须是4的倍数。int64（8字节）：起始地址必须是8的倍数。填充规则：如果当前偏移量不是下一个成员变量对齐要求的倍数，则编译器会在前一个成员后插入“填充字节”，以使下一个成员的起始地址满足对齐要求。结构体总大小：结构体的
【PCIe 总线及设备入门学习专栏 4.5 -- PCIe 中断 MSI 与 MSI-X 机制介绍】主公讲 ARM #【PCIe Bus 专栏】PCIe msi PCIe MSI-X PCIe 中断机制 MSI-X 中断机制 MSI 中断机制 PCI 中断
文章目录PCI设备中断机制PCIe设备中断机制PCIeMSI中断机制MSICapabilityMSI-X中断机制MSI-XcapabilityMSI-XTablePBAMSI-Xcapability解析MSI/MSI-X操作流程扫描设备配置设备MSI配置MSI-X配置中断触发与处理PCI设备中断机制以前的PCI设备是支持物理上的INTA/B/C/D中断信号，设备可以可以表明自己通过哪个引脚来发出中
顺丰科技-2024 机器学习算法面经程序员奇奇 offer分享+面试经验顺丰科技机器学习机器学习算法面经
专栏分享：计算机小伙伴秋招春招找工作的面试经验和面试的详情知识点专栏首页：软件测试开发类面经合集主要分享：测试开发类岗位在面试互联网公司时候一些真实的经验面试code学习参考请看：数据结构面试必刷100题一面：1.自我介绍2.线程和进程的区别，什么时候用多进程，什么时候用多线程（这个属于给自挖坑了）3.实习项目问题，项目目标是怎么定的，用的什么算法
基于 Python + Django 的学生成绩综合评价分析预测可视化系统源码空间站11 python django 开发语言课程设计机器学习成绩预测毕业设计
开发报告：一、项目概述本项目是一个基于Python和Django框架开发的学生成绩综合评价分析与预测可视化系统。系统的主要功能包括：学生成绩数据的管理与展示、成绩预测模型的建立与应用、以及预测结果的可视化展示。该系统利用机器学习算法（如线性回归）进行成绩预测，并通过DjangoWeb框架实现数据的展示和用户交互。二、系统功能概述学生信息管理：系统管理学生的基本信息，包括年龄、性别、爱好等，基于Dj
机器学习之学习笔记孤城laugh 机器学习学习笔记人工智能 python
机器学习-学习笔记1.简介2.算法3.特征工程3.1数据集3.2特征提取3.3特征预处理3.4特征降维4.分类算法4.1`sklearn`转换器和估计器4.2K-近邻算法（KNN）4.3模型选择与调优4.4朴素贝叶斯算法4.5决策树4.6集成学习方法之随机森林5.回归算法5.1线性回归5.2过拟合与欠拟合5.3岭回归5.4逻辑回归（实际上是分类算法，用于解决二分类问题）6.聚类算法1.无监督学习2
深度学习day1 孤城laugh 深度学习人工智能笔记学习机器学习
深度学习day11.深度学习与机器学习的区别1.1特征提取方面1.2数据量与计算性能要求1.3算法代表2.深度学习框架之TensorFlow2.1TensorFlow基础2.2TensorFlow基础知识1.**张量（Tensor）**：多维数组、多维列表2.**变量（Variable）**：用于表示程序处理的共享持久状态3.**图与函数**4.**可视化学习（TensorBoard）**：用来展
C# Serilog：日志界的超级英雄，带你玩转日志记录墨瑾轩一起学学C#【一】c#javascript 开发语言
关注墨瑾轩，带你探索编程的奥秘！超萌技术攻略，轻松晋级编程高手技术宝库已备好，就等你来挖掘订阅墨瑾轩，智趣学习不孤单即刻启航，编程之旅更有趣想象一下，你的应用程序是个超级英雄，每当夜幕降临，它在代码的世界里惩恶扬善，而Serilog就是那个默默站在英雄背后，记录每一次战斗细节的智者。它不仅仅记录普通的日志，还能让你的日志变得超级有组织、可读性强，更重要的是，它赋予了你超能力——灵活配置和分析日志的
ztree设置禁用节点 3213213333332132 JavaScript ztree json setDisabledNode Ajax
ztree设置禁用节点的时候注意，当使用ajax后台请求数据,必须要设置为同步获取数据，否者会获取不到节点对象，导致设置禁用没有效果。 $(function(){ showTree(); setDisabledNode(); });
JVM patch by Taobao bookjovi java HotSpot
在网上无意中看到淘宝提交的hotspot patch，共四个，有意思，记录一下。 7050685：jsdbproc64.sh has a typo in the package name 7058036：FieldsAllocationStyle=2 does not work in 32-bit VM 7060619：C1 should respect inline and
将session存储到数据库中 dcj3sjt126com sql PHP session
CREATE TABLE sessions ( id CHAR(32) NOT NULL, data TEXT, last_accessed TIMESTAMP NOT NULL, PRIMARY KEY (id) ); <?php /** * Created by PhpStorm. * User: michaeldu * Date
Vector 171815164 vector
public Vector<CartProduct> delCart(Vector<CartProduct> cart, String id) { for (int i = 0; i < cart.size(); i++) { if (cart.get(i).getId().equals(id)) { cart.remove(i);
各连接池配置参数比较 g21121 连接池
排版真心费劲，大家凑合看下吧，见谅~ Druid DBCP C3P0 Proxool 数据库用户名称 Username Username User 数据库密码 Password Password Password 驱动名
[简单]mybatis insert语句添加动态字段 53873039oycg mybatis
mysql数据库,id自增,配置如下： <insert id="saveTestTb" useGeneratedKeys="true" keyProperty="id" parameterType=&
struts2拦截器配置云端月影 struts2拦截器
struts2拦截器interceptor的三种配置方法方法1. 普通配置法 <struts> <package name="struts2" extends="struts-default"> &
IE中页面不居中，火狐谷歌等正常 aijuans IE中页面不居中
问题是首页在火狐、谷歌、所有IE中正常显示，列表页的页面在火狐谷歌中正常，在IE6、7、8中都不中，觉得可能那个地方设置的让IE系列都不认识，仔细查看后发现，列表页中没写HTML模板部分没有添加DTD定义，就是<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3
String,int,Integer,char 几个类型常见转换 antonyup_2006 html sql .net
如何将字串 String 转换成整数 int? int i = Integer.valueOf(my_str).intValue(); int i=Integer.parseInt(str); 如何将字串 String 转换成Integer ? Integer integer=Integer.valueOf(str); 如何将整数 int 转换成字串 String ? 1.
PL/SQL的游标类型百合不是茶显示游标(静态游标)隐式游标游标的更新和删除 %rowtype ref游标(动态游标)
游标是oracle中的一个结果集,用于存放查询的结果; PL/SQL中游标的声明; 1,声明游标 2,打开游标(默认是关闭的); 3,提取数据 4,关闭游标注意的要点:游标必须声明在declare中,使用open打开游标,fetch取游标中的数据,close关闭游标隐式游标:主要是对DML数据的操作隐
JUnit4中@AfterClass @BeforeClass @after @before的区别对比 bijian1013 JUnit4 单元测试
一.基础知识 JUnit4使用Java5中的注解（annotation），以下是JUnit4常用的几个annotation： @Before：初始化方法对于每一个测试方法都要执行一次（注意与BeforeClass区别，后者是对于所有方法执行一次）@After：释放资源对于每一个测试方法都要执行一次（注意与AfterClass区别，后者是对于所有方法执行一次
精通Oracle10编程SQL(12)开发包 bijian1013 oracle 数据库 plsql
/* *开发包 *包用于逻辑组合相关的PL/SQL类型（例如TABLE类型和RECORD类型）、PL/SQL项（例如游标和游标变量）和PL/SQL子程序（例如过程和函数） */ --包用于逻辑组合相关的PL/SQL类型、项和子程序，它由包规范和包体两部分组成 --建立包规范：包规范实际是包与应用程序之间的接口，它用于定义包的公用组件，包括常量、变量、游标、过程和函数等 --在包规
【EhCache二】ehcache.xml配置详解 bit1129 ehcache.xml
在ehcache官网上找了多次，终于找到ehcache.xml配置元素和属性的含义说明文档了，这个文档包含在ehcache.xml的注释中！ ehcache.xml ： http://ehcache.org/ehcache.xml ehcache.xsd ： http://ehcache.org/ehcache.xsd ehcache配置文件的根元素是ehcahe ehcac
java.lang.ClassNotFoundException: org.springframework.web.context.ContextLoaderL 白糖_ java eclipse spring tomcat Web
今天学习spring+cxf的时候遇到一个问题：在web.xml中配置了spring的上下文监听器： <listener> <listener-class>org.springframework.web.context.ContextLoaderListener</listener-class> </listener> 随后启动
angular.element boyitech AngularJS AngularJS API angular.element
angular.element 描述: 包裹着一部分DOM element或者是HTML字符串，把它作为一个jQuery元素来处理。（类似于jQuery的选择器啦）如果jQuery被引入了，则angular.element就可以看作是jQuery选择器，选择的对象可以使用jQuery的函数；如果jQuery不可用，angular.e
java-给定两个已排序序列，找出共同的元素。 bylijinnan java
import java.util.ArrayList; import java.util.Arrays; import java.util.List; public class CommonItemInTwoSortedArray { /** * 题目：给定两个已排序序列，找出共同的元素。 * 1.定义两个指针分别指向序列的开始。 * 如果指向的两个元素
sftp 异常，有遇到的吗？求解 Chen.H java jcraft auth jsch jschexception
com.jcraft.jsch.JSchException: Auth cancel at com.jcraft.jsch.Session.connect(Session.java:460) at com.jcraft.jsch.Session.connect(Session.java:154) at cn.vivame.util.ftp.SftpServerAccess.connec
[生物智能与人工智能]神经元中的电化学结构代表什么? comsci 人工智能
我这里做一个大胆的猜想,生物神经网络中的神经元中包含着一些化学和类似电路的结构,这些结构通常用来扮演类似我们在拓扑分析系统中的节点嵌入方程一样,使得我们的神经网络产生智能判断的能力,而这些嵌入到节点中的方程同时也扮演着"经验"的角色.... 我们可以尝试一下...在某些神经
通过LAC和CID获取经纬度信息 dai_lm lac cid
方法1：用浏览器打开http://www.minigps.net/cellsearch.html，然后输入lac和cid信息(mcc和mnc可以填0)，如果数据正确就可以获得相应的经纬度方法2：发送HTTP请求到http://www.open-electronics.org/celltrack/cell.php?hex=0&lac=<lac>&cid=&
JAVA的困难分析 datamachine java
前段时间转了一篇SQL的文章（http://datamachine.iteye.com/blog/1971896），文章不复杂，但思想深刻，就顺便思考了一下java的不足，当砖头丢出来，希望引点和田玉。 -----------------------------------------------------------------------------------------
小学5年级英语单词背诵第二课 dcj3sjt126com english word
money 钱 paper 纸 speak 讲，说 tell 告诉 remember 记得，想起 knock 敲，击，打 question 问题 number 数字，号码 learn 学会，学习 street 街道 carry 搬运，携带 send 发送，邮寄，发射 must 必须 light 灯，光线，轻的 front
linux下面没有tree命令 dcj3sjt126com linux
centos p安装 yum -y install tree mac os安装 brew install tree 首先来看tree的用法 tree 中文解释：tree 功能说明：以树状图列出目录的内容。语　　法：tree [-aACdDfFgilnNpqstux][-I <范本样式>][-P <范本样式
Map迭代方式，Map迭代，Map循环蕃薯耀 Map循环 Map迭代 Map迭代方式
Map迭代方式，Map迭代，Map循环 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年
Spring Cache注解+Redis hanqunfeng spring
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>org.springframework.data</groupId> <artifactId>spring-data-redis</artifactId>
Guava中针对集合的 filter和过滤功能 jackyrong filter
在guava库中，自带了过滤器(filter)的功能，可以用来对collection 进行过滤，先看例子： @Test public void whenFilterWithIterables_thenFiltered() { List<String> names = Lists.newArrayList("John"
学习编程那点事 lampcy 编程 android PHP html5
一年前的夏天，我还在纠结要不要改行，要不要去学php？能学到真本事吗？改行能成功吗？太多的问题，我终于不顾一切，下定决心，辞去了工作，来到传说中的帝都。老师给的乘车方式还算有效，很顺利的就到了学校，赶巧了，正好学校搬到了新校区。先安顿了下来，过了个轻松的周末，第一次到帝都，逛逛吧！接下来的周一，是我噩梦的开始，学习内容对我这个零基础的人来说，除了勉强完成老师布置的作业外，我已经没有时间和精力去
架构师之流处理---------bytebuffer的mark,limit和flip nannan408 ByteBuffer
1.前言。如题，limit其实就是可以读取的字节长度的意思，flip是清空的意思，mark是标记的意思。 2.例子. 例子代码: String str = "helloWorld"; ByteBuffer buff = ByteBuffer.wrap(str.getBytes()); Sy
org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1, column 1 Everyday都不同 $转义 el表达式
最近在做Highcharts的过程中，在写js时，出现了以下异常：严重: Servlet.service() for servlet jsp threw exception org.apache.el.parser.ParseException: Encountered " ":" ": "" at line 1,
用Java实现发送邮件到163 tntxia java实现
/* 在java版经常看到有人问如何用javamail发送邮件？如何接收邮件？如何访问多个文件夹等。问题零散，而历史的回复早已经淹没在问题的海洋之中。本人之前所做过一个java项目，其中包含有WebMail功能，当初为用java实现而对javamail摸索了一段时间，总算有点收获。看到论坛中的经常有此方面的问题，因此把我的一些经验帖出来，希望对大家有些帮助。此篇仅介绍用
探索实体类存在的真正意义 java小叶檀 POJO
一. 实体类简述实体类其实就是俗称的POJO,这种类一般不实现特殊框架下的接口，在程序中仅作为数据容器用来持久化存储数据用的 POJO（Plain Old Java Objects）简单的Java对象它的一般格式就是 public class A{ private String id; public Str