tzc_fly

scIMC：scRNA-seq插补方法基准

在scRNA-seq中一个主要的挑战即为“dropout”事件，它扭曲了基因表达，显著影响了单细胞转录组的下游分析。为了解决这个问题，已经做了很多努力，并开发了几种基于模型和基于深度学习的scRNA-seq插补方法。但是，目前还缺乏对现有方法进行全面、系统的比较。在这项工作中，作者使用6个模拟和2个真实的scRNA-seq数据集，从以下四个方面全面评估和比较了总共12种可用的插补方法：1.基因表达恢复，2.细胞聚类，3.基因差异表达，4.细胞轨迹重建。最终得到结论，在主要的基准比较下，基于深度学习的方法通常比基于模型的方法表现出更好的整体性能，这表明深度学习在插补方面的力量。

来自：scIMC: a platform for benchmarking comparison and visualization analysis of scRNA-seq data imputation methods
网站：https://server.wei-group.net/scIMC/

背景概述

据估计，人体共有 $4×10^{13}$ 个细胞，它们表现出不同的形态和功能。细胞转录组分析在表征细胞生物学状态方面起着重要作用。传统的bulk RNA测序（bulk RNA-seq）技术可以检测细胞群体的平均基因表达水平。然而，基因在不同细胞中的表达水平存在差异。因此，这种技术无法量化细胞间的异质性。scRNA-seq（scRNA-seq）技术的最新发展使研究人员能够研究不同细胞间基因表达的细胞间异质性，发现新的细胞类型，提高细胞分辨率水平。

然而，scRNA-seq也带来了新的计算挑战。主要的挑战是目前的技术缺陷，如低RNA捕获和测序效率，导致无法检测到表达的基因，很大比例的表达基因为零或低读取计数。观察到的零值并不能反映真实的基因表达，这被定义为“dropout”事件。“dropout”事件引入了很高的技术噪声，使分析scRNA-seq数据变得困难。然而，并非scRNA-seq数据中的所有零都可以视为“dropout”事件。因为存在真正的零表达事件，代表特定细胞类型中的低水平基因表达。因此，在scRNA-seq数据中区分“假”（dropout）和“真”（biological gene silencing）的零计数是具有挑战性的。因此，迫切需要处理“dropout”事件。

插补是恢复“dropout”事件的常用方法。在最近的研究中提出了几种scRNA-seq数据插补方法。作者将现有的方法大致分为两类：1.基于模型的方法和2.基于深度学习的方法。

基于模型的方法

利用细胞间的先验知识和信息预测缺失值的基于模型的插补方法，包括利用细胞-细胞相互作用网络、基因-基因相互作用网络以及两者的整合进行插值。这些方法根据相似的细胞信息、相似的基因信息和使用先验知识的数学计算来恢复目标基因的表达。例如，SAVER（single cell Analysis Via Expression Recovery）是一种优化整个基因表达计数的方法，利用基因和细胞之间的信息来提高所有基因的表达值。同样，MAGIC（Markov Affinity-based Graph Imputation of Cells）应用数据扩散在相似的细胞之间共享信息，以优化基因表达矩阵，并计算缺失值。MAGIC和SAVER都优化了所有基因表达，包括那些不受“dropout”事件影响的基因表达，同时增加了将新噪声引入其余数据的可能性。为了解决这个问题，提出了一种名为scImpute的新方法，该方法首先自动识别可能的“dropout”事件，然后执行imputation，以避免向其余数据引入新的噪声。后来又提出了一种利用聚类结果识别多组相似细胞，并通过平均相似细胞的表达值进行imputation的方法DrImpute。

随着相互作用网络的出现，合理使用先验网络已成为插补方法的关键。scNPF在相似的细胞之间共享信息，并使用相互作用网络的先验知识来确定给定细胞的基因表达。scNPF的优势在于它不仅可以利用生物网络中存储的丰富结构，还可以捕获上下文特定的信息来增强基因之间的关系。除scNPF外，netNMF-sc还使用网络正则化非负矩阵分解NMF将计数矩阵分解为两个低维矩阵：基因embedding矩阵和细胞embedding矩阵。网络正则化使网络中连接的两个基因在低维基因矩阵中具有相似的表示，从而恢复数据结构。

基于深度学习的方法

近年来，深度学习已广泛应用于scRNA-seq领域，如DeepMAPS用于生物网络推理。基于深度学习的方法可以捕捉基因表达的隐藏分布，并学习基因表达分布模型的参数来估算缺失值。例如，AutoImpute是一种基于自编码器和稀疏基因表达矩阵的插补方法。它可以学习输入数据的固有分布，并估计缺失值。Lopea等人开发了单细胞变分推理scVI，利用随机优化和深度神经网络来聚合相似细胞和基因之间的信息，并估计计数矩阵的基本分布。然而，上述方法不能有意保留生物零点（真零计数），也不能扩展到分析数千个细胞的大型数据集。为了解决这个问题，提出了一种自适应阈值低秩近似（ALRA）方法。它能够通过非负性和相关性结构选择性地输入缺失值，并在输入“dropout”事件的同时有效地保持生物零点。深度计数自动编码器网络（DCA）通过引入具有零膨胀的负二项式噪声模型来捕捉非线性基因-基因相关性，同时考虑数据的计数分布、稀疏性来估算缺失值。DeepImpute（深度神经网络Imputation）将基因分为目标基因（待估算的基因）和训练基因（与目标基因高度相关，用于训练神经网络以确定数据分布），用于模型训练。Zhou等人利用迁移学习从DNA甲基化数据中估算缺失的表达值，并开发了一种方法，即所谓的TDimpute。在scIGANs中，基因表达矩阵被划分为小图像，插补过程被视为图像恢复的过程。Wang等人开发了scGNN（单细胞图神经网络），使用图神经网络来学习细胞-细胞关系，并结合三个自动编码器来估算“dropout”事件和细胞聚类。

尽管已经提出了大量的插补方法，并且大多数插补方法在不同的场景中都取得了良好的性能，但仍缺乏对最先进插补方法性能的全面比较。此外，还需要通过更全面的实验来改进比较。在这项研究中，作者在以下方面对六个模拟数据集和两个真实的scRNA-seq数据集上总共12种可用的插补方法进行了评估和比较。

首先，作者研究了现有方法恢复真实基因表达分布的能力。
其次，作者评估了细胞聚类时在区分不同细胞类型方面的性能。
第三，作者分别通过bulkRNAseq数据和scRNA-seq数据预测的差异表达基因的重叠来测试现有方法检测的差异表达基因。
最后，作者评估了这些方法重建细胞轨迹的能力。

最重要的是，建立了scIMC（单细胞插补方法比较平台），这是第一个计算平台，允许感兴趣的研究人员在其定制的数据集上对最先进的插补方法进行数据插补和下游比较分析，并提供可视化结果分析，以找出哪种方法最适合特定下游任务中的数据集。

使用方法

在这项工作中，作者构建了一个无偏的框架，以定量评估和比较现有的最先进的scRNA-seq数据插补方法。基于这一框架，在六个模拟数据集和两个真实数据集上比较了插补方法在多种广泛使用的指标方面的性能。基准测试框架的总体概述如图1所示。可以看出，涉及三个主要步骤：A数据预处理、B缺失值插补，C下游比较分析，详细描述如下：

数据预处理：在六个模拟数据集和两个真实数据集上进行了基准测试。对于每个数据集，通常分两个子步骤对原始基因表达矩阵（插补前）进行预处理（见图1A）。首先，对矩阵进行归一化，以便将需要处理的数据（通过某种算法）限制在一定范围内。标准化是为了方便后续的数据处理，以及确保程序运行过程中更快收敛。然后，对归一化矩阵进行对数变换。log转换旨在更方便地找到数据之间的关系（可以理解为更好的数据可视化），使数据的呈现接近我们想要的假设，从而更好地进行统计推断。

图1A：所有数据集都是通过去除在少于两个细胞中表达的基因来过滤掉的，这些基因被称为低表达基因。通过“scanpy”对数据集进行标准化。然后，对归一化矩阵进行对数变换。

缺失值插补：表1总结了专门为scRNA-seq数据插补设计的21种最先进的插补方法，其中有11种基于模型的方法和10种基于深度学习的方法。如表1所示，基于模型的方法可以根据其使用的信息进一步分为三个子类，例如跨细胞的信息、跨基因的信息以及跨细胞和基因的信息。基于深度学习的方法可以根据其深度网络类型进一步划分，包括自动编码器、MLP、图神经网络和其他网络。作者试图实现所有的方法，但其中只有12种成功执行，分别是SAVER、scTSSR、MAGIC、scImpute、DrImpute、scNPF、AutoImpute、ALRA、DCA、DeepImpute、scGNN和scIGAN。

图1B：插补方法主要分为两类：基于模型的方法，基于深度学习的方法。

在该表中，Cell and Gene-based是指使用跨细胞和基因的信息的方法，Cell-based是使用跨细胞的信息的方式，Gene-based是使用跨基因信息的方式。此外，Auto-based是基于自动编码器的方法，MLP-based表示基于多层感知器的方法，Graph-based是指基于图网络的方法，Other-based表示了基于其他网络的方法。此外， $G * C$ 表示 gene $*$ cell 表达矩阵， $C * G$ 表示cell $*$ gene表达矩阵。 $G - G$ 表示gene $-$ gene相互作用网络。该表中的前11种方法是基于模型的方法，其他方法是基于深度学习的方法。

下游比较分析：为了定量比较各种方法生成的估算矩阵的好坏，作者评估了恢复实际基因表达的性能。如图1C所示，下游比较分析是为了衡量它们在实际应用场景中的性能。作者进一步比较了以下三个下游分析任务中的方法，包括聚类分析、差异表达分析和细胞轨迹分析等。

-图1C：下游比较分析。

基准数据集

在这项研究中，使用了六个模拟数据集和两个真实数据集来评估不同插补方法的性能。这里有具有不同零表达率的六个模拟数据集。两个真实的数据集是人类胚胎干细胞（ESCs）数据集和Time-course scRNA-seq数据集（Single-cell RNA-seq reveals novel regulators of human embryonic stem cell differentiation to definitive endoderm）。

模拟数据集：Splatter是一个R-Bioconductor软件包，用于模拟scRNAseq数据。作者使用Splatter生成了一个包含500个细胞和1000个基因的真计数矩阵（没有dropout的矩阵）。然后设置dropout.mid参数从1到6，为了模拟零表达率分别为0.78、0.71、0.63、0.55、0.48和0.42的六个数据集。

human ESC数据集：包括6个bulkRNA-seq样本（4个用于H1胚胎干细胞，2个用于DEC）和350个scRNA-seq细胞（212个用于H1-ESC，138个用于DEC）。bulkRNA-seq数据和scRNA-seq的基因表达矩阵中的零百分比分别为14.8%和49.1%。作者使用该数据集来评估插补方法捕获差异表达基因（DEG）的能力。对于P值（P值是显著指数）<0.05的基因，认为它是差异表达的，即所谓的DEG。分别对bulkRNA-seq数据和scRNA-seq的数据进行了edgeR来检测DEG。考虑到bulkRNA-seq数据的DEG是一个黄金标准，不同方法捕获DEG的性能被定义为bulkRNA-seq数据检测到的DEG与scRNA-seq检测到的之间的重叠。

time-course scRNA-seq数据集：作者使用了来源于从H1-ESC到DEC的分化的时间过程scRNA-seq数据。该数据集由758个细胞组成，包括从H1-ESC分化为DEC后0小时的92个细胞、12小时的102个细胞、24小时的66个细胞、36小时的172个细胞、72小时的138个细胞和96小时的188个细胞。为了评估插补方法重建轨迹的性能，作者在该数据集上执行了现有的插补方法，并使用Monocle3重建轨迹。值得注意的是，在比较的方法中，DCA和scGNN由于其固有的局限性而未能在该数据集上执行。

评价指标

基因表达矩阵表示为 $X$ （RMSE和PCC中的真实基因表达矩阵），而 $\widehat{X}$ 是估算矩阵。为了定量评估插补方法在恢复基因表达方面的性能，作者使用了两个指标，均方根误差（RMSE）和Pearson相关系数（PCC）。为了评估和比较聚类结果和基因差异表达结果，使用了五种常见的指标：归一化互信息（NMI）、调整后的兰德指数（ARI）、轮廓系数（Si分数，silhouette coefficient）、Jaccard相似系数（Jaccard）和纯度（Purity）。至于细胞轨迹的比较，作者采用了另外两个指标：伪时间排序得分（POS，pseudo-temporal ordering score）和肯德尔秩相关得分（KOR，Kendall’s rank correlation score）。

RMSE
它是测量估算矩阵和原始矩阵之间的差异，从而计算观测值和真实值之间的偏差。RMSE定义为： $RMSE(X,\widehat{X})=\sqrt{\frac{1}{n}\sum_{i=1}^{n}(\widehat{X}_{i}-X_{i})^{2}}$

PCC
它是为了检查估算矩阵和原始矩阵之间的相关性，定义为： $\rho_{X,\widehat{X}}=\frac{E(X,\widehat{X})-E(X)E(\widehat{X})}{\sqrt{E(X^{2})E^{2}(X)}\sqrt{E(\widehat{X}^{2})E^{2}(\widehat{X})}}$ 其中， $E (X)$ 表示 $X$ 的mean， $E^{2}(X)$ 是 $E (X)$ 的平方。

NMI
它是指两个随机变量之间的相关性。记 $l ab e l$ 为原始的标签， $\widehat{label}$ 为聚类获得的簇标签： $NMI=2\frac{I(label,\widehat{label})}{H(label)+H(\widehat{label})}$ 其中： $I(label,\widehat{label})=\sum_{a\in label,b\in\widehat{label}}p(a,b)log\frac{p(a,b)}{p(a)p(b)}$ $H(label)=\sum_{a\in label}p(a)log(p(a))$ 其中， $p (a), p (b), p (a, b)$ 分别表示样本属于簇 $a$ 的概率，样本属于簇 $b$ 的概率，样本同时属于簇 $a$ 和簇 $b$ 的概率。

ARI
它测量两个数据分布之间的一致程度。我们假设有 $m$ 个细胞，它们被聚类成 $k$ 个聚类。 $\left\{u_{i}\right\}_{i}^{m}$ 表示预测的簇标签， $\left\{v_{j}\right\}_{j}^{m}$ 表示真实的簇标签。

轮廓系数
它用于评估插补方法的细胞聚类性能。它结合了内聚和分离。Si得分越接近1，聚类就越准确；越接近-1，结果越差。Si分数定义为： $Si=\frac{b_{i}-a_{i}}{max(b_{i},a_{i})}$ 其中， $a_{i}$ 表示第 $i$ 个样本与同一聚类中的所有其他样本之间的平均距离， $b_{i}$ 表示给定聚类中的第 $i$ 个样本与所有样本（不包含第 $i$ 个样本的簇）之间的平均间距。

Jaccard相似系数
利用Jaccard相似系数（Jaccard）来评估插补方法的基因差异的重叠度。Jaccard用于比较样本之间的相似性。Jaccard系数值越大，样本的相似性就越高。Jaccard定义为： $J(A,B)=\frac{|A\cap B|}{|A\cup B|}$ 其中 $A$ 和 $B$ 是两个集合。Jaccard是 $A$ 和 $B$ 的交并比。

纯度
这是一个常用的聚类评估指标。

伪时间排序得分
它可用于评估细胞排序性能。POS为： $POS=\sum_{i=1}^{n-1}\sum_{j>i}g(i,j)$ 其中 $n$ 是样本的数量， $g (i, j)$ 是表征有序路径中的第 $i$ 个和第 $j$ 个细胞的顺序与它们基于外部信息的期望顺序匹配程度的得分。

KOR
它经常被用来衡量两个排名之间的对应程度。其定义为： $\tau=\frac{4P}{n(n-1)}-1$ 其中 $n$ 是样本数量， $P$ 是两个排名在给定样本之后的样本数量之和。

额外的工具

为了进行DEG分析，作者在scRNA-seq数据上运行了edgeR，当一个基因的P值<0.05时，我们认为它是差异表达的。

Monocle3被用于重建scRNA-seq数据的细胞轨迹。作者在R3.6.3环境中使用默认参数实现了Monocle3。值得注意的是，UMAP是Monocle3的默认可视化方法，用于可视化数据的细胞轨迹。

TSCAN是一种用于重建scRNA-seq分析中的伪时间轨迹的工具（TSCAN: Pseudo-time reconstruction and evaluation in single-cell RNA-seq analysis.）。它通过基于聚类的最小生成树方法对细胞进行排序。

结果

基因差异表达分析

基因差异表达分析，作为另一种常见的下游分析，是指对其表达水平取决于某些变量的基因进行分析。scRNA-seq可以深入了解单个细胞中基因表达的随机性，而这些差异表达基因会影响不同细胞亚群的定义。因此，在检测不同细胞类型中的已知差异基因时，有效的插补方法应保持scRNA-seq与bulk RNA-seq的一致性。由于缺乏差异表达分析的黄金标准，作者将bulkRNA-seq数据预测的差异表达基因作为黄金参考。差异基因表达分析在Human ESCs数据集上。

值得注意的是，DCA未能在此数据集上执行，因为计数矩阵被视为已归一化。edgeR通常用于分析基因差异表达。作者对bulkRNA-seq数据和scRNA-seq的原始和插补计数矩阵进行edgeR，然后用火山图可视化结果，如图2所示，其中x轴表示log Fold Change（log FC），y轴表示−log（P Value）。由于edgeR无法根据AutoImpute的结果运行，作者只比较了其余10种方法的性能。捕获DEG的性能被定义为bulkRNA-seq数据检测到的DEG与scRNA-seq检测到的数据之间的重叠。

图2：基因差异表达分析比较。

从图2中可以看到，与原始matrix相比，scImpute的估算数据检测到更多的差异表达基因。与bulkRNA-seq的结果相比，scImpute和ALRA具有最相似的形状。为了直观分析，表2中列出了10种插补方法的插补数据检测到的差异表达基因的数量。原始scRNA-seq数据的零表达率远高于bulkRNA-seq的数据，并且与bulkRNA-seq数据共享的DEG最少。如图所示，我们观察到由估算数据检测到的差异表达基因的数量大于由原始scRNA-seq数据（不包括scGNN）检测到的数量。

表2：DEG数量统计。

轨迹分析

细胞轨迹的重建对于在scRNAseq数据中通过时间进程探索细胞周期动力学模式至关重要。细胞轨迹分析包括三个主要步骤：降维、聚类和轨迹重建。尽管在scRNA-seq数据中广泛使用各种细胞轨迹重建方法，但它们受到“dropout”事件的严重影响。作者在time-course scRNA-seq数据集上评估插补方法，使用Monocle3和TSCAN重建轨迹。

POS和KOR得分用于测量真实时间标签和伪时间标签之间的相关性。Monocle3构建的细胞轨迹如图3所示，表3列出了不同插补方法的POS和KOR。从表3中可以看出，scImpute实现了由估算数据推断的细胞轨迹与真实细胞顺序之间的最高对应，POS为0.928，KOR为0.743，并且在没有预处理步骤的TSCAN中也表现良好。scTSSR在具有预处理步骤的TSCAN中表现良好，POS为0.918，KOR为0.734。此外，SAVER、ALRA和scIGAN的POS和KOR得分较低，表明它们的结果较差。没有预处理步骤的SAVER和ALRA的POS和KOR甚至是负的。结果表明，scImpute最适合于探索scRNA-seq数据中的细胞轨迹。

图3：轨迹重建结果。

表3：POS（w）和KOR（w）表示通过具有预处理步骤的TSCAN获得的POS和KOR分数。POS和KOR表示通过TSCAN在没有预处理步骤的情况下获得的POS和KOR得分。

Codeforces Round 1034 (Div. 3) G解题思路拉长时间线数据结构与算法算法数据结构 c++
链接Problem-G-Codeforces题目大意给定n,m,q分别为数组大小，数组的每个数非负且小于m，要进行q次操作操作分为两种：1.令a[i]=x(永久性)2.输入一个k，对于每个a[i]都可进行任意次操作a[i]=(a[i]+k)%m，对数组进行操作，判断能否增厚变成一个非严格递增数组题目思路对样例进行分析可以发现对于每个a[i]可以分为g=gcd（m，k）类，可以为每一类标号，号码为a
探索Gemini Balance：Google Gemini API的代理与负载均衡解决方案几道之旅人工智能智能体及数字员工负载均衡运维人工智能
引言在人工智能领域，API的高效使用和管理至关重要。尤其是当涉及到Google的GeminiAPI时，为了实现更稳定、更高效的服务，我们需要一个强大的代理和负载均衡工具。今天，我们就来深入了解一下GeminiBalance这个开源项目，它为GeminiAPI的使用提供了全面而灵活的解决方案。项目概述GeminiBalance是一个基于PythonFastAPI构建的应用程序，主要用于提供Googl
意识边疆保卫战：22：47深圳AI-BioFab人机融合危机全息实录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《意识边疆保卫战：22：47深圳AI-BioFab人机融合危机全息实录》副标题：机械义肢产线惊现神经突触叛乱，中国科学家激活甲骨文量子纹重写人类认知主权2025年7月2日22：47光明科学城脑机接口中心急电负五层神经植入舱突爆血雾！为边防军人陈默安装的AI机械臂在神经接驳瞬间剧烈震颤，量子脑电图
时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《时空屏障崩塌：14:28深圳AI-BioFab平行宇宙保卫战全纪实》副标题：抗癌疫苗冷链门关闭前3秒遭量子生物武器袭击，中国科学家启动长城时空盾改写人类文明存续方程2025年7月2日14:28:57光明科学城虫洞警报第184支疫苗即将注入液氮罐的刹那，B3层量子钟突现重影！14:28/15:4
实时直击：全球首座AI-BioFab工厂72小时全息记录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《实时直击：全球首座AI-BioFab工厂72小时全息记录》副标题：2025年7月2日深圳现场——癌症疫苗11天定制神话如何改写万亿生物经济规则本报深圳2025年7月2日电（记者徐远舟）此刻，位于光明科学城负三层的无菌车间内，液态机器人正将第4,817管CRISPR编辑液注入微流控芯片。墙上的量
生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生命制造的读秒革命：全球首个AI-BioFab工厂72小时全息记录》副标题：2025年7月2日14：04深圳现场——癌症疫苗定制最后3分钟如何改写万亿生物经济规则光明科学城2025年7月2日电（记者直击）负三层B区微流控平台红光闪烁，液态机械臂正将第9,217管CRISPR编辑液注入芯片。量子
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
千亿参数大模型轻量化实战：手机端LLM推理加速300%方案
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《千亿参数大模型轻量化实战：手机端LLM推理加速300%方案》副标题：2025实测骁龙8Gen4+FP4稀疏量化技术，70B模型推理延迟低至127ms，重构移动端AI天花板封面图：[高通骁龙8Gen4芯片显微照片与Llama3-70B手机端运行界面对比图，右上角标注「实测延迟：127ms/tok
多模态进化论：GPT-5V图文推理能力在工业质检中的颠覆性应用 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《多模态进化论：GPT-5V图文推理能力在工业质检中的颠覆性应用》副标题：2025年实测报告显示误检率降至0.0038%，重构制造业质量标准体系封面建议：GPT-5V识别微米级电路板缺陷的对比图，背景显示传统AOI与GPT-5V的误检率曲线一、工业质检的范式革命▶︎传统视觉检测的三大死穴传统AO
《脑机接口：意识数字化的奇点何时到来？》 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《脑机接口：意识数字化的奇点何时到来？》展开全景式论述。文章结合2025年最新科研突破与伦理实践，以“技术裂变-意识革命-文明跃迁”为逻辑主线，揭示神经科学与人工智能融合如何重绘人类存在的边界：脑机接口：意识数字化的奇点何时到来？副标题：从神经解码到意识上传，一场重塑人类本质的技术奇袭作者：意识
在股市中寻找志同道合的朋友 niuniu15816888 财经社交大数据
作为一名普通的股票投资者，我在这条路上已经走了五年。从最初的懵懂无知到现在能独立分析行情，我深深体会到：**投资不是一个人的战斗，找到志同道合的伙伴能让这条路走得更远**。今天，我想和大家分享一些我在投资社交中的真实感悟。一、为什么我们需要投资社交？记得刚开始炒股时，我总是一个人盯着K线图发呆。直到有一天，我在一个股票论坛上认识了几位同样喜欢研究新能源板块的朋友，我们组建了一个小群组。每周五晚上，
【硬核拆解】英伟达Blackwell芯片架构如何重构AI算力边界？ HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站一、Blackwell诞生的算力危机（2025现状）graphTDA[2025年AI算力需求]-->B[千亿参数模型训练能耗>20GWh]A-->C[10万亿参数模型涌现]A-->D[传统架构内存墙：数据搬运耗能占68%]行业拐点事件：2025年3月：OpenAI宣布训练125万亿参数MoE模型
[AI笔记]-LLM中的3种架构:Encoder-Only、Decoder-Only、Encoder-Decoder Micheal超 AI笔记人工智能笔记架构
一、概述架构描述特点案例Encoder-Only仅包含编码器部分这类模型主要专注输入数据中提取特征或上下文信息，通常不需要生成新内容、只需要理解输入的任务，如：分类(文本分类、情感分析等)、信息抽取、序列标注等。在这种架构中，所有的注意力机制和网络层都集中在编码输入数据上，其输出通常是关于输入的复杂语义表示。谷歌的BERT、智谱AI发布的第四代基座大语言模型GLM4Decoder-Only也被称为
设计模式之上下文对象设计模式 Code Monkey’s Lab 设计模式设计模式
目录一、模式介绍二、架构设计三、Demo示例四、总结一、模式介绍上下文对象（ContextObject）模式最早由《CoreJ2EEPatterns》第二版提出，其核心目标是在多层或多组件间共享与当前作用域（如一次请求、一次会话、一次业务流程）相关的所有状态和服务，消除各组件对底层环境细节（如协议、线程、本地存储等）的直接依赖，从而提高系统的可复用性、可维护性和可测试性。ContextObject
长尾形分布论文速览三十篇【60-89】木木阳 Long-tailed 人工智能
长尾形分布速览（60-89）这些研究展示了LLMs在长尾数据分布、持续学习、异常检测、联邦学习、对比学习、知识图谱、推荐系统、多目标跟踪、标签修复、对象检测、医疗生物医学以及其他应用中的广泛应用。通过优化和创新，LLMs在这些领域展现了卓越的性能，并为解决长尾问题提供了有效的工具和方法。1.长尾持续学习与对抗学习长尾持续学习(Paper60):通过优化器状态重用来减少遗忘，提高在长尾任务中的持续学
H264码流介绍及 FFmpeg解封装得到H264码流方法冰冰的coco 音视频 ffmpeg
参考文章音视频H264编解码协议-知乎视频H264编码详解（上）-知乎H.264媒体流AnnexB和AVCC格式分析-CSDNH264之NALU解析-知乎H264帧,SPS,PPS概念-知乎H.264流媒体协议格式中的AnnexB格式和AVCC格式深度解析-CSDNH264简介H.264从1999年开始，到2003年形成草案，最后在2007年定稿有待核实。在ITU的标准⾥称为H.264，在MPEG
MyBatis SQL 执行过程原理分析（附源码）代理层：Mapper 接口动态代理路由层：MapperMethod 分发核心引擎：SqlSession 执行夜雨hiyeyu.com mybatis sql 数据库数据库架构 java spring boot db
MyBatisSQL执行过程原理分析（附源码）1.代理层：Mapper接口动态代理2.路由层：MapperMethod分发3.核心引擎：SqlSession执行4.执行器：Executor调度5.处理器层：StatementHandler执行6.结果映射：ResultSetHandler转换核心执行流程图关键设计亮点性能优化建议MyBatis的SQL执行过程可以分为6个核心阶段，我们将通过源码逐层
成像光谱遥感技术中的AI革命：ChatGPT在遥感领域中的应用科研的力量人工智能 ChatGPT chatgpt 人工智能
课程将最新的人工智能技术与实际的遥感应用相结合，提供不仅是理论上的，而且是适用和可靠的工具和方法。无论你是经验丰富的研究人员还是好奇的从业者，本课程都将为分析和解释遥感数据开辟新的、有效的方法，使你的工作更具影响力和前沿性。遥感技术主要通过卫星和飞机从远处观察和测量我们的环境，是理解和监测地球物理、化学和生物系统的基石。ChatGPT是由OpenAI开发的最先进的语言模型，在理解和生成人类语言方面
解锁AI新世界：ModelGate携手Cherry Studio，开启智能之旅
解锁AI新世界：ModelGate携手CherryStudio，开启智能之旅在人工智能技术飞速发展的当下，我们的工作与生活正被AI深刻改变。你是否渴望拥有一个强大的工具，帮你轻松驾驭各类AI应用，提升效率与创造力？今天，就为大家介绍一对黄金搭档——ModelGate与CherryStudio，它们将带你进入AI应用的全新境界。CherryStudio堪称AI桌面生态的“集大成者”，是一款支持多家主
【Django开发】前后端分离django美多商城项目第3篇：用户注册业务实现,用户注册前端逻辑【附代码文档】
教程总体简介：欢迎来到美多商城！项目需求分析1.项目主要页面介绍2.归纳项目主要模块3.知识要点项目架构设计1.项目开发模式2.项目运行机制项目介绍创建工程1.准备项目代码仓库3.创建美多商城工程配置开发环境1.新建配置文件2.指定开发环境配置文件配置Jinja2模板引擎1.安装Jinja2扩展包配置MySQL数据库3.安装PyMySQL扩展包配置Redis数据库1.安装django-redis扩
Python 开发规范：pdb & cProfile：调试 & 性能分析写文章的大米 Python 核心技术 python
↑↑↑欢迎点赞、关注、收藏！！！，10年IT行业老鸟，持续分享更多IT干货文章目录pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性2、pdb调试工具3、cProfile性能分析工具pdb&cProfile：调试&性能分析核心内容1、调试和性能分析的必要性在实际生产环境中，代码调试（找问题根因、修复bug）和性能分析（优化效率、减少latency）是开发关键环节。尤其，面对
论文学习_SoK: An Essential Guide For Using Malware Sandboxes In Security Applications: Challenges, Pitfa kitsch0x97 学习
0.文章概述恶意软件沙箱尽管在安全应用程序中带来许多优势，但其复杂的选择、配置和使用过程常让新用户不知所措，甚至可能导致错误的部署，进而对安全分析结果产生负面影响。目前，缺乏系统化的指导来帮助用户正确选择和应用沙箱工具，这种知识空白阻碍了沙箱在不同研究领域中的有效应用。为了填补这一知识空白，研究团队系统分析了84篇关于x86/64恶意软件沙箱的学术论文，并提出了一种新颖的框架，以简化沙箱组件和操作
Prompt Engineering 指南教程班磊闯Andrea
PromptEngineering指南教程Prompt-Engineering-Guidedair-ai/Prompt-Engineering-Guide:是一个用于指导对话人工智能开发的文档。适合用于学习对话人工智能开发和自然语言处理。特点是提供了详细的指南和参考资料，涵盖了多种对话人工智能技术和算法，并且可以自定义学习路径和行为。项目地址:https://gitcode.com/gh_mirr
数据结构：递归：汉诺塔问题（Tower of Hanoi） 95号闪电麦坤数据结构数据结构
目录问题描述第一性原理分析代码实现第一步：明确函数要干什么第二步：写好递归的“结束条件”第三步：写递归步骤递归调用树问题描述有三个柱子（A,B,C），上面有n个大小不等的圆盘，最开始所有圆盘按从大到小顺序堆在柱子A上。目标：将所有圆盘移动到柱子C，移动时要满足：一次只能移动一个盘子；任何时刻小盘子不能压在大盘子上。❓核心问题：如何将n个盘子从A移动到C，同时只用B做辅助，且不违反约束？第一性原理分
AI人工智能 Agent：在节能减排中的应用 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1全球气候变化与节能减排随着工业化进程的加速和人口的不断增长，全球气候变化问题日益严峻。温室气体排放导致的全球变暖、极端天气事件频发等问题，已经对人类的生存环境和社会经济发展造成了严重威胁。因此，节能减排已成为全球共识，各国政府和企业都在积极探索和实施各种节能减排措施。1.2人工智能技术的兴起近年来，人工智能（AI）技术发展迅猛，并在各个领域取得了显著成果。AI技术具有强大的数据分
【分析学】从有限开覆盖定理出发 -- 实数系完备性 BlackPercy 分析学数学高等数学
目录有限开覆盖定理实数系完备性定理确界定理单调有界定理闭区间套定理聚点定理柯西收敛定理有限开覆盖定理开覆盖定义：设{Ui}i∈I\{U_i\}_{i\inI}{Ui}i∈I是一个开覆盖，即[a,b]⊆⋃i∈IUi[a,b]\subseteq\bigcup_{i\inI}U_i[a,b]⊆⋃i∈IUi,称⋃i∈IUi\bigcup_{i\inI}U_i⋃i∈IUi为闭区间[a,b][a,b][a,b
【iSAQB软件架构】原型和技术概念验证小马哥编程 ui 系统架构架构开发语言产品经理
在软件开发项目的过程中可能会出现许多不同类型的问题。要么利益相关者难以明确（尤其是完整地）阐述需求，要么系统用户和开发人员之间的合作无法正常进行。通常，合作在分析和设计阶段结束，因为开发人员随后会退出，只有在软件完成时才展示他们的工作成果。如果团队要相互学习，团队之间的协调非常重要。各种解决方案必须与客户进行测试和讨论，并且某些需求无法仅根据其理论描述得到保证（例如，实时需求）。因此，在定义阶段完
【ISAQB大纲解读】软件密集型系统的三大分类小马哥编程系统架构架构
软件密集型系统的类型划分为信息系统、嵌入式系统和移动系统，主要基于其应用场景、功能定位、硬件依赖程度及软件设计逻辑的显著差异。以下从三类系统的核心特征、典型场景及分类逻辑展开分析：一、软件密集型系统的定义与分类逻辑软件密集型系统指软件在系统功能实现中起决定性作用的系统，其分类本质上反映了不同场景下软件与硬件、业务需求的耦合方式。三类系统的划分依据包括：应用领域：商业办公、设备控制、移动交互等不同场
CLIP之后，多模态模型将如何进化？三大技术路径解析老周聊AI AI大模型人工智能 MCP 机器学习神经网络深度学习 AI大模型大模型训练框架
多模态学习的革命：CLIP技术深度解析关注老周不迷路本文较长，建议点赞收藏以免遗失。由于文章篇幅有限，更多涨薪知识点，也可在主页查看最新AI大模型应用开发学习资料免费领取引言：多模态学习的时代来临在人工智能领域，多模态学习正成为最具前景的研究方向之一。传统AI系统通常专注于单一模态（如纯文本或纯图像），而人类认知的本质却是多模态的——我们通过视觉、听觉、触觉等多种感官协同理解世界。OpenAI于2
华为认证二选一：物联网 VS 人工智能，你的赛道在哪里？博睿谷IT99_ 物联网人工智能华为华为认证
一篇不讲情怀只讲干货的科普指南一、华为物联网&人工智能到底在搞什么？华为物联网（IoT）的核心是“万物互联”。通过传感器、通信技术（如NB-IoT/5G）、云计算平台（如OceanConnect），将物理设备（车、路灯、工厂机器）连入网络，实现数据采集、远程控制和智能决策。大白话就是：它让哑巴设备学会“说话”。华为人工智能（AI）的核心是“让机器学会思考”。聚焦大模型训练、部署与应用（如昇腾AI解
jdk tomcat 环境变量配置 Array_06 java jdk tomcat
Win7 下如何配置java环境变量 1。准备jdk包，win7系统，tomcat安装包（均上网下载即可） 2。进行对jdk的安装，尽量为默认路径（但要记住啊！！以防以后配置用。。。） 3。分别配置高级环境变量。电脑-->右击属性-->高级环境变量-->环境变量。分别配置 : path &nbs
Spring调SDK包报java.lang.NoSuchFieldError错误 bijian1013 java spring
在工作中调另一个系统的SDK包，出现如下java.lang.NoSuchFieldError错误。 org.springframework.web.util.NestedServletException: Handler processing failed; nested exception is java.l
LeetCode[位运算] - #136 数组中的单一数 Cwind java 题解位运算 LeetCode Algorithm
原题链接：#136 Single Number 要求：给定一个整型数组，其中除了一个元素之外，每个元素都出现两次。找出这个元素注意：算法的时间复杂度应为O(n)，最好不使用额外的内存空间难度：中等分析：题目限定了线性的时间复杂度，同时不使用额外的空间，即要求只遍历数组一遍得出结果。由于异或运算 n XOR n = 0, n XOR 0 = n，故将数组中的每个元素进
qq登陆界面开发 15700786134 qq
今天我们来开发一个qq登陆界面，首先写一个界面程序，一个界面首先是一个Frame对象，即是一个窗体。然后在这个窗体上放置其他组件。代码如下： public class First { public void initul(){ jf=ne
Linux的程序包管理器RPM 被触发 linux
在早期我们使用源代码的方式来安装软件时，都需要先把源程序代码编译成可执行的二进制安装程序，然后进行安装。这就意味着每次安装软件都需要经过预处理-->编译-->汇编-->链接-->生成安装文件--> 安装，这个复杂而艰辛的过程。为简化安装步骤，便于广大用户的安装部署程序，程序提供商就在特定的系统上面编译好相关程序的安装文件并进行打包，提供给大家下载，我们只需要根据自己的
socket通信遇到EOFException 肆无忌惮_ EOFException
java.io.EOFException at java.io.ObjectInputStream$PeekInputStream.readFully(ObjectInputStream.java:2281) at java.io.ObjectInputStream$BlockDataInputStream.readShort(ObjectInputStream.java:
基于spring的web项目定时操作知了ing java Web
废话不多说，直接上代码，很简单配置一下项目启动就行 1，web.xml <?xml version="1.0" encoding="UTF-8"?> <web-app xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns="h
树形结构的数据库表Schema设计矮蛋蛋 schema
原文地址： http://blog.csdn.net/MONKEY_D_MENG/article/details/6647488 程序设计过程中，我们常常用树形结构来表征某些数据的关联关系，如企业上下级部门、栏目结构、商品分类等等，通常而言，这些树状结构需要借助于数据库完成持久化。然而目前的各种基于关系的数据库，都是以二维表的形式记录存储数据信息，
maven将jar包和源码一起打包到本地仓库 alleni123 maven
http://stackoverflow.com/questions/4031987/how-to-upload-sources-to-local-maven-repository <project> ... <build> <plugins> <plugin> <groupI
java IO操作与 File 获取文件或文件夹的大小，可读，等属性！！！百合不是茶
类 File File是指文件和目录路径名的抽象表示形式。 1，何为文件：标准文件（txt doc mp3...）目录文件（文件夹）虚拟内存文件 2，File类中有可以创建文件的 createNewFile（）方法,在创建新文件的时候需要try{} catch(）{}因为可能会抛出异常；也有可以判断文件是否是一个标准文件的方法isFile();这些防抖都
Spring注入有继承关系的类（2） bijian1013 java spring
被注入类的父类有相应的属性，Spring可以直接注入相应的属性，如下所例：1.AClass类 package com.bijian.spring.test4; public class AClass { private String a; private String b; public String getA() { retu
30岁转型期你能否成为成功人士 bijian1013 成长励志
很多人由于年轻时走了弯路，到了30岁一事无成，这样的例子大有人在。但同样也有一些人，整个职业生涯都发展得很优秀，到了30岁已经成为职场的精英阶层。由于做猎头的原因，我们接触很多30岁左右的经理人，发现他们在职业发展道路上往往有很多致命的问题。在30岁之前，他们的职业生涯表现很优秀，但从30岁到40岁这一段，很多人
【Velocity四】Velocity与Java互操作 bit1129 velocity
Velocity出现的目的用于简化基于MVC的web应用开发，用于替代JSP标签技术，那么Velocity如何访问Java代码.本篇继续以Velocity三http://bit1129.iteye.com/blog/2106142中的例子为基础， POJO package com.tom.servlets; public
【Hive十一】Hive数据倾斜优化 bit1129 hive
什么是Hive数据倾斜问题操作：join,group by,count distinct 现象：任务进度长时间维持在99%（或100%），查看任务监控页面，发现只有少量（1个或几个）reduce子任务未完成；查看未完成的子任务，可以看到本地读写数据量积累非常大，通常超过10GB可以认定为发生数据倾斜。原因：key分布不均匀倾斜度衡量：平均记录数超过50w且
在nginx中集成lua脚本：添加自定义Http头，封IP等 ronin47 nginx lua csrf
Lua是一个可以嵌入到Nginx配置文件中的动态脚本语言，从而可以在Nginx请求处理的任何阶段执行各种Lua代码。刚开始我们只是用Lua 把请求路由到后端服务器，但是它对我们架构的作用超出了我们的预期。下面就讲讲我们所做的工作。强制搜索引擎只索引mixlr.com Google把子域名当作完全独立的网站，我们不希望爬虫抓取子域名的页面，降低我们的Page rank。 location /{
java-3.求子数组的最大和 bylijinnan java
package beautyOfCoding; public class MaxSubArraySum { /** * 3.求子数组的最大和题目描述：输入一个整形数组，数组里有正数也有负数。数组中连续的一个或多个整数组成一个子数组，每个子数组都有一个和。求所有子数组的和的最大值。要求时间复杂度为O(n)。例如输入的数组为1, -2, 3, 10, -4,
Netty源码学习-FileRegion bylijinnan java netty
今天看org.jboss.netty.example.http.file.HttpStaticFileServerHandler.java 可以直接往channel里面写入一个FileRegion对象，而不需要相应的encoder： //pipeline（没有诸如“FileRegionEncoder”的handler）： public ChannelPipeline ge
使用ZeroClipboard解决跨浏览器复制到剪贴板的问题 cngolon 跨浏览器复制到粘贴板 Zero Clipboard
Zero Clipboard的实现原理 Zero Clipboard 利用透明的Flash让其漂浮在复制按钮之上，这样其实点击的不是按钮而是 Flash ，这样将需要的内容传入Flash，再通过Flash的复制功能把传入的内容复制到剪贴板。 Zero Clipboard的安装方法首先需要下载 Zero Clipboard的压缩包，解压后把文件夹中两个文件：ZeroClipboard.js
单例模式 cuishikuan 单例模式
第一种（懒汉，线程不安全）： public class Singleton { 2 private static Singleton instance; 3 pri
spring+websocket的使用 dalan_123
一、spring配置文件 <?xml version="1.0" encoding="UTF-8"?><beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3.or
细节问题：ZEROFILL的用法范围。 dcj3sjt126com mysql
1、zerofill把月份中的一位数字比如1，2，3等加前导0 mysql> CREATE TABLE t1 (year YEAR(4), month INT(2) UNSIGNED ZEROFILL, -> day
Android开发10——Activity的跳转与传值 dcj3sjt126com Android开发
Activity跳转与传值，主要是通过Intent类，Intent的作用是激活组件和附带数据。一、Activity跳转方法一Intent intent = new Intent(A.this, B.class); startActivity(intent) 方法二Intent intent = new Intent();intent.setCla
jdbc 得到表结构、主键 eksliang jdbc 得到表结构、主键
转自博客：http://blog.csdn.net/ocean1010/article/details/7266042 假设有个con DatabaseMetaData dbmd = con.getMetaData(); rs = dbmd.getColumns(con.getCatalog(), schema, tableName, null); rs.getSt
Android 应用程序开关GPS gqdy365 android
要在应用程序中操作GPS开关需要权限： <uses-permission android:name="android.permission.WRITE_SECURE_SETTINGS" /> 但在配置文件中添加此权限之后会报错，无法再eclipse里面正常编译，怎么办？ 1、方法一：将项目放到Android源码中编译； 2、方法二：网上有人说cl
Windows上调试MapReduce zhiquanliu mapreduce
1.下载hadoop2x-eclipse-plugin https://github.com/winghc/hadoop2x-eclipse-plugin.git 把 hadoop2.6.0-eclipse-plugin.jar 放到eclipse plugin 目录中。 2.下载 hadoop2.6_x64_.zip http://dl.iteye.com/topics/download/d2b
如何看待一些知名博客推广软文的行为？ justjavac 博客
本文来自我在知乎上的一个回答：http://www.zhihu.com/question/23431810/answer/24588621 互联网上的两种典型心态：当初求种像条狗，如今撸完嫌人丑当初搜贴像条犬，如今读完嫌人软你为啥感觉不舒服呢？难道非得要作者把自己的劳动成果免费给你用，你才舒服？就如同 Google 关闭了 Gooled Reader，那是
sql优化总结 macroli sql
为了是自己对sql优化有更好的原则性，在这里做一下总结，个人原则如有不对请多多指教。谢谢！要知道一个简单的sql语句执行效率，就要有查看方式，一遍更好的进行优化。一、简单的统计语句执行时间 declare @d datetime ---定义一个datetime的变量set @d=getdate() ---获取查询语句开始前的时间select user_id
Linux Oracle中常遇到的一些问题及命令总结超声波 oracle linux
1.linux更改主机名 (1)#hostname oracledb　　　　临时修改主机名 (2) vi /etc/sysconfig/network 　　修改hostname (3) vi /etc/hosts　　　　　　　　修改IP对应的主机名 2.linux重启oracle实例及监听的各种方法（注意操作的顺序应该是先监听，后数据库实例） &nbs
hive函数大全及使用示例 superlxw1234 hadoop hive函数
具体说明及示例参见附件文档。文档目录：目录一、关系运算： 4 1. 等值比较: = 4 2. 不等值比较: <> 4 3. 小于比较: < 4 4. 小于等于比较: <= 4 5. 大于比较: > 5 6. 大于等于比较: >= 5 7. 空值判断: IS NULL 5
Spring 4.2新特性-使用@Order调整配置类加载顺序 wiselyman spring 4
4.1 @Order Spring 4.2 利用@Order控制配置类的加载顺序 4.2 演示两个演示bean package com.wisely.spring4_2.order; public class Demo1Service { } package com.wisely.spring4_2.order; public class