wen05054105

热点综述 | 跨模态单细胞分析的最佳实践

跨模态的单细胞数据的可用性越来越高，推动了新的计算方法的发展，以帮助科研人员获得生物学见解。近日《Nature Reviews Genetics 》发表了一篇综述文章，总结了单模态和多模态单细胞数据分析的独立基准研究，为最常见分析步骤提供全面的最佳实践工作方案。

跨模态单细胞分析

转录组

scRNA-seq测量每个细胞的mRNA 分子丰度。提取的生物组织样本构成了单细胞实验的输入。组织在单细胞解离过程中被消化，然后进行单细胞分离以分别分析每个细胞的 mRNA。

scRNA-seq单模态分析步骤概述

从原始计数矩阵到高质量的细胞数据

过滤低质量细胞和噪声校正：SoupX 等流行方法根据数据集中其他“空”液滴和细胞簇的表达谱估计细胞特异性污染分数；CellBender 将环境 RNA 的去除制定为无监督贝叶斯模型；scDblFinder在二重检测精度和计算效率方面优于其他方法。当低质量细胞和双细胞聚集在一起时，通常需要在下游分析期间重新评估所选的质量控制策略。因此，我们建议最初设置允许阈值，并可能在（重新）分析期间根据需要移除更多细胞。

归一化和方差稳定：最近的一个基准测试比较了基于KNN图与ground truth重叠的单细胞数据的22个转换，具有大小因子s的移位对数变换log（y/s+1）表现良好，但不应将每百万计数用作输入；表现类似良好的一种方法是皮尔逊残差的分析近似，它拟合以排序深度为协变量的广义线性模型，以获得变换的计数矩阵。归一化方法应该在后续分析任务的基础上仔细选择。移位对数被证明能更好地稳定方差，用于后续的降维，Scran在批量校正任务中表现良好，分析Pearson残差更适合选择生物可变基因和鉴定稀有细胞身份。

消除混杂的变异来源：一项基准比较了14个指标的16种集成方法，这些方法基于批量校正和生物方差守恒。线性嵌入模型，如正则相关分析和Harmony，在具有不同批处理结构的更简单集成任务上表现良好。根据集成任务的复杂性，如图谱集成，深度学习方法（如scANVI、scVI和scGen）以及线性嵌入模型（如Scanorama）表现最好，而对于不太复杂的集成任务，Harmony是首选方法。scIB包可用于使用上述基准的评估指标来评估集成。除了计数采样效应外，scRNA-seq数据可能包含生物混杂因素（如细胞周期效应），Tricycle被证明对具有高细胞类型异质性的数据集表现良好。

选择信息特征和降维：在不影响小亚群可识别性的情况下，特征选择方法应理想地选择解释数据集中生物变异的基因，方法是优先考虑亚群之间而不是一个亚群内的变异基因。Deviance在识别亚群中具有高变异性的基因方面表现良好，从而在选择信息基因方面也表现良好。在特征选择之后，可以通过主成分分析（PCA）等降维算法进一步降低数据集的维数。

从聚类到细胞识别

单细胞聚类：识别细胞群体的第一步是将细胞聚类成具有相似表达谱的组，以解释数据中的异质性。独立的基准测试表明，通过Louvain算法基于图模块化优化的聚类检测最适合于聚类识别。Louvain的继任者Leiden通过产生有保证的连接细胞群来规避连接不良的问题，并且在计算上更高效。

细胞类型注释：建议采用三步方法，利用自动注释，然后是专家手动注释和最后一步验证，以获得理想的注释结果。第一步，自动细胞类型注释，可以分为基于分类器的方法（例如CellTypist和Clustifyr）和参考映射（例如 scArches、Symphony或Azimuth），第二步，手动注释，利用每个簇的基因特征来注释细胞簇。这些基因特征通常被称为标记基因，可以使用简单的差异表达测试方法（例如 t 检验或 Wilcoxon 秩和检验）来识别，作为最后一步，注释应由专家验证，特别是对于具有高复杂性的数据集或涉及可能无法获得参考的稀有细胞亚群的研究。

从离散状态到连续过程：轨迹推理方法的性能取决于数据集中存在的轨迹类型，Slingshot在简单拓扑上表现更好，PAGA和RaceID/StemID在复杂轨迹上得分更高。因此，我们建议使用 dynguidelines来选择适用的方法。为了推断动态、定向信息，velocyto和scVelo模型使用未剪接和剪接reads来推断RNA 速度。谱系追踪数据的分析可以使用Cassiopeia 进行。

揭示机制

差异基因表达（DGE）分析：DGE分析目前从两个角度进行。样本级视图聚合每个样本-标签组合的计数，以创建pseudobulks，使用最初设计用于批量表达分析的包进行分析，如edgeR、DEseq2或limma（推荐这些方法允许进行复杂的实验设计）。或者，细胞级视图使用广义混合效应模型（例如MAST）单独地对细胞进行建模。目前DGE分析方法仍然显示出真实阳性率（TPR）和精确度之间的权衡，在DGE分析之前，应通过聚集个体内的细胞类型特异性计数来说明样本内的相关性。

基因集富集分析：常见的数据库包括 MSigDB、Gene Ontology、KEGG 或 Reactome。这一概念的扩展是加权基因集，包括用于信号通路的PROGENy和用于转录因子 (TF) 的DoRothEA。常用的富集方法包括超几何分布检验、GSEA或GSVA，可在 DGE分析后或在单个细胞水平上应用。基因集富集分析对基因集的选择比统计方法更敏感；因此，我们建议仔细选择数据库，以确保潜在的基因集被覆盖。decoupleR 等丰富框架在单个工具中提供了对不同数据库和方法的访问；为批量转录组学开发的富集方法可以应用于scRNA-seq，但一些基于单细胞的方法，即Pagoda2可能优于它们。

破译细胞组成的变化：专门为使用细胞类型计数的单细胞数据设计的测试包括scDC、scCODA和tascCODA，它们可以包含分层细胞类型信息。DA-seq和MILO使用KNN图来定义在实验条件之间测试差异丰度的亚群。

推断扰动效应：扰动建模的一个领域试图在未知任务的实验装置中成功区分未成功的靶向细胞，并评估扰动效应。Mixscape和MUSIC首先去除了混淆的变异源，然后成功地从未成功扰动的细胞中进行解剖，最终对扰动效应进行可视化和评分。Augur和MELD仅涵盖第三步，并根据扰动响应的程度对细胞类型进行排序，以确定受扰动影响最大的细胞群体。扰动建模的第二个领域涉及未经实验测量的扰动。scGen、CPA和CellBox等潜在空间学习模型旨在预测对不可见扰动、组合或药物剂量的反应。此类模型通常适用于高表达基因，但由于缺乏方差，可能难以处理低表达基因。

跨细胞的通信事件：方法和相互作用数据库的选择对预测的相互作用有很大影响。CellChate和CellPhoneDB也考虑了异构相互作用复合物，以及SingleCellSignalR被发现对数据和资源噪声都很稳健。我们建议使用LIANA，它为方法和数据库的几种组合提供了总体排名。此外，可使用Nichenet或Cytotalk等工具提供细胞内活动的补充估计，例如诱导的基因表达变化或空间信息，可用于增加预测相互作用的置信度。

染色质可及性

分析调控元件对于解读细胞多样性和理解细胞决策至关重要。基因表达受调控机制的复杂相互作用控制，包括表观遗传学和染色质可及性。为了深入了解单细胞水平上染色质状态的动力学，scATAC-seq测量单个细胞中全基因组染色质的可及性。

scATAC-seq分析步骤概述

特征定义和质量控制

scATAC-seq数据由于数据的全基因组性质而缺乏标准化的特征集。大多数工作流程使用逐个峰或逐个细胞的矩阵作为分析的基础，其性能优于基因矩阵或TF motif特征。scATAC-seq质量控制最常见的入口点是片段文件，其中包含由两个相邻的Tn5转座事件生成的所有已测序 DNA 片段。这些用于计算一组scATAC-seq特异性质量度量，以确定低质量细胞。与scRNA-seq数据中的测序深度相比较，检查了每个细胞的测序片段总数、片段对数总数和转录起始位点（TSS）富集分数。低质量的细胞通常会形成一个集群，将低计数和低TSS富集分数结合在一起，这些分数应该被去除。此外，核小体信号用于评估片段长度分布。进一步建议验证映射到与伪影信号相关的基因组区域的读数的比率。为了对双因子进行评分，我们建议遵循Germain等人的建议。使用两种专门为scATAC-seq数据设计的正交方法，并在下游分析中考虑这两种评分。第一种方法是调整scDblFinder；第二种是AMULET。

数据降维表示

在scATAC-seq数据中，最常见的归一化策略是峰的二值化。然而，这也可能会删除生物信息，因此建议直接对scATAC计数进行建模。基于潜在语义索引（ArchR 和 Signac）、潜在狄利克雷分配（cisTopic）和光谱嵌入（snapATAC）的降维方法被证明对下游聚类和细胞注释表现最佳。关于批量校正，LIGER 被证明对scATAC-seq数据表现最佳。最近，针对scATAC-seq数据提出了 PeakVI或MultiVI等深度学习模型作为降维和批量校正相结合的方法。在获得校正后的低维表示后，我们推荐Leiden聚类，因为它在scRNA-seq衍生表示中具有良好的性能。

基于可访问区域细胞类型注释

可以根据差异可及区域 (DAR) 和基因活性评分对细胞簇进行注释。DAR可以通过类似于scRNA-seq的差异测试方法获得，现有的批量ATAC-seq数据基准建议在样本量有限时使用edgeR来确定DAR，在大样本量的情况下使用DESeq2。DAR可能包含信息序列模式，例如已知的顺式调控元件 (CRE)，或者可以链接到近端基因，这在功能丰富分析工具（例如GREAT、LOLA或GIGGLE）中得到利用。与基因相关的CRE的染色质可及性可以概括为基因表达的估计（基因活性评分）。为了指导细胞类型注释，简单的模型通常就足够了，并且可以通过平滑相邻细胞之间的基因活性评分来增强可视化，这通常使用MAGIC进行。

TF-motif分析

为了获得每个细胞的富集分数，chromVAR 可用于计算每个细胞所有包含基序的峰的可及性偏差，同时校正Tn5转座酶的插入偏差，这是由转座酶的序列结合偏好引起的。TF标记有助于簇注释并代表决定细胞状态的调节蛋白的最佳候选者。一旦确定了感兴趣的TF，scATAC-seq数据就可以通过足迹进一步验证 TF 的影响。当前的足迹工具通常使用k-mer模型来纠正此偏差，该模型通过每个k-mer内的切割位点数量相对于全基因组出现次数来估计偏差。

将单细胞染色质可及性与转录组联系起来

专有的10x Multiome、sci-CAR 或 scCAT-seq 等分析允许对基因表达和染色质可及性进行联合分析。当前的工作流程使用已建立的方法进行单模态质量控制，并采用所有模态的高质量细胞的交集进行综合分析。由于尚未确定此集成的最佳方法，我们建议首先执行单模态分析，包括细胞类型注释。这可以通过将更新的聚类结果与单模态分析的细胞类型标签进行比较来评估联合表示。然后，高质量的多模态表示可作为大多数单模态分析方法的输入，包括细胞类型注释、差异测试和轨迹分析。

配对的scRNA-seq和scATAC-seq数据还支持使用新的联合方法来识别基因表达和细胞状态的调节因子。为了识别潜在的CRE，使用基于相关性的方法将峰与细胞簇内的基因联系起来。可以通过使用SCENIC推断活性TF，然后将相应的基序与峰值区域匹配以增加额外的可解释性来扩展这种方法。为了深入了解局部或全局染色质景观是否影响特定细胞状态下基因的表达，可以比较基于局部邻域和全基因组染色质状态表达的可预测性。目前正在开发利用两种模态（例如FigR或Pando）推断基因调控网络的方法。

表面蛋白表达

用于结合scRNA-seq和表面蛋白分析的最广泛使用的方案是CITE-seq和REAP-seq，主要区别是用于量化表面蛋白表达水平的抗体衍生标签（ADT）。

CITE-seq数据处理概述

校正ADT计数

应在ADT模式中对单个质量控制指标进行仔细评估，RNA和ADT的联合测量应分别进行质量控制。由于抗体功效是可变的，跨多项研究的 ADT 数据整合可能导致强烈的批次效应，需校正。

计算ADT成分偏差

细胞特性会导致异质捕获效率，从而导致细胞组成偏差。只有表达目标蛋白的细胞会导致标签计数增加，这可能只是特定的细胞类型。这可以通过使用中心对数比 (CLR) 转换或按背景去噪和缩放 (DSB) 进行归一化来解决。

联合分析转录组学和ADT数据

在各自的预处理之后，可以使用通常适用的多模态集成工具或CITE-seq特定的、基于深度学习的totalVI来获得联合嵌入，该工具学习成对测量的联合概率表示，该联合概率表示也考虑了噪声和技术偏差，包括每个模态的批处理效应。另一种方法是使用CiteFuse，它使用CLR对ADT进行归一化，并将两种模态矩阵与相似性网络融合算法相结合。然后，可以使用Leiden对联合嵌入进行聚类，并通过将聚类与所有其他聚类进行比较，使用Wilcoxon秩和检验基于差异表达的RNA和ADT进行注释。这两种模态都可用于下游任务，如研究细胞-细胞通信，其中考虑配体簇的RNA表达和受体簇的蛋白质表达，或使用CiteFuse进行RNA和ADT相关性分析。

单细胞免疫组库

商用10x Chromium单细胞免疫分析和BD Rhapsody TCR/BCR 多组学分析能够生成配对的转录组学和AIRR数据。可以使用 scirpy、Dandelion或scRepertoire等流程进行免疫受体分析，包括解码AIRR序列特征、筛选功能性适应性免疫受体、克隆型的鉴定和分类、确定细胞特异性、将适应性免疫受体与转录组学测量相结合等。

适应性免疫受体分析概述

在空间中解析单细胞数据

分析空间数据集需要专门定制的分析工具，可以使用Squidpy、Giotto、Seurat或SpatialExperiment等流程进行分析。

空间转录组学预处理和下游分析步骤概述

获得细胞计数矩阵和空间坐标

已经提出了多种方法来分解基于芯片的基因表达谱中的基因表达谱。Cell2location、SpatialDWLS和RCTD根据单细胞解析参考中细胞群的基因表达谱估计每个点的细胞类型组成。对于模拟数据集，Cell2location优于其他细胞类型去卷积方法，但需要更多的计算资源，而对于真实数据集，SpatialDWLS和 RCTD在基于四种不同精度指标的总体精度得分方面表现最佳。

对基于图像的技术，Giotto和squidpy等处理流程允许在其中添加定制的分割方法，这简化了对所选方法的比较、选择和评估。此外，转录物的定位可以用于无分割的方法，如SSAM或Baysor，这些方法直接将细胞标签分配给空间邻近的像素。Baysor还结合了通过组织学图像获得的细胞形状信息，以增强分割结果。这些工具可以作为基于分割的方法的有用替代方案。

细胞特性和细胞微环境的表征

对于单细胞分辨率的基于成像的空间转录组学数据，可以类似于scRNA-seq数据对细胞进行注释。标准空间原始scRNA-seq 数据和目标空间解析数据的对齐能够以空间解析的方式对整个转录组（以标准scRNA-seq测量）进行插补，Tangram通过优化空间和 scRNA-seq 数据之间的基因相似性来估算空间样本中未检测到的转录本。它被证明在各种准确性指标和可扩展性方面优于其他插补方法（例如 gimVI和SpaGE）。

除了仅根据基因表达谱来注释细胞外，还可以利用空间位置来识别细胞身份。BayesSpace、stLearn和spaGCN等工具通过考虑基因表达共性和空间邻域结构来识别空间域。获得的标签可用于识别组织中具有相似表达谱的区域，并且可能对应于数据集的整体形态。

不同样品的细胞微环境的识别可能会因图像取向的差异而受到阻碍，Tangram, GridNet和eggplant生成跨样本的通用坐标框架以缓解此问题。

识别与细胞组织和组织结构相关的空间模式

scRNA-seq在鉴定高度可变基因和DGE分析方面对基因表达差异的分析进行了广泛的探索。对于空间转录组学数据，这是通过空间可变基因（SVG）的鉴定来补充的。为此目的的方法在其假设和SVG的定义方面存在很大差异，并且在如何最好地识别SVG方面没有达成共识。例如，SPARK和SpatialDE利用空间相关性测试，BayesSpace使用马尔可夫随机场，spaGCN使用图神经网络来整合基因表达数据、空间信息和组织学图像，sepal使用基于扩散的建模来识别具有空间模式的基因。

细胞间依赖空间的通信事件

空间细胞间通讯的方法通常比较基于周围相邻细胞的基因表达模式。GCNG、Misty和 NCEM根据细胞空间图和图神经网络制定此任务，SpaOTsc使用最优传输，SVCA通过空间方差分量分析量化细胞间通讯事件对基因表达谱的影响。

参考文献

Heumos, L., Schaar, A.C., Lance, C. et al. Best practices for single-cell analysis across modalities. Nat Rev Genet (2023). https://doi.org/10.1038/s41576-023-00586-w

python视频工具包 ffmpeg 使用示例 pythonffmpeg
1.简介FFMPEG堪称自由软件中最完备的一套多媒体支持库，它几乎实现了所有当下常见的数据封装格式、多媒体传输协议以及音视频编解码器，提供了录制、转换以及流化音视频的完整解决方案。2.ffmpeg的常用方法将某文件下所有ts文件按顺序合并，转换成MP4格式存储：importffmpegdeftest2():ts_folder='path/ts_files/ceshi/'output_mp4="pa
LeetCode 刷题：数据结构与算法的实战经验分享
LeetCode刷题：数据结构与算法的实战经验分享关键词：LeetCode、数据结构、算法、刷题经验、实战摘要：本文将围绕LeetCode刷题展开，深入探讨数据结构与算法在实际刷题过程中的应用。通过分享实战经验，帮助读者更好地理解和掌握数据结构与算法知识，提升解题能力。文章将从背景介绍入手，阐述刷题的目的和意义，接着详细解释核心概念，分析它们之间的关系，然后介绍核心算法原理和具体操作步骤，结合数学
高压电缆护层电流监测系统的技术实现李子圆圆人工智能
目录文章目录概要高精度电流监测的技术实现多级预警机制的构建逻辑极端环境下的稳定运行技术远程运维的技术支撑概要高压电缆护层作为电力传输的关键防护结构，其接地电流的异常变化是判断设备状态的重要指标。TLKS-PLGD高压电缆护层电流监测系统通过传感器技术与智能算法的结合，构建了一套完整的电缆安全监测方案。高精度电流监测的技术实现高精度电流监测的技术实现护层电流监测的核心在于数据采集的精准性。该系统采用
Rust BSS段原理与实践解析萧曵丶 Rust rust 开发语言后端内存模型
在Rust中，BSS段（BlockStartedbySymbol）是程序内存布局的关键部分，专门用于存储未初始化或零初始化的全局/静态变量。以下是从原理到实践的深入解析：一、BSS的核心特性零初始化BSS段中的所有变量在程序加载时自动初始化为0（或对应类型的零值：0、null、false等）。staticmutCOUNTER:usize=0;//实际存储在BSS段磁盘空间优化BSS段在可执行文件中
构建安全密码存储策略：核心原则与最佳实践 weixin_47233946 信息安全安全
密码是用户身份认证的第一道防线，其存储安全性直接关系到用户隐私和企业信誉。近年来频发的数据泄露事件揭示了密码管理的关键性。本文将深入探讨从加密算法到系统性防护的完整密码存储方案，帮助开发者构建企业级安全防御体系。一、密码存储基本准则绝对禁止明文存储：即使采用数据库加密措施，直接存储用户原始密码仍存在不可逆泄露风险。运维人员权限滥用或备份文件泄露都可能成为突破口。加密≠安全：AES等对称加密存在密钥
python汇率_用Python抓取汇率
抓取的是中行的数据:网址代码#-*-coding:utf-8-*-importreimporturllib.requesturl='http://www.boc.cn/sourcedb/whpj/index.html'#网址req=urllib.request.Request(url)response=urllib.request.urlopen(req)the_page=response.rea
python抓取汇率_09 使用Python爬取中国银行网站选择汇率最坑的一天
爬取2018年8月27日~9月2日的欧元汇率。先说结论：如果是现汇卖出价，可以选择2018-08-3109:19:26，现钞卖出价805.28。我刚问了报销过的人她说任选都行，可以不是中行折算价。最近出差，学校可以以人民币的形式报销路费、住宿费，汇率，可以任选出差期间的任何一天任何时候的中国银行的汇率，中国银行网站上的汇率长这样：如果想要合理利用规则，多回一点本，不妨选择汇率最坑的一天(默默给财务
数据结构实验解析(C++版)——实验一复杂度分析拯救三金数据结构 c++算法
目录一、实验例题例题1例题2二、实验原理与背景知识1、实验原理2、背景知识三、解题思路与算法1、解题思路2、算法四、代码实现例题1代码例题2代码五、实验结果分析与总结1、实验结果分析2、该实验与数据结构的联系一、实验例题例题1时间空间限制时间限制：1SEC空间限制：128MB问题描述分析以下代码：for(i=1;iusingnamespacestd;intmain(){longlongn;//输入
vLLM 优化与调优：提升模型性能的关键策略强哥之神人工智能深度学习计算机视觉 deepseek 智能体 vllm
在当今人工智能领域，大语言模型（LLM）的应用日益广泛，而优化和调优这些模型的性能成为了至关重要的任务。vLLM作为一种高效的推理引擎，提供了多种策略来提升模型的性能。本文将深入探讨vLLMV1的优化与调优策略，帮助读者更好地理解和应用这些技术。抢占式调度（Preemption）由于Transformer架构的自回归特性，有时键值缓存（KVcache）空间不足以处理所有批量请求。在这种情况下，vL
爬虫小结 Crescent_P python小项目 python 数据分析
python爬虫小组作业上周布置了python的小组作业,每一组要求爬取老师指定的信息,本组抽到的题目如下:从中国银行网址：http://www.boc.cn/sourcedb/whpj/获取主要外汇（美元、欧元、英镑、加拿大元、澳大利亚元、日元、韩元、新台币、澳门元和港币）的牌价信息，计算出它们的每天平均价。要求把今年5月份每天平均价格保存到Excel文件中，每种外汇的数据保存在一个工作表中，并
Spring Data Neo4j 与后端人工智能算法的数据交互 AI大模型应用实战 spring neo4j 人工智能 ai
SpringDataNeo4j与后端人工智能算法的数据交互关键词：SpringDataNeo4j、图数据库、人工智能算法、数据交互、知识图谱、图神经网络、数据集成摘要：本文深入探讨了如何利用SpringDataNeo4j框架实现后端人工智能算法与图数据库的高效数据交互。文章首先介绍了图数据库和人工智能算法的基本概念，然后详细解析了SpringDataNeo4j的核心架构和原理。接着，通过实际代码示
Python 爬虫实战：抓取华尔街日报付费文章摘要的全方位指南 Python爬虫项目 python 爬虫开发语言信息可视化数据分析
引言在全球化的信息时代，获取高质量的新闻内容对于研究、投资和决策具有重要意义。《华尔街日报》（TheWallStreetJournal，简称WSJ）作为国际知名的财经媒体，其文章内容备受关注。然而，WSJ的大部分内容属于付费订阅，普通用户无法直接访问。本文将深入探讨如何使用Python爬虫技术，结合最新的工具和方法，抓取WSJ的付费文章摘要。一、了解目标网站结构1.1WSJ网站结构分析WSJ的官方
Python爬虫实战：使用最新技术爬取头条新闻数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫开发语言 scrapy 音视频
一、前言：Python爬虫在现代数据获取中的重要性在当今信息爆炸的时代，数据已经成为最宝贵的资源之一。作为数据获取的重要手段，网络爬虫技术在各个领域发挥着越来越重要的作用。Python凭借其简洁的语法、丰富的库生态系统和强大的社区支持，已经成为网络爬虫开发的首选语言。本文将详细介绍如何使用Python及其最新的爬虫技术来爬取头条新闻数据。我们将从基础概念讲起，逐步深入到高级技巧，最后给出完整的爬虫
Python爬虫实战：爬取ETF基金持仓变化 Python爬虫项目 python 爬虫开发语言信息可视化数据分析
1.项目背景ETF（Exchange-TradedFund，交易型开放式指数基金）作为一种在交易所上市交易的基金，其持仓信息对于投资者具有重要参考价值。了解ETF的持仓变化，可以帮助投资者判断市场趋势和资金流向。本文将通过Python爬虫技术，自动化地获取ETF基金的持仓变化数据，进行存储和分析。2.技术选型与环境准备2.1技术选型编程语言：Python3.8+爬虫框架：Scrapy数据解析：Be
【数据结构】复杂度分析
目录一、算法1.基本概念2.描述方法3.算法效率二、算法的时间复杂度三、算法的空间复杂度一、算法1.基本概念通俗的讲，算法是解决问题的方法，比如在现实生活中一道菜谱，一个安装轮椅的操作指南等。严格的说，算法是对特定问题求解步骤的一种描述，是指令的有限序列。算法具有的基本特性有：（1）有穷性。一个算法必须总是在执行有穷步之后结束，且每一步都在有求时间内完成。（2）确定性。算法中的每一条指令必须有确切
【Python】（一）面试题和Py基础题戏精亿点点菜 python 开发语言
1.技术面试题（1）TCP与UDP的区别是什么？答：TCP（TransmissionControlProtocol，传输控制协议）提供的是面向连接，可靠的字节流服务。即客户和服务器交换数据前，必须现在双方之间建立一个TCP连接，之后才能传输数据。并且提供超时重发，丢弃重复数据，检验数据，流量控制等功能，保证数据能从一端传到另一端。UDP（UserDataProtocol，用户数据报协议）是一个简单
Python 爬虫实战：实时采集外汇汇率数据的全方位指南 Python爬虫项目 python 爬虫开发语言信息可视化数据分析
引言在全球化的金融市场中，外汇汇率的实时数据对于投资者、企业和研究人员来说至关重要。通过自动化的方式获取这些数据，不仅可以提高效率，还能为决策提供及时的支持。本文将深入探讨如何使用Python爬虫技术，结合最新的工具和方法，实时采集外汇汇率数据。一、外汇汇率数据的获取途径1.1使用官方API接口许多金融机构和数据提供商提供了官方的API接口，供开发者获取外汇汇率数据。例如：AlphaVantage
从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南
从零构建智能ai语音助手：ESP32s3+Python+大语言模型实战指南一、项目概述大家好！今天给大家带来一个干货满满的实战项目——基于ESP32S3硬件和Python后端的智能语音助手系统。这个项目将物联网技术与AI技术完美结合，打造一个可以实时对话、意图识别的智能语音交互系统。相比传统的离线语音系统只能识别固定命令词，我们这套系统可以：实现自然语言理解，支持多种表达方式无需预设固定命令词，更
视觉算法之卷积神经网络清风AI 深度学习算法详解及代码复现计算机视觉 cnn 神经网络深度学习 python 课程设计毕业设计
定义与特点卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种专为处理具有网格结构的数据而设计的深度学习模型。其独特的结构和功能使其在图像处理、语音识别等领域展现出卓越的性能:CNN的核心设计理念源于对生物视觉系统的模仿。通过模拟大脑皮层中视网膜和视觉皮层的层次化结构,CNN能够有效地捕捉图像中的局部特征并逐步抽象为高层语义信息。这种设计使得CNN特别擅长处理图像和音
心理健康语音分析AI模型：开启心理评估新时代 AI大模型应用实战人工智能语音识别 ai
心理健康语音分析AI模型：开启心理评估新时代关键词：心理健康评估、语音信号处理、情感计算、AI模型、多模态融合摘要：传统心理评估依赖量表问卷和人工观察，存在主观性强、效率低、难以实时监测等局限。本文将带您走进“心理健康语音分析AI模型”的世界，从基础概念到核心技术，从算法原理到实战案例，揭秘AI如何通过“听声音”读懂心理状态，开启心理评估的智能化新时代。背景介绍目的和范围心理健康问题已成为全球公共
Python 领域 pytest 的测试用例的可维护性设计
Python领域pytest的测试用例的可维护性设计关键词：pytest、测试用例、可维护性、测试框架、自动化测试、测试设计模式、重构摘要：本文深入探讨了如何在Python测试框架pytest中设计可维护的测试用例。我们将从测试用例可维护性的核心原则出发，分析pytest的特性和最佳实践，介绍多种提高测试代码可维护性的设计模式和技巧。文章包含实际代码示例、项目实战案例以及可维护性评估指标，帮助开发
MySQL存储结构深度解析：Buffer Pool与Page管理 hdzw20 mysql复习 mysql 数据库
MySQL存储结构解析：BufferPool与Page管理在MySQL的InnoDB存储引擎中，BufferPool是其核心组件之一，它极大地提升了数据库的性能。理解BufferPool的内部结构和工作机制，对于优化MySQL数据库至关重要。本文将讨论BufferPool的结构、三大链表、改进型LRU算法以及ChangeBuffer机制。1.BufferPool结构：控制块与缓存页BufferPo
Python爬虫小白入门指南，成为大牛必须经历的三个阶段
学习任何一门技术，都应该带着目标去学习，目标就像一座灯塔，指引你前进，很多人学着学着就学放弃了，很大部分原因是没有明确目标，所以，一定要明确学习目的，在你准备学爬虫前，先问问自己为什么要学习爬虫。有些人是为了一份工作，有些人是为了好玩，也有些人是为了实现某个黑科技功能。不过可以肯定的是，学会了爬虫能给你的工作提供很多便利。小白入门必读作为零基础小白，大体上可分为三个阶段去实现。第一阶段是入门，掌握
python 包管理工具uv
uv--versionuvpythonfinduvpythonlistexportUV_DEFAULT_INDEX="https://mirrors.tuna.tsinghua.edu.cn/pypi/web/simple"#换成私有的repoexportUV_HTTP_TIMEOUT=120uvpythoninstall3.12uvvenvmyenv--python3.12--seeduvhtt
Python通关秘籍之基础教程(一） Smile丶Life丶 Python 通关指南：从零基础到高手之路 python 开发语言后端
引言在编程的世界里，Python就像一位温和而强大的导师，它以简洁优雅的语法和强大的功能吸引着无数初学者和专业人士。无论你是想开发网站、分析数据、构建人工智能，还是仅仅想学习编程思维，Python都是你的理想选择。Python的魅力在于它的易读性和广泛的应用场景。它的代码就像英语句子一样自然，即使是完全没有编程经验的人也能快速上手。同时，Python拥有庞大的生态系统，从Web开发（Django、
Python 包管理工具（uv） cliffordl python python uv 开发语言
Python虚拟环境（conda）Python虚拟环境（venv）Python包管理工具（uv）文章目录1.uv的特点2.安装uv2.1.使用官方推荐方式2.2.使用pip安装（Python>=3.8）2.3.使用conda/mamba安装3.基本使用方法3.1.初始化项目并创建虚拟环境3.1.1.CMD运行结果3.1.2.VScode运行结果3.2.安装依赖3.3.生成依赖文件3.4.使用pyp
Python协程从入门到精通：9个案例解析yield、gevent与asyncio实战 python_chai Python python 开发语言协程并发 yield生成器 gerrnlet gevent
引言痛点分析：传统多线程在高并发场景下的性能瓶颈。协程优势：轻量级、高并发、低资源消耗。本文目标：通过9个代码案例，系统讲解协程的核心技术和应用场景。目录引言1.协程基础：理解yield生成器1.1yield的暂停与恢复机制1.2生产者-消费者模型实战1.3双向通信：send()方法详解2.手动协程控制：greenlet进阶2.1greenlet的显式切换原理2.2多任务协作案例3.自动化协程：g
多模态大模型发展全景：从架构创新到应用突破陈敬雷-充电了么-CEO兼CTO python 大模型多模态大模型 AIGC 机器学习深度学习 DeepSeek
注：此文章内容均节选自充电了么创始人，CEO兼CTO陈敬雷老师的新书《GPT多模态大模型与AIAgent智能体》（跟我一起学人工智能）【陈敬雷编著】【清华大学出版社】《GPT多模态大模型与AIAgent智能体》新出书籍配套视频【陈敬雷】推荐算法系统实战全系列精品课【陈敬雷】文章目录GPT多模态大模型系列四多模态大模型发展全景：从架构创新到应用突破更多技术内容总结GPT多模态大模型系列四多模态大模型
Python爬虫在社交平台数据挖掘中的应用：深入探索用户互动程序员威哥 python 爬虫数据挖掘
引言社交媒体已经成为全球用户互动的主要平台，每天都有大量的信息生成，用户之间的互动行为如点赞、评论、分享、转发等构成了宝贵的数据资源。如何利用这些互动数据为商业决策、用户行为分析以及产品优化提供支持，已经成为数据科学与大数据分析领域的一个重要课题。Python作为一款强大的编程语言，凭借其丰富的爬虫库和数据分析工具，已经成为挖掘社交平台数据的重要工具。在本文中，我们将通过Python爬虫技术，深入
Python 爬虫实战：精准抓取母婴电商平台数据，深入分析用户评价洞察市场趋势程序员威哥最新爬虫实战项目 python 爬虫开发语言
前言随着生活水平的提高，越来越多的年轻父母开始关注母婴产品的质量和品牌。而母婴电商平台成为了他们选择和购买产品的主要渠道之一。母婴产品市场也因此变得异常活跃且充满竞争。在这样的市场环境下，用户评价不仅反映了产品的实际质量，也揭示了消费者的需求和偏好，成为品牌决策的核心依据之一。Python爬虫是获取电商平台用户评价数据、产品详情、价格等关键信息的强大工具。通过抓取和分析这些数据，品牌商可以实时了解
书其实只有三类西蜀石兰类
一个人一辈子其实只读三种书，知识类、技能类、修心类。知识类的书可以让我们活得更明白。类似十万个为什么这种书籍，我一直不太乐意去读，因为单纯的知识是没法做事的，就像知道地球转速是多少一样（我肯定不知道），这种所谓的知识，除非用到，普通人掌握了完全是一种负担，维基百科能找到的东西，为什么去记忆？知识类的书，每个方面都涉及些，让自己显得不那么没文化，仅此而已。社会认为的学识渊博，肯定不是站在
《TCP/IP 详解，卷1：协议》学习笔记、吐槽及其他 bylijinnan tcp
《TCP/IP 详解，卷1：协议》是经典，但不适合初学者。它更像是一本字典，适合学过网络的人温习和查阅一些记不清的概念。这本书，我看的版本是机械工业出版社、范建华等译的。这本书在我看来，翻译得一般，甚至有明显的错误。如果英文熟练，看原版更好： http://pcvr.nl/tcpip/ 下面是我的一些笔记，包括我看书时有疑问的地方，也有对该书的吐槽，有不对的地方请指正： 1.
Linux—— 静态IP跟动态IP设置 eksliang linux IP
一.在终端输入 vi /etc/sysconfig/network-scripts/ifcfg-eth0 静态ip模板如下： DEVICE="eth0" #网卡名称 BOOTPROTO="static" #静态IP（必须） HWADDR="00:0C:29:B5:65:CA" #网卡mac地址 IPV6INIT=&q
Informatica update strategy transformation 18289753290
更新策略组件：标记你的数据进入target里面做什么操作，一般会和lookup配合使用，有时候用0,1,1代表 forward rejected rows被选中，rejected row是输出在错误文件里，不想看到reject输出，将错误输出到文件，因为有时候数据库原因导致某些column不能update，reject就会output到错误文件里面供查看，在workflow的
使用Scrapy时出现虽然队列里有很多Request但是却不下载，造成假死状态酷的飞上天空 request
现象就是：程序运行一段时间，可能是几十分钟或者几个小时，然后后台日志里面就不出现下载页面的信息，一直显示上一分钟抓取了0个网页的信息。刚开始已经猜到是某些下载线程没有正常执行回调方法引起程序一直以为线程还未下载完成，但是水平有限研究源码未果。经过不停的google终于发现一个有价值的信息，是给twisted提出的一个bugfix 连接地址如下http://twistedmatrix.
利用预测分析技术来进行辅助医疗蓝儿唯美医疗
2014年，克利夫兰诊所（Cleveland Clinic）想要更有效地控制其手术中心做膝关节置换手术的费用。整个系统每年大约进行2600例此类手术，所以，即使降低很少一部分成本，都可以为诊所和病人节约大量的资金。为了找到适合的解决方案，供应商将视野投向了预测分析技术和工具，但其分析团队还必须花时间向医生解释基于数据的治疗方案意味着什么。克利夫兰诊所负责企业信息管理和分析的医疗
java 线程(一)：基础篇 DavidIsOK java 多线程线程
&nbs
Tomcat服务器框架之Servlet开发分析 aijuans servlet
最近使用Tomcat做web服务器，使用Servlet技术做开发时，对Tomcat的框架的简易分析：疑问：为什么我们在继承HttpServlet类之后，覆盖doGet(HttpServletRequest req, HttpServetResponse rep)方法后，该方法会自动被Tomcat服务器调用，doGet方法的参数有谁传递过来？怎样传递？分析之我见： doGet方法的
揭秘玖富的粉丝营销之谜与小米粉丝社区类似 aoyouzi 揭秘玖富的粉丝营销之谜
玖富旗下悟空理财凭借着一个微信公众号上线当天成交量即破百万，第七天成交量单日破了1000万;第23天时，累计成交量超1个亿……至今成立不到10个月，粉丝已经超过500万，月交易额突破10亿，而玖富平台目前的总用户数也已经超过了1800万，位居P2P平台第一位。很多互联网金融创业者慕名前来学习效仿，但是却鲜有成功者，玖富的粉丝营销对外至今仍然是个谜。　　近日，一直坚持微信粉丝营销
Java web的会话跟踪技术百合不是茶 url会话 Cookie会话 Seession会话 Java Web 隐藏域会话
会话跟踪主要是用在用户页面点击不同的页面时,需要用到的技术点会话:多次请求与响应的过程 1,url地址传递参数,实现页面跟踪技术格式:传一个参数的 url?名=值传两个参数的 url?名=值 &名=值关键代码
web.xml之Servlet配置 bijian1013 java web.xml Servlet配置
定义： <servlet> <servlet-name>myservlet</servlet-name> <servlet-class>com.myapp.controller.MyFirstServlet</servlet-class> <init-param> <param-name>
利用svnsync实现SVN同步备份 sunjing SVN 同步 E000022 svnsync 镜像
1. 在备份SVN服务器上建立版本库 svnadmin create test 2. 创建pre-revprop-change文件 cd test/hooks/ cp pre-revprop-change.tmpl pre-revprop-change 3. 修改pre-revprop-
【分布式数据一致性三】MongoDB读写一致性 bit1129 mongodb
本系列文章结合MongoDB，探讨分布式数据库的数据一致性，这个系列文章包括：数据一致性概述与CAP 最终一致性(Eventually Consistency) 网络分裂(Network Partition)问题多数据中心(Multi Data Center) 多个写者(Multi Writer)最终一致性一致性图表(Consistency Chart) 数据
Anychart图表组件-Flash图转IMG普通图的方法白糖_ Flash
问题背景：项目使用的是Anychart图表组件，渲染出来的图是Flash的，往往一个页面有时候会有多个flash图，而需求是让我们做一个打印预览和打印功能，让多个Flash图在一个页面上打印出来。那么我们打印预览的思路是获取页面的body元素，然后在打印预览界面通过$("body").append(html)的形式显示预览效果，结果让人大跌眼镜：Flash是
Window 80端口被占用 WHY? bozch 端口占用 window
平时在启动一些可能使用80端口软件的时候，会提示80端口已经被其他软件占用，那一般又会有那些软件占用这些端口呢？下面坐下总结： 1、web服务器是最经常见的占用80端口的，例如：tomcat , apache , IIS , Php等等； 2
编程之美-数组的最大值和最小值-分治法（两种形式） bylijinnan 编程之美
import java.util.Arrays; public class MinMaxInArray { /** * 编程之美数组的最大值和最小值分治法 * 两种形式 */ public static void main(String[] args) { int[] t={11,23,34,4,6,7,8,1,2,23}; int[]
Perl正则表达式 chenbowen00 正则表达式 perl
首先我们应该知道 Perl 程序中，正则表达式有三种存在形式，他们分别是：匹配：m/<regexp>;/ （还可以简写为 /<regexp>;/ ，略去 m）替换：s/<pattern>;/<replacement>;/ 转化：tr/<pattern>;/<replacemnt>;
[宇宙与天文]行星议会是否具有本行星大气层以外的权力呢? comsci
举个例子: 地球,地球上由200多个国家选举出一个代表地球联合体的议会,那么现在地球联合体遇到一个问题,地球这颗星球上面的矿产资源快要采掘完了....那么地球议会全体投票,一致通过一项带有法律性质的议案,既批准地球上的国家用各种技术手段在地球以外开采矿产资源和其它资源........ &
Oracle Profile 使用详解 daizj oracle profile 资源限制
Oracle Profile 使用详解转一、目的： Oracle系统中的profile可以用来对用户所能使用的数据库资源进行限制，使用Create Profile命令创建一个Profile，用它来实现对数据库资源的限制使用，如果把该profile分配给用户，则该用户所能使用的数据库资源都在该profile的限制之内。二、条件：创建profile必须要有CREATE PROFIL
How HipChat Stores And Indexes Billions Of Messages Using ElasticSearch & Redis dengkane elasticsearch Lucene
This article is from an interview with Zuhaib Siddique, a production engineer at HipChat, makers of group chat and IM for teams. HipChat started in an unusual space, one you might not
循环小示例，菲波拉契序列，循环解一元二次方程以及switch示例程序 dcj3sjt126com c 算法
# include <stdio.h> int main(void) { int n; int i; int f1, f2, f3; f1 = 1; f2 = 1; printf("请输入您需要求的想的序列："); scanf("%d", &n); for (i=3; i<n; i
macbook的lamp环境 dcj3sjt126com lamp
sudo vim /etc/apache2/httpd.conf /Library/WebServer/Documents 是默认的网站根目录重启Mac上的Apache服务这个命令很早以前就查过了，但是每次使用的时候还是要在网上查：停止服务：sudo /usr/sbin/apachectl stop 开启服务：s
java ArrayList源码下 shuizhaosi888 ArrayList源码
版本 jdk-7u71-windows-x64 JavaSE7 ArrayList源码上：http://flyouwith.iteye.com/blog/2166890 /** * 从这个列表中移除所有c中包含元素 */ public boolean removeAll(Collection<?> c) {
Spring Security（08）——intercept-url配置 234390216 Spring Security intercept-url 访问权限访问协议请求方法
intercept-url配置目录 1.1 指定拦截的url 1.2 指定访问权限 1.3 指定访问协议 1.4 指定请求方法 1.1 &n
Linux环境下的oracle安装 jayung oracle
linux系统下的oracle安装本文档是Linux(redhat6.x、centos6.x、redhat7.x) 64位操作系统安装Oracle 11g(Oracle Database 11g Enterprise Edition Release 11.2.0.4.0 - 64bit Production)，本文基于各种网络资料精心整理而成，共享给有需要的朋友。如有问题可联系：QQ：52-7
hotspot虚拟机 leichenlei java HotSpot jvm 虚拟机文档
JVM参数 http://docs.oracle.com/javase/6/docs/technotes/guides/vm/index.html JVM工具 http://docs.oracle.com/javase/6/docs/technotes/tools/index.html JVM垃圾回收 http://www.oracle.com
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” noaighost Web node.js
读《Node.js项目实践：构建可扩展的Web应用》 ——引编程慢慢变成系统化的“砌砖活” 眼里的Node.JS 初初接触node是一年前的事，那时候年少不更事。还在纠结什么语言可以编写出牛逼的程序，想必每个码农都会经历这个月经性的问题：微信用什么语言写的？facebook为什么推荐系统这么智能，用什么语言写的？dota2的外挂这么牛逼，用什么语言写的？……用什么语言写这句话，困扰人也是阻碍
快速开发Android应用 rensanning android
Android应用开发过程中，经常会遇到很多常见的类似问题，解决这些问题需要花时间，其实很多问题已经有了成熟的解决方案，比如很多第三方的开源lib，参考 Android Libraries 和 Android UI/UX Libraries。编码越少，Bug越少，效率自然会高。但可能由于根本没听说过、听说过但没用过、特殊原因不能用、自己已经有了解决方案等等原因，这些成熟的解决
理解Java中的弱引用 tomcat_oracle java 工作面试
　不久之前，我面试了一些求职Java高级开发工程师的应聘者。我常常会面试他们说，“你能给我介绍一些Java中得弱引用吗？”，如果面试者这样说，“嗯，是不是垃圾回收有关的？”，我就会基本满意了，我并不期待回答是一篇诘究本末的论文描述。　　然而事与愿违，我很吃惊的发现，在将近20多个有着平均5年开发经验和高学历背景的应聘者中，居然只有两个人知道弱引用的存在，但是在这两个人之中只有一个人真正了
标签输出html标签" target="_blank">关于标签输出html标签 xshdch jsp
http://back-888888.iteye.com/blog/1181202 关于<c:out value=""/>标签的使用，其中有一个属性是escapeXml默认是true(将html标签当做转移字符，直接显示不在浏览器上面进行解析)，当设置escapeXml属性值为false的时候就是不过滤xml，这样就能在浏览器上解析html标签， &nb

热点综述 | 跨模态单细胞分析的最佳实践

你可能感兴趣的:(空间转录组,机器学习,算法,python)