tzc_fly

基于GPT构建单细胞多组学基础模型

生成式预训练模型在自然语言处理和计算机视觉等各个领域取得了显著的成功。特别是将大规模多样化的数据集与预训练的Transformer相结合，已经成为开发基础模型的一种有前途的方法。文本由单词组成，细胞可以通过基因进行表征。这种类比启发作者探索细胞和基因生物学基础模型的潜力。通过利用呈指数增长的单细胞测序数据，作者首次尝试通过对超过1000万个细胞进行生成式预训练来构建单细胞基础模型。scGPT有效地捕捉了有关基因和细胞的生物学见解。此外，该模型可以轻松进行微调，以在各种下游任务中实现最先进的性能，包括批次整合、多组学整合、细胞类型注释、基因网络推断。

来自：scGPT: Towards Building a Foundation Model for Single-Cell Multi-omics Using Generative AI

背景
方法
- Input embedding
- scGPT
- 生成式预训练
- 基本的微调目标
- - 基因表达预测GEP
  - 基于细胞的GEP（GEPC）
  - 细胞相似度学习ECS
  - 细胞分类CLS
scGPT在下游任务的微调
- 批次整合
- 细胞类型注释
- 多组学整合
- 基因网络推断
结果
- scRNA-seq批次整合
- 细胞类型注释
- 多组学整合
- 基因网络推断

背景

生成式预训练模型最近在许多领域取得了前所未有的成功。这些基础模型可以轻松地适应各种下游任务和场景。与从头开始训练的特定任务模型相比，预训练模型在多个任务上展示出了更好的性能。这显示了它们在这些领域具有任务无关和深入理解知识的证据。尽管基础模型在其他领域取得了显著成功，但目前基于机器学习的单细胞研究相对分散。由于测序能力和研究问题的范围限制，每项研究中使用的数据集的广度和规模往往有限。这就需要一个在大规模数据上进行预训练的基础模型，以实现对单细胞生物学的全面理解。在此项研究中，作者通过对超过1000万个细胞进行生成式预训练，首次尝试构建了一个单细胞基础模型，即scGPT。作者证明了预训练模型在基因和细胞层面捕捉到了有意义的生物学见解。在零样本学习中，预训练模型能够在未见过的数据集上揭示有意义的细胞簇。通过在少样本学习设置中进行微调，模型在各种下游任务上取得了最先进的性能，包括批次校正、多组学整合、细胞类型注释、伪细胞生成和基因网络推断。预训练基础模型将进一步增进我们对细胞生物学的理解，并为未来的新发现奠定基础。

方法

单细胞测序可以捕获细胞水平的遗传特征。例如，单细胞RNA测序（scRNA-seq）可以测量基因表达水平，从而揭示细胞的身份、状态和功能。最近总结的细胞参考图谱，如人类细胞图谱，包含来自不同器官和组织的数百万个单细胞，提供了对细胞异质性的表征。作者引入了scGPT作为单细胞领域的生成预训练基础模型。核心模型采用了堆叠的Transformer层和多头注意力机制，可以同时学习细胞和基因的特征表示。

图1A展示了一个包括预训练和微调两阶段的工作流程。在预训练阶段，作者从CellXGene门户网站收集了超过1030万个来自血液和骨髓细胞的scRNA-seq数据用于训练。作者引入了特别设计的注意力掩码和生成式训练流程，以自监督的方式训练scGPT模型，共同优化细胞和基因的表示。在训练过程中，模型逐渐学会根据简单的细胞或基因表达提示生成细胞的基因表达水平。在微调阶段，研究人员可以将预训练的模型应用于新的数据集和特定的任务。

scGPT通过基因表达建模从多样的单细胞数据中学习细胞和基因的表示。为了促进基因表示的学习，作者采用基因表达预测（GEP）作为生成自监督目标，以自回归的方式从已知的标记中迭代预测未知标记的基因表达值。为了增强细胞表示的学习，作者设计了基于细胞建模的基因表达预测（GEPC）目标，模型从细胞表示中预测基因表达值。这在基因表达谱和细胞异质性之间建立了直接的联系，使得在scGPT框架内可以进行联合优化。此外，scGPT的特征式架构可以轻松扩展到多种测序模态、批次。scGPT作为一个强大的单细胞特征提取器，可以在之前未见过的数据集上发挥作用。在基准实验中，scGPT优于最近的方法，并在所有下游任务中取得了最先进的结果。这证明了预训练的好处以及所学知识在不同应用场景中的可转移性。通过提供一个稳健且统一的框架，scGPT使得单细胞研究人员能够轻松地在相关研究中利用预训练的基础模型。

图1：模型框架。
a：模型首先根据来自细胞图谱的大规模scRNA-seq数据进行生成训练。对于下游应用，可以在新数据上微调预训练的模型权重。scGPT的核心组件包含堆叠的Transformer块，具有专门用于生成训练的注意力掩模。可以将scGPT应用于各种任务，包括聚类、批校正、细胞类型注释、多组学整合、基因扰动预测（genetic perturbation prediction）和基因网络推断。
b：Input embedding的视图。输入包含三层信息，gene token、表达值和condition token（模态、批次、扰动条件）。
c：scGPT中Transformer层的视图。其中引入了一个特别设计的注意力掩模，用于对单细胞测序数据进行生成式预训练。

Input embedding

scRNA-seq被处理为矩阵 $X\in R^{N\times G}$ ，其每个元素 $X_{i,j}$ 代表RNA的read count。这个矩阵被称为原始矩阵。输入scGPT包含三个部分：gene tokens（对于ATAC则是peak region tokens），expression values和condition tokens。

对于gene tokens，基因是scGPT的最小单位，相当于NLP中的单词，因此，将gene名称作为token，并在完整的token词汇表中分配给每个gene $g_{j}$ 一个独一的整数标识 $id(g_{j})$ 。这种方法提供了很大的灵活性来协调不同基因集相关的多个研究（比如由不同的测序技术或预处理管道生成）。特别的，通过在不同研究中取所有基因的并集可以将不同的gene token整合到一个公共词汇表。此外，还在词汇表中加入了特殊的标记，比如 $< c l s >$ 用于将所有基因聚合到一个细胞， $< p a d >$ 用于将输入扩展到固定长度。细胞 $i$ 的gene tokens被表示为 $t_{g}^{(i)}\in N^{M}$ （ $N$ 为自然数）： $t_{g}^{(i)}=[id(g_{1}^{(i)}),id(g_{2}^{(i)}),...,id(g_{M}^{(i)})]$ 其中， $M$ 为预定义输入长度，通常为高变基因数。

对于expression values， $X$ 在作为输入前需要进行额外处理，对于细胞 $i$ ，处理后有 $x_{j}^{(i)}$ ： $x^{(i)}=[x_{1}^{(i)},...,x_{M}^{(i)}]$ 对于condition token，包含与个体基因相关的元信息，比如functional pathways（用pathways tokens表示），为了表示position-wise的condition tokens，作者使用与输入基因共享相同维度的输入向量： $t_{c}^{(i)}=[t_{c,1}^{(i)},t_{c,2}^{(i)},...,t_{c,M}^{(i)}]$ 其中， $t_{c,j}^{(i)}$ 表示与某个条件对应的整数索引。

作者使用Conv层 $emb_{g}$ 和 $emb_{c}$ 编码gene token和condition token。为了促进将每个token映射到固定长度 $D$ 的embedding向量，使用全连接层 $emb_{x}$ 增强expression values。最终细胞 $i$ 的embedding为 $h^{(i)}\in R^{M\times D}$ ： $h^{(i)}=emb_{g}(t_{g}^{(i)})+emb_{x}(x^{(i)})+emb_{c}(t_{c}^{(i)})$

scGPT

自注意力机制用于 $M$ 个token的序列，这可以捕捉基因之间的相互作用。堆叠的transformer为： $h_{0}^{(i)}=h^{(i)}$ $h_{l}^{(i)}=transformer(h_{l-1}^{(i)}),\forall l\in[1,n]$ 作者使用 $h_{n}^{(i)}\in R^{M\times D}$ 用于基因水平（比如基因表达预测GEP）和细胞水平的任务。对于细胞水平任务，首先整合 $h_{n}^{(i)}$ 到细胞向量，再用于细胞分类。

每个细胞都被认为是一个由基因组成的句子 $h_{c}^{(i)}\in R^{D}$ （由 $h_{n}^{(i)}$ 聚合得到）。在scGPT中，作者使用特定的token $< c l s >$ 作为细胞表示，用于学习transformer中的pooling操作。 $< c l s >$ 被附加到input tokens的开头，并且以最终的embedding的这个位置（即 $< c l s >$ ）作为细胞表示。因此，细胞embedding $h_{c}^{(i)}$ 等于堆叠transformer的最后一层的第一行 $h_{n}^{(i)}[]$ 。

作者使用额外的tokens集合来表示不同的批次和测序模态，这和condition tokens的介绍是一样的。模态的token $t_{m}^{(i)}$ 与个体输入 $g_{j}$ 相关（比如个体输入特征可以是gene，region，protein）。批次的token在细胞级别上，相同的批次token $t_{b}^{(i)}$ 被复制到细胞 $i$ 的每个最小特征上： $t_{b}^{(i)}=[t_{b,1}^{(i)},...,t_{b,M}^{(i)}]=[C,...,C]$ 在前面描述的三种token与这里批次token和模态token的区别是，批次token和模态token不用作transformer的输入。相反，在输入特定的微调目标之前，它们在特征级别或细胞级别上与transformer输出拼接。这是为了防止Transformer放大相同模态特征内的注意力，而削弱不同模态的特征。此外，明确模态和批次的身份有助于下游任务的建模。当模型学习预测基于模态或批次身份的表达时，这些偏差被隐式地从基因和细胞表示本身中移除，这是一种便捷的批校正技术。

以多组学整合为例，拼接transformer输出和模态以及批次的embedding，作为下游微调目标的输入： $h'^{(i)}_{n}=concat(h^{(i)}_{n},emb_{b}(t_{b}^{(i)})+emb_{m}(t_{m}^{(i)}))$ 其中， $emb_{b}$ 和 $emb_{m}$ 为批次和模态的embedding层。

对于批次整合，将批次embedding与细胞表示拼接，得到下游的输入为： $h'^{(i)}_{c}=concat(h^{(i)}_{c},emb_{b}(t_{b}^{(i)}))$

生成式预训练

在模型训练之前，表达值被归一化、对数变换。为了加快训练速度，将输入限制为每个输入细胞的非零表达基因（这就是gene token唯一性带来的优势）。该策略为随后的微调阶段提供了有用的预训练结果，在此阶段默认包括所有非零表达的基因。

自注意力被广泛用于捕获token之间的共现模式。在自然语言处理中，这主要通过两种方式实现：

在BERT中使用掩码token，在模型的输出中预测输入序列中的随机掩码token；
在Transformer解码器模型（如OpenAI GPT系列）中具有顺序预测的自回归模型。

OpenAI GPT3和GPT4中使用的生成式预训练采用统一的框架，其中模型从已知输入token组成的"提示符"（prompt）中预测最有可能的下一个token。该框架提供了很大的灵活性，可用于各种自然语言生成应用，并展示了诸如zero-shot和few-shot设置中的上下文感知新功能。作者认为生成式训练可以以类似的方式对单细胞模型有益。具体来说，对两个任务感兴趣：

基于已知基因表达生成未知基因表达值，即通过"gene prompts"生成；
在给定输入细胞类型条件下生成全基因组表达，即通过"cell prompts"生成。

尽管使用了类似的token和prompt，但由于数据的无序性质，对gene read count进行建模与自然语言本质上是不同的。与句子中的单词不同，细胞内基因的顺序是可以互换的，并且没有"下一个基因"这种概念可以预测。这使得直接在单细胞中应用GPT模型具有挑战性。为了应对这一挑战，作者为scGPT开发了一种专门的注意力机制，该机制根据注意力得分定义了预测的顺序。

scGPT的注意力掩码以统一的方式支持基因提示（gene prompts）和细胞提示（cell prompts）。将二元注意力掩码应用于Transformer块的自注意力图。对于输入 $h_{l}^{(i)}\in R^{M\times D}$ （ $M$ 个token），transformer block生成 $M$ 个query和key vectors去计算注意力图 $A\in R^{M\times M}$ ，注意力掩码也是 $M\times M$ 的。可视化的注意力mask见图S1-A，与掩码每一列相关联的token标识标注在图的底部，即 $< c l s >$ 、已知基因和未知基因。 $h_{l}^{(i)}$ 中的每个token都可以是这三组中的一组：

用于表示细胞的 $< c l s >$ ；
已知基因的token embedding；
未知基因（其表达值expression values需要预测）；

scGPT的mask attention的法则是只允许在"已知基因"的embedding和查询基因本身之间进行注意计算。在每一代迭代中，scGPT预测一组新基因的基因表达值。这些基因依次成为下一次注意力计算迭代的"已知基因"。

如图S1-A所示，在训练过程中，从输入基因中随机选择一个比例作为未知基因，因此在输入中省略其表达值。对这些未知基因的查询，只允许对已知基因和查询基因本身进行注意力计算（比如图S1-A中的蓝色mask不是一个正方形减少的形式，而是逐渐压缩的矩形）。例如，在位置M预测的基因与细胞embedding的注意力得分，是用已知的基因和它自己，而不是其他未知的基因。推理步骤在图S1-B中说明。在细胞提示生成的推断过程中，scGPT生成了所有基于特定细胞类型的全基因组基因表达。

图S1：scGPT的注意力mask。

基本的微调目标

基因表达预测GEP

在每个细胞内，基因子集和对应的表达值被随机mask。scGPT可以准确预测mask位置的表达值。这种微调目标有利于模型有效编码数据集中基因之间的共表达。具体来说，使用一个全连接的MLP来估计基因 $M$ 在Transformer输出上的表达值。GEP优化的目标为： $\widetilde{x}^{(i)}=MLP(h_{n}^{(i)})$ $L_{GEP}=\frac{1}{|M_{mask}|}\sum_{j\in M_{mask}}ce(\widetilde{x}_{j}^{(i)},x_{j}^{(i)})$ 其中， $M_{mask}$ 表示掩码的位置， $\widetilde{x}^{(i)}\in N^{M}$ 表示细胞 $i$ 的表达估计， $ce$ 为交叉熵，注意，在整合任务中，用 $h_{n}'^{(i)}$ 代替 $h_{n}^{(i)}$ 。

GEP提出了一个通用的自监督微调目标，旨在预测基因表达值。在某些下游任务中，例如扰动预测，需要预测被扰动的基因表达值，而不是原始值。把这种任务称为perturb-GEP。在perturb-GEP中，预测的表达式值被应用于所有有效的目标位置，而不仅仅是GEP中的屏蔽位置。

基于细胞的GEP（GEPC）

该目标与GEP类似，但是需要根据细胞表示 $h_{c}^{(i)}$ 来预测基因表达值，对于细胞 $i$ 的每个基因 $j$ ，创建一个query向量 $q_{j}$ ： $q_{j}=MLP(emb_{g}(t_{g}^{(i)}))$ $\widetilde{x}_{j}^{(i)}=q_{j}\cdot Wh_{c}^{(i)}$ $L_{GEPC}=\frac{1}{|M_{mask}|}\sum_{j\in M_{mask}}ce(\widetilde{x}_{j}^{(i)},x_{j}^{(i)})$ 同样的，对于整合任务，使用 $h_{c}'^{(i)}$ 代替 $h_{c}^{(i)}$ 。

细胞相似度学习ECS

这种学习可以增强细胞表示： $L_{ECS}=-(sim(h_{c}^{(i)},h_{c}^{(i')})-\beta)^{2}$ 其中， $s im$ 表示余弦相似度函数， $i$ 和 $i^{'}$ 为mini-batch中的两个细胞， $β$ 表示预定义的阈值。

细胞分类CLS

这个调优目标旨在利用学习到的细胞表示来注释细胞。使用一个单独的MLP分类器从细胞表示 $h_{c}^{(i)}$ 中预测细胞类型。该微调目标在预测的细胞类型概率和真值标签之间使用交叉熵损失进行优化。

scGPT在下游任务的微调

批次整合

在批次整合中，预先训练的基础模型与当前数据集之间的公共基因token集被保留，进一步从公共基因集中选择高变基因作为输入，基因表达值在模型训练前进行归一化、对数变换。使用预训练的模型权值初始化微调模型。所有gene token，不管表达值是zero还是non-zero，都被用于微调。上一节的基本的微调目标中的GEP，GEPC，ECS被同时优化。

细胞类型注释

对于细胞类型标注任务，在一个reference数据集上使用GT标签对模型进行了微调，并在一个外部query数据集上验证标注性能。保留了预训练的基础模型和reference集之间的公共基因token集。在模型训练之前对表达值进行预处理。使用预训练的模型权值初始化微调模型。所有表达值为zero和non-zero的基因token都用于训练。CLS微调目标用于最小化分类损失。

多组学整合

scMultiomic数据可能在每个批次中包含种不同的测序模态，这对集成分析提出了更具挑战性的方案。scMultiomic分为两种数据集成设置，配对（paired）和镶嵌（mosaic）。在配对设置中，所有样本（细胞）共享测序的所有数据模态。在镶嵌设置中，一些样本共享一些公共数据模态，但不是全部。

由于存在额外的ATAC或蛋白质token，需要从头开始训练额外的token嵌入和模型的其余部分。在训练中使用了所有同时具有zero和non-zero表达值的token。scGPT使用了额外的模态token来指示每个token的数据类型（即基因、区域，蛋白质），用于促进GEP和GEPC微调目标中的mask基因和表达值预测。在配对设置下，采用GEP和GEPC两种微调目标对模型进行优化。在mosaic设置中，DAR（Domain Adaptation via Reverse Back-propagation）被包括在内，以方便多模态批次校正。

基因网络推断

在zero-shot设置下，基于余弦相似度从scGPT模型的基因嵌入中提取基因相似度网络。在经过微调的设置中，作者以与免疫人类数据集上经过微调的scGPT模型类似的方式构建了基因网络。根据Ceglia等人的管道，进一步从包含5个或更多基因的基因嵌入簇中提取基因。

结果

scRNA-seq批次整合

在单细胞测序数据的聚类和可视化中，存在来自多个数据集或测序批次的批次效应。通过采用微调工作流程，scGPT框架有效地解决了这个挑战，通过引入定制的微调目标，可以成功纠正批次效应，同时保留了数据中固有的真实生物学信号。scGPT在批次校正后保持集成数据的生物差异方面取得了最先进的性能。

作者在两个集成数据集Immune Human（10个批次）和PBMC 10K（2个批次）上对scGPT与三种流行的集成方法scVI、Seurat和Harmony进行了基准测试。如图2A所示，在Immune Human数据集中，scGPT成功地将所有CD4+ T细胞、CD8+ T细胞和CD14+单核细胞的批次集成到各自的聚类中，而Seurat在这些细胞类型中产生了一些对应于测序批次的亚聚类。scGPT还成功将单核细胞源性树突状细胞与CD16+单核细胞分开，而scVI和Harmony两者之间这两个聚类有明显的重叠。此外，在PBMC 10K数据集中，scGPT是唯一能清楚地将细胞类型与注释的聚类分离开来的方法。相比之下，scVI、Seurat和Harmony都将此其他细胞类型与CD14+单核细胞和CD8 T细胞混淆。scGPT的优越聚类性能也体现在生物保留分数上，其中scGPT的AvgBIO分数为0.812，比Seurat和Harmony高5％，比另一种深度学习方法scVI高10％。在图2C中，scGPT在所有细胞类型聚类指标中都表现出竞争力，这归功于其生物保留性。考虑到生物保留性和批次校正性能，scGPT在总体指标中也排名靠前。

图2a：用scVI、Seurat和Harmony在不同数据集上对scGPT模型（Few shot）进行批集成后的细胞类型聚类性能测试。
b：Few shot和从头训练的scGPT模型基因嵌入图谱的比较。每种细胞类型的高变基因被突出显示。在从头开始训练的scGPT模型中学习到的细胞嵌入的UMAP图被可视化见右。
c：批次整合的定量评价。

细胞类型注释

细胞类型注释是在聚类之后的单细胞分析中至关重要的一步，它解决了测序组织中的异质性问题，并为进一步研究细胞和基因功能提供了基础，以获得生物学和病理学的见解。虽然已经有了几种细胞注释方法，如cellAssign、singleR和Chetah，但它们通常需要在模型输入之前进行降维，这可能会导致信息丢失。相比之下，scGPT的Transformer模型可以直接以无偏的方式接受基因表达数据作为输入，并对整个高变基因集进行全面的分析。这种方法提供了更高的可靠性和改进的细胞类型分类准确性。针对细胞类型注释任务，作者使用交叉熵损失对预训练的scGPT模型进行了微调，以便根据新的参考数据集的真实标签进行训练。以人胰腺细胞数据集为例，作者在参考集上训练了scGPT模型，并在不同的查询集上验证了分类性能。图3A和B显示了通过真实标签与预测的细胞类型着色的细胞特征，scGPT模型展现出高达96.7%的准确性得分。该模型在预测大多数细胞类型方面也表现出较高的精度，除了参考集中细胞数量极低的稀有细胞类型（见图3C）。

图3：细胞类型注释

多组学整合

单细胞多组学（scMultiomic）数据一次性提供了多个遗传调控视图，包括表观遗传学、转录组学和翻译活性。它为增强特征和细胞表示学习提供了丰富的机会。然而，挑战在于如何可靠地聚合来自多个视图的细胞表示，同时保留生物信号。

scGPT框架可以轻松扩展到集成多个测序数据模态。scMulti-omic数据中的每种组学类型（例如基因表达、染色质可及性和蛋白质丰度）类似于NLG中的不同语言。类似地，scGPT支持从不同测序模态联合优化多组学token。该框架还允许通过扩展"词汇表"无缝添加新的测序模态到现有的预训练网络中。在基准实验中，与现有的最先进方法相比，scGPT在细胞表示学习和多组学批次集成任务中展现出出色的性能（见图4）。

图4：多组学整合

基因网络推断

转录因子、辅因子和靶基因之间的相互作用构成了基因调控网络(Gene Regulatory Network, GRN)，介导着重要的生物过程。现有的GRN推断方法通常依赖于静态基因表达的相关性或伪时间估计作为因果图的替代。通过基因标记的生成式训练，scGPT隐式地编码了这些关系在其基因特征中。因此，可以应用scGPT展示从其基因特征网络中分组功能相关基因并区分功能不同基因的能力。在图5A中，作者展示了经过预训练的基因特征网络中人类白细胞抗原（Human Leukocyte Antigens, HLA）的相似性网络。在零样本设置下，scGPT模型突出显示了两个与两个经过充分研究的触发不同免疫反应的HLA类别对应的聚类，即HLA类I和HLA类II。HLA类I抗原HLA-A、C和E被CD8+ T细胞识别以介导细胞杀伤，而HLA类II抗原HLA-DR、DP和DQ被CD4+ T细胞识别以触发更广泛的辅助功能。对于在免疫人类数据集上进行微调的scGPT模型，作者探索了与该数据集中存在的免疫细胞类型特定的CD抗原网络（见图5C）。预训练的scGPT能够将CD3E、D和G基因识别为编码T细胞激活的T3复合物，将CD79A和B识别为B细胞信号传导，将CD8A和B识别为HLA类I分子的共受体。通过微调的scGPT进一步突出了CD36和CD14之间的关联，它们是单核细胞和巨噬细胞的marker。这证明了scGPT从预训练中学到的知识的泛化能力，并提取了与微调数据集相关的具体信息。

图5：基因网络推断

Java力扣题解：169 多数元素——投票法早起之王 leetcode leetcode
题目给定一个大小为n的数组，找到其中的多数元素。多数元素是指在数组中出现次数大于⌊n/2⌋的元素。你可以假设数组是非空的，并且给定的数组总是存在多数元素。来源：力扣（LeetCode）链接：https://leetcode-cn.com/problems/majority-element著作权归领扣网络所有。商业转载请联系官方授权，非商业转载请注明出处。分析这里的投票法，是以第一个元素为基准数，票
如何运用python爬虫获取大型资讯类网站文章，并同时导出pdf或word格式文本？大懒猫软件深度学习 python 网络爬虫自然语言处理
这里，我们以比较知名的商业新知网站https://www.shangyexinzhi.com/为例进行代码编写，下面进行代码应用思路。第一部分，分析网站结构首先，我们来分析，要使用Python技术分析一个网站的结构，通常可以通过以下步骤实现：获取网站的HTML内容：使用requests库来获取网站的HTML源代码。解析HTML内容：使用BeautifulSoup库来解析HTML，提取网站的结构信息
LeetCode 21. 合并两个有序链表链表合并 Java实现 Lentr0py LeetCode 算法题 leetcode 链表 java 算法数据结构
21.合并两个有序链表21.合并两个有序链表题目来源题目分析题目难度题目标签题目限制解题思路思路：核心算法步骤迭代法代码实现代码解读性能分析复杂度结果测试用例扩展讨论优化写法其他实现总结21.合并两个有序链表题目来源21.合并两个有序链表题目分析将两个升序链表合并为一个新的升序链表并返回。新链表是通过拼接给定的两个链表的所有节点组成的。题目难度难度：简单题目标签标签：链表题目限制两个链表的节点数目
【大模型】ChatGPT 创作各类高质量文案使用详解小码农叔叔 AI大模型实战与应用 ChatGPT文案创作 ChatGPT文案创作详解 ChatGPT文案创作技巧 ChatGPT数据分析 ChatGPT生成PPT
目录一、前言二、ChatGPT文案创作的优势三、ChatGPT各类文案创作操作实战3.1ChatGPT创作产品文案3.1.1ChatGPT创作产品文案基本思路3.1.2ChatGPT创作产品文案案例一3.1.2.1操作过程3.1.3ChatGPT创作产品文案案例二3.2ChatGPT创作视频脚本3.2.1ChatGPT创作视频脚本基本思路3.2.2ChatGPT创作视频脚本案例一3.3ChatGP
周报管理系统大霸王龙行业+领域+业务场景=定制 python microsoft ascii 文本处理
代码仓库产品名称：智汇周报管理系统主要功能：自动化报告生成：智汇周报管理系统能够自动收集项目进展、任务完成情况、团队成员工作日志等关键数据，基于预设模板或用户自定义模板，一键生成周报。支持多格式导出（如Word、PDF、Excel），满足不同场景下的报告需求。智能数据分析与可视化：系统内置强大的数据分析引擎，能够自动对收集到的数据进行统计分析，如任务完成率、进度延误情况、成员工作负荷等，并通过图表
GPT-4、GPT-4O 和 GPT-4O-mini 的区别与联系 surfirst LLM ai 语言模型 chatgpt
简介近年来，人工智能技术飞速发展，特别是在自然语言处理领域。GPT-4是OpenAI推出的新一代大模型，而GPT-4O和GPT-4O-mini是其优化版本，专门为不同应用场景和计算资源需求进行调整。在这篇文章中，我们将详细比较GPT-4、GPT-4O和GPT-4O-mini的区别与联系，帮助开发者更好地选择适合的模型。GPT-4是OpenAI发布的第四代通用预训练模型，具备强大的生成和理解能力，适
如何获取股票行情数据接口？有哪些可靠的途径与方法？财云量化 python炒股自动化量化交易程序化交易股票行情数据接口可靠途径官方渠道股票量化接口股票API接口
炒股自动化：申请官方API接口，散户也可以python炒股自动化（0），申请券商API接口python炒股自动化（1），量化交易接口区别Python炒股自动化（2）：获取股票实时数据和历史数据Python炒股自动化（3）：分析取回的实时数据和历史数据Python炒股自动化（4）：通过接口向交易所发送订单Python炒股自动化（5）：通过接口查询订单，查询账户资产股票量化，Python炒股，CSDN
怎么利用商品详情 API 接口实现数据获取与应用？前端后端运维数据挖掘api
在电商蓬勃发展的时代，数据成为了驱动业务增长的关键要素。对于电商从业者、开发者以及数据分析爱好者而言，获取商品详情数据并加以有效应用，是实现精准营销、优化用户体验、提升运营效率的重要途径。商品详情API接口就像是一把钥匙，为我们打开了获取海量商品数据的大门。本文将深入探讨如何利用商品详情API接口实现数据的获取与应用，并通过丰富的代码示例，帮助大家更好地理解和实践。一、理解商品详情API接口API
LSP介绍并实现语言服务 lsp编程语言ide
首发于Enaium的个人博客LSP(LanguageServerProtocol)介绍前段时间我为JimmerDTO实现了一个LSP的语言服务，这是我第一次实现LSP，所以在这里我分享一下我实现LSP的经验。首先来看一下效果，图片太多，我就放一部分，更多的可以看jimmer-dto-lspLSP是一种协议，用于在IDE和语言服务器之间通信。IDE通过LSP请求语言服务器提供代码分析服务，语言服务器
Swift 周报第二十八期 Swift社区 Apple周刊 swift 开发语言 ios
文章目录前言新闻和社区外媒：iPhone的平均售价直逼1000美元创历史新高分析师：iPhone需求良好，苹果股价还能涨22%准备好迎接即将在5月9日推出的增强全球定价机制提案通过的提案正在审查的提案Swift论坛推荐博文话题讨论关于我们前言本期是Swift编辑组自主整理周报的第十九期，每个模块已初步成型。各位读者如果有好的提议，欢迎在文末留言。欢迎投稿或推荐内容。目前计划每两周周一发布，欢迎志同
第72期 | GPTSecurity周报云起无垠 GPTSecurity 人工智能安全
GPTSecurity是一个涵盖了前沿学术研究和实践经验分享的社区，集成了生成预训练Transformer（GPT）、人工智能生成内容（AIGC）以及大语言模型（LLM）等安全领域应用的知识。在这里，您可以找到关于GPT/AIGC/LLM最新的研究论文、博客文章、实用的工具和预设指令（Prompts）。现为了更好地知悉近一周的贡献内容，现总结如下。SecurityPapers1.从孤立指令到互动鼓
Session+Redis，Token+Redis，JWT+Redis，用户身份认证，到底选择哪种更合适？简学云资源平台 Java技术 #Redis redis java
1三中方案的比较在选择Session+Redis、Token+Redis、JWT+Redis这三种用户身份认证方案时，我们需要考虑各自的优势、劣势以及应用场景。以下是对这三种方案的详细分析和比较：1.Session+Redis优势：Session登录是一种在Web应用程序中用于跟踪用户状态的机制，通过在服务器端存储会话信息，可以确保用户只需一次登录，并在整个会话期间保持登录状态。使用Redis作为
【2024校招总结帖】数据分析、面试经验、心得体会分享 huaxinjiayou java
首航新能源，一进来就开始大批裁员工作节奏比较快，公司对员工的加班要求也比较严格，而且没有加班费，缺乏福利待遇。另外，公司裁员频繁，而阿里国际一面面经吹爆阿里国际面试官，比某些自以为是的面试官好太多了，面试还不开摄像头。写题的时候，我问他要开摄像头吗鼠人传（第五十二集，2024/4/30）刷题：补昨天的C、MinimizingtheSum，定义dp[i][j]为长度i，使用最多j次可2024西山居S
沃尔玛礼品卡绑定分析 2766958292 java node go python php 沃尔玛沃尔玛礼品卡绑定
声明:本文章中所有内容仅供学习交流使用，不用于其他任何目的，抓包内容、敏感网址、数据接口等均已做脱敏处理，严禁用于商业用途和非法用途，否则由此产生的一切后果均与作者无关！逆向分析部分代码参考funcdoPostRequest(urlstring,headersmap[string]string,body[]byte)(*http.Response,error){req,err:=http.NewR
python爬取自如网房源信息 2401_87368790 python 开发语言
本次爬取自如网房源信息所用到的知识点:requestsget请求lxml解析htmlXpathMongoDB存储正文分析目标站点url:http://hz.ziroom.com/z/nl/z3.html?p=2的p参数控制分页get请求获取单页源码--coding:utf-8--importrequestsimporttimefromrequests.exceptionsimportRequest
9.1 GPTs 应用商店介绍：解锁定制化 AI 的无限潜能少林码僧 AI大模型应用实战专栏人工智能 chatgpt
GPTs应用商店介绍：解锁定制化AI的无限潜能引言：迈入AI应用的新时代随着OpenAI的GPT模型不断进化，GPTs应用商店的推出标志着AI定制化的一个新纪元。它是一个开放平台，允许用户轻松创建、共享和探索各种定制化GPT应用程序。无论是自动化日常任务、提供行业解决方案，还是开发个性化的智能助手，GPTs应用商店都提供了强大的支持，让AI成为每个人触手可及的工具。1.什么是GPTs应用商店？GP
java.sql.Date 弃用分析与替代方案蓝田～ java microsoft
引言java.sql.Date是Java标准库中的一个类，它继承自java.util.Date，主要用于在Java应用程序与数据库之间进行日期数据的传输。然而，随着Java语言的发展，java.sql.Date以及其父类java.util.Date逐渐被认为存在设计缺陷，并被新的日期时间API所替代。本文将对java.sql.Date的启用原因进行分析，并探讨其弃用原因及替代方案。启用原因分析SQ
Coze，Dify，FastGPT，对比云连山 AI编程 AI编程
在当今AI技术迅速发展的背景下，AIAgent智能体成为了关键领域，Coze、Dify和FastGPT作为其中的佼佼者，各有千秋。平台介绍-FastGPT：由环界云计算公司发起，是基于大语言模型（LLM）的开源知识库问答系统。其亮点是支持Flow可视化工作流编排，在知识问答领域表现出色，拥有庞大用户群体，包括数百家企业付费客户等。网址为https://fastgpt.cn/。-Dify：苏州语灵人
npm:升级自身时报错:EBADENGINE 落日弥漫的橘_ Node.js npm 前端 node.js
具体报错信息如下：1.原因分析npm和当前的node版本不兼容。//当前实际版本:Actual:{"npm":"10.2.4","node":"v20.11.0"}可以通过官网文档查看与自己node版本兼容的是哪一版本的npm，相对应进行更新即可：Node.js—Node.js版本2.解决方法升级一下node版本。//需要node的版本号为^20.17.0以上，Required:{"node":"
【黑龙江乡镇界】面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移内容测评鸿业远图科技 arcgis
本文将详细讲解与“最新黑龙江乡镇界面图层arcgis数据shp格式乡镇名称和编码wgs84无偏移”相关的知识点，包括GIS基础、ArcGIS软件、SHP文件格式、WGS84坐标系统以及乡镇行政数据的重要性。GIS基础GIS（GeographicInformationSystem，地理信息系统）是一种用于采集、存储、管理、分析和展示所有类型地理数据的系统。它整合了地图、数据库、统计分析和计算机图形等
ROS学习（5）可视化和调试工具一敲代码的雪糕 ROS ROS
文章目录前言一、调试ROS节点1、使用gdb调试器调试节点2、在节点启动时调用gdb调试器3、在节点启动时调用valgrind分析节点4、设置ROS节点core文件存储二、日志消息1.输出日志消息2.调试消息级别3.为特定节点配置调试消息级别4.消息命名5.按条件显示消息与过滤消息6.显示消息的方式7.使用rqt_console和rqt_logger_level在运行时修改调试级别总结前言ROS自
【Kafka：概念、架构与应用】三日看尽长安花系统架构师 kafka 架构分布式
Kafka：概念、架构与应用目录什么是KafkaKafka的核心概念2.1生产者（Producer）2.2消费者（Consumer）2.3主题（Topic）2.4分区（Partition）2.5消息偏移量（Offset）2.6消费组（ConsumerGroup）Kafka的架构设计3.1Broker与集群3.2Zookeeper的作用Kafka的工作流程Kafka的应用场景Kafka的优缺点分析<
AI-知识库搭建（一）腾讯云向量数据库使用 CJ点人工智能 GPT 向量数据库知识库
一、AI知识库将已知的问答知识，问题和答案转变成向量存储在向量数据库，在查找答案时，输入问题，将问题向量化，匹配向量库的问题，将向量相似度最高的问题筛选出来，将答案提交。二、腾讯云向量数据库向量数据库_大模型知识库_向量数据存储_向量数据检索-腾讯云腾讯云向量数据库（TencentCloudVectorDB）是一款全托管的自研企业级分布式数据库服务，专用于存储、检索、分析多维向量数据。该数据库支持
PyQt6医疗多模态大语言模型（MLLM）实用系统框架构建初探（下.代码部分） Allen_LVyingbo 医疗高效编程研发 python 健康医疗 python pyqt 语言模型人工智能
医疗MLLM框架编程实现本医疗MLLM框架结合Python与PyQt6构建，旨在实现多模态医疗数据融合分析并提供可视化界面。下面从数据预处理、模型构建与训练、可视化界面开发、模型-界面通信与部署这几个关键部分详细介绍编程实现。6.1数据预处理在医疗MLLM框架中，多模态数据的预处理是非常关键的一步，它直接影响到后续模型的训练效果和性能。我们需要对医学影像、文本数据和音频数据分别进行预处理，以确保数
【Python】红旗超市线下缴电费用户数据分析及可视化（pandas+pyecharts）风度78 百度人工智能 python 机器学习数据分析
场景分析：一部分用户习惯在红旗超市线下进行缴电费，电力公司希望了解哪些用户喜欢到线下缴费，具体分布在哪里，才能有针对性地宣传掌上电力app引导用户体验更高效的线上缴费方式，提升用户满意度。需求分析：首先要拿到红旗超市线下缴费清单数据，对所有数据进行隐私化处理，数据预览如图所示：可以看出台区名称为本项目的核心字段，通过台区匹配到经纬度信息，然后利用经纬度信息进行线下缴费热力图展示。同时可以提供分析报
【SpringBoot 框架】- SpringBoot 配置文件 2401_84408404 程序员 spring boot java spring
【SpringBoot框架】-入门——环境搭建、工程热部署、idea快捷创建SpringBoot项目【SpringBoot框架】-SpringBoot原理分析【SpringBoot框架】-SpringBoot配置文件【SpringBoot框架】-SpringBoot整合Mybatis、Junit、Redis目录一、SpringBoot配置文件类型1.application.properties配置
【postgresql初级使用】在表的多个频繁使用列上创建一个索引，多条件查询优化，多场景案例揭示索引失效韩楚风 postgresql 数据库 sql database
多列索引专栏内容：postgresql使用入门基础手写数据库toadb并发编程个人主页：我的主页管理社区：开源数据库座右铭：天行健，君子以自强不息；地势坤，君子以厚德载物.文章目录多列索引概述多列索引创建创建语法创建说明案例分析创建数据创建索引带首列查询不带首列查询总结结尾概述
通过ChatGPT使用Mermaid.js生成时间序列图、组织结构图等百态老人生成式AI 经验分享前端人工智能
1、用mermaid.js生成京东网站改版时间序列图以下是使用Mermaid.js生成的京东网站改版时间序列图：gantttitle京东网站改版时间序列图dateFormatYYYY-MM-DDsection基础功能改版登录注册界面:done,2018-01-15,10d购物车页面优化:done,2018-02-10,10d商品详情页改版:done,2018-03-15,15d收银台页面改版:do
ECharts：数据可视化的魔法师，偶尔也会“皮”一下 Python私教 Web 使用Vue3进行前端开发 Vue 信息可视化 echarts 前端
在数据爆炸的时代，如何从海量数据中提取有价值的信息，并将其清晰易懂地呈现出来，成为了各行各业面临的共同挑战。数据可视化作为一种有效的信息传递手段，应运而生，并逐渐成为数据分析领域不可或缺的一部分。而在众多数据可视化工具中，ECharts凭借其强大的功能、灵活的配置和丰富的图表类型，脱颖而出，成为了众多开发者的首选利器。一、ECharts：数据可视化的利器ECharts是一个由百度开源的可视化图表库
如何应对访问国外服务器缓慢的问题？SDWAN组网是性价比之选蓝讯小刘服务器运维
在全球化日益加深的今天，企业经常需要访问国外的服务器以进行远程办公、跨国业务处理、数据传输和视频会议等。然而，不少企业在使用中遇到了访问速度缓慢的问题。本文将介绍几种有效的解决方案，帮助提高访问效率。首先，我们来分析一下访问缓慢的原因：1.政策限制：为了维护国家网络的安全与稳定，我国对部分国外网站和服务器有一定的访问限制。2.技术障碍：国内与国际互联网的网络架构和协议存在差异，这可能导致数据传输不
html 周华华 html
js 1，数组的排列 var arr=[1,4,234,43,52,]; for(var x=0;x<arr.length;x++){ for(var y=x-1;y<arr.length;y++){ if(arr[x]<arr[y]){ &
【Struts2 四】Struts2拦截器 bit1129 struts2拦截器
Struts2框架是基于拦截器实现的，可以对某个Action进行拦截，然后某些逻辑处理，拦截器相当于AOP里面的环绕通知，即在Action方法的执行之前和之后根据需要添加相应的逻辑。事实上，即使struts.xml没有任何关于拦截器的配置，Struts2也会为我们添加一组默认的拦截器，最常见的是，请求参数自动绑定到Action对应的字段上。 Struts2中自定义拦截器的步骤是：
make:cc 命令未找到解决方法 daizj linux 命令未知 make cc
安装rz sz程序时，报下面错误： [root@slave2 src]# make posix cc -O -DPOSIX -DMD=2 rz.c -o rz make: cc：命令未找到 make: *** [posix] 错误 127 系统：centos 6.6 环境：虚拟机错误原因：系统未安装gcc，这个是由于在安
Oracle之Job应用周凡杨 oracle job
最近写服务，服务上线后，需要写一个定时执行的SQL脚本，清理并更新数据库表里的数据，应用到了Oracle 的 Job的相关知识。在此总结一下。一：查看相关job信息 1、相关视图 dba_jobs all_jobs user_jobs dba_jobs_running 包含正在运行
多线程机制朱辉辉33 多线程
转至http://blog.csdn.net/lj70024/archive/2010/04/06/5455790.aspx 程序、进程和线程：程序是一段静态的代码，它是应用程序执行的蓝本。进程是程序的一次动态执行过程，它对应了从代码加载、执行至执行完毕的一个完整过程，这个过程也是进程本身从产生、发展至消亡的过程。线程是比进程更小的单位，一个进程执行过程中可以产生多个线程，每个线程有自身的
web报表工具FineReport使用中遇到的常见报错及解决办法（一）老A不折腾 web报表 finereport java报表报表工具
FineReport使用中遇到的常见报错及解决办法（一）这里写点抛砖引玉，希望大家能把自己整理的问题及解决方法晾出来，Mark一下，利人利己。出现问题先搜一下文档上有没有，再看看度娘有没有，再看看论坛有没有。有报错要看日志。下面简单罗列下常见的问题，大多文档上都有提到的。 1、address pool is full：含义：地址池满，连接数超过并发数上
mysql rpm安装后没有my.cnf 林鹤霄没有my.cnf
Linux下用rpm包安装的MySQL是不会安装/etc/my.cnf文件的，至于为什么没有这个文件而MySQL却也能正常启动和作用，在这儿有两个说法，第一种说法，my.cnf只是MySQL启动时的一个参数文件，可以没有它，这时MySQL会用内置的默认参数启动，第二种说法，MySQL在启动时自动使用/usr/share/mysql目录下的my-medium.cnf文件，这种说法仅限于r
Kindle Fire HDX root并安装谷歌服务框架之后仍无法登陆谷歌账号的问题 aigo root
原文：http://kindlefireforkid.com/how-to-setup-a-google-account-on-amazon-fire-tablet/ Step 4: Run ADB command from your PC On the PC, you need install Amazon Fire ADB driver and instal
javascript 中var提升的典型实例 alxw4616 JavaScript
// 刚刚在书上看到的一个小问题,很有意思.大家一起思考下吧 myname = 'global'; var fn = function () { console.log(myname); // undefined var myname = 'local'; console.log(myname); // local }; fn() // 上述代码实际上等同于以下代码 m
定时器和获取时间的使用百合不是茶时间的转换定时器
定时器:定时创建任务在游戏设计的时候用的比较多 Timer();定时器 TImerTask();Timer的子类由 Timer 安排为一次执行或重复执行的任务。定时器类Timer在java.util包中。使用时，先实例化，然后使用实例的schedule(TimerTask task, long delay)方法，设定
JDK1.5 Queue bijian1013 java thread java多线程 Queue
JDK1.5 Queue LinkedList： LinkedList不是同步的。如果多个线程同时访问列表，而其中至少一个线程从结构上修改了该列表，则它必须保持外部同步。（结构修改指添加或删除一个或多个元素的任何操作；仅设置元素的值不是结构修改。）这一般通过对自然封装该列表的对象进行同步操作来完成。如果不存在这样的对象，则应该使用 Collections.synchronizedList 方
http认证原理和https bijian1013 http https
一.基础介绍在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式，用的端口也不一样,前者是80，后
【Java范型五】范型继承 bit1129 java
定义如下一个抽象的范型类，其中定义了两个范型参数，T1，T2 package com.tom.lang.generics; public abstract class SuperGenerics<T1, T2> { private T1 t1; private T2 t2; public abstract void doIt(T
【Nginx六】nginx.conf常用指令(Directive) bit1129 Directive
1. worker_processes 8; 表示Nginx将启动8个工作者进程，通过ps -ef|grep nginx,会发现有8个Nginx Worker Process在运行 nobody 53879 118449 0 Apr22 ? 00:26:15 nginx: worker process
lua 遍历Header头部 ronin47 lua header 遍历　
local headers = ngx.req.get_headers() ngx.say("headers begin", "<br/>") ngx.say("Host : ", he
java-32.通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小(两数组的差最小)。 bylijinnan java
import java.util.Arrays; public class MinSumASumB { /** * Q32.有两个序列a,b，大小都为n,序列元素的值任意整数，无序. * * 要求：通过交换a,b中的元素，使[序列a元素的和]与[序列b元素的和]之间的差最小。 * 例如: * int[] a = {100,99,98,1,2,3
redis 开窍的石头 redis
在redis的redis.conf配置文件中找到# requirepass foobared 把它替换成requirepass 12356789 后边的12356789就是你的密码打开redis客户端输入config get requirepass 返回 redis 127.0.0.1:6379> config get requirepass 1) "require
[JAVA图像与图形]现有的GPU架构支持JAVA语言吗？ comsci java语言
无论是opengl还是cuda，都是建立在C语言体系架构基础上的，在未来，图像图形处理业务快速发展，相关领域市场不断扩大的情况下，我们JAVA语言系统怎么从这么庞大，且还在不断扩大的市场上分到一块蛋糕，是值得每个JAVAER认真思考和行动的事情
安装ubuntu14.04登录后花屏了怎么办 cuiyadll ubuntu
这个情况，一般属于显卡驱动问题。可以先尝试安装显卡的官方闭源驱动。按键盘三个键：CTRL + ALT + F1 进入终端，输入用户名和密码登录终端：安装amd的显卡驱动 sudo apt-get install fglrx 安装nvidia显卡驱动 sudo ap
SSL 与数字证书的基本概念和工作原理 darrenzhu 加密 ssl 证书密钥签名
SSL 与数字证书的基本概念和工作原理 http://www.linuxde.net/2012/03/8301.html SSL握手协议的目的是或最终结果是让客户端和服务器拥有一个共同的密钥，握手协议本身是基于非对称加密机制的，之后就使用共同的密钥基于对称加密机制进行信息交换。 http://www.ibm.com/developerworks/cn/webspher
Ubuntu设置ip的步骤 dcj3sjt126com ubuntu
在单位的一台机器完全装了Ubuntu Server，但回家只能在XP上VM一个，装的时候网卡是DHCP的，用ifconfig查了一下ip是192.168.92.128,可以ping通。转载不是错： Ubuntu命令行修改网络配置方法 /etc/network/interfaces打开后里面可设置DHCP或手动设置静态ip。前面auto eth0，让网卡开机自动挂载. 1. 以D
php包管理工具推荐 dcj3sjt126com PHP Composer
http://www.phpcomposer.com/ Composer是 PHP 用来管理依赖（dependency）关系的工具。你可以在自己的项目中声明所依赖的外部工具库（libraries），Composer 会帮你安装这些依赖的库文件。中文文档入门指南下载安装包列表 Composer 中国镜像
Gson使用四（TypeAdapter） eksliang json gson Gson自定义转换器 gsonTypeAdapter
转载请出自出处：http://eksliang.iteye.com/blog/2175595 一.概述 Gson的TypeAapter可以理解成自定义序列化和返序列化二、应用场景举例例如我们通常去注册时（那些外国网站），会让我们输入firstName，lastName,但是转到我们都
JQM控件之Navbar和Tabs gundumw100 html xml css
在JQM中使用导航栏Navbar是简单的。只需要将data-role="navbar"赋给div即可： <div data-role="navbar"> <ul> <li><a href="#" class="ui-btn-active&qu
利用归并排序算法对大文件进行排序 iwindyforest java 归并排序大文件分治法 Merge sort
归并排序算法介绍，请参照Wikipeida zh.wikipedia.org/wiki/%E5%BD%92%E5%B9%B6%E6%8E%92%E5%BA%8F 基本思想：大文件分割成行数相等的两个子文件，递归（归并排序）两个子文件，直到递归到分割成的子文件低于限制行数低于限制行数的子文件直接排序两个排序好的子文件归并到父文件直到最后所有排序好的父文件归并到输入
iOS UIWebView URL拦截啸笑天 UIWebView
本文译者：candeladiao，原文：URL filtering for UIWebView on the iPhone说明：译者在做app开发时，因为页面的javascript文件比较大导致加载速度很慢，所以想把javascript文件打包在app里，当UIWebView需要加载该脚本时就从app本地读取，但UIWebView并不支持加载本地资源。最后从下文中找到了解决方法，第一次翻译，难免有
索引的碎片整理SQL语句 macroli sql
SET NOCOUNT ON DECLARE @tablename VARCHAR (128) DECLARE @execstr VARCHAR (255) DECLARE @objectid INT DECLARE @indexid INT DECLARE @frag DECIMAL DECLARE @maxfrag DECIMAL --设置最大允许的碎片数量,超过则对索引进行碎片
Angularjs同步操作http请求with $promise qiaolevip 每天进步一点点学习永无止境 AngularJS 纵观千象
// Define a factory app.factory('profilePromise', ['$q', 'AccountService', function($q, AccountService) { var deferred = $q.defer(); AccountService.getProfile().then(function(res) {
hibernate联合查询问题 sxj19881213 sql Hibernate HQL 联合查询
最近在用hibernate做项目，遇到了联合查询的问题，以及联合查询中的N+1问题。针对无外键关联的联合查询，我做了HQL和SQL的实验，希望能帮助到大家。（我使用的版本是hibernate3.3.2） 1 几个常识：（1）hql中的几种join查询，只有在外键关联、并且作了相应配置时才能使用。（2）hql的默认查询策略，在进行联合查询时，会产
struts2.xml wuai struts
<?xml version="1.0" encoding="UTF-8" ?> <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configuration 2.3//EN" "http://struts.apache

基于GPT构建单细胞多组学基础模型

目录

背景

方法

Input embedding

scGPT

生成式预训练

基本的微调目标

基因表达预测GEP

基于细胞的GEP（GEPC）

细胞相似度学习ECS

细胞分类CLS

scGPT在下游任务的微调

批次整合

细胞类型注释

多组学整合

基因网络推断

结果

scRNA-seq批次整合

细胞类型注释

多组学整合

基因网络推断

你可能感兴趣的:(单细胞多组学分析,gpt)