焦糖关关

《Catalysis Clustering with GAN by Incorporating Domain Knowledge》论文精读分析

ABSTRACT

背景介绍：聚类是一种重要的无监督学习方法，在数据稀疏、高维的情况下，它面临着严峻的挑战。生成的集群通常用一般的方法进行评估，这对实际应用程序和领域可能没有意义或用处。聚类算法利用距离度量搜索数据空间，将接近的项分组到一个聚类中，并将远处的样本分配到不同的聚类中

提出问题: 1.在许多真实的应用程序中，维数很高，数据空间变得非常稀疏。选择一个合适的距离度量是非常困难的，当涉及分类数据时就更加困难。2.现有的距离度量大多是通用的，基于它们创建的集群对特定领域的应用程序不一定有意义

解决问题：将域定义的规则和指导方针集成到集群过程中。该文章提出了一种基于GAN的称为催化聚类的方法，将领域知识纳入聚类过程。

1.通过GAN生成催化剂，也就是从原始数据分布中提取的特殊合成点，并通过特定领域的度量（domain-specific metric）来验证提高聚类质量。

2.使用催化剂和实际数据进行聚类分析

3.最后的簇是催化剂点被移除后产生的

效果：在两个具有挑战性的真实数据集上的实验清楚地表明，文章称方法是有效的，可以生成对真实应用程序有意义和有用的聚类。(具体看后文)

INTRODUCTION

聚类分析将相似的项被分组在一起，不同的样本被分开。传统的方法如欧几里得距离或曼哈顿距离，依赖于基于距离的度量来衡量两个项目的相似或不同程度。

面临挑战：

1.当需要产生对领域应用程序有用的集群时，就会出现挑战。从特定领域或应用程序的角度来看，标准度量不一定反映样本相似性。

2.另一个挑战涉及到比较缺失自然排序的目标，比如分类数据。举例：两个有不同突变基因的肺癌患者对同种治疗的反应相似，他们有多相似?对于肿瘤专家分析这个问题，这两个病人应该属于同一个群。有效的合并领域知识代替通用指标可以生成对领域应用更有用的更好的集群。

3.现有的基于距离的聚类方法往往不能处理高维数据。其原因是高纬空间中的数据趋于几何稀疏，许多距离度量在高维空间中变得无效和没有意义。像PCA这样的通用技术并没有考虑到基于领域知识的特征的重要性，如果放弃重要的特征，一些样本将错误地在降维空间中更接近。

为解决上述挑战，文章提出一种新的聚类框架，称之为催化聚类Catalysis Clustering。

举例：假设有一组患者被诊断为肺癌，聚类算法将其分为三个聚类，如图。医生对结果进行分析，从医学角度来看，分配给c1类的三个方格具有与c3类相似的特征(治疗反应、生存率等)。

在催化聚类中，提出生成对抗网络生成合成数据点synthetic data points，再通过领域知识确定合成数据的有效性validity。***如何确定这种有效性？***如图，合成点为虚线表示和空心点。其中蓝色和绿色对聚类集群没有影响，红色的空心将错误聚类的三个方块与其余红色方块联系起来了，边界因此发生改变。

从结果看，并非所有的合成点是有用的，通过特定于领域的度量来评估。如果没有达到任何指标改进，那么无用的合成点就会被丢弃。这样可以生成与领域相关的集群。

优势：

该催化聚类框架可以与任何现有的聚类算法一起工作。作者认为，此方法首次将GAN生成数据用于聚类分析

主要贡献：

1.引入催化聚类框架，利用利用领域知识产生对领域应用有用的聚类，并且可以和任何现有的聚类算法一起工作。

2.如何评估GANs生成的数据在机器学习中仍然是一个严峻的挑战，而对于数字数据来说则更加困难。结合领域知识，作者开发了一种方法来评估GAN生成的数值数据的质量及其对聚类分析的有用性。

3.选择癌症分层现实应用来验证想法，实验结果表明有效性和实用性。

RELATED WORK

聚类分析是一种有效的探索性数据分析的有力工具，在数据挖掘中得到了广泛的研究，并在许多实际应用中得到了应用。举例：有论文使用k-means聚类聚类识别不同哮喘类型；有的论文使用Consensus clustering共识聚类回顾性鉴别重症监护病房患者。现有算法对距离度量依赖性太高，没有提供对领域应用有用的结果。DiSC试图将为每个样本提供的领域特定有用性分数纳入半监督降维聚类方法。

由于认识到一般聚类方法的局限性，近年来出现了许多领域特有的聚类算法，如用于跨多个癌症数据集聚类的CoINcIDE算法、用于基因突变聚类分析的Network-Based Stratification算法。

文章中的催化聚类框架，除了聚类算法，另一个重要组成是合成数据生成器，采用生成对抗网络，GAN可以通过两个神经网络捕获数据分布。

最近的工作包含：ClusterGAN支持在潜在空间进行聚类。CatGAN[28]训练其中一个网络将数据分类为预定义数量的类别。InfoGAN学习用于集群的解纠缠表示。面向任务的GAN解决了PolSAR图像解译的困难，利用特殊的网络T-Net完成某一任务。

区别：这些方法都将GAN合并到聚类过程中，但是此论文中只使用GANs学习底层数据分布，进一步生成合成点。

CATALYSIS CLUSTERING WITH GAN

催化聚类框架提高了聚类分析的实用性和质量，允许专家应用领域知识进行聚类分析，为特定领域的应用生成有用的聚类。

3.1 Problem formulation

假定一个数值数据集X，它的分布PX未知，k表示集群数量。k不是催化催化聚类框架所要求的，但可能是特定的聚类算法所要求的。假设选择了一个聚类算法Clust 和一个由专家设计的度量 M 来从领域角度评估 Clust 的性能。目标是找到一组集群{ X1, …,Xk},Xi⊂XandX1∩ · · · ∩Xk=空集：Clust(X)={X1, …,Xk} 这个使度量M最大化，优化问题定义为

3.2 Catalysis Clustering Architecture

上图是Catalysis Clustering的框架架构图，主要思路就是引入催化剂，即从真实数据分布生成的合成样本，来提高结果集群的有用性和质量。类似于化学中的催化剂，用于启动和提高质量，之后就被移除，即它们不参与最终聚类评估，把Catalysis Clustering 框架分为三个阶段：

1.使用GAN生成催化剂Catalyst。GAN 拟合数据分布 PX 以生成一组催化剂 C。生成的催化剂样本有两个要求：（1）必须遵循 GAN 确保的原始数据分布； (2) 他们必须按照领域知识的规定提高聚类质量。

2.Catalysis Clustering。对组合数据集XUC 执行聚类以获得{(X1UC1), …,(XkUCk)}。

3.评估。每个 Ci 从各自的集群中删除，{X1, …,Xk} 用度量 M 评估。集合 C 仅在聚类阶段使用，之后被忽略，因此只评估真实数据。

3.3 Stage 1: Catalyst generation with GAN 使用GAN生成催化剂Catalyst

合成采样的技术有SMOTE、Borderline-SMOTE和ADASYN。大多数现有方法试图在现有数据中填充代表性不足的类，以减少数据不平衡并提供平衡的数据集。此文章不同点在于将合成采样应用于整个数据，并且通过领域知识充分评估了这些合成样本的质量。只用于合成高质量样品，称之为催化剂。

定义一，催化剂：给定一个集合X，一个底层分布PX，聚合算法Clust和一个评估指标来最大化，一个合成点如果包含以下两个属性就是催化剂catalyst。

(1)c~PX

(2)M(S1)>M(S2),S1是X∪ {c}新集群分配，并且{c}被排除在最终分配之外，即S1=Clust(X∪ {c}) \ {c}。S2是X上的初始集群分配，即S2=Clust(X)。

为了满足第一条，作者采用了Goodfellow和其他人在文献【10】中介绍的生成对抗网络的变体。原始形式的GAN不需要任何关于数据的先验知识，学习从潜在空间映射到感兴趣的数据分布PX。为了实现这一点，GAN 使用了两个相互竞争的对抗模型：生成器 G 和判别器 D。G 的主要目标是捕获数据分布 PX 并生成与原始数据 X 相似的数据样本。同时，D 估计给定样本来自 PX 的概率。因此，生成器模型和鉴别器模型相互竞争，如公式 (2) 所述。

这里 V(D,G) 是一个值函数，x∈X 是一个数据样本，z 是一个噪声样本，Pz 是先验噪声分布。D(·)和G(·)分别是鉴别器函数和生成器函数。D(·) 返回样本为真 (D(·)=1) 或假 (D(·)=0) 的概率。在训练阶段，G(·) 寻求最小化 log(1−D(G(z)))，即最大化 D(G(z))。相反，D(·)寻求最小化D(G(z))，这意味着鉴别器应该以高概率拒绝假样本G(z)。最后，G 拟合数据分布 PX，用生成的样本欺骗 D。如下图3。结果是G(z)=c∼PX满足合成点为催化剂的第一个要求。
（自己问题一：D(·)寻求最小化D(G(z))？怎么看出来的？问题二：G 拟合数据分布PX，用生成的样本欺骗 D:这里的意思是不是指G生成的样本数据达到了PX的分布情况,就可以被初步使用）

第二个要求是保证合成样本是有用的，即提高聚类质量。不是每个GAN生成的样本都能满足这个要求，应该应用一个特定领域的度量来检查这个样本是否提高了聚类质量。此方法要求使用由领域专家设计的 metric M 评估每个合成样本 c。如果引入了对产生的簇的质量的改进，即 M(S1)>M(S2)，其中 S1=Clust(X∪ {c}) ∩ {c} and S2=Clust(X)，则很有用。

（问题一：领域专家设计度量评估每个合成样本的观点。领域专家提供什么样的度量？给出什么标准应用到项目？问题二：S1的定义的变化。前文S1=Clust(X∪ {c}) \ {c}）

（结合到工程项目，可以针对高纬度稀缺数据的问题。结合领域度量就可以先针对特定指标列进行聚类,某一个小领域进行聚类，比如企业家某些品质的聚类？企业的某一特质的聚类？）

3.4 Stage 2: Catalysis Clustering 催化聚类

这阶段的主要目标：

（1）给定：一个数据集X，一组催化剂C，一个特定领域的度量M，一个聚类算法Clust，以及如果Clust需要的集群数量k；

（2）找到：聚类分配{X1, …,Xk}

（3）目标：优化方程（1）

算法 1 描述了催化聚类的过程。作为输入，催化聚类采用数据集X、一组生成的催化剂C、特定领域的评估指标M和聚类算法Clust。实际中的Clust应该用特定的聚类算法代替，例如 K-means、NMF 等。聚类的数量 k 不是我们的 Catalysis Clustering 框架所要求的，但可以由为此步骤选择的特定聚类算法所要求。一开始，催化剂 C 与 X 组合，Clust 应用于组合数据集。聚类完成后，从每个簇中去除所有催化剂。然后在下一阶段用 M 评估产生的集群分配{X1, …,Xk}。

3.5 Stage 3: Evaluation 评估

催化聚类需要从领域知识的角度进行具体和定量的评估，主要问题之一是对于什么是坏的/无用的或好的/有用的“集群”缺乏准确而通用的定义。存在许多用于聚类评估的通用指标，例如 Normalized Mutual Information 或者 Rand Index。但是，它们需要一组“真正的”集群，并且没有考虑集群是否对域应用程序有用。但是催化聚类将领域知识整合到质量评估中，不需要了解真实聚类分配的知识。

在第 1 阶段，合成样本在被选择用于即将进行的聚类过程之前，会根据特定领域的度量标准不断地进行评估。在这种情况下，催化剂充当了一种调整和使能机制，能够探索和评估各种集群边界。催化剂来源于原始数据分布使它们成为弥补数据收集不足的有效候选者。在第 3 阶段，将相同的 M 应用于最终聚类结果，以给出聚类质量的定量度量。

在聚类分析过程中使用领域知识非常有利于实际应用。在给定的感兴趣的领域中，从数据得出的基础模型可能是已知的并且定义明确的。在这种情况下，我们可以使用现有的规则和约束来设置或设计用于评估的度量M。例如，在文章的案例研究中，借助一组患者的生存信息评估基因突变亚组。这种特定于领域的方法有助于整合更多知识以更好地了解底层模型，同时仍然可以灵活地插入不同的指标以研究不同的方面，即使是在同一应用程序或数据集中。

(提出问题:关于度量M的设置,这方面具体是怎么操作的没有提到 ?)

4 CASE STUDY: CANCER STRATIFICATION USING GENE MUTATION DATA

案例研究：使用基因突变数据进行癌症分层

癌症分层旨在根据癌症类型的特定特征将癌症患者分为具有临床意义的亚型。有用的基于突变的聚类分析和正确预测每个亚组的临床结果成为成功治疗患者的关键。在数学上，基于突变的癌症分层问题可以表述如下：假设有一组 g 基因，从 n 个患者中收集，k 是亚型的数量。k 存在于医学研究人员开发的几种癌症中。因此，结果数据存储在 n×g 矩阵中：

其中 pi,j 为 0 或 1，表示基因是否发生突变。这样，第 i 行代表特定患者，而第 j 列代表基因 j 是否突变（1）或未突变（0）。任务是将每个突变情况 pi,j 分配给 k 个亚型之一。

作者们采用基于网络的分层 Network-Based Stratification（NBS）作为聚类算法。患有同一类型癌症的患者的基因可能没有常见的突变，而一名患者的突变基因可能从几个到几千个不等，考虑到人类基因超过 20,000 个，这相当稀少。为了处理高水平的数据稀疏性，NBS 将每个突变情况（mutation profile）投影到人类基因交互网络上，以将每个突变的影响分散到其网络邻域上，并生成一个不太稀疏的特征矩阵 F。

非负矩阵分解进一步用低秩矩阵逼近 [20] 来逼近 F，使得 F≈W H。下图描述了这个过程。催化剂与真实数据结合后，整个数据集被投影到基因相互作用网络上，将每个二元向量转换为网络上的连续激活曲线。对平滑矩阵 F 应用非负矩阵分解。(看不太懂~~~)

4.1 生存曲线测量作为聚类评估指标的发展

案例目标：帮助医生通过癌症分层回答：1）患者从癌症中存活下来几率？接近 0（即死亡）或 1（即存活）的概率是更明确的答案的首选。2）患者还可以活多久？时间更具体。

基本想法，临床结果相似且与任何其他患者亚组截然不同的患者亚组应属于同一集群。为了在 Catalysis Clustering 中使用这个概念，需要将其转换为定量度量。下边的过程将是通用的，可以用作任何领域中度量设计的模板。

此案例，使用Kaplan-Meier 估计量和生存曲线进行度量设计。假设将癌症患者的生存数据分为 3 个集群。基于此信息，Kaplan-Meier 估计量生成如图 4 所示的生存图。相比亚型2，1和3有较高的聚类质量，因为它们提供了关于生存率的更具体的信息。亚型 2 不能为医生提供信息，因为它不能为患者的寿命提供任何明确的信息。

作者们设计了一个特定领域度量标准，生命曲线标准SCM，来确定由生存曲线定义的集群的质量。在最好的情况下，生存曲线应该类似于图 4 中的亚型 1 或 3。至于最坏的情况，例如亚型 2。生存曲线的“步数”越多，其预测值越低。因此，随着时间→∞，生存曲线 2 看起来更像是一条对角线。

所以，作者们测量了对角线和每条生存曲线之间的角度。这个角度将代表曲线与最坏情况（一条对角线）的距离。角度越接近45°，意味着生存曲线离对角线越远，聚类质量越高。下图是更加直观的解释。

等式 (3) 计算点 (x,y) 处的角度，这里k1是对角线的斜率，即线(0,1)-(1,0)，k2是线(0,1)-(x,y)的斜率，j是点(x, y) 所属的集群。

生存曲线 j 的 SCM 由等式 (4) 描述，其中 nj 是集群 j 中的点总数。该度量用于确定集群j的质量。

方程 (5) 描述了分配给每个生存图的角度值。 SCMavg 表示计算角度的加权总和，以便较小规模的亚型（即包含少量患者）不会不公平地歪曲总结果。因此，SCMavg 用于确定生存图的质量，如等式所示，其中 k 是簇数，nj 是簇 j 的基数，N 是点总数

尽管这个评估指标是为癌症分层而设计的，但它可以很容易地根据其他危及生命的疾病进行调整。即使对于没有死亡的疾病，也可以用恢复时间或其他临床标志物代替存活时间。可以为其他领域开发类似的指标，例如社会分析 [17,31]、预测企业生存 [26] 或财务分析 [1]。（后两部分值得进一步关注,后续可以看看有无必要跟进）

4.2 数据说明

测试使用的从癌症基因组图谱 (TCGA) 和国际癌症基因组联盟 (ICGC) 等主要项目中收集的卵巢癌和肺癌队列的体细胞突变配置文件（mutation profiles）。表1是两个数据集的统计数据

体细胞处理具备挑战性：1）配置文件非常稀少,举例：卵巢癌数据集，平均而言，患者在 9,850 个基因中的突变少于 200 个 2）另一个挑战是体细胞突变配置文件具有显着的异质性，两个临床相同的患者通常不会共享一个以上的突变[19]。因此，标准的基于距离的聚类算法在基于突变的癌症分层任务中失败。

对于评估步骤，我们使用从 [16]文献收集的生存数据。这些数据集包含患者的年龄、性别、生存信息（即观察期内的生存天数）等信息。不幸的是，没有突变和生存特征之间的完全对应关系。结果，在卵巢癌的案例下，仅收集了 325 名受试者（共 356 名）的生存信息，而在肺癌的案例下，仅收集了 303 名患者的信息（共 381 名）。

4.3 实验设置

在实验中，使用了GAN的改进版本，Wasserstein GAN (WGAN)，考虑到了分布之间的距离。由于数据是离散且非常稀疏的，对 WGAN 进行了一些数据预处理。实验中，WGAN 训练了 25,000 个 epoch。由于 GAN 不生成离散数据，因此实验设置了 0.5 的阈值将生成的连续数据转换为二进制形式。

实验选择基于网络的分层 (NBS) [16] 与催化聚类 (CC) 进行比较，因为 NBS 代表了基于突变的癌症分层中最先进的最新技术。该方法在[16]文献中被证明有效，将 NBS 算法应用于原始数据集，并将其用作基线。在文献[16] 中，NBS 确定了卵巢癌队列的 4 个亚型和肺癌队列的 6 个亚型。为了公平比较，选择 k=4 用于卵巢病例研究和 k=6 用于肺病例研究。

因为真正的集群是未知的，还有待发现，所以不可能将标准化交互信息（Normalized Mutual
Information ）或调整兰德指数（Adjusted Rand Index）等标准度量纳入集群评估过程，这在实践中经常发生。相反，与 SCM 一起，我们还计算对数秩检验及其相应的 p 值作为聚类质量的外部度量。

对数秩检验是 χ2 检验的一种形式，通常用于比较两个样本的生存分布。它计算一个统计量来检验零假设 H0，即两个或多个独立组之间的生存率没有差异（即每个组在任何时间点发生死亡的概率都相同）。

p 值越低，我们对生存曲线在统计上显着不同的信心就越大。 SCM 和对数秩检验一起提供了对所得聚类的有用性和独特性的综合评估。

4.4 卵巢癌分层

下图(a) 说明了基于 NBS 聚类分配的生存图，图 7(b) 说明了基于催化聚类分配的情况。表 2 表明，根据 SCMavg，与 NBS 相比，CC 取得了更好的结果。尽管 CC 在四分之二的 SCM 值上取得了改进，但 SCMavg 清楚地表明，从领域知识的角度来看，新的集群分配更好。

卵巢癌案例研究：（a）NBS 亚型和（b）催化聚类亚型的 Kaplan-Meier 生存图。时间尺度被标准化为具有介于 0 和 1 之间的值。两个 p 值都很低，这使我们高度自信，在这两种情况下，生存曲线在统计上是不同的。

表 3 表示集群分配的列联表。正如表 3 清楚地显示的那样，NBS 分配包含两个小集群：大小为 21 的 NBS1 和大小为 14 的 NBS3。催化聚类能够将这两个集群的大小增加大约 57% 和 142 ％分别。

表 3 中的对角线显示了 NBS 和 CC 将多少样本分配给相同的集群。这些结果支持我们的假设，即催化聚类能够将相对较远的样本重新分配给更相关的聚类。从表 3 可以看出，聚类 2 和聚类 4 中的大多数样本都被分配到了同一个聚类中，而更多的不确定样本被重新排列在其他聚类中。尽管这些确定的改进可能看起来微不足道，但在关键的癌症分层任务中，即使我们算法的微小改进也意味着患者治疗的显着改进。

在案例中，106 名重新分配的患者（或所有患者的 33%）有更高的机会及时接受正确的治疗，这意味着可以挽救更多的生命。

4.5 肺癌分层

在收集到的突变谱中的 381 名患者中，只有 303 名有生存信息，其中 22 名因数据缺失而无法使用，因此仅使用 281 名患者的数据进行评估。另一个复杂因素是有更多的集群 ask=6。

下图(a) 说明了基于 NBS 聚类分配的生存图，(b) 说明了 CC 聚类分配。根据对数秩检验和 p 值，与 NBS 相比，催化聚类产生更多独特的亚型。表 4 显示，与 NBS 相比，CC 实现了更好的 SCMavg 结果。尽管 CC 在六个 SCM 值中的三个实现了改进，但 SCMavg 清楚地表明，从领域知识的角度来看，新的集群分配更好。

表 5 是 NBS 和 CC 集群分配的列联表。与之前的案例研究类似，大约 28% 的患者被重新分配，这意味着 82 人有更高的机会及时接受适当的治疗。

5 CONCLUSION

总结，文章提出了一个催化聚类框架，它将领域知识融入实际的方法中。 该框架可以容纳各种聚类算法并利用领域知识来生成对领域应用有用的集群。借助 GAN 生成的催化剂，这是从真实数据分布中提取的特殊合点，可以克服数据收集的不足，提高聚类质量。论文还展示了如何使用领域知识评估GAN生成的催化剂和集群。因此，催化聚类不仅产生相似样本的分组，而且产生对领域科学家具有更高质量和实用性的聚类。此方法还在俩个数据集上验证了实用性。

文章提到虽然这个案例研究侧重于癌症研究，但催化聚类独立于领域、聚类算法或任何特定的评估过程。催化聚类框架和领域知识度量设计程序都可以很容易地适应各个领域。

SQLite 数据库在大数据分析中的应用潜力数据库管理艺术数据库 sqlite 数据分析 ai
SQLite数据库在大数据分析中的应用潜力关键词：SQLite、大数据分析、轻量级数据库、嵌入式数据库、数据仓库、OLAP、性能优化摘要：本文深入探讨了SQLite这一轻量级嵌入式数据库在大数据分析领域的应用潜力。我们将从SQLite的核心架构出发，分析其在大数据场景下的优势和限制，并通过实际案例展示如何通过优化策略和扩展技术使SQLite能够处理大规模数据集。文章包含性能对比测试、优化技巧和实际
和李沐老师学深度学习--2.数据操作部分代码实现（学习笔记）
大家对代码有不懂地方都可以上网去查找，最好是有一定的数据分析基础比较容易理解，李沐老师课程视频链接我放在这里了大家有不懂都可以观看课程进行学习04数据操作+数据预处理【动手学深度学习v2】_哔哩哔哩_bilibili深度学习课程电子书：大家可以使用翻译插件观看书的内容Preface—DiveintoDeepLearning1.0.3documentation深度学习github项目：https:/
使用LangChain构建智能应用：从入门到实战 afTFODguAKBF langchain python
引言在当今的人工智能时代，构建智能应用程序已经成为越来越多开发者的目标。LangChain是一个强大的工具，可以帮助我们快速开发基于大型语言模型（LLM）的应用。本篇文章将带你了解如何从零开始使用LangChain，构建一个简单的LLM应用程序，并逐步探索更复杂的功能。主要内容构建简单的LLM应用使用LangChain，我们可以快速构建一个简单的LLM应用程序。接下来，我将带你一步步实现。什么是L
端侧开发详解初赛收官盛宴 | 2025高通边缘智能创新应用大赛第九场公开课来袭！阿加犀智能人工智能智能硬件
各位开发者、技术爱好者，2025高通边缘智能创新应用大赛即将迎来初赛阶段的最后一堂重磅公开课！诚邀大家于7月3日（星期四）晚8点，准时收看由瑞莎的嵌入式开发工程师张子烽（Morgan）带来的专题分享，共同探索端侧智能应用开发的创新技术路径。聚焦前沿平台掌握端侧智能开发流程本次课程将聚焦基于瑞莎DragonQ6A开发板的端侧人工智能应用开发。该开发板搭载高通跃龙™QCS6490平台（由阿加犀提供开发
中国双非高校经费TOP榜数据分析归零鸟高考考研高校大学
当我们习惯性仰望985、211这些“国家队”时，一批地方重点支持的高校正悄悄发力，手握重金，展现出不逊于名校的“钞能力”。特别是“双非”大学中的佼佼者，它们的年度经费预算，足以让许多普通院校望尘莫及。今天就带大家揭开2024年全国高校经费预算的神秘面纱，尤其关注那些没有985/211光环，却获得财政“真金白银”大力支持的双非实力派们！（数据综合整理自各高校2024年公开预算报告及相关教育资讯平台，
SpringBoot生态全景图：从SpringCloud到云原生技术栈演进 fanxbl957 Web spring boot spring cloud 云原生
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot生态全景图：从S
Python Pandas 如何进行数据分组统计 Python编程之道 Python人工智能与大数据 Python编程之道 python pandas 网络 ai
PythonPandas如何进行数据分组统计关键词：PythonPandas、数据分组、groupby、聚合函数、数据透视表、数据统计、数据分析摘要：本文将深入探讨如何使用PythonPandas库进行高效的数据分组统计操作。我们将从基础概念入手，详细讲解groupby机制的原理和使用方法，介绍各种聚合函数的应用，探讨高级分组技巧，并通过实际案例展示如何解决复杂的数据分析问题。文章还将涵盖性能优化
四个机器学习模型对比道路裂缝检测识别分类模型深度学习乐园深度学习实战项目机器学习分类人工智能
完整源码项目包获取→点击文章末尾名片！一、课题综述1.1.课题简介在机器学习的研究领域中，传统分类算法模型数量众多，适合的应用场景也各不相同。1.2.课题目标（示例）本课题使用的数据集来自于数据分析与数据挖掘竞赛Kaggle，该竞赛为数据科学领域著名的国际性赛事之一。课题使用的数据集为带标签的图像数据集，包含带有裂痕和不带有裂痕的桥梁、墙和人行道图片。课题的目标为对于目标数据集，搭建相应的传统机器
基于AFM注意因子分解机的推荐算法深度学习乐园深度学习实战项目深度学习科研项目推荐算法算法机器学习
关于深度实战社区我们是一个深度学习领域的独立工作室。团队成员有：中科大硕士、纽约大学硕士、浙江大学硕士、华东理工博士等，曾在腾讯、百度、德勤等担任算法工程师/产品经理。全网20多万+粉丝，拥有2篇国家级人工智能发明专利。社区特色：深度实战算法创新获取全部完整项目数据集、代码、视频教程，请进入官网：zzgcz.com。竞赛/论文/毕设项目辅导答疑，v：zzgcz_com1.项目简介项目A033基于A
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案 mmlihaio 数据库云原生 python
Tair向量数据库：阿里云原生内存数据库服务的高性能向量检索解决方案1.引言在当今的人工智能和大数据时代，高效的向量检索已成为许多应用场景的关键需求。Tair作为阿里云开发的云原生内存数据库服务，不仅提供了丰富的数据模型和企业级能力，还引入了基于非易失性内存(NVM)存储介质的持久内存优化实例。本文将深入探讨如何利用Tair向量数据库功能，实现高性能的向量存储和检索。2.Tair向量数据库概述Ta
《聚类算法》入门--大白话篇：像整理房间一样给数据分类
一、什么是聚类算法？想象一下你的衣柜里堆满了衣服，但你不想一件件整理。聚类算法就像一个聪明的助手，它能自动帮你把衣服分成几堆：T恤放一堆、裤子放一堆、外套放一堆。它通过观察衣服的颜色、大小、款式这些特征，把相似的放在一起，不相似的分开。在计算机世界里，聚类算法就是帮我们把杂乱的数据分成有意义的组。它不需要提前知道答案（这就是"无监督学习"），而是像侦探一样，从数据中发现隐藏的规律。二、最常见的三种
阿里云魔搭社区AIGC专区：中国AI创作的革命性平台 Liudef06小白阿里云 AIGC 人工智能
在生成式人工智能重塑全球数字创作版图的浪潮中，中国首个一站式AIGC开发平台——阿里云魔搭社区AIGC专区于2024年9月杭州云栖大会正式亮相。这一突破性进展不仅填补了国内全流程AI创作工具的空白，更以157款多模态开源模型和全免费GPU算力的开放姿态，为超过690万开发者提供了从模型调用到应用落地的完整生态支持。一、魔搭社区：中国AI模型生态的奠基者魔搭社区（ModelScope）作为阿里云在2
探秘阿里云Tair KVCache：大模型推理的加速引擎云资源服务商阿里云云计算人工智能
一、引言近年来，人工智能领域发展迅猛，大语言模型（LLM）不断取得突破，其应用场景也日益广泛。从智能客服到内容生成，从智能写作到智能翻译，大语言模型正在深刻地改变着我们的生活和工作方式。随着模型规模的不断扩大和推理需求的日益增长，大模型推理过程中的显存瓶颈问题逐渐凸显，成为制约其发展和应用的关键因素。在大模型推理中，KVCache技术作为一种优化手段，通过缓存历史Token的Key/Value向量
AI正在偷偷取代这10种职业，你的工作安全吗？
近年来，人工智能（AI）的飞速发展正在悄然改变我们的工作方式。从自动化客服到AI生成内容，许多传统职业正面临被取代的风险。虽然AI带来了更高的效率和便利，但也让不少人开始担忧：我的工作会被AI抢走吗？今天，我们就来盘点10种最容易被AI取代的职业，并探讨如何在这个AI时代保持竞争力。1.客服代表取代指数：★★★★★AI驱动的聊天机器人（如ChatGPT、GoogleBard）已经能够处理大部分基础
基于MATLAB的资源优化与工期固定-资源均衡分析方法研究【附代码】拉勾科研工作室 matlab 开发语言
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）资源均衡优化相关理论与问题分类在现代工程项目中，资源的合理分配和使用是确保项目按时完成、成本可控的关键因素。资源均衡优化作为项目管理中的核心环节，旨在通过调整资源的使用方案，使资源消耗在整个工期内尽可能平稳，避免
医学图像增强的层级化模糊与虚拟仪器无参考质量评价研究【附代码】拉勾科研工作室计算机视觉图像处理人工智能
算法与建模领域的探索者|专注数据分析与智能模型设计✨擅长算法、建模、数据分析matlab、python、仿真✅具体问题可以私信或查看文章底部二维码✅感恩科研路上每一位志同道合的伙伴！（1）层级模糊隶属度的X光医学图像增强算法针对X光医学图像普遍存在的对比度差、细节模糊等问题，本算法提出了一种基于层级模糊隶属度的增强方法。该方法的核心思想在于利用拉普拉斯金字塔分解图像，并在多尺度下分层计算模糊隶属度
直播预告！探讨生成模型中的极简概念擦除青稞社区. 青稞Talk 人工智能图像处理
主页：http://qingkeai.online/原文：https://mp.weixin.qq.com/s/yc4whKbnVY8ho1w7rgFVGg6月16日20:00，青稞Talk第55期，新加坡国立大学博士生张扬，将直播分享《生成模型中的极简概念擦除》。分享嘉宾张扬，慕尼黑工业大学计算机专业硕士，新加坡国立大学人工智能专业博士。曾于牛津大学进行学术访问，并在微软亚洲研究院及美国运通新加
【DeepSeek实战】3、Ollama实战指南：LobeChat+多网关架构打造高可用大模型集群无心水 Ollama实战指南 LobeChat实战 DeepSeek实战 DeepSeek全栈应用开发 AI入门大模型 CSDN技术干货
一、企业级大模型集群架构全景解析在人工智能落地应用的过程中，大模型服务的高可用性、成本控制和灵活扩展能力成为企业关注的核心痛点。本方案通过LobeChat前端、AI网关层和Ollama模型集群的三层架构设计，实现了无需复杂运维即可部署的生产级大模型服务体系。该架构不仅支持负载均衡、故障转移和模型热切换等企业级特性。还通过量化技术将硬件成本降低60%以上，为中小企业提供了与商业云服务相当的性能体验。
生成式人工智能实战 | 深度卷积生成对抗网络（Deep Convolutional Generative Adversarial Network, DCGAN）盼小辉丶生成式人工智能实战150讲人工智能生成对抗网络神经网络
生成式人工智能实战|深度卷积生成对抗网络0.前言1.模型与数据集分析1.1模型分析1.2数据集介绍2.构建DCGAN生成人脸图像2.1数据处理2.2模型构建2.3模型训练0.前言深度卷积生成对抗网络(DeepConvolutionalGenerativeAdversarialNetworks,DCGAN)是基于生成对抗网络(ConvolutionalGenerativeAdversarialNet
Python爬虫实战：用Tushare和Baostock爬取股票历史数据及K线图与技术指标计算
在金融数据分析和量化交易中，股票历史数据的获取是进行技术分析、回测和策略研究的第一步。传统上，投资者需要依赖付费数据服务，然而如今，借助Python强大的爬虫工具和开源数据接口，我们能够轻松地爬取免费的历史股票数据，并结合K线图与技术指标来进行深入分析。Tushare和Baostock是两个非常流行的开源金融数据接口。Tushare提供了丰富的国内外金融数据，特别是A股市场的历史数据和实时数据，而
2024年AI 智能助手（大模型）产品市场分析｜商派徐礼昭｜商派软件市场负责人人工智能
一、引言人工智能的浪潮不断向前推进，智能助手作为其中的重要应用，已经逐渐渗透到我们生活的各个方面。它们以其便捷性和个性化的特点，改变了我们与世界的互动方式。本报告将对AI智能助手进行全面的行业分析，包括行业概况、主要玩家、用户数据、发展要素以及未来趋势等方面，并通过具体案例分享，帮助读者深入了解这一领域的现状和未来发展潜力。二、行业概览（一）智能助手的定义和发展阶段智能助手是利用人工智能技术为用户
高通 QCS8550 大模型性能深度解析：从算力基准到场景实测的全维度 Benchmark 伊利丹~怒风 Qualcomm 人工智能 AI编程 python arm 自然语言处理
前言在人工智能技术狂飙突进的时代，大模型正以前所未有的速度重塑各行业生态，从智能客服到多模态交互，从边缘推理到端侧部署，其应用场景不断拓展。而这一切革新的背后，离不开底层硬件的强力支撑。高通QCS8550作为面向下一代智能设备的旗舰级计算平台，凭借高达48TOPS的AI算力与先进的第七代高通AI引擎，在大模型性能表现上极具竞争力。其异构多核架构不仅能高效处理复杂的神经网络计算，还通过软硬件协同优化
从零开始理解零样本学习：AI人工智能必学技术 AI天才研究院 Agentic AI 实战 AI人工智能与大数据 AI大模型企业级应用开发实战 ai
从零开始理解零样本学习：AI人工智能必学技术关键词：零样本学习、人工智能、机器学习、知识迁移、语义嵌入摘要：本文旨在全面深入地介绍零样本学习这一在人工智能领域具有重要意义的技术。首先阐述零样本学习的背景和基本概念，通过详细的解释和直观的示意图让读者建立起对零样本学习的初步认识。接着深入剖析其核心算法原理，结合Python代码进行详细说明，同时引入相关数学模型和公式并举例阐释。通过项目实战部分，带领
高斯混合模型（Gaussian Mixture Model, GMM）不想秃头的程序神经网络语音识别人工智能深度学习网络
高斯混合模型（GaussianMixtureModel,GMM）是一种概率模型，用于表示数据点由多个高斯分布（GaussianDistribution）混合生成的过程。它广泛应用于聚类分析、密度估计、图像分割、语音识别等领域，尤其适合处理非球形簇或多模态数据。以下是GMM的详细介绍：一、核心思想GMM假设数据是由多个高斯分布混合生成的，每个高斯分布代表一个簇（Cluster），并引入隐变量（Lat
[Python]-基础篇1- 从零开始的Python入门指南踏雪无痕老爷子 Python python 开发语言
无论你是尚未接触编程的新手，还是想从其他语言转向Python的开发者，这篇文章都是你的入门课。一、Python是什么？Python是一种解释型、高级、通用型编程语言，以简洁明了、简单易用着称。它可以应用于网站开发、自动化脚本、数据分析、人工智能、系统操作等多种场景。二、如何安装Python步骤：访问Python官方网站选择目前最新的Python3.x版本下载Windows用户请务必勾选“AddPy
Python爬虫实战：全方位爬取知乎学习板块问答数据 Python爬虫项目 2025年爬虫实战项目 python 爬虫学习开发语言 scrapy 游戏
1.项目背景与爬取目标知乎是中国最大的知识问答社区，聚集了大量高质量的学习资源和经验分享。爬取知乎“学习”板块的问答数据，可以为学习资料整理、舆情分析、推荐系统开发等提供数据支持。本项目目标：爬取“学习”话题下的热门问答列表抓取每个问答的标题、作者、回答内容、点赞数、评论数等详细信息实现动态加载内容的抓取，包含图片和富文本避免被反爬机制限制，保证数据采集稳定结合数据分析，为后续应用打基础2.知乎“
Python爬虫实战：爬取知乎问答与用户信息 Python爬虫项目 python 爬虫 php 数据分析开发语言开源
简介随着网络信息量的爆炸，如何有效获取有价值的内容，成为了数据分析、机器学习等领域的基础之一。爬虫作为数据采集的基本工具之一，常常被用来获取互联网上的公开数据。在这篇博客中，我们将结合最新的Python爬虫技术，详细讲解如何爬取知乎问答与用户信息。本文将会介绍：Python爬虫的基础知识知乎问答网页结构分析使用Python进行知乎数据爬取爬取知乎问答内容与用户信息如何处理和存储爬取的数据使用最新的
【机器学习&深度学习】反向传播机制
目录一、一句话定义二、类比理解三、为什重要？四、用生活例子解释：神经网络=烹饪机器人4.1第一步：尝一口（前向传播）4.2第二步：倒着推原因（反向传播）五、换成人工智能流程说一遍六、图示类比：找山顶（最优参数）七、总结一句人话八、PyTorch代码示例：亲眼看到每一层的梯度九、梯度=损失函数对参数的偏导数十、类比总结反向传播（Backpropagation）是神经网络中训练过程的核心机制，它就像“
Python 数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙清水白石008 python Python题库 python 数据挖掘动画
Python数据挖掘实战：关联规则与聚类分析，解锁数据价值的钥匙引言在数字化浪潮席卷全球的今天，数据已成为企业和组织最重要的战略资产。海量数据蕴藏着巨大的价值，等待我们去挖掘和发现。数据挖掘(DataMining)，作为从海量数据中提取有价值知识和模式的关键技术，正日益受到各行各业的重视。它如同探矿者的火眼金睛，能够穿透数据的迷雾，发现隐藏在背后的规律和趋势，为商业决策、科学研究和社会发展提供强有
潜入思维的海洋：SoftCoT++如何让语言模型更聪明步子哥智能涌现语言模型人工智能自然语言处理
在人工智能的浩瀚星空下，大型语言模型（LLMs）如同一颗颗璀璨的恒星，照亮了从文本生成到复杂推理的广阔领域。然而，这些模型在推理任务中往往像是在迷雾中航行——尽管它们能抵达目的地，却常常因为固定的思维路径而错过更优的航线。2025年5月，一篇题为《SoftCoT++:Test-TimeScalingwithSoftChain-of-ThoughtReasoning》的论文如同一盏明灯，照亮了如何让
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户

《Catalysis Clustering with GAN by Incorporating Domain Knowledge》论文精读分析

《Catalysis Clustering with GAN by Incorporating Domain Knowledge》论文精读分析

ABSTRACT

INTRODUCTION

RELATED WORK

CATALYSIS CLUSTERING WITH GAN

3.1 Problem formulation

3.2 Catalysis Clustering Architecture

3.3 Stage 1: Catalyst generation with GAN 使用GAN生成催化剂Catalyst

3.4 Stage 2: Catalysis Clustering 催化聚类

3.5 Stage 3: Evaluation 评估

4 CASE STUDY: CANCER STRATIFICATION USING GENE MUTATION DATA

案例研究：使用基因突变数据进行癌症分层

4.1 生存曲线测量作为聚类评估指标的发展

4.2 数据说明

4.3 实验设置

4.4 卵巢癌分层

4.5 肺癌分层

5 CONCLUSION

你可能感兴趣的:(聚类,人工智能,数据分析)