无水先生

【深度学习】深度强化学习初学者指南

一、说明

GAN（Generative Adversarial Networks）是一种深度学习模型，它由两个神经网络组成：一个生成网络和一个判别网络。生成网络学习如何生成类似于给定数据集的新数据，而判别网络则学习如何区分生成网络生成的数据和原始数据。这两个网络相互竞争，使得生成器越来越接近于生成真实数据，判别器越来越接近于准确地识别真实数据和生成数据。GAN 已经在许多领域中取得了成功，如图像处理、自然语言处理等。

二、模型发展史介绍

深度强化学习将人工神经网络与强化学习框架相结合，帮助软件代理学习如何实现目标。也就是说，它将函数近似和目标优化结合在一起，将状态和操作映射到它们带来的奖励。

你可能不理解所有这些术语，但它们将在下面以更深入和更通俗易懂的语言进行解释，利用你作为一个个体在世界上移动的个人经历。

虽然神经网络是最近人工智能在计算机视觉、机器翻译和时间序列预测等问题上取得突破的原因，但它们也可以与强化学习算法相结合，创造出像Deepmind的AlphaGo这样令人震惊的东西，这种算法击败了围棋棋盘游戏的世界冠军。这就是为什么你应该关心深度RL。

强化学习是指面向目标的算法，它学习如何实现复杂的目标（目标）或如何在许多步骤中沿特定维度最大化;例如，他们可以在游戏中通过多次移动最大化赢得的分数。强化学习算法可以从一张白纸开始，在适当的条件下，实现超人的表现。就像被责骂和对待激励的宠物一样，这些算法在做出错误决定时受到惩罚，在做出正确决定时受到奖励——这就是强化。

结合深度神经网络的强化算法可以击败玩众多雅达利视频游戏、星际争霸 II 和 Dota-2 的人类专家。虽然这对非游戏玩家来说听起来微不足道，但它比强化学习以前的成就有了巨大的进步，而且最先进的技术正在迅速发展。

强化学习解决了将即时行动与其产生的延迟结果相关联的难题。像人类一样，强化学习算法有时必须等待才能看到他们决策的结果。它们在延迟返回的环境中运作，在这种环境中，可能很难理解在许多时间步长中哪种行动会导致哪种结果。

强化学习算法在更模糊的现实生活中慢慢地表现得越来越好，同时从任意数量的可能动作中进行选择，而不是从可重复视频游戏的有限选项中进行选择。也就是说，他们开始在现实世界中实现目标。如果您有可衡量的 KPI 要达到，深度强化学习可能会有所帮助。DeepMind 在 2021 年 <> 月声称，强化学习可能足以实现通用人工智能（AGI）。

公司开始将深度强化学习应用于工业问题。

Pieter Abbeel的协变在工业机器人中使用深度RL。Pathmind将深度强化学习应用于工业运营和供应链的模拟，以优化工厂，仓库和物流。谷歌正在将深度强化学习应用于机器人运动和芯片设计等问题，而Microsoft则依靠深度强化学习为其自主控制系统技术提供动力。

三、强化学习基本术语

3.1 强化学习的定义

强化学习可以通过代理、环境、状态、行动和奖励的概念来理解，所有这些都将在下面解释。大写字母倾向于表示事物的集合，小写字母表示该事物的特定实例;例如是所有可能的动作，而是集合中包含的特定动作。Aa

代理：代理执行操作;例如，送货的无人机，或导航视频游戏的超级马里奥。算法是代理。考虑到在生活中，代理人是你，可能会有所帮助。1
动作（A）：是代理可以进行的所有可能动作的集合。操作几乎是不言自明的，但应该注意的是，代理通常从离散的、可能的操作列表中进行选择。在视频游戏中，该列表可能包括向右或向左奔跑、跳高或跳低、蹲下或站立不动。在股票市场中，该清单可能包括购买、出售或持有一系列证券及其衍生品中的任何一种。在处理空中无人机时，替代方案将包括3D空间中的许多不同的速度和加速度。A
折扣系数：折扣系数乘以代理商发现的未来奖励，以抑制奖励对代理选择行动的影响。为什么？它旨在使未来的奖励价值低于即时奖励;也就是说，它在代理人中强制执行一种短期享乐主义。通常用小写希腊字母 gamma 表示：γ.如果γ是 .8，并且在 10 个时间步长后有 3 分的奖励，则该奖励的现值为。折扣系数为 1 将使未来的奖励与即时奖励一样有价值。我们在这里与延迟满足作斗争。0.8³ x 10
环境：代理在其中移动并响应代理的世界。环境将代理的当前状态和操作作为输入，并将代理的奖励及其下一个状态作为输出返回。如果你是主体，环境可能是处理你的行为并决定其后果的物理定律和社会规则。
状态（S）：状态是主体发现自己所处的具体而直接的情况;即一个特定的地点和时刻，一个瞬间的配置，将代理与其他重要事物（如工具、障碍物、敌人或奖品）联系起来。它可以是环境返回的当前情况，也可以是未来任何情况。您是否曾经在错误的时间出现在错误的地方？这是一种状态。
奖励（R）：奖励是我们衡量代理在给定状态下行为成功或失败的反馈。例如，在视频游戏中，当马里奥触摸硬币时，他会赢得积分。从任何给定状态，代理以操作的形式向环境发送输出，环境返回代理的新状态（由对先前状态执行操作的结果）以及奖励（如果有）。奖励可以是立即的，也可以是延迟的。他们有效地评估代理的行为。
策略（π）：策略是代理用来根据当前状态确定下一步操作的策略。它将状态映射到行动，即承诺最高回报的行动。
价值（V）：带折扣的预期长期回报，与短期回报相对。定义为政策下当前状态的预期长期回报。我们会打折奖励，或者降低其估计价值，它们发生得越远。请参阅折扣系数。请记住凯恩斯：“从长远来看，我们都死了。这就是您打折未来奖励的原因。区分很有用RVπ(s)π
Q 值或操作值（Q）：Q 值类似于 Value，只是它需要一个额外的参数，即当前操作。指根据策略采取行动 A 从当前状态长期返回。Q 将状态-操作对映射到奖励。请注意 Q 和策略之间的区别。aQπ(s, a)πs
轨迹：影响这些状态的状态和操作的序列。来自拉丁语“扔横”。特工的生命不过是一个高高抛起的球，在时空中拱起，没有停泊，很像现代世界的人类。
主要区别：奖励是在给定状态下收到的即时信号，而价值是您可能期望从该状态获得的所有奖励的总和。价值是一种长期的期望，而奖励是一种即时的乐趣。价值是晚餐吃菠菜沙拉，期待健康长寿;奖励是晚餐吃可卡因，然后见鬼去吧。它们在时间跨度上有所不同。因此，您可能会遇到价值和奖励分歧的状态：即使您转到具有长期价值潜力的职位，您也可能获得低而即时的奖励（菠菜）;或者您可能会获得很高的即时奖励（可卡因），随着时间的推移导致前景减少。这就是为什么价值函数，而不是即时奖励，是强化学习试图预测和控制的。

因此，环境是将当前状态下采取的行动转换为下一个状态和奖励的功能;代理是将新状态和奖励转换为下一个操作的函数。我们可以知道并设置代理的功能，但是在大多数情况下，应用强化学习是有用和有趣的，我们不知道环境的功能。这是一个黑匣子，我们只能看到输入和输出。这就像大多数人与技术的关系：我们知道它做什么，但我们不知道它是如何工作的。强化学习代表了智能体试图近似环境的功能，这样我们就可以将动作发送到黑匣子环境中，从而最大化它吐出的奖励。

在上面的反馈循环中，下标表示时间步长和，每个时间步长都表示不同的状态：时刻的状态和时刻的状态。与其他形式的机器学习（如监督和无监督学习）不同，强化学习只能根据一个接一个发生的状态-动作对来按顺序考虑。tt+1tt+1

强化学习根据它们产生的结果来判断行为。它是面向目标的，其目的是学习一系列行动，引导智能体实现其目标，或最大化其目标功能。以下是一些示例：

在电子游戏中，目标是以最多的分数完成游戏，因此在整个游戏中每增加一点积分都会影响代理的后续行为;也就是说，特工可能会知道它应该射击战舰、触摸硬币或躲避流星以最大化其分数。
在现实世界中，目标可能是让机器人从A点移动到B点，机器人能够靠近B点的每一英寸都可以算作点。

下面是一个用于强化学习的目标函数示例;即它定义目标的方式。

我们将奖励函数 r 与 t 相加，它代表时间步长。因此，这个目标函数计算了我们可以通过运行游戏获得的所有奖励。在这里，x 是给定时间步长的状态，a 是在该状态下执行的操作。r 是 x 和 a 的奖励函数。（我们暂时忽略γ。

强化学习与监督学习和无监督学习的不同之处在于它如何解释输入。我们可以通过描述他们对“事物”的了解来说明他们的区别。

无监督学习：那件事就像另一件事。（这些算法学习没有名称的相似性，并且通过扩展，它们可以发现反向并通过识别异常或不同之处来执行异常检测）
监督学习：那个东西是“双培根芝士汉堡”。（标签，把名字放在脸上...这些算法学习数据实例与其标签之间的相关性;也就是说，它们需要一个标记的数据集。这些标签用于“监督”和纠正算法，因为它在预测标签时会做出错误的猜测。
强化学习：吃那个东西，因为它味道很好，会让你活得更久。（基于短期和长期奖励的行动，例如您摄入的卡路里量或您生存的时间长度。强化学习可以被认为是稀疏反馈环境中的监督学习。

3.2 强化学习的领域选择

想象自主强化学习代理的一种方法是，一个盲人试图只用耳朵和一根白色手杖在世界上航行。代理有小窗口，可以让他们感知周围的环境，这些窗口甚至可能不是他们感知周围事物的最合适方式。

（事实上，决定你的座席应该注意哪些类型的输入和反馈是一个很难解决的问题。这称为域选择。正在学习如何玩视频游戏的算法大多可以忽略这个问题，因为环境是人为的并且受到严格限制。因此，视频游戏提供了实验室的无菌环境，在那里可以测试有关强化学习的想法。领域选择需要人类决策，通常基于有关要解决的问题的知识或理论;例如，为自动驾驶汽车中的算法选择输入域可能包括选择除了摄像头和GPS数据之外还包括雷达传感器。

四、状态-行动对和奖励的复杂概率分布

强化学习的目标是为任何给定状态选择最知名的操作，这意味着必须对操作进行排名，并相对于彼此分配值。由于这些操作是依赖于状态的，因此我们真正衡量的是状态-操作对的值;即从某种状态采取的操作，您在某处执行的操作。以下是一些示例，以证明操作的价值和意义取决于执行该操作的状态：

如果行动是嫁给某人，那么在35岁时嫁给一个18岁的人可能意味着与35岁时嫁给一个90岁的人不同，这两种结果可能有不同的动机并导致不同的结果。
如果动作是大喊“开火！”，那么在拥挤的剧院里表演动作应该意味着与在一队拿着步枪的人旁边表演动作不同。如果不了解上下文，我们就无法预测行动的结果。

我们将状态-操作对映射到我们期望它们使用 Q 函数生成的值，如上所述。Q 函数将代理的状态和操作作为其输入，并将它们映射到可能的奖励。

强化学习是通过一系列状态-操作对运行代理的过程，观察结果的奖励，并使 Q 函数的预测适应这些奖励，直到它准确地预测代理采取的最佳路径。这种预测被称为政策。

强化学习是一种尝试，用于模拟与大量状态-操作对相关的奖励的复杂概率分布。这就是强化学习与马尔可夫决策过程配对的原因之一，马尔可夫决策过程是一种从复杂分布中采样以推断其属性的方法。它与激发斯坦·乌拉姆发明蒙特卡洛方法的问题非常相似;也就是说，试图推断纸牌的给定一手牌成功的机会。

任何统计方法本质上都是对无知的承认。某些现象（生物、政治、社会学或与棋盘游戏有关）的巨大复杂性使得无法从第一原理进行推理。研究它们的唯一方法是通过统计，测量表面事件并试图在它们之间建立相关性，即使我们不了解它们相关的机制。强化学习，就像深度神经网络一样，就是这样一种策略，它依靠采样从数据中提取信息。

在花费一些时间使用马尔可夫决策过程之类的东西来近似状态-行动对上的奖励概率分布之后，强化学习算法可能倾向于重复导致奖励并停止测试替代方案的操作。在利用已知奖励和继续探索以发现也会导致胜利的新行动之间存在着紧张关系。正如石油公司具有在钻探新储量的同时从已知油田抽出原油的双重功能一样，也可以使强化学习算法在不同程度上进行开发和勘探，以确保它们不会以牺牲已知赢家为代价来放弃奖励行动。

强化学习是迭代的。在其最有趣的应用中，它并不是从知道状态-操作对将产生哪些奖励开始的。它通过一次又一次地运行状态来学习这些关系，就像运动员或音乐家迭代状态以试图提高他们的表现一样。

五、机器学习与时间的关系

你可以说算法是一种更快地聚合时间课程的方法。2强化学习算法与时间的关系与人类不同。算法可以在试验不同动作的同时一遍又一遍地运行相同的状态，直到它可以推断出哪些动作最好从哪些状态中。实际上，算法享受自己的土拨鼠日，在那里他们从愚蠢的混蛋开始，慢慢变得聪明。

由于人类从未在电影之外体验过土拨鼠日，强化学习算法有可能比人类学到更多、更好。事实上，这些算法相对于人类的真正优势并不在于它们的固有天性，而是源于它们同时在许多芯片上并行生活的能力，能够日夜训练而不会感到疲劳，从而学习更多。在围棋游戏中训练的算法，如AlphaGo，将比任何人希望在100辈子中完成的围棋游戏要多得多。3

六、神经网络和深度强化学习

神经网络适合在哪里？神经网络是函数逼近器，当状态空间或动作空间太大而无法完全知道时，它在强化学习中特别有用。

神经网络可用于近似值函数或策略函数。也就是说，神经网络可以学习将状态映射到值，或将状态-操作对映射到 Q 值。与其使用查找表来存储、索引和更新所有可能的状态及其值，这在非常大的问题中是不可能的，我们可以在状态或动作空间的样本上训练神经网络，以学习预测这些相对于我们在强化学习中的目标的价值。

像所有神经网络一样，他们使用系数来近似将输入与输出相关的函数，他们的学习包括通过沿着梯度迭代调整这些权重来找到正确的系数或权重，从而承诺减少误差。

在强化学习中，卷积网络可用于在输入是视觉时识别代理的状态;例如，马里奥所在的屏幕，或无人机之前的地形。也就是说，它们执行图像识别的典型任务。

但是卷积网络从强化学习中的图像中获得的解释与监督学习中的图像不同。在监督学习中，网络将标签应用于图像;也就是说，它将名称与像素匹配。

事实上，它将根据概率对最适合图像的标签进行排名。显示驴的图像，它可能会决定图片 80% 可能是驴，50% 可能是马，30% 可能是狗。

在强化学习中，给定代表状态的图像，卷积网络可以对在该状态下可能执行的动作进行排序;例如，它可能会预测向右跑将返回 5 分，跳跃 7 分，向左跑将返回任何分。

上图说明了策略代理执行的操作，将状态映射到最佳操作。

策略将状态映射到操作。

如果您还记得，这与 Q 不同，Q 将状态操作对映射到奖励。

更具体地说，Q 将状态-操作对映射到即时奖励与轨迹中后续操作可能收获的所有未来奖励的最高组合。这是来自维基百科的Q的等式：

为预期奖励赋值后，Q 函数只需选择具有最高所谓 Q 值的状态-操作对。

在强化学习开始时，神经网络系数可以随机或随机初始化。利用来自环境的反馈，神经网络可以利用其预期奖励和真实奖励之间的差异来调整其权重并改进其对状态-操作对的解释。

这种反馈循环类似于监督学习中错误的反向传播。然而，监督学习始于神经网络试图预测的地面真相标签的知识。它的目标是创建一个模型，将不同的图像映射到它们各自的名称。

强化学习依赖于环境向其发送标量数字以响应每个新操作。环境返回的奖励可能会变化、延迟或受到未知变量的影响，从而将噪声引入反馈回路。

这导致我们得到 Q 函数的更完整表达式，它不仅考虑了动作产生的即时奖励，还考虑了可能在序列中更深几个时间步长返回的延迟奖励。

像人类一样，Q函数是递归的。就像调用 wetware 方法中包含另一个方法一样，我们都是其中的果实，在给定的状态-操作对上调用 Q 函数需要我们调用嵌套的 Q 函数来预测下一个状态的值，这反过来又取决于之后状态的 Q 函数，等等。human()human()

七、真实世界的强化学习应用

强化学习是关于做出顺序决策，以通过许多步骤实现目标。虽然其他类型的人工智能执行你可能称之为感知的任务，比如识别图像的内容，但强化学习执行战术和战略任务。游戏是强化学习可以解决的问题的一个很好的代表，但强化学习也被应用于私营和公共部门的现实世界过程。

机器人
工业运营
供应链与物流
交通管制
竞价和广告
推荐系统
负载平衡
增强型自然语言处理

九、脚注

1）想象一个强化学习算法在行动，以视觉方式描绘它可能会有所帮助。假设算法正在学习玩视频游戏超级马里奥。它试图让马里奥通过游戏并获得最多的积分。为此，我们可以并行启动许多不同的马里奥，并在所有可能的游戏状态的空间中运行它们。这就好像你有1个马里奥在一座山上挖隧道，当他们挖掘时（例如，当他们一次又一次地决定采取哪种行动来影响游戏环境时），他们的经验隧道就像一棵错综复杂和分形的树枝一样分支。马里奥的体验隧道是穿过山脉的光走廊。就像在生活中一样，一个成功的行动可能会使成功的行动更有可能在更大的决策流中成为可能，从而推动获胜的马里奥斯继续前进。你也可以想象，如果每个马里奥都是一个特工，那么在他面前是一个热图，跟踪他可以与状态行动对相关联的奖励。（想象一下，每个状态操作对都有自己的屏幕，上面覆盖着从黄色到红色的热量。许多屏幕组装在一个网格中，就像你可能在华尔街交易员面前看到的那样，有许多显示器。一个动作屏幕可能是“从这个状态跳得更厉害”，另一个可能是“在这个状态下跑得更快”，依此类推。由于一些状态-行动对比其他状态-行动对导致更多的奖励，并且可以采取不同类型的动作，如跳跃、蹲下或跑步，因此奖励对动作的概率分布不是钟形曲线，而是复杂的，这就是为什么使用马尔可夫和蒙特卡洛技术来探索它，就像斯坦乌拉姆探索赢得纸牌一样。也就是说，虽然很难在公式中描述奖励分布，但可以对其进行采样。由于算法开始时是无知的，并且许多通过游戏状态空间的路径尚未探索，因此热图将反映他们缺乏经验;也就是说，他们想象的奖励的热图中可能有空白，或者他们可能只是从一些关于奖励的默认假设开始，这些假设会随着经验而调整。马里奥本质上是由这些热图引导的寻求奖励的导弹，它们在游戏中运行的次数越多，他们未来潜在奖励的热图就越准确。热图基本上是马里奥当前状态中可能的状态-操作对奖励的概率分布。

2）技术使时间和空间崩溃，乔伊斯称之为“不可避免的存在方式”。我们所说的崩溃是什么意思？很长的距离开始表现得像非常短的距离，长周期被加速变成短周期。例如，无线电波使人们能够远距离与他人交谈，就好像他们在同一个房间里一样。其他波长也是如此，最近由光纤电缆启用的视频电话会议也是如此。虽然距离没有被抹去，但对于某些活动来说，距离并不重要。任何数量的技术都可以节省时间。家用电器是将长任务变成短任务的技术的一个很好的例子。但计算也是如此。计算速度或硅处理信息的速度稳步提高。通过并行计算，可以进一步提高速度;即分解计算工作负载并将其分布在多个芯片上以同时处理。并行化硬件是一种并行化时间的方法。这对于需要处理非常大的数据集的算法以及性能随经验而提高的算法特别有用且相关。AI智库OpenAI训练了一种算法来玩流行的多人视频游戏Data 2个月，每天该算法玩的游戏相当于10年的游戏。在这180个月结束时，该算法（称为OpenAI Five）击败了世界冠军人类团队。这一胜利是并行化和加速时间的结果，因此算法可以利用比任何单个人希望收集的更多的经验来获胜。

3）正确的类比实际上可能是学习算法就像一个物种。算法在学习时运行的每个模拟都可以被视为物种的个体。正如算法贯穿游戏的知识被收集到算法的世界模型中一样，任何群体的个体人类都将通过语言进行报告，从而使集体的世界模型，体现在其文本，记录和口头传统中，变得更加智能（至少在理想情况下。引入我们集体模型的颠覆和噪音是另一篇文章的主题，也可能是另一个网站的主题。这更清楚地说明了为什么算法和个体人类之间的竞争，即使人类是世界冠军，也是不公平的。我们正在让一个积累了一万条生命智慧的文明与一袋肉对抗。

2023年搜索领域的技术认证与职业发展指南搜索引擎技术搜索引擎 ai
2023年搜索领域的技术认证与职业发展指南关键词搜索领域、技术认证、职业发展、搜索引擎技术、人工智能搜索摘要本指南旨在为搜索领域的从业者和有志于进入该领域的人士提供全面的技术认证与职业发展参考。首先介绍搜索领域的概念基础，包括其历史发展和关键问题。接着阐述相关理论框架，分析不同认证背后的原理。架构设计部分展示搜索系统的组成与交互。实现机制探讨算法复杂度和代码优化。实际应用部分给出实施和部署策略。高
探索AI人工智能医疗NLP实体识别系统的架构设计 AI学长带你学AI 人工智能自然语言处理 easyui ai
探索AI人工智能医疗NLP实体识别系统的架构设计关键词：人工智能、医疗NLP、实体识别、系统架构、深度学习、自然语言处理、医疗信息化摘要：本文将深入探讨医疗领域NLP实体识别系统的架构设计。我们将从基础概念出发，逐步解析医疗文本处理的特殊性，详细介绍实体识别技术的核心原理，并通过实际案例展示如何构建一个高效可靠的医疗实体识别系统。文章还将探讨当前技术面临的挑战和未来发展方向，为医疗AI领域的从业者
AI智能体原理及实践：从概念到落地的全链路解析 you的日常人工智能大语言模型人工智能机器学习深度学习神经网络自然语言处理
AI智能体正从实验室走向现实世界，成为连接人类与数字世界的桥梁。它代表了人工智能技术从"知"到"行"的质变，是能自主感知环境、制定决策、执行任务并持续学习的软件系统。在2025年，AI智能体已渗透到智能家居、企业服务、医疗健康、教育和内容创作等领域，展现出强大的生产力与创造力。然而，其发展也伴随着技术挑战、伦理困境和安全风险，需要从架构设计到落地应用的全链条思考与平衡。一、AI智能体的核心定义与技
人工智能动画展示人类的特征 AGI大模型与大数据研究院 AI大模型应用开发实战 java python javascript kotlin golang 架构人工智能
人工智能，动画，人类特征，情感识别，行为模拟，机器学习，深度学习，自然语言处理1.背景介绍人工智能（AI）技术近年来发展迅速，已渗透到生活的方方面面。从智能语音助手到自动驾驶汽车，AI正在改变着我们的世界。然而，尽管AI技术取得了令人瞩目的成就，但它仍然难以完全模拟人类的复杂行为和特征。人类的特征是多方面的，包括情感、认知、社交和创造力等。这些特征是人类区别于其他生物的重要标志，也是人类社会文明发
深度学习篇---简单果实分类网络
下面我将提供一个使用Python从零实现果实分类模型的完整流程，包括数据准备、模型构建、训练和部署，不依赖任何深度学习框架，仅使用NumPy进行数值计算。1.数据准备与预处理首先需要准备果实图像数据集，将其分为好果和坏果两类，并进行预处理：importosimportnumpyasnpfromPILimportImagefromsklearn.model_selectionimporttrain_
Python深度学习：3步实现AI人脸识别，效果堪比专业软件！小筱在线 python 人工智能 python 深度学习
引言：AI人脸识别的时代已经到来在当今数字化时代，人脸识别技术已经从科幻电影走进了我们的日常生活。从手机解锁到机场安检，从银行身份验证到智能门禁系统，这项技术正以前所未有的速度改变着我们的生活方式。而令人振奋的是，借助Python和深度学习技术，普通人也能构建出专业级的人脸识别系统。本文将带领您通过三个关键步骤，使用Python深度学习技术实现一个准确率高达99%的人脸识别系统。这个系统不仅原理简
Spring AI 第二讲之 Chat Model API 第八节ZhiPu AI Chat 疼死老夫了人工智能
SpringAI支持知普人工智能的各种人工智能语言模型。您可以与知普人工智能语言模型互动，并基于知普人工智能模型创建多语言对话助手。先决条件您需要与ZhiPuAI创建一个API，以访问ZhiPuAI语言模型。在ZhiPuAI注册页面创建账户，并在APIKeys页面生成令牌。SpringAI项目定义了一个名为spring.ai.zhipuai.api-key的配置属性，你应将其设置为从APIKeys
Chat Model API 虾条_花吹雪 Spring AI java
聊天模型API为开发人员提供了将人工智能聊天完成功能集成到应用程序中的能力。它利用预训练的语言模型，如GPT（生成预训练转换器），以自然语言对用户输入生成类似人类的响应。API通常通过向人工智能模型发送提示或部分对话来工作，然后人工智能模型根据其训练数据和对自然语言模式的理解生成对话的完成或继续。然后将完成的响应返回给应用程序，应用程序可以将其呈现给用户或用于进一步处理。Spring人工智能聊天模
【推荐算法课程二】推荐算法介绍-深度学习算法盒子6910 运维视角下的广告业务算法推荐算法深度学习运维开发运维人工智能
三、深度学习在推荐系统中的应用3.1深度学习推荐模型的演化关系图3.2AutoRec——单隐层神经网络推荐模型3.2.1AutoRec模型的基本原理AutoRec模型是一个标准的自编码器，它的基本原理是利用协同过滤中的共现矩阵，完成物品向量或者用户向量的自编码。再利用自编码的结果得到用户对物品的预估评分，进而进行推荐排序。什么是自编码器？自编码器是指能够完成数据“自编码”的模型。无论是图像、音频，
巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
【深度学习】神经网络剪枝方法的分类烟锁池塘柳0 机器学习与深度学习深度学习神经网络剪枝
神经网络剪枝方法的分类摘要随着深度学习模型，特别是大语言模型（LLM）的参数量爆炸式增长，模型的部署和推理成本变得异常高昂。如何在保持模型性能的同时，降低其计算和存储需求，成为了工业界和学术界的核心议题。神经网络剪枝（Pruning）作为模型压缩的关键技术之一，应运而生。本文将解析剪枝技术的不同分类，深入探讨其原理、优缺点。文章目录神经网络剪枝方法的分类摘要1为什么我们需要剪枝？2分类方法一：剪什
Python 图像分类入门超龄超能程序猿机器学习 python 分类开发语言
一、介绍图像分类作为深度学习的基础任务，旨在将输入图像划分到预定义的类别集合中。在实际的业务中，图像分类技术是比较常用的一种技术技能。例如，在安防监控中，可通过图像分类识别异常行为；在智能交通系统中，实现对交通标志和车辆类型的快速识别等。本文将通过安装包已有数据带你逐步了解使用Python进行图像分类的全过程。二、环境搭建在开始图像分类项目前，需要确保Python环境中安装了必要的库。主要包括：T
初始CNN(卷积神经网络) 超龄超能程序猿机器学习 cnn 人工智能神经网络
卷积神经网络（ConvolutionalNeuralNetwork，简称CNN）作为深度学习的重要分支，在图像识别、目标检测、语义分割等领域大放异彩。无论是手机上的人脸识别解锁，还是自动驾驶汽车对道路和行人的识别，背后都离不开CNN的强大能力一、CNN诞生的背景与意义在CNN出现之前，传统的图像识别方法主要依赖人工提取特征，例如使用SIFT（尺度不变特征变换）、HOG（方向梯度直方图）等算法。这些
深度学习实验：GPU加速，突破性能瓶颈 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
深度学习实验：GPU加速，突破性能瓶颈1.背景介绍随着深度学习模型变得越来越复杂和庞大，传统的CPU已经无法满足训练和推理的计算需求。GPU凭借其强大的并行计算能力和专门为矩阵运算优化的架构，成为了深度学习领域的核心加速器。本文将探讨如何利用GPU加速深度学习实验,突破性能瓶颈,提高模型训练和推理的效率。2.核心概念与联系2.1GPU架构GPU(图形处理器)最初是为了加速图形渲染而设计的,但由于其
使用大模型预测胃穿孔的全流程系统技术方案大纲
目录一、项目概述二、项目背景三、建设目标四、建设内容（一）建设架构（二）核心功能（三）核心技术（四）预期成效（五）方案总结五、系统架构方案流程图六、实验验证证据七、健康教育与指导一、项目概述本项目旨在构建一套基于大模型的胃穿孔预测及全流程管理系统，通过整合术前、术中、术后各环节数据，利用先进的人工智能技术，实现对胃穿孔疾病的精准预测、手术方案优化、并发症风险预警以及术后护理指导等功能，为医疗决策提
深度学习相关指标工作笔记 Victor Zhong AI 框架深度学习笔记人工智能
这里写目录标题检测指标iou/Ｇou/Ｄiou/ＣiouMSE(MeanSquaredError)(均方误差)(回归问题)交叉熵损失函数(CrossEntropyErrorFunction)(分类问题)检测指标iou/Ｇou/Ｄiou/ＣiouIntersectionoverUnion(IoU)是目标检测里一种重要的评价值交并比令人遗憾的是IoU无法优化无重叠的bboxes如果用IoU作为loss
【深度学习新浪潮】基于扩散模型的图像编辑加速方法小米玄戒Andrew 深度学习新浪潮深度学习人工智能扩散模型 Transformer DiT 图像编辑模型加速
在基于扩散模型的图像编辑任务中，实现高质量与高效加速的平衡需要综合运用模型架构优化、采样策略创新、条件控制增强及硬件加速等多维度技术。一、一步反演与掩码引导的编辑框架通过一步反演框架将输入图像映射到可编辑的潜在空间，结合掩码引导的注意力重缩放机制，实现文本引导的局部编辑。例如，SwiftEdit通过一步反演和注意力重缩放，将编辑时间压缩至0.23秒，比传统多步方法快50倍。具体步骤包括：一步反演：
表观遗传风暴：深圳AI-BioFab终极防御战全纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站⚡《表观遗传风暴：深圳AI-BioFab终极防御战全纪实》副标题：抗癌疫苗灌装倒计时90秒惊现组蛋白叛乱，中国启动虫洞计算化解文明级生物危机2025年7月2日14:26光明科学城急电当第184支抗癌疫苗注入冷链罐的瞬间，B3层突爆刺眼蓝光！培养舱内数千细胞染色体疯狂解旋，量子钟在14:26:03
医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站医疗影像诊断新范式：多模态AI在癌症早筛中的落地难题——2025年临床转化瓶颈突破与多中心验证报告残酷现实：FDA2025Q1报告显示，87%的AI影像工具因临床转化失败止步于III期试验破局曙光：斯坦福-梅奥联合研究证实，多模态融合使肺结节良恶性判别AUC提升至0.98（单模态上限0.91）一
合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《合成生物学奇点：AI驱动CRISPR超进化工厂2025投产纪实》副标题：全球首座AI-BioFab落地深圳，蛋白质设计周期从3年压缩至11天，生物制造成本暴跌90%一、生物制造范式的历史性颠覆▶︎传统生物工程的三大世纪困局graphTDA[缓慢的试错循环]-->B[单基因改造耗时≥6个月]C[
Transformer已死？2025年十大替代架构实战评测
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站封面图建议：十大架构3D渲染图环绕碎裂的Transformer图标，背景为动态性能雷达图副标题：实测推理速度/显存占用/长文本能力，附迁移成本决策树一、争议源起：Transformer的时代性局限（2025版）graphLRA[Transformer痛点]-->B[显存黑洞：千亿模型推理需1.6
生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南 HeartException 人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《生物启发AI新突破：神经形态芯片+脉冲神经网络落地指南》副标题：基于2025年英特尔Loihi3芯片的工业级部署实战（附能耗对比&代码库）封面建议：脉冲神经网络动态脉冲传导图覆盖在神经形态芯片显微结构上，标注「能效比：传统GPU的1/800」一、2025生物启发AI的临界点突破生物神经特性事件
《从Backprop到Diffusion：深度学习的算法进化树全景图》 HeartException 学习人工智能
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站《从Backprop到Diffusion：深度学习的算法进化树全景图》**展开系统性解析。全文基于算法原理-技术突破-产业重塑的三层逻辑链，融合2025年最新研究成果与产业数据，呈现深度学习四十年的底层技术迁徙路径从Backprop到Diffusion：深度学习的算法进化树全景图副标题：一部算法
语言模型之谜：提示内容与格式的交响诗步子哥 AGI通用人工智能语言模型人工智能自然语言处理
当代人工智能领域中，语言模型（LLM）正以前所未有的规模和深度渗透到各行各业。从代码生成到数学推理，从问答系统到多项选择题，每一次技术的跃进都离不开一个看似简单却充满玄机的关键环节——提示（prompt）的设计。而在这场提示优化的探索中，内容与格式的双重奏正逐渐揭开其神秘面纱，谱写出一曲宏大的交响诗。本文将带您走进“内容格式集成提示优化（CFPO）”的奇幻世界，揭示如何透过细腻的内容雕琢和精妙的格
多模态大模型：技术原理与实战看清GPT的进化史和创新点 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
多模态大模型：技术原理与实战看清GPT的进化史和创新点1.背景介绍1.1人工智能的发展历程1.1.1早期人工智能1.1.2机器学习时代1.1.3深度学习的崛起1.2自然语言处理的演进1.2.1基于规则的方法1.2.2统计机器学习方法1.2.3深度学习方法1.3大语言模型的出现1.3.1Transformer架构的提出1.3.2GPT系列模型的发展1.3.3多模态大模型的兴起2.核心概念与联系2.1
《卷积神经网络到Vision Transformer：计算机视觉的十年架构革命》 HeartException 人工智能学习
前言前些天发现了一个巨牛的人工智能免费学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站题目《卷积神经网络到VisionTransformer：计算机视觉的十年架构革命》展开深度解析，全文采用技术演进史+架构对比+产业影响的三段式结构，附关键数据与趋势预测：卷积神经网络到VisionTransformer：计算机视觉的十年架构革命副标题：从局部感知到全局建模，一场改变AI视觉基石的
Alpha系统联结大数据、GPT两大功能，助力律所管理降本增效资讯分享周大数据 gpt
如何通过AI工具实现法律服务的提质增效,是每一位法律人都积极关注和学习的课题。但从AI技术火爆一下,法律人一直缺乏系统、实用的学习资料,来掌握在法律场景下AI的使用技巧。今年5月,iCourt携手贵阳律协大数据与人工智能专业委员会,联合举办了《人工智能助力律师行业高质量发展巡回讲座》,超过100家律所的律师参与活动。讲座上,iCourtAIGC研究员、AlphaGPT产品研发负责人兰洋,为贵州律协
Xtuner：大模型微调快速上手潘达斯奈基~ AIGC AIGC
一、XTuner是什么？简单来说，XTuner是一个轻量级、易于使用的、为大语言模型（LLM）设计的微调工具库。它由上海人工智能实验室（OpenMMLab）开发，是其强大AI工具生态（MMCV,MMEngine等）的一部分。它的核心设计理念是“用一个配置文件搞定一切”，让开发者和研究人员可以极大地简化微调流程。二、为什么选择XTuner？（核心优势）轻量且用户友好：命令行驱动：你不需要编写复杂的训
对于规范和实现，你会混淆吗？ yangshangchuan HotSpot
昨晚和朋友聊天，喝了点咖啡，由于我经常喝茶，很长时间没喝咖啡了，所以失眠了，于是起床读JVM规范，读完后在朋友圈发了一条信息： JVM Run-Time Data Areas：The Java Virtual Machine defines various run-time data areas that are used during execution of a program. So
android 网络百合不是茶网络
android的网络编程和java的一样没什么好分析的都是一些死的照着写就可以了,所以记录下来方便查找 , 服务器使用的是TomCat 服务器代码; servlet的使用需要在xml中注册 package servlet; import java.io.IOException; import java.util.Arr
[读书笔记]读法拉第传 comsci 读书笔记
1831年的时候,一年可以赚到1000英镑的人..应该很少的... 要成为一个科学家,没有足够的资金支持,很多实验都无法完成但是当钱赚够了以后....就不能够一直在商业和市场中徘徊......
随机数的产生沐刃青蛟随机数
c++中阐述随机数的方法有两种：一是产生假随机数（不管操作多少次，所产生的数都不会改变）这类随机数是使用了默认的种子值产生的，所以每次都是一样的。 //默认种子 for (int i = 0; i < 5; i++) { cout<<
PHP检测函数所在的文件名 IT独行者 PHP 函数
很简单的功能，用到PHP中的反射机制，具体使用的是ReflectionFunction类，可以获取指定函数所在PHP脚本中的具体位置。创建引用脚本。代码： [php] view plain copy // Filename: functions.php <?php&nbs
银行各系统功能简介文强chu 金融
银行各系统功能简介　业务系统核心业务系统业务功能包括：总账管理、卡系统管理、客户信息管理、额度控管、存款、贷款、资金业务、国际结算、支付结算、对外接口等清分清算系统以清算日期为准，将账务类交易、非账务类交易的手续费、代理费、网络服务费等相关费用，按费用类型计算应收、应付金额，经过清算人员确认后上送核心系统完成结算的过程国际结算系
Python学习1(pip django 安装以及第一个project) 小桔子 python django pip
最近开始学习python,要安装个pip的工具。听说这个工具很强大，安装了它，在安装第三方工具的话so easy!然后也下载了，按照别人给的教程开始安装，奶奶的怎么也安装不上！第一步：官方下载pip-1.5.6.tar.gz, https://pypi.python.org/pypi/pip easy! 第二部：解压这个压缩文件，会看到一个setup.p
php 数组 aichenglong PHP 排序数组循环多维数组
1 php中的创建数组 $product = array('tires','oil','spark');//array()实际上是语言结构而不是函数 2 如果需要创建一个升序的排列的数字保存在一个数组中，可以使用range()函数来自动创建数组 $numbers=range(1,10)//1 2 3 4 5 6 7 8 9 10 $numbers=range(1,10,
安装python2.7 AILIKES python
安装python2.7 1、下载可从 http://www.python.org/进行下载#wget https://www.python.org/ftp/python/2.7.10/Python-2.7.10.tgz 2、复制解压 #mkdir -p /opt/usr/python #cp /opt/soft/Python-2
java异常的处理探讨百合不是茶 JAVA异常
//java异常 /* 1，了解java 中的异常处理机制，有三种操作 a,声明异常 b,抛出异常 c,捕获异常 2，学会使用try-catch-finally来处理异常 3，学会如何声明异常和抛出异常 4，学会创建自己的异常 */ //2，学会使用try-catch-finally来处理异常
getElementsByName实例 bijian1013 element
实例1： <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/x
探索JUnit4扩展：Runner bijian1013 java 单元测试 JUnit
参加敏捷培训时，教练提到Junit4的Runner和Rule，于是特上网查一下，发现很多都讲的太理论，或者是举的例子实在是太牵强。多搜索了几下，搜索到两篇我觉得写的非常好的文章。文章地址：http://www.blogjava.net/jiangshachina/archive/20
[MongoDB学习笔记二]MongoDB副本集 bit1129 mongodb
1. 副本集的特性 1)一台主服务器(Primary),多台从服务器(Secondary) 2)Primary挂了之后，从服务器自动完成从它们之中选举一台服务器作为主服务器，继续工作，这就解决了单点故障，因此，在这种情况下，MongoDB集群能够继续工作 3)挂了的主服务器恢复到集群中只能以Secondary服务器的角色加入进来 2
【Spark八十一】Hive in the spark assembly bit1129 assembly
Spark SQL supports most commonly used features of HiveQL. However, different HiveQL statements are executed in different manners: 1. DDL statements (e.g. CREATE TABLE, DROP TABLE, etc.)
Nginx问题定位之监控进程异常退出 ronin47
nginx在运行过程中是否稳定，是否有异常退出过？这里总结几项平时会用到的小技巧。 1. 在error.log中查看是否有signal项，如果有，看看signal是多少。比如，这是一个异常退出的情况： $grep signal error.log 2012/12/24 16:39:56 [alert] 13661#0: worker process 13666 exited on s
No grammar constraints (DTD or XML schema).....两种解决方法 byalias xml
方法一：常用方法关闭XML验证工具栏：windows => preferences => xml => xml files => validation => Indicate when no grammar is specified:选择Ignore即可。方法二：（个人推荐）添加内容如下 <?xml version=
Netty源码学习-DefaultChannelPipeline bylijinnan netty
package com.ljn.channel; /** * ChannelPipeline采用的是Intercepting Filter 模式 * 但由于用到两个双向链表和内部类，这个模式看起来不是那么明显，需要仔细查看调用过程才发现 * * 下面对ChannelPipeline作一个模拟，只模拟关键代码： */ public class Pipeline {
MYSQL数据库常用备份及恢复语句 chicony mysql
备份MySQL数据库的命令，可以加选不同的参数选项来实现不同格式的要求。 mysqldump -h主机 -u用户名 -p密码数据库名 > 文件备份MySQL数据库为带删除表的格式，能够让该备份覆盖已有数据库而不需要手动删除原有数据库。 mysqldump -–add-drop-table -uusername -ppassword databasename > ba
小白谈谈云计算--基于Google三大论文 CrazyMizzz Google 云计算 GFS
之前在没有接触到云计算之前，只是对云计算有一点点模糊的概念，觉得这是一个很高大上的东西，似乎离我们大一的还很远。后来有机会上了一节云计算的普及课程吧，并且在之前的一周里拜读了谷歌三大论文。不敢说理解，至少囫囵吞枣啃下了一大堆看不明白的理论。现在就简单聊聊我对于云计算的了解。我先说说GFS &n
hadoop 平衡空间设置方法 daizj hadoop balancer
在hdfs-site.xml中增加设置balance的带宽，默认只有1M： <property> <name>dfs.balance.bandwidthPerSec</name> <value>10485760</value> <description&g
Eclipse程序员要掌握的常用快捷键 dcj3sjt126com 编程
判断一个人的编程水平，就看他用键盘多，还是鼠标多。用键盘一是为了输入代码（当然了，也包括注释），再有就是熟练使用快捷键。曾有人在豆瓣评《卓有成效的程序员》：“人有多大懒，才有多大闲”。之前我整理了一个程序员图书列表，目的也就是通过读书，让程序员变懒。程序员作为特殊的群体，有的人可以这么懒，懒到事情都交给机器去做，而有的人又可以那么勤奋，每天都孜孜不倦得
Android学习之路 dcj3sjt126com Android学习
转自：http://blog.csdn.net/ryantang03/article/details/6901459 以前有J2EE基础，接触JAVA也有两三年的时间了，上手Android并不困难，思维上稍微转变一下就可以很快适应。以前做的都是WEB项目，现今体验移动终端项目，让我越来越觉得移动互联网应用是未来的主宰。下面说说我学习Android的感受，我学Android首先是看MARS的视
java 遍历Map的四种方法 eksliang java HashMap java 遍历Map的四种方法
转载请出自出处： http://eksliang.iteye.com/blog/2059996 package com.ickes; import java.util.HashMap; import java.util.Iterator; import java.util.Map; import java.util.Map.Entry; /** * 遍历Map的四种方式
【精典】数据库相关相关 gengzg 数据库
package C3P0; import java.sql.Connection; import java.sql.SQLException; import java.beans.PropertyVetoException; import com.mchange.v2.c3p0.ComboPooledDataSource; public class DBPool{
自动补全 huyana_town 自动补全
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"><html xmlns="http://www.w3.org/1999/xhtml&quo
jquery在线预览PDF文件，打开PDF文件天梯梦 jquery
最主要的是使用到了一个jquery的插件jquery.media.js，使用这个插件就很容易实现了。核心代码 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.
ViewPager刷新单个页面的方法 lovelease android viewpager tag 刷新
使用ViewPager做滑动切换图片的效果时，如果图片是从网络下载的，那么再子线程中下载完图片时我们会使用handler通知UI线程，然后UI线程就可以调用mViewPager.getAdapter().notifyDataSetChanged()进行页面的刷新，但是viewpager不同于listview，你会发现单纯的调用notifyDataSetChanged()并不能刷新页面
利用按位取反（~）从复合枚举值里清除枚举值草料场 enum
以 C# 中的 System.Drawing.FontStyle 为例。如果需要同时有多种效果，如：“粗体”和“下划线”的效果，可以用按位或（|） FontStyle style = FontStyle.Bold | FontStyle.Underline; 如果需要去除 style 里的某一种效果，
Linux系统新手学习的11点建议刘星宇编程工作 linux 脚本
　　随着Linux应用的扩展许多朋友开始接触Linux，根据学习Windwos的经验往往有一些茫然的感觉：不知从何处开始学起。这里介绍学习Linux的一些建议。　　一、从基础开始：常常有些朋友在Linux论坛问一些问题，不过，其中大多数的问题都是很基础的。例如：为什么我使用一个命令的时候，系统告诉我找不到该目录，我要如何限制使用者的权限等问题，这些问题其实都不是很难的，只要了解了 Linu
hibernate dao层应用之HibernateDaoSupport二次封装 wangzhezichuan DAO Hibernate
/** * 方法描述:sql语句查询返回List<Class> * 方法备注: Class 只能是自定义类 * @param calzz * @param sql * @return * 创建人：王川 * 创建时间：Jul