快乐小码农

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）
- Text-to-Text 模型
- - ChatGPT
  - LaMDA
  - PEER
  - Meta AI Speech from Brain
- Text-to-Code 模型
- - Codex
  - Alphacode
- Text-to-Science 模型
- - Galactica
  - Minerva
- 其他模型
- - AlphaTensor
  - GATO
  - PhysDiff
  - ChatBCG

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

AI生成模型可不止ChatGPT一个，光是基于文本输入的就有7种——图像、视频、代码、3D模型、音频、文本、科学知识…尤其2022年，效果好的AI生成模型层出不穷，又以OpenAI、Meta、DeepMind和谷歌等为核心，发了不少达到SOTA的模型。

随着技术的进步，我们已经在文本到图像或文本到音频等任务中看到了大量的创造力和个性化。它们在文本到科学或文本到代码的任务中也很准确。这在很大程度上可以提升我们的自动化水平，帮助优化创造性和非创造性任务。

今天我们继续学习由西班牙科米利亚斯主教大学（Comillas Pontifical University）的研究人员提交的综述论文《ChatGPT is not all you need. A State of the Art Review of large Generative AI models》。

论文：ChatGPT is not all you need. A State of the Art Review of large Generative AI models
机构：Quantitative Methods Department, Universidad Pontificia Comillas, Madrid, Spain
作者：Roberto Gozalo-Brizuela, Eduardo C. Garrido-Merch´an
地址：https://arxiv.org/pdf/2301.04655.pdf

大家可以回顾第一部分，第二部分的内容：
传送门1：ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（一）
传送门2：ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（二）

这第三部分，我们接着来看Text-to-Text，Text-to-Code，Text-to-Science和其他模型的一些细节。

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）
- Text-to-Text 模型
  - ChatGPT
  - LaMDA
  - PEER
  - Meta AI Speech from Brain
- Text-to-Code 模型
  - Codex
  - Alphacode
- Text-to-Science 模型
  - Galactica
  - Minerva
- 其他模型
  - AlphaTensor
  - GATO
  - PhysDiff
  - ChatBCG

Text-to-Text 模型

前面的模型都将非结构化数据类型转换为另一种类型。但是，关于文本，将文本转换为另一个文本是非常有用的，以满足一般问题和回答的任务。以下四个模型处理文本并输出文本以满足不同的需求。

ChatGPT

最近广受欢迎的 ChatGPT 由 OpenAI 开发，是一个AI对话生成工具，懂得回答问题、拒绝不正当的问题请求并质疑不正确的问题前提。具体地，ChatGPT 背后的算法是Transformer，训练过程主要是通过人类反馈的强化学习（RLHF）算法，即在强化学习阶段，通过拟合大量的人工标注的偏好数据，来对齐大规模语言模型和人类偏好，从而给出令人满意的有用（Helpful）、可靠（Honest）和无害（Harmless）的回答。除了以对话的方式与用户进行互动，也可以生成代码和进行简单数学运算。

如下图14所示 ChatGPT 的训练过程，有监督学习和强化学习两阶段，需要训练监督模型、偏好模型和强化模型，已经抛弃了传统的 LM 方式。

训练监督模型	训练偏好模型	训练强化模型
1.大量标注：采样随机请求，人类训练师撰写预期回答。2.监督训练：微调预训练模型（GPT-3.5），请求（Prompt）–> 回答（人工）。3.主要目标：具备一定的对话能力。	1.大量标注：采样随机请求，人类训练师给生成的多个候选回答进行质量排序。2.偏序训练：微调预训练模型（GPT-3.5），请求（Prompt）+回答 --> 评分（浮点数）。3.蒸馏偏好：人类反馈。	采用强化学习PPO算法，以监督模型初始化，最大化偏好模型的反馈奖励。

ChatGPT 成功背后的最重要技术是 RLHF（Reinforcement Learning from Human Feedback）算法。RLHF 的训练过程可以分解为三个核心步骤：

预训练语言模型（LM）
收集数据并训练奖励模型
通过强化学习微调 LM

所以，ChatGPT 模型上基本上和之前 GPT-3 都没有太大变化，主要变化的是训练策略变了，用上了强化学习。强化学习非常像生物进化，模型在给定的环境中，不断地根据环境的惩罚和奖励（reward），拟合到一个最适应环境的状态。图14展示的训练步骤，重点是第二步，如何建一个 reward 函数。而在 ChatGPT 里，具体就是找了40个外包公司不断地从模型的输出结果中筛选，判断哪些句子是好的，哪些是低质量的，这样就可以训练得到一个 reward 模型。通过 reward 模型来评价模型的输出结果好坏。

虽然 ChatGPT 为代表的 RLHF 技术非常有影响力，引发了巨大的关注，但仍然存在若干局限性：

RLHF 范式训练出来的这些模型虽然效果更好，但仍然可能输出有害或事实上不准确的文本。
在基于 RLHF 范式训练模型时，人工标注的成本是非常高昂的，而 RLHF 性能最终仅能达到标注人员的知识水平。
RLHF的流程还有很多值得改进的地方，其中，改进 RL 优化器显得尤为重要。

LaMDA

LaMDA 是超过 50 多位谷歌研究者参与撰写的论文《 LaMDA: Language Models for Dialog Applications 》中介绍的一个语言模型，与大多数其他语言模型不同，LaMDA接受了对话训练。

LaMDA 模型基于 Transformer 开发，专门用于对话，具有 1370 亿个参数，在1.56T的公共对话数据集和其他公开网页文本上进行预训练，只有0.001%的训练数据被用于微调，这也是它效果好的原因之一。特别地，LaMDA 的对话框模式利用了 Transformer 在文本中呈现长期依赖关系的能力。

LaMDA 在技术上没什么新突破，但提供了很多有价值的落地方案参考。首先，对于训练对话模型来说，定义目标和指标至关重要。LaMDA 模型具有质量、安全和扎实性三个关键目标，每个目标有各自的衡量指标。

Sensibleness, Specificity, Interestingness：是否合理、符合上下文、有创造力。
Safety：是否有风险、不公正。
Groundedness、Informativeness：在知识型问答中，是否包含真实的信息、并引用相关链接。

其次，LaMDA 用单个大模型实现整个端到端的问答。模型结构采用decoder-only Transformer，类似 GPT 的自回归模型，做到了同时「生成+排序」。

第三，LaMDA 的一个最关键的创新点是融入知识。模型有时会生成很多看起来合理，但不合逻辑的回复。一种方案是增加模型大小，从而让它很好地记忆训练数据中的外部知识。而LaMDA提出了一种模拟人类先研究后回复的训练方案，从而让模型更好利用外部知识。如下图15是 LaMDA 的一段有意思的对话。

PEER

PEER 是由 Meta AI Research 和卡内基梅隆大学的研究人员提出的一个新的文本生成模型，基于维基百科编辑历史进行训练，直到模型掌握完整的写作流程。

PEER 基于四个步骤：计划（Plan），编辑（Edit），解释（Explain），重复（Repeat），完全模拟人类写作文的过程，从打草稿、征求建议到编辑文本，再不断迭代。重复这些步骤，直到文本处于不需要进一步更新的满意状态。该模型允许将写作任务分解成更多子任务，并允许人类随时干预，引导模型写出人类想要的作品。

PEER 解决了传统语言模型只会生成最终结果，并且生成文本无法控制的问题，通过输入自然语言命令，PEER可以对生成文本进行修改。

最重要的是，PEER 使用**自我训练（self-training）**方法提高训练数据的质量、数量以及多样性。具体地，训练多个PEER实例，并用这些实例学习填充写作过程中的多个环节。这些模型可以用来生成合成数据作为训练语料库中缺失部分的替代。

但是，模型依靠维基百科作为训练数据的唯一来源存在缺陷：

仅使用维基百科训练得到的模型在预期文本内容的样子和预测的计划和编辑方面需要和维基百科相似。
维基百科中的评论是有噪音的，因此在许多情况下，评论并不是计划或解释的恰当输入。
维基百科中的许多段落不包含任何引文，虽然这种背景信息的缺乏可以通过使用检索系统来弥补，但即使这样的系统也可能无法为许多编辑找到支持性的背景信息。

Meta AI Speech from Brain

Speech from Brain 是由 Meta AI 开发的AI模型，可以根据大脑活动的无创记录解码语音，相关论文是《从非侵入性大脑记录解码语音》（Decoding speech from non-invasive brain recordings）。具体地，首先使用深度学习方法对语音输入和对应的脑电（磁）图信号进行解码，得到深层次的特征表示；然后，应用对比学习策略匹配两种模态的潜在特征表示；最终，在四个公共数据集上评估了该模型。

目前，从大脑活动中解码语音的大多数进展，依赖于侵入性大脑记录技术，例如立体定向脑电图和脑皮层电图。但相较于无创方法，它们需要打开头骨并将电极直接放在大脑本身上，对人有一定风险和危害性。而 Meta AI 提出的模型试图从非侵入性大脑记录中直接解码语言。这将提供一个更安全、更可扩展的解决方案，使更多人受益。这种方法的挑战来自于噪音和每个人的大脑以及传感器放置位置的差异。

为了解决这个问题，Meta AI 的研究人员转向机器学习算法来帮助“清理”噪声。他们使用的模型称为 wave2vec 2.0，这是该团队在 2020 年研发的开源自监督学习 AI 工具，可用于从嘈杂的音频中识别正确的语音。

具体来说，研究人员专注于脑电图和脑磁图两种非侵入性技术，他们在这两种方式的四个开源录音上，对 wave2vec 2.0 进行了训练。训练数据集包括来自 169 名健康志愿者，在听有声读物和孤立句子（英语和荷兰语）时，大脑活动的 150 多个小时的录音。该团队还将这些脑电图/EEG和脑磁图/MEG的记录输入到一个“大脑”模型中，该模型由一个带有残差连接的标准深度卷积网络组成。

为了从非侵入性大脑信号中解码语音，Meta AI 提出一种单一的端到端架构，用对比学习的方式在大量的个体群中进行训练，以预测自然语音的自监督表示。

值得一提的是，Meta AI 在之前工作中，使用 wav2vec 2.0 证明了该算法可生成与大脑相似的语音表示。如下图所示。wav2vec 2.0 中语音“类脑”表示的特点使其成为构建解码器的理想选择，它有助于了解应该从大脑信号中提取哪些表示。

进一步分析表明，该算法的几个组成部分，包括 wav2vec 2.0 和主题层，有利于解码性能。此外，算法随着脑电图/EEG和脑磁图/MEG记录的增加而改进。尽管数据中存在噪声和可变性，但经过自我监督训练的AI可以解码反常的语音。总的来说，这项研究的最大局限是它专注于解码语音感知，但最终目标是将此项研究扩展到语音生成。

Text-to-Code 模型

和Text-to-Text类似，但并非所有文本都遵循相同的语法。一种特殊类型的文本是代码。

Codex

Codex 是由 OpenAI 开发的将文本翻译为代码的AI系统。Codex 是一个通用编程模型，因为它基本上可以应用于任何编程任务。目前，Codex 最擅长 Python 语言，并且精通 JavaScript、Go、Perl、PHP、Ruby、Swift 、TypeScript 和 Shell 等其他十数种编程语言。Codex 的演示和API可以在OpenAI的网站上找到：https://openai.com/blog/openai-codex/。

编程可以分为两部分：1）将问题分解为更简单的问题，2）将这些问题映射到已经存在的现有代码（库、API或函数）中。其中第二部分是程序员最花时间的部分，也是 Codex 最擅长的地方。

Codex 的目的是让程序员在第一部分上花费更多时间，而不是第二部分。毕竟，大量的代码都是在重复或直接抄袭别人之前所做的事情。

Codex 建立在 OpenAI 的语言生成模型 GPT-3 之上，该模型在大规模的数据上进行训练，可以用来解析和生成文本等功能。GPT-3 的一个应用是生成代码，但是 Codex 改进了代码生成能力，它可以对从网上搜集的开源代码库进行训练。

Codex 基于GPT-3使用code数据进行了Fine-Tuning，模型参数从 12M 到 12B不等。众所周知，在训练大规模预训练模型时，通常是“模型未动，数据先行”。Codex 的训练数据收集于2020年5月 Github上托管的 54,000,000 个公开代码仓，包括 179 GB 文件大小在 1 MB 以下的独一无二的Python文件，在经过过滤后，最终的数据集大小为 159GB。

当然 Codex 还存在一些局限性，Codex 更倾向于“背代码”和做“代码组合”，而没有真正掌握多少编程知识。如果我们把编程能力分为：1. 编程语言知识（语法知识、API功能等）；2. 逻辑推理能力（算法能力）；3. 利用已有代码的能力（掌握一些常用实现）；那么 Codex 在前两点上的能力都比较弱，只在第三点上展现出了强大的能力，从这个角度来看，真正的专业的代码智能依旧任重而道远。

Alphacode

AlphaCode 是由 DeepMind 开发的基于 Transformer 的语言模型，实现了大规模代码生成，并且针对那些需要深度推理的编程问题，能够创建新颖的解决方案。在 10 场有 5000 多名人类参与者的竞赛级别的编程比赛中，AlphaCode 排名位于前 54.3%。也就是说，其已达到了平均人类水平。AlphaCode 相关论文以《可实现完成竞赛级别的代码生成任务的 AlphaCode》（Competition-level code generation with AlphaCode）为题发表在 Science，并成为当期封面论文。

DeepMind 为 AlphaCode 设置了以下三个关键组件，使其得以在代码生成任务中实现可以与人类竞争的水平：一是选用广泛且简洁的竞争性编程数据集，以便进行训练和评估；二是采用大型、且具备高效采样能力的架构；三是通过大规模模型抽样来缩小探索空间，并根据程序行为对一小组提交内容进行过滤。

如上图所示，是 AlphaCode 的方法概述，其系统工作主要分为4个步骤：

Pre-training：基于一个标准的语言建模目标函数，使用 Transformer 模型架构在GitHub数据集上做预训练。这是一个比Codex预训练数据集更广泛的数据集，总计715.1GB。这样模型可以合理地表征人类编码空间，可以极大地减少搜索量级。
Fine-tuning：使用带tempering的GOLD目标函数，在编程竞赛数据集CodeContests上做微调。这可以进一步将搜索空间缩小，并可以通过预训练来补偿少量的竞争性编程数据。
Large scale sampling：为每个问题生成大量样本。用训练完的模型 sample 大量的 solution 出来，并且做过滤和聚类。过滤是为了去掉无法通过样例的代码（会干掉绝大部分），聚类是为了让实现不同但输出相同的代码只提交一次（节约提交的budget）。聚类中，还需要一个独立训练的生成测试数据的模型。这个步骤是针对竞赛题设计的，从这个步骤看，直接用生成的代码直接run错误的概率很高。
Execute & evaluate：对这些样本进行过滤，并获得数量不超过 10 个的一小组候选样本提交。然后通过使用示例测试和聚类等，对所选样本进行隐藏的测试评估，然后根据程序的反馈来选择样本。

AlphaCode 并不包含关于计算机代码结构的明确的内置知识，相反，它依靠一种纯粹的「数据驱动」方法来编写代码，也就是通过简单地观察大量现有代码来学习计算机程序的结构。从根本上说，使 AlphaCode 在竞争性编程任务上胜过其他系统的原因归结为两个主要属性：1. 训练数据；2. 候选解决方案的后处理。

Text-to-Science 模型

科研文字也是AI文本生成的目标之一，但要任重而道远。

Galactica

Galatica 是由 Meta AI 和 Papers with Code 联合开发的一个学术论文处理领域预训练大模型。Galatica 作为1200亿参数论文写作辅助模型，又被称之为“写论文的Copilot模型”，目的是帮助人们快速总结并从新增论文中得到新结论，在包括生成文本、数学公式、代码、化学式和蛋白质序列等任务上取得了不错的效果，然而一度因为内容生成不可靠被迫下架。 Galactica 试用地址：https://galactica.org/.

Galactica 模型是在一个大型语料库上训练出来的，该语料库包括超过3.6亿条上下文引文和超过5000万条在不同来源中规范化的独特引用。这使得Galactica能够建议引文并帮助发现相关的论文。

Galatica 模型的主要优点是即便进行多个episode的训练后，模型仍然不会过拟合，并且上游和下游的性能会随着token的重复使用而提高。数据集的设计对 Galatica 至关重要，因为所有的数据都是以通用的markdown格式处理的，从而能够混合不同来源的知识。引文（citations）通过一个特定的token来处理，使得研究人员可以在任何输入上下文中预测一个引文。Galactica 模型预测引文的能力会随着规模的提升而提高。

此外，Galatica 模型在仅有解码器的设置中使用了一个Transformer架构，对所有尺寸的模型进行了GeLU激活，从而可以执行涉及SMILES化学公式和蛋白质序列的多模态任务。

研究团队说，Galactica可以存储、组合和推理科学内容。在数学MMLU等基准测试中，它远远超过了Chinchilla（41.3%比35.7%）或PaLM 540B（20.4%比8.8%）等大型语言模型。

图注：Galactica 总结出一篇综述论文

Minerva

Minerva 是由谷歌开发的深度学习语言模型，目的是通过逐步推理解决数学定量问题，可以主动生成相关公式、常数和涉及数值计算的解决方案，也能生成LaTeX、MathJax等公式，而不需要借助计算器来得到最终数学答案。

Minerva 相关论文以《用语言模型解决定量推理问题》（Solving Quantitative Reasoning Problems with Language Models）为题提交在arXiv上。下图是 Minerva 针对一个定量数学问题的输出示例。

Minerva 构建在 Pathways 语言模型（PaLM，5400 亿个参数，密集激活，基于Transformer语言模型）之上，并在一个 118GB 数据集（包括科学论文和含有数学表达式的网页）上进行训练。为了在符号数据上训练模型，训练数据集中保留了数学符号表示。这个过程如下图所示。

Minerva 的一个局限性是模型的答案不能进行自动评估。由于 Minerva 并没有使用底层数学结构来回答问题，这使其无法自动验证答案，因而检测不到“误报”情况。该模型还无法利用计算器或Python解释器等外部工具。因此，它进行需要复杂数值计算的定量推理任务的能力有限。Minerva模型的性能目前与人类的表现还有不小差距。

为了推广量化推理的 NLP 模型，谷歌 AI 分享了一个交互式示例集合：https://minerva-demo.github.io，用于帮助用户探索 Minerva 的能力。

其他模型

除了前面提及的9大类的21个模型，还有其他的生成模型，如Alphatensor、GATO、PhysDiff等。

AlphaTensor

AlphaTensor 由DeepMind开发，懂得自己改进矩阵乘法并提升计算速度，不仅改进了目前最优的4×4矩阵解法，也提升了70多种不同大小矩阵的计算速度，基于“棋类AI”AlphaZero打造，其中棋盘代表要解决的乘法问题，下棋步骤代表解决问题的步骤。

基于深度强化学习方法，智能体 AlphaTensor 的训练过程就是玩一个单人游戏，目标是在有限的因子空间内寻找张量分解。在TensorGame的每一步，玩家需要选择如何结合矩阵的不同entries来进行乘法，并根据达到正确的乘法结果所需的操作数量来获得奖励分数。AlphaTensor 使用一种特殊的神经网络架构来利用合成训练游戏（synthetic training game）的对称性。

GATO

GATO 是由DeepMind开发的通用智能体，它可以作为一个多模态、多任务或多embodiment泛化策略来使用。该模型可用于执行不同模态下（文本、图像、视频、音频等）复杂的计算任务，如生成对话与字幕、玩视频游戏、控制机械臂搭积木等。

在所有任务中使用单一的神经序列模型有很多好处，减少了手工制作具有自身归纳偏见策略模型的需要，并增加了训练数据的数量和多样性。这种通用智能体在大量任务中都取得了成功，并且可以用很少的额外数据进行调整，以便在更多的任务中取得成功。

在 GATO 的训练阶段，来自不同任务和模态的数据被序列化为扁平的 token 序列，并由类似于大型语言模型的 Transformer 神经网络进行批处理。在此过程中，模型的一部分损失函数被选择性地隐藏，以使得 GATO 只对行为决策和文本目标进行学习。

GATO 只有11.8 亿个参数，可以实时控制现实世界机器人的模型规模。与 1750 亿个参数的 GPT-3、巨大的 5400 亿个参数的PaLM 模型或 700 亿个参数的 Chinchilla 相比，它的体量无疑是很小的。

PhysDiff

PhysDiff 是英伟达推出的人体运动生成扩散模型，进一步解决了AI人体生成中漂浮、脚滑或穿模等问题，教会AI模仿使用物理模拟器生成的运行模型，并在大规模人体运动数据集上达到了最先进的效果。

ChatBCG

ChatBCG 是由来自斯坦福大学的两名学生（Joseph Semrai与Silas Alberti）共同开发的一个用来生成 PPT 的模型。目前已在官网开放Demo和试用：https://www.chatbcg.com/。

ChatBCG 已经开放的功能，包括自动生成大纲、标题、要点、粗体关键字、图像和图形，还能够变换多种布局和主题。此外，完成的文件还支持以PPTX和PDF格式导出。

参考：
https://openai.com/blog/chatgpt/

https://roll.sohu.com/a/634763268_121207965

https://baijiahao.baidu.com/s?id=1742754879198749278&wfr=spider&for=pc

https://baijiahao.baidu.com/s?id=1742990592560504585&wfr=spider&for=pc

http://www.360doc.com/content/22/1025/09/76039144_1053186428.shtml

https://baijiahao.baidu.com/s?id=1751778973357411234&wfr=spider&for=pc

https://t.cj.sina.com.cn/articles/view/5901272611/15fbe4623019021f7l?finpagefr=p_104

https://minerva-demo.github.io/#category=Algebra&index=1

https://www.deepmind.com/blog/discovering-novel-algorithms-with-alphatensor

https://www.deepmind.com/publications/a-generalist-agent

https://baijiahao.baidu.com/s?id=1756520241186383004&wfr=spider&for=pc

https://www.producthunt.com/posts/chatbcg-generative-ai-for-slides

欢迎各位关注我的个人公众号：HsuDan，我将分享更多自己的学习心得、避坑总结、面试经验、AI最新技术资讯。

python爬虫根据需要查找某个链接并保存快乐小运维 python 爬虫开发语言
importreimportosfromurllib.parseimporturlparse,quoteimportasyncioimportaiohttpfrombs4importBeautifulSoup#所有下载文件file_name=“1.txt”asyncdeffetch_url(session,url):try:#首先尝试HTTPSasyncwithsession.get(url,ti
交换机和路由器的区别毛毛的毛毛智能路由器网络
交换机（Switch）和路由器（Router）都是网络中常见的设备，它们各自有不同的功能和作用。以下是交换机和路由器之间的主要区别：1.工作层级交换机（Switch）：主要工作在数据链路层（OSI模型的第2层），也可以工作在网络层（第3层），这种交换机称为“三层交换机”。交换机通过MAC地址来识别和转发数据帧，它根据设备的硬件地址来决定将数据发送到哪个端口。路由器（Router）：主要工作在网络层
DNS介绍（5）：DNS 劫持及解决方案 thinking-fish 基础设施 dns劫持网络 dns 网络安全
DNS劫持分析DNS劫持，亦称为域名重定向或DNS篡改，是一种网络攻击技术。其核心在于攻击者通过篡改DNS系统的域名解析结果，将用户本意访问的域名指向攻击者所掌控的IP地址。这种攻击不仅可能使用户无法顺利访问所需网站，还可能让用户面临多种网络安全风险。DNS（DomainNameSystem）是互联网的一项基础设施，负责将人们易于记忆的域名转换为计算机能够识别的IP地址。当DNS系统被攻击者篡改时
Python 写的《桌面时钟》屏保 PieroPc Python python 开发语言
原代码：#日历式时钟#导入所需的库#作者：Hoye#日期：2024年12月16日#功能：显示当前日期、星期、时间，并显示模拟时钟importtkinterastkfromtkinterimportttkimporttimeimportmathimportsysdefexit_screensaver(event=None):root.quit()defdraw_clock_face():#清除画布c
神经架构搜索在大模型效率优化中的应用 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
神经架构搜索，大模型，效率优化，自动机器学习，深度学习1.背景介绍近年来，深度学习模型取得了令人瞩目的成就，在图像识别、自然语言处理、语音识别等领域展现出强大的能力。然而，随着模型规模的不断扩大，训练和部署这些大模型也带来了巨大的挑战。计算资源消耗巨大:大模型的训练需要大量的计算资源，例如高性能GPU和TPU，这导致训练成本高昂，难以普及。内存占用量大:大模型的参数量庞大，需要大量的内存进行存储和
RestFul架构 zhanglinlove 工具 RESTFUL
REST是一种跨平台、跨语言的架构风格，jax-rs标准是在java领域，对rest式的web服务制定的实现标准，jersey是jax-rs标准的参考实现。GET（SELECT）：从服务器取出资源（一项或多项）。POST（CREATE）：在服务器新建一个资源。PUT（UPDATE）：在服务器更新资源（客户端提供完整资源数据）。PATCH（UPDATE）：在服务器更新资源（客户端提供需要修改的资源数
中间件以及主流中间件产品:IBM MQSeries和BEA Tuxedo介绍 CoderIsArt 架构设计研究中间件
中间件简介中间件（Middleware）是一类位于操作系统和应用程序之间的软件层，负责提供通用服务，简化分布式系统开发和集成。中间件的目标是屏蔽底层操作系统和网络的复杂性，为应用程序提供统一的接口和支持。中间件的功能消息传递：提供可靠的消息队列服务，支持异步通信。事务管理：支持分布式事务管理，保证数据一致性。服务集成：连接不同的应用程序和系统，促进跨平台和多语言环境下的协作。负载均衡和高可用性：确
Data Mesh：《华为数据之道》中的数据治理和**Data Mesh**架构的理念差异 PersistDZ 数据架构华为架构 data mesh 数据之道
《华为数据之道》中的数据治理和DataMesh架构的理念有一定的差异，尽管两者都强调如何有效管理和利用数据，但它们的侧重点、方法论和适用场景有所不同。以下是它们的异同、优劣势及适用场景的详细比较：1.数据治理与DataMesh的定义数据治理（《华为数据之道》中的数据治理）数据治理是一个全面的过程，旨在通过规范化、标准化、系统化的数据管理，使数据成为企业的核心资产。书中提出了数据治理的五化模型（标准
卷积神经网络（CNN）：深度学习中的核心模型任义礼智信深度学习 cnn 人工智能
引言卷积神经网络（ConvolutionalNeuralNetworks,CNNs）是深度学习领域的一种重要模型，广泛应用于图像处理、计算机视觉、自然语言处理等多个领域。CNN凭借其卓越的特征提取能力和参数共享机制，已成为计算机视觉任务中最主流的算法之一。本文将深入探讨CNN的基本原理、结构组件、应用场景及其发展方向。CNN的基本原理CNN是一种特殊的前馈神经网络（FeedforwardNeura
ARM体系与架构吃饱了好撑 arm开发架构
ARM体系与架构硬件基础ARM处理器什么是哈佛结构和冯诺依曼结构？冯诺依曼结构采用指令和数据统一编址，使用同条总线传输，CPU读取指令和数据的操作无法重叠。哈佛结构采用指令和数据独立编址，使用两条独立的总线传输，CPU读取指令和数据的操作可以重叠。利弊冯诺依曼结构主要用于通用计算机领域，需要对存储器中的代码和数据频繁的进行修改，统一编址有利于节约资源。哈佛结构主要用于嵌入式计算机，程序固化在硬件中
Oracle SQL每日一问之ORA-01723:zero-length columns are not allowed yan han ORACLE SQL oracle sql 数据库
我：CREATETABLETABLE_1PARALLEL8ASSELECT/*+parallel(8)*/t1.emp_no,NULLemp_nameFROMtemp1t1;[AI机器人bot:]在你的SQL语句中，错误"zero-lengthcolumnsarenotallowed"可能是由于在创建表时没有为`NULLemp_name`指定数据类型。即使在`CREATETABLE...ASSEL
【机器学习：十五、神经网络的编译和训练】 KeyPan 机器学习机器学习神经网络人工智能深度学习 pytorch ubuntu linux
1.TensorFlow实现代码TensorFlow是深度学习中最为广泛使用的框架之一，提供了灵活的接口来构建、编译和训练神经网络。以下是实现神经网络的一个完整代码示例，以“手写数字识别”为例：importtensorflowastffromtensorflow.kerasimportlayers,models#加载MNIST数据集(x_train,y_train),(x_test,y_test)
【机器学习：十六、其他的激活函数】 KeyPan 机器学习机器学习人工智能算法服务器运维 ubuntu
1.Sigmoid激活函数的替代方案Sigmoid激活函数在神经网络中曾广泛使用，其数学公式为：σ(x)=11+e−x\sigma(x)=\frac{1}{1+e^{-x}}σ(x)=1+e−x1输出范围为(0,1)，适合二分类问题。但随着深度学习的发展，Sigmoid函数逐渐被替代，主要原因包括：梯度消失问题：当输入绝对值较大时，梯度趋近于零，导致权重更新困难。非零中心问题：输出值始终为正，可能
深度学习图像算法中的网络架构：Backbone、Neck 和 Head 详解肥猪猪爸 #深度学习深度学习算法人工智能数据结构神经网络计算机视觉机器学习
深度学习已经成为图像识别领域的核心技术，特别是在目标检测、图像分割等任务中，深度神经网络的应用取得了显著进展。在这些任务的网络架构中，通常可以分为三个主要部分：Backbone、Neck和Head。这些部分在整个网络中扮演着至关重要的角色，它们各自处理不同的任务，从特征提取到最终的预测输出，形成了一个完整的图像处理流程。本文将详细介绍这三部分的作用以及它们在目标检测和图像分割中的应用，帮助大家更好
ARM架构与嵌入式系统开发全流程教程夏勇兴
本文还有配套的精品资源，点击获取简介：ARM架构因其低功耗、高性能和灵活性而广泛应用于嵌入式系统、移动设备等多种计算平台。本教程将深入介绍ARM处理器的类型，包括Cortex系列、ARMv8-A架构，以及Thumb和Thumb-2指令集。同时，涵盖ARM编程基础知识，包括汇编语言、C/C++编程和软件开发工具链，以及嵌入式系统中的应用和入门级教程，帮助初学者逐步掌握ARM处理器的工作原理和嵌入式系
【AIcoding技术必知必会】11问--CI/CD流水线是什么？ srzxy42 AI coding技术必知必会 ai 产品经理学习
基础介绍软件开发生命周期（SDLC）由下面这几个关键阶段组成：开发、测试、部署和运维。CI/CD将这些阶段自动化并整合起来，实现更快更可靠的发布。当代码提交到git仓库，便会触发自动的构建和测试流程。其中会运行端到端测试用例来验证代码。如果测试通过，代码就会自动部署到预发或生产环境。如果发现问题，代码就打回开发阶段进行修复。这种自动化过程为开发者提供了快速反馈，减少了生产环境中出问题的概率。CI/
NL2SQL技术方案系列(6)：金融领域知识检索，NL2SQL技术方案以及行业案例实战讲解4 汀、人工智能 LLM工业级落地实践人工智能 NL2SQL LLM 自然语言处理 copilot 知识检索语义搜索
NL2SQL技术方案系列(6)：金融领域NL2SQL技术方案以及行业案例实战讲解4NL2SQL基础系列(1)：业界顶尖排行榜、权威测评数据集及LLM大模型（SpidervsBIRD）全面对比优劣分析[Text2SQL、Text2DSL]NL2SQL基础系列(2)：主流大模型与微调方法精选集，Text2SQL经典算法技术回顾七年发展脉络梳理NL2SQL进阶系列(1)：DB-GPT-Hub、SQLco
当下是否入行AI ? 一场关于未来的赌注与机遇 dami_king 随笔人工智能
当下是否入行AI：一场关于未来的赌注与机遇在科技的浪潮中，人工智能（AI）无疑是最为汹涌的一波。它不仅改变了我们与机器互动的方式，还重塑了各行各业的面貌。面对这样的变革，许多人站在十字路口犹豫不决——现在进入AI领域还来得及吗？这个问题的答案，并非简单的“是”或“否”。今天，让我们一起深入探讨这个话题，看看对于想要投身AI的人来说，当下是不是一个好的时机。AI行业的现状与发展2024年，AI已经从
Random指定随机种子遇到的坑咖啡程序员 Random
提示：文章写完后，目录可以自动生成，如何生成可参考右边的帮助文档文章目录前言指定随机种子出现的问题？总结前言业务中，之前有一个抽奖的需求，之初想让固定的奖品和玩家绑定一个固定的池子，也就是每个用户对应抽奖的池子的随机种子是固定的！但是这样就会遇到一个巨大的坑！在指定Random随机种子的时候一定要谨慎！指定随机种子出现的问题？在计算机编程中，随机数生成算法实际上是通过确定性的计算来产生伪随机数序列
Maven 构建配置文件用心去追梦 maven pycharm java
Maven的构建配置主要通过一系列的XML文件来实现，最核心的是pom.xml（ProjectObjectModel，项目对象模型）。以下是pom.xml中几个关键的配置部分及其说明：ProjectInformation（项目信息）::定义项目所属的组织唯一标识符，通常是域名的反向表示。:定义实际项目名称，与groupId一起构成项目的唯一坐标。:项目的版本号。:指定项目的打包类型，如jar,wa
频域增强通道注意力机制EFCAM模型详解及代码复现呆头鹅AI工作室深度学习算法详解及代码复现深度学习人工智能神经网络 conda python
背景与动机在深度学习领域，如何有效处理时间序列数据一直是一个重要的研究方向。近年来，频域分析技术在时间序列处理中展现出了巨大潜力，特别是离散余弦变换（DCT）因其能够高效捕捉低频信息并避免高频噪声干扰而受到广泛关注。FECAM模型的开发正是基于这一背景，旨在结合频域分析和通道注意力机制，以提高模型对时间序列数据的特征提取和表示能力。通过这种创新方法，FECAM模型能够更有效地捕捉时间序列中的关键特
Airflow：深入理解Airflow Sensor 梦想画家数据分析工程 #Airflow #python 数据集成数据工程 Airflow
ApacheAirflowSensors是实现特定感知的任务，它可以持续监控外部条件或事件，并阻止下游任务的执行，直到满足指定的条件。它们对于编排复杂的工作流是必不可少的，在这些工作流中，任务需要在继续之前等待外部依赖关系变得可用。在这个全面的指南中，我们将详细探讨ApacheAirflowSensors，包括它们的类型，工作原理和常见的用例。关于具体每个内置Sensor应用实例，读者可以参考之前
python3安装教程 @小左 python 开发语言
1.下载python百度网盘下载python-3.12.3-amd64.exe链接：https://pan.baidu.com/s/1MV3kvVdjCdS_G-_KgefwLw?pwd=pgzu提取码：pgzu官网下载：WelcometoPython.org有很多版本，选择需要的版本下载2.安装python双击python-3.12.3-amd64.exeNext安装成功3.检查pythonwi
RabbitMQ，RocketMQ，Kafka 事务性，消息丢失，消息顺序性和消息重复发送的处理策略 90后小伙追梦之路面试 java 架构 kafka rabbitmq 分布式 redis 数据库
消息队列常见问题处理分布式事务什么是分布式事务我们的服务器从单机发展到拥有多台机器的分布式系统，各个系统之前需要借助于网络进行通信，原有单机中相对可靠的方法调用以及进程间通信方式已经没有办法使用，同时网络环境也是不稳定的，造成了我们多个机器之间的数据同步问题，这就是典型的分布式事务问题。在分布式事务中事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。分
关于固定随机种子，模型每次结果也不一样的问题可能解决方法小白每天学一点 pytorch 深度学习人工智能 python
问题描述最近一直被“固定随机种子，模型每次结果也不一样”这个问题困扰，我的模型同样的代码每次跑的结果都不一样，而且还忽高忽低，有可能有模型本身架构不合适的问题（按理来说，即便有变动也不会差别太大），忽略掉每次结果差距较大这个问题，先来解决每次结果都不一样这个问题。原因分析：可以按照以下原因顺序检查模型：1.没有设置随机种子。2.虽然设置了随机种子，但随机初始化参数也会有变动。3.若第2中情况已检查
C语言数据结构编程练习-用指针创建顺序表，进行创销和增删改查操作墨楠。 #C 语言数据结构研习汇 C c语言数据结构数据库
使用多文件进行编程main.c文件#include"02.h"intmain(){fn2();return0;}02.h头文件#pragmaonce#define_CRT_SECURE_NO_WARNINGS#include#include#include#defineMAX_NUMBER100typedefintelememtType;//elememt:元素typedefstructorder
Java设计模式之单例模式倚-天-照-海设计模式 java 设计模式单例模式
单例模式(SingletonPattern)：确保某一个类只有一个实例，而且自行实例化并向整个系统提供这个实例，这个类称为单例类，它提供全局访问的方法。单例模式是一种对象创建型模式。单例模式有三个要点：一是某个类只能有一个实例；二是它必须自行创建这个实例；三是它必须自行向整个系统提供这个实例。对单例的实现可以分为两大类——懒汉式和饿汉式，他们的区别在于：懒汉式：指全局的单例实例在第一次被使用时构建
node.js中实现token的生成与验证小灰灰学编程 Node.js node.js token 前端
Token（令牌）是一种用于在客户端和服务器之间安全传输信息的加密字符串。在Web开发中，Token常用于身份验证和授权，确保用户能够安全地访问受保护的资源。作用与意义身份验证：Token可以用来验证用户的身份，确保用户已经通过认证流程。授权：通过Token，服务器可以识别用户的权限，从而允许或拒绝访问特定的资源。状态管理：在无状态（stateless）的API设计中，Token可以携带用户的状态
阿里云通义开源首个推理步骤评估标准，探索AI推理模型新路径量子位
1月16日，阿里云通义开源全新的数学推理过程奖励模型Qwen2.5-Math-PRM，72B及7B尺寸模型性能均大幅超越同类开源过程奖励模型；在识别推理错误步骤能力上，Qwen2.5-Math-PRM以7B的小尺寸就超越了GPT-4o。同时，通义团队还开源首个步骤级的评估标准ProcessBench，填补了大模型推理过程错误评估的空白。在当前大模型推理过程中，不时存在逻辑错误或编造看似合理的推理步
大数据新视界 -- 大数据大厂之 Impala 性能优化：融合人工智能预测的资源预分配秘籍（上）（29 / 30）青云交大数据新视界 #Impala 之道大数据 Impala 人工智能预测资源预分配数据收集模型构建查询性能优化
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
eclipse maven IXHONG eclipse
eclipse中使用maven插件的时候，运行run as maven build的时候报错 -Dmaven.multiModuleProjectDirectory system propery is not set. Check $M2_HOME environment variable and mvn script match. 可以设一个环境变量M2_HOME指
timer cancel方法的一个小实例 alleni123 多线程 timer
package com.lj.timer; import java.util.Date; import java.util.Timer; import java.util.TimerTask; public class MyTimer extends TimerTask { private int a; private Timer timer; pub
MySQL数据库在Linux下的安装 ducklsl mysql
1.建好一个专门放置MySQL的目录 /mysql/db数据库目录 /mysql/data数据库数据文件目录 2.配置用户，添加专门的MySQL管理用户 >groupadd mysql ----添加用户组 >useradd -g mysql mysql ----在mysql用户组中添加一个mysql用户 3.配置，生成并安装MySQL >cmake -D
spring------>>cvc-elt.1: Cannot find the declaration of element Array_06 spring bean
将-------- <?xml version="1.0" encoding="UTF-8"?> <beans xmlns="http://www.springframework.org/schema/beans" xmlns:xsi="http://www.w3
maven发布第三方jar的一些问题 cugfy maven
maven中发布第三方jar到nexus仓库使用的是 deploy:deploy-file命令有许多参数，具体可查看 http://maven.apache.org/plugins/maven-deploy-plugin/deploy-file-mojo.html 以下是一个例子： mvn deploy:deploy-file -DgroupId=xpp3
MYSQL下载及安装 357029540 mysql
好久没有去安装过MYSQL，今天自己在安装完MYSQL过后用navicat for mysql去厕测试链接的时候出现了10061的问题，因为的的MYSQL是最新版本为5.6.24，所以下载的文件夹里没有my.ini文件，所以在网上找了很多方法还是没有找到怎么解决问题，最后看到了一篇百度经验里有这个的介绍，按照其步骤也完成了安装，在这里给大家分享下这个链接的地址
ios TableView cell的布局张亚雄 tableview
cell.imageView.image = [UIImage imageNamed:[imageArray objectAtIndex:[indexPath row]]]; CGSize itemSize = CGSizeMake(60, 50); &nbs
Java编码转义 adminjun java 编码转义
import java.io.UnsupportedEncodingException; /** * 转换字符串的编码 */ public class ChangeCharset { /** 7位ASCII字符，也叫作ISO646-US、Unicode字符集的基本拉丁块 */ public static final Strin
Tomcat 配置和spring aijuans spring
简介 Tomcat启动时，先找系统变量CATALINA_BASE，如果没有，则找CATALINA_HOME。然后找这个变量所指的目录下的conf文件夹，从中读取配置文件。最重要的配置文件：server.xml 。要配置tomcat，基本上了解server.xml，context.xml和web.xml。 Server.xml -- tomcat主
Java打印当前目录下的所有子目录和文件 ayaoxinchao 递归 File
其实这个没啥技术含量，大湿们不要操笑哦，只是做一个简单的记录，简单用了一下递归算法。 import java.io.File; /** * @author Perlin * @date 2014-6-30 */ public class PrintDirectory { public static void printDirectory(File f
linux安装mysql出现libs报冲突解决 BigBird2012 linux
linux安装mysql出现libs报冲突解决安装mysql出现 file /usr/share/mysql/ukrainian/errmsg.sys from install of MySQL-server-5.5.33-1.linux2.6.i386 conflicts with file from package mysql-libs-5.1.61-4.el6.i686
jedis连接池使用实例 bijian1013 redis jedis连接池 jedis
实例代码： package com.bijian.study; import java.util.ArrayList; import java.util.List; import redis.clients.jedis.Jedis; import redis.clients.jedis.JedisPool; import redis.clients.jedis.JedisPoo
关于朋友 bingyingao 朋友兴趣爱好维持
成为朋友的必要条件：志相同，道不合，可以成为朋友。譬如马云、周星驰一个是商人，一个是影星，可谓道不同，但都很有梦想，都要在各自领域里做到最好，当他们遇到一起，互相欣赏，可以畅谈两个小时。志不同，道相合，也可以成为朋友。譬如有时候看到两个一个成绩很好每次考试争做第一，一个成绩很差的同学是好朋友。他们志向不相同，但他
【Spark七十九】Spark RDD API一 bit1129 spark
aggregate package spark.examples.rddapi import org.apache.spark.{SparkConf, SparkContext} //测试RDD的aggregate方法 object AggregateTest { def main(args: Array[String]) { val conf = new Spar
ktap 0.1 released bookjovi kernel tracing
Dear, I'm pleased to announce that ktap release v0.1, this is the first official release of ktap project, it is expected that this release is not fully functional or very stable and we welcome bu
能保存Properties文件注释的Properties工具类 BrokenDreams properties
今天遇到一个小需求：由于java.util.Properties读取属性文件时会忽略注释，当写回去的时候，注释都没了。恰好一个项目中的配置文件会在部署后被某个Java程序修改一下，但修改了之后注释全没了，可能会给以后的参数调整带来困难。所以要解决这个问题。 &nb
读《研磨设计模式》-代码笔记-外观模式-Facade bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* * 百度百科的定义： * Facade（外观）模式为子系统中的各类（或结构与方法）提供一个简明一致的界面， * 隐藏子系统的复杂性，使子系统更加容易使用。他是为子系统中的一组接口所提供的一个一致的界面 * * 可简单地
After Effects教程收集 cherishLC After Effects
1、中文入门 http://study.163.com/course/courseMain.htm?courseId=730009 2、videocopilot英文入门教程（中文字幕） http://www.youku.com/playlist_show/id_17893193.html 英文原址： http://www.videocopilot.net/basic/ 素
Linux Apache 安装过程 crabdave apache
Linux Apache 安装过程下载新版本： apr-1.4.2.tar.gz（下载网站：http://apr.apache.org/download.cgi） apr-util-1.3.9.tar.gz（下载网站：http://apr.apache.org/download.cgi） httpd-2.2.15.tar.gz（下载网站：http://httpd.apac
Shell学习之变量赋值和引用 daizj shell 变量引用赋值
本文转自：http://www.cnblogs.com/papam/articles/1548679.html Shell编程中，使用变量无需事先声明，同时变量名的命名须遵循如下规则：首个字符必须为字母（a-z，A-Z）中间不能有空格，可以使用下划线（_）不能使用标点符号不能使用bash里的关键字（可用help命令查看保留关键字）需要给变量赋值时，可以这么写：
Java SE 第一讲（Java SE入门、JDK的下载与安装、第一个Java程序、Java程序的编译与执行） dcj3sjt126com java jdk
Java SE 第一讲： Java SE：Java Standard Edition Java ME: Java Mobile Edition Java EE：Java Enterprise Edition Java是由Sun公司推出的（今年初被Oracle公司收购）。收购价格：74亿美金 J2SE、J2ME、J2EE JDK：Java Development
YII给用户登录加上验证码 dcj3sjt126com yii
1、在SiteController中添加如下代码： /** * Declares class-based actions. */ public function actions() { return array( // captcha action renders the CAPTCHA image displ
Lucene使用说明 dyy_gusi Lucene search 分词器
Lucene使用说明 1、lucene简介 1.1、什么是lucene Lucene是一个全文搜索框架，而不是应用产品。因此它并不像baidu或者googleDesktop那种拿来就能用，它只是提供了一种工具让你能实现这些产品和功能。 1.2、lucene能做什么要回答这个问题，先要了解lucene的本质。实际
学习编程并不难,做到以下几点即可! gcq511120594 数据结构编程算法
不论你是想自己设计游戏，还是开发iPhone或安卓手机上的应用，还是仅仅为了娱乐，学习编程语言都是一条必经之路。编程语言种类繁多，用途各异，然而一旦掌握其中之一，其他的也就迎刃而解。作为初学者，你可能要先从Java或HTML开始学，一旦掌握了一门编程语言，你就发挥无穷的想象，开发各种神奇的软件啦。 1、确定目标学习编程语言既充满乐趣，又充满挑战。有些花费多年时间学习一门编程语言的大学生到
Java面试十问之三：Java与C++内存回收机制的差别 HNUlanwei java C++finalize()堆栈内存回收
大家知道， Java 除了那 8 种基本类型以外，其他都是对象类型（又称为引用类型）的数据。 JVM 会把程序创建的对象存放在堆空间中，那什么又是堆空间呢？其实，堆（ Heap）是一个运行时的数据存储区，从它可以分配大小各异的空间。一般，运行时的数据存储区有堆（ Heap）和堆栈（ Stack），所以要先看它们里面可以分配哪些类型的对象实体，然后才知道如何均衡使用这两种存储区。一般来说，栈中存放的
第二章 Nginx+Lua开发入门 jinnianshilongnian nginx lua
Nginx入门本文目的是学习Nginx+Lua开发，对于Nginx基本知识可以参考如下文章： nginx启动、关闭、重启 http://www.cnblogs.com/derekchen/archive/2011/02/17/1957209.html agentzh 的 Nginx 教程 http://openresty.org/download/agentzh-nginx-tutor
MongoDB windows安装基本命令 liyonghui160com
windows安装安装目录： D:\MongoDB\ 新建目录 D:\MongoDB\data\db 4.启动进城： cd D:\MongoDB\bin mongod -dbpath D:\MongoDB\data\db &n
Linux下通过源码编译安装程序 pda158 linux
一、程序的组成部分　　Linux下程序大都是由以下几部分组成：　　二进制文件：也就是可以运行的程序文件　　库文件：就是通常我们见到的lib目录下的文件　　配置文件：这个不必多说，都知道　　帮助文档：通常是我们在linux下用man命令查看的命令的文档　　二、linux下程序的存放目录　　linux程序的存放目录大致有三个地方：　　/etc, /b
WEB开发编程的职业生涯４个阶段 shw3588 编程 Web 工作生活
觉得自己什么都会 2007年从学校毕业，凭借自己原创的ASP毕业设计，以为自己很厉害似的，信心满满去东莞找工作，找面试成功率确实很高，只是工资不高，但依旧无法磨灭那过分的自信，那时候什么考勤系统、什么OA系统、什么ERP，什么都觉得有信心，这样的生涯大概持续了约一年。根本不是自己想的那样 2008年开始接触很多工作相关的东西，发现太多东西自己根本不会，都需要去学，不管是asp还是js，
遭遇jsonp同域下变作post请求的坑 vb2005xu jsonp 同域post
今天迁移一个站点时遇到一个坑爹问题,同一个jsonp接口在跨域时都能调用成功,但是在同域下调用虽然成功,但是数据却有问题. 此处贴出我的后端代码片段 $mi_id = htmlspecialchars(trim($_GET['mi_id '])); $mi_cv = htmlspecialchars(trim($_GET['mi_cv '])); 贴出我前端代码片段: $.aj

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

文章目录

ChatGPT is not all you need，一文看尽SOTA生成式AI模型：6大公司9大类别21个模型全回顾（三）

Text-to-Text 模型

ChatGPT

LaMDA

PEER

Meta AI Speech from Brain

Text-to-Code 模型

Codex

Alphacode

Text-to-Science 模型

Galactica

Minerva

其他模型

AlphaTensor

GATO

PhysDiff

ChatBCG

你可能感兴趣的:(AI,深度学习,人工智能,AIGC,生成式AI模型,SOTA模型)