yule.yang

ChatGPT 和生成式 AI 年度回顾：16个精彩瞬间

ChatGPT 发布已经一年了，有专家将其描述为投放在人工智能世界的“中子弹”。从那以后，人工智能的发展速度是无与伦比的。本文探讨了过去一年中 ChatGPT 和生成式 AI 的一些重要时刻。

1. ChatGPT - 革命的开始

ChatGPT 由人工智能研究公司 OpenAI 于 2022 年 11 月 30 日推出。在发布的短短五天内，这款聊天机器人就吸引了 100 多万用户，显示出公众对这项新的人工智能技术的巨大兴趣。

ChatGPT 建立在 OpenAI 的 GPT-3 系列大型语言模型之上，使其能够对自然语言提示生成类似人类的文本响应。用户可以与 ChatGPT 进行对话，向它提问或请求它执行某些任务，例如总结文章、编写代码或撰写论文或诗歌。

ChatGPT 的病毒式流行源于其令人印象深刻的语言能力以及它是免费且可公开访问的事实。虽然 GPT-3 等其他 AI 模型以前仅供研究人员和开发人员使用，但 ChatGPT 的推出首次向公众开放了对话式 AI。

ChatGPT的推出也引发了关于高度先进的人工智能系统潜在危险的辩论。批评者指出了错误信息传播等风险，因为 ChatGPT 能够生成非常令人信服的文本。这引发了关于人工智能伦理的讨论，以及在部署此类变革性技术时需要透明度和监督。

ChatGPT 的推出代表了使 AI 触手可及的一个里程碑。它让我们得以一窥未来人工智能如何融入我们的日常生活，自动执行死记硬背的任务并增强人类的创造力。

2. GPT-4 的推出 - 提高性能

2023 年 3 月，OpenAI 发布了 GPT-4，这是其生成式预训练 Transformer 语言模型的更新版本。

OpenAI 称，与 GPT-3 相比，GPT-4 表现出了显著的改进，有 1.76万亿参数(与 GPT-3 的1750亿参数相比)，在准确性和幻觉缓解方面的性能提高了 40%。

GPT-4 可以执行许多自然语言任务，例如摘要、翻译、论文写作和回答问题。它还可以记住上下文并执行逻辑推理。参数和训练数据的增加使 GPT-4 成为迄今为止功能最强大的生成式 AI 模型之一。

3. ChatGPT 插件 - 额外功能

ChatGPT 插件于 2023 年 3 月首次为选定的开发人员和合作伙伴推出。插件允许 ChatGPT 访问外部信息并执行受限的操作，如预订航班。最初的插件是由 Expedia、Slack 和 Wolfram 等公司开发的。

在接下来的几个月里，OpenAI 逐渐向更多的用户开放了访问权限。截至 2023 年 5 月，ChatGPT Plus 用户可使用的插件超过 200 个。这让 Plus 用户可以提前使用娱乐、购物、旅游等插件。

然而，插件的可用性仍然有限。正如我们将看到的，有了自定义 GPTs 和 ChatGPT 存储，OpenAI 还提供了更多。2023 年 11 月，OpenAI 在他们的第一届开发峰会上宣布了 GPT Store。

4. ChatGPT 中的自定义指令 - 更好的控制

ChatGPT 的自定义说明首次在 2023 年 7 月的测试版中推出，仅针对 ChatGPT Plus 订阅者。这使得 Plus 用户可以提供持续的指导和偏好，以形成 ChatGPT 在对话中的响应，而不必对每个提示重复说明。

该特性通过合并您希望 ChatGPT 在每次生成响应时考虑的首选项或规范，使 ChatGPT 更加强大。

5. ChatGPT 高级数据分析 - 更清晰的结果

作为 ChatGPT 企业版的一部分，高级数据分析于 2023 年 8 月在 ChatGPT 中推出。它建立在现有的 Code Interpreter 插件的基础上，扩展了其分析数据的能力。高级数据分析使技术和非技术团队能够在几秒钟内从信息中获得见解。

在接下来的几个月里，高级数据分析继续作为 ChatGPT Plus 和企业订阅的一部分提供。它提供了比免费 ChatGPT 模型更有用的数据分析能力。但是，访问仍然有限。

随着 GPT Store 和自定义 GPTs 的宣布，OpenAI 基本上民主化了高级数据分析所提供的——塑造聊天 GPT 技能和知识的力量。

现在所有人都可以通过 GPT 商店使用数据分析功能，而不仅仅是企业订阅者。

6. DALLE-3 的推出 - 迈向多模态人工智能

在 ChatGPT 中使用 DALLE-3 生成

2023 年 10 月，OpenAI 推出了 DALLE-3，这是其革命性的人工智能文本到图像生成器的最新版本。DALLE-3 代表了在生成准确反映书面提示的图像方面的重大飞跃-这是人工智能图像合成中臭名昭着的挑战。

与以前的版本相比，DALLE-3 显著提高了对提示文本的理解和遵从性。它现在可以处理更长的、更详细的提示，而不会丢失上下文或忽略关键字。这将产生更符合用户预期视觉的图像。

DALLE-3 还引入了更高的分辨率和更逼真的输出。

一个突出的新功能是与 ChatGPT 的集成，允许用户简单地向聊天机器人描述图像想法。然后， ChatGPT 将自动生成一个定制的提示段落，以提供给 DALLE-3。如果需要，用户可以通过要求 ChatGPT 改进提示来进行迭代。这简化了提示工程过程。

OpenAI 在此版本中优先考虑安全性，采取措施防止不适当或有偏见的内容。DALLE-3 拒绝模仿在世艺术家的风格或未经许可代表公众人物的请求。该公司现在允许艺术家选择不使用他们的作品来训练未来的迭代。

7. OpenAI 的首个开发者日 - 更多进展

OpenAI 于 2023 年 11 月 6 日举行的首次开发日开发者大会，标志着该公司的一个重要里程碑。在主题演讲中，首席执行官 Sam Altman 公布了许多新的 AI 功能，api 和产品。正如我们将在下面看到的，开发日发布了GPT-4 Turbo、助手 API、自定义 GPTs 和 GPT 商店。

Dev Day 强调了 OpenAI 致力于快速迭代和扩展其 AI 的访问。这次活动展示了在能力和灵活性上的巨大飞跃。通过改进的模型、新的 api 和像 GPT 商店这样的产品，OpenAI 正在使开发人员和用户能够根据他们的独特需求塑造 AI。这些公告显示了 OpenAI 在引领AI革命方面的优势地位。

8. GPT-4 Turbo - 性能改进

GPT-4 Turbo 代表了 OpenAI 的下一代文本生成 AI 模型 GPT-4。在 OpenAI 的第一个开发日上宣布，GPT-4 Turbo 比2023 年 3 月发布的原始 GPT-4 提供了一些改进。

最值得注意的是，GPT-4 Turbo 已经根据截至 2023 年 4 月的数据进行了训练，而不仅仅是 GPT-4的 2021 年 9 月的数据。这为模型在响应提示时提供了更多最新的知识。GPT-4 Turbo 还支持更大的上下文大小，多达 128000 个 token，使其能够理解更多的上下文并产生更周到的响应。

此外，GPT-4 Turbo 具有优化的性能和定价。它的成本是每 1000 个输入 0.01 美元，每 1000 个输出 0.03 美元，这使得它比 GPT-4 更实惠。OpenAI 指出，与 GPT-4 相比，输入定价便宜 3 倍，输出定价便宜 2 倍。

目前，开发人员可以通过 API 访问 GPT-4 Turbo 预览版。随着模型超越测试版，OpenA I计划在未来几周内发布完整的生产版本。API 预览已经使开发人员能够开始集成和测试 GPT-4 Turbo 的增强功能。

9. GPT - 自定义模型

GPTs，或自定义 AI 模型，代表了一种新方法，任何人都可以为特定的用例创建定制的 ChatGPT版本，而无需编码。正如在开发日上宣布的那样，GPTs 允许用户结合指令、知识源和技能来构建定制的 AI 代理。

例如，老师可以创建一个专注于数学教育的 GPT 来帮助学生学习。或者，游戏公司可能会建立一个可以回答幻想世界中错综复杂的知识和角色问题的系统。从本质上讲，GPTs 为普通人开启了一种能力，让他们能够根据自己的独特需求塑造 ChatGPT 的功能。

GPTs 通过将 ChatGPT 的广泛知识转化为有针对性的专业知识来提供价值。它们还允许用户纠正错误信息，保持知识更新，并通过持续的指导防止有害响应。通过自定义行为，GPTs 可以变得更加有用和可靠。

10. GPT Store - 分享想法

GPT商店代表了人们如何访问和利用AI技术的重大转变。它允许任何人为特定的用例创建和分发定制的ChatGPT版本(称为GPTs)，而不需要编写代码。

GPT 商店提供了一个分享这些AI作品并可能变现的平台。经过验证的构建者可以发布他们的GPTs，让他们可以通过搜索和排行榜被发现。在接下来的几个月里，他们还可以根据使用情况赚钱。

这与非常成功的 app store 模式类似，但适用于人工智能模式，而不是移动应用。它激励构建者创造创造性的 GPTs，为他人提供价值。GPT 商店可以在将 AI 应用于特定用例方面释放一波创造力，就像移动应用程序的激增一样。

通过通过 GPT 商店普及可定制 AI 的访问，OpenAI 正在围绕定制模型建立一个生态系统和经济。基于平台创建者和构建者的创新性，ChatGPT 的功能有可能迅速扩展到新的领域。

11. OpenAI Sam Altman 的解雇和重新雇用 - 内部动荡

风靡全球的人工智能聊天机器人 ChatGPT 背后的 OpenAI 公司，在短短五天内经历了一次奇怪的高管人事变动，包括解雇和重新聘用首席执行官萨姆·奥特曼。这个传奇故事就像一部错误的喜剧，情节的曲折和逆转堪比情景喜剧。

11 月 17 日，OpenAI 董事会突然解雇了奥特曼，并没有给出明确的解释。考虑到奥特曼作为联合创始人的身份，以及在他的领导下 ChatGPT 最近取得的成功，这一举动震惊了许多人。当数百名OpenAI 员工发起反抗，威胁如果奥特曼不复职就辞职时，事情变得更加复杂了。

他们认为，奥特曼对于维护 OpenAI 安全开发人工智能以造福人类的使命至关重要。微软意识到这是一个机会，于是聘请奥特曼领导一个新的人工智能项目，试图挖走他和其他员工。在 ChatGPT刚刚起步的时候，这一权力变动有可能扼杀 OpenAI。

令人意外的是，OpenAI 董事会在解雇奥尔特曼仅仅五天之后就同意让他重新担任 CEO。

作为交易的一部分，大多数老董事会成员辞职。

似乎结局好一切都好，但这个传奇故事暴露了幕后的一些重大戏剧性事件。这是一个曲折和情感的过山车——困惑，愤怒，阴谋，解脱——值得肥皂剧。

在这一天结束的时候，奥特曼得意洋洋地出现了，他的声誉和影响力得到了加强。然而，OpenAI 内部的权力斗争远未解决。随着他们继续塑造人工智能的未来，这不会是硅谷最热门的初创公司的最后一次情节转折。

更广泛的人工智能领域的发展

随着 OpenAI 和 ChatGPT 的迅速崛起，生成式 AI 也有了许多重要的发展。

12. Google Bard 发布

2023 年 2 月，谷歌推出了基于 LaMDA 和 PaLM 2 LLM 的人工智能聊天机器人 Bard。随着ChatGPT 的流行，谷歌推出了自己的人工智能，包括推理、编码和多语言功能。与 ChatGPT 不同，Bard 从网络上提取信息。

13. LLaMA开源语言模型

Llama 1 于 2022 年 7 月首次推出，是一个拥有 70 亿个参数的开源对话人工智能模型。它是在GitHub 上提供的，用于研究目的。Llama 1 表现出很强的对话能力，但其有限的尺寸限制了更复杂的推理。

一年后，也就是 2023 年 7 月，Meta 和微软宣布发布 Llama 2，代表了拥有 700 亿个参数的下一代模型。Llama 2 经过优化，可以在 Windows 和 Azure 云上高效运行。它还集成了更好的内容过滤以确保安全。更大的 Llama 2 解锁了更复杂的推理能力。

2023 年 8 月，IBM 宣布计划在其沃森人工智能平台上也提供 Llama 2。这将使企业用户能够访问Llama 2 的增强功能。IBM 还表示，在发布“Llama 2”之后，将推出自己的人工智能开发模型和工具。

14. Pandas AI

2023 年 6 月，广受欢迎的 Pandas Python 库添加了一系列人工智能功能来增强其功能。Pandas AI 可以使用自然语言对 Pandas 数据框架数据进行汇总。此外，您可以使用它来绘制复杂的可视化、操作数据框架和生成业务见解。

它是一个初学者友好的工具;即使是没有什么技术背景的人也可以使用它来执行复杂的数据分析任务，帮助您更快地分析数据并得出有意义的结论。

15. Mistral 7B 开源语言模型

Mistral 7B 是由总部位于巴黎的法国初创公司 Mistral AI 于 2023 年 9 月发布的。

Mistral 7B 是一种开源语言模型，在保持效率的同时提供了令人印象深刻的性能。它只有 70 亿个参数，在许多基准测试中都优于 Meta 的 Llama 213B 等大型专有模型。Mistral 较小的尺寸使其对于希望构建自定义 AI 应用程序的开发人员和组织来说更容易访问和灵活。

Mistral 的突出特点之一是它的多功能性——它既擅长于文本生成等自然语言任务，也擅长于编码相关任务。与其他只关注自然语言的语言模型相比，这种双重优势使其具有独特的价值。

16. Stable Video Diffusion

Stability AI于 2022 年 11 月 22 日发布了稳定视频扩散研究预览。

Stable Video Diffusion 是 Stability AI 发布的首个视频 AI 新模型，可以从静态图像生成动画短视频。它建立在 Stability AI 流行的稳定扩散图像生成模型的基础上，代表了该公司首次涉足生成视频合成。

该模型有两个版本—— SVD 和 SVD-XT。SVD 可以将图像转换成 14 帧的视频，而 SVD-XT 可以生成 25 帧的视频，两者的帧率都在 3 ~ 30 帧/秒之间。这些模型先在包含数百万个视频的大型数据集上进行训练，然后再对数十万个视频片段进行微调，最终达到约 100 万个视频片段。

总结

在生成式人工智能领域，过去的一年可以说是革命性的，有突破性的进展和重要的里程碑。ChatGPT 的推出为这一年的快速进展奠定了基调，使对话式人工智能的访问民主化，并引发了关于先进人工智能系统影响的重要对话。今年晚些时候引入了 GPT-4，其功能得到了扩展，进一步突显了该领域的快速发展步伐。

将 DALLE-3 集成到这个生态系统中，为人工智能功能带来了一个新的维度，增强了从文本描述生成详细的上下文感知图像的能力。这种整合不仅推动了人工智能创造力的界限，而且强调了人工智能开发中伦理考虑和安全的重要性。

这一年，OpenAI 还应对了内部挑战，首席执行官萨姆·奥特曼(Sam Altman)被解雇后又被重新聘用，这突显了领先人工智能组织内部的复杂性和动态。

另一方面，语言模型的开源生态系统的兴起，如 Meta 的 LLaMA-2, Mistral AI 的 Mistral 7B 和其他开源 LLM，为用户和开发人员提供了更多的选择和功能。这种竞争对消费者是有益的，因为像GPT-4 这样的专有型号的价格在 2023 年已经大幅下降，我们期待这一趋势继续下去。

智能体架构设计的五大核心原则：构建下一代AI系统的工程基石一休哥助手人工智能
引言：智能体架构的范式演进人工智能领域正经历从孤立模型向自主智能体的范式转变。2025年，全球AI智能体市场规模突破200亿美元，在金融、医疗、制造等领域的渗透率超40%。然而，智能体开发仍面临协作效率低（多智能体任务重叠率达30%）、安全风险高（工具调用错误率18%）和系统僵化（需求变更迭代周期超2周）三大痛点。本文基于产业实践提炼五大核心设计原则，为构建下一代智能体系统提供架构指南。传统LLM
当OT遇见IT：Apache IoTDB如何用“时序空间一体化“破解工业物联网数据孤岛困局 Loving_enjoy 计算机学科论文创新点机器学习 facebook 经验分享课程设计
>在工业4.0的浪潮中，OT（运营技术）与IT（信息技术）的融合成为关键痛点。本文将深入解析ApacheIoTDB如何通过创新性的"时序空间一体化"技术，打通工业数据壁垒，并附可落地的完整解决方案代码。###一、工业数据孤岛：OT与IT的世纪之困####典型工业数据版图```mermaidgraphLROT领域-->A[设备传感器]OT领域-->B[PLC控制系统]OT领域-->C[SCADA系统
微信小程序官方组件展示之视图容器page-container源码 MLC061
以下将展示微信小程序之视图容器page-container源码官方组件能力，组件样式仅供参考，开发者可根据自身需求定义组件样式，具体属性参数详见小程序开发文档。功能描述：页面容器。小程序如果在页面内进行复杂的界面设计（如在页面内弹出半屏的弹窗、在页面内加载一个全屏的子页面等），用户进行返回操作会直接离开当前页面，不符合用户预期，预期应为关闭当前弹出的组件。为此提供“假页”容器组件，效果类似于pop
STM32+w5500+TcpClient学习笔记结城明日奈是我老婆嵌入式 stm32 学习笔记
文章目录参考文章本地和远程IP连接的配置(重点)TCP发送参考文章注意:SPI的CSRST脚这些都是通过cubeMX自定义的可以自行修改。用的是SPI1项目地址//MyTcpClient.h#ifndefMYTCPCLIENT_H#defineMYTCPCLIENT_H#include"main.h"#include"w5500.h"#include"socket.h"#include"wizch
No matter how 遥远星光
Wishyoucankeepinmindyourpreviouswhenbeenknockeddowntoresisthostility.Wishyourememberyourtreaishwhengetlostinyourway.Lovewhoyouwanttolove,dowhatyouwanttodo,listentoyourheart,nomatterwhathappens.Therear
智能体架构深度解构：一次用户请求的完整旅程一休哥助手架构
引言：智能体系统的复杂性迷宫当用户向AI智能体发出一个简单请求时，背后正上演着一场精密的认知交响乐。2025年全球智能体日均处理请求量突破120亿次，但仅38%的用户理解其内部运作机制。本文通过解构一次真实请求的完整生命周期（从输入到输出），揭示智能体架构的核心流程与关键技术，涵盖11个关键步骤与23项核心技术，为开发者提供全景式架构指南。用户请求输入处理意图理解记忆检索任务规划工具调用安全管控执
医疗AI与融合数据库的整合：挑战、架构与未来展望（上） Loving_enjoy 计算机学科论文创新点机器学习 facebook 课程设计经验分享
在医疗AI爆发式增长的今天，单一数据库已无法满足多模态医疗数据的处理需求。本文将揭秘医疗融合数据库的核心架构，通过真实代码示例展示如何破解医疗数据整合的世纪难题。###一、医疗数据的"四维挑战"####1.多模态数据洪流```python#典型患者数据组成patient_data={"时序数据":"ECG/EEG波形(1000Hz采样)","影像数据":"CT/MRI(单次扫描2GB+)","文本
pyQT学习笔记——Qt常用组件与绘图类的使用指南 tt555555555555 Qt pyqt 学习笔记
Qt常用组件与绘图类的使用指南一、大小策略（SizePolicy）1.1大小策略概述1.2具体参数1.3其他常见策略1.4伸展值的作用二、常用组件的使用2.1QSpinBox和QComboBox示例代码2.2QDialog示例代码2.3QTableView示例代码三、QPainter类介绍3.1QPainter的使用示例代码3.2QPainter的功能一、大小策略（SizePolicy）1.1大小
Java基础入门（传智）暑期预习笔记（一）7.18 wssgakki Java java
Java的基本语法【修饰符】class类名{程序代码}publicclassHelloword{publicstaticvoidmain(String[]args){System.out.printIn(”你好呀");}注意大小写、排版问题{左大括号里面的第一行代码要有缩进ctrl+shift+F键快速格式化代码一个连续的字符串不能分开在两行中书写即同一个双引号里面的内容不能分两行写。Java中的
12、Rust 特性：多种形式与应用 Linux 精通Rust：从入门到实践 Rust 特性 Trait
Rust特性：多种形式与应用在Rust编程中，特性（trait）是一项强大的工具，它可以让我们定义一组行为，并让不同的类型来实现这些行为。特性有多种形式，下面我们来详细了解一下。1.特性的多种形式特性有多种不同的形式，每种形式都有其特定的用途和优势。1.1标记特性（Markertraits）标记特性定义在std::marker模块中，它们没有任何方法，只是简单地声明一个名称，用于标记一个类型属于某
Traefik 中实现流量治理3种方式和场景选择老兵发新帖云原生
Traefik中实现功能扩展或流量治理，三种主流实现方式的对比及典型应用场景：⚙️1.中间件链（MiddlewareChain）——最常用、开箱即用适用场景：基础流量治理（如请求头修改、身份认证、限流等）。优势：配置简单、无需编码、原生集成。典型实现：请求头操作：通过Header中间件增删/修改Header。身份认证：使用ForwardAuth将请求转发至外部认证服务（如Keycloak）。URL
PyQT5 新手入门学习笔记 UncleShuShuShu python的坑 python pyqt5
一、PyQt5的起点第一个简单的pyqt程序#创建一个label程序（QLabel模块）importsysfromPyQt5.QtWidgetsimportQApplication,QLabelif__name__=='__main__':app=QApplication(sys.argv)label=QLabel('helloworld')#label的setText方法:label=Qlabe
昇思MindSpore创新训练营·长三角站开始报名！昇思MindSpore 人工智能自然语言处理深度学习
一、介绍为充分发挥长三角研究型大学联盟教学实践基地共建共享功能，加强华东高校优秀青年学子的交流与互动，提供学生与产业界接触的机会，上海交通大学与华为技术有限公司共同发起，面向长三角研究型大学学生开设昇思MindSpore创新训练营。本次训练营以实践项目和业界需求为牵引，以学生实践为主线，让学生在实践的过程中学习和实践人工智能相关知识，掌握相关技术和工具，紧跟业界最新趋势，加深对人工智能行业的认识，
[数据结构]#2 链表
有关顺序表与链表的操作，简而言之就是四个字——增、删、改、查。在上一篇文章，我们提到顺序表的插入与删除https://blog.csdn.net/Marvinem13/article/details/148900187?fromshare=blogdetail&sharetype=blogdetail&sharerId=148900187&sharerefer=PC&sharesource=Mar
LangChain4j：Java开发者的AI应用构建利器 | 1. 实战：构建AI对话应用秋秋棠人工智能 java 大数据
LangChain4j：Java开发者的AI应用构建利器目录LangChain4j简介LangChain4jvsSpringAI：JavaAI框架对比实战：构建AI对话应用环境搭建配置大模型核心服务实现深入ChatModel：灵活配置与应用框架选择建议LangChain4j简介LangChain4j是专为Java开发者设计的AI应用开发框架，它提供了开箱即用的API和模块化设计，让开发者能够快速构
OPPO未来科技大会，科技感满满！你最爱哪些黑科技呢？冬天不冷了
#OPPO未来科技大会#OPPO携手IHSMarkit发布《智能互融：借助5G、人工智能和云技术，释放机遇》白皮书，表明人工智能、云技术和边缘设备、互联和物联网的协同努力，将为企业和消费者带来价值。看了一下早上的，是说明年绿厂要发不少好玩的产品，比如智能手表AR眼镜之类的，有些可能跟Reno3一块发，对外是说构建生态万物互联，其实就是多卖几样多赚钱，然后用这钱砸了搞技术赚更大的钱，毕竟现场说了未来
【AI论文】CLiFT：面向计算高效与自适应神经渲染的压缩光场标记
摘要：本文提出了一种神经渲染方法，该方法将场景表示为“压缩光场标记（CLiFTs）”，以保留场景丰富的外观和几何信息。CLiFT通过压缩标记实现计算高效的渲染，同时能够通过调整标记数量来表征场景，或利用单个训练好的网络渲染新视角。具体而言，给定一组图像，多视图编码器会根据相机位姿对图像进行标记化处理。潜在空间K均值聚类算法利用这些标记选取一组精简的光线作为聚类中心。随后，多视图“压缩器”将所有标记
sgg大数据全套技术链接[plus] 原来是大华啊~ 资源大数据
写在开头：感谢尚硅谷，尚硅谷万岁，我爱尚硅谷111个技术栈+43个项目，兄弟们，冲！最近小米又又又火了一把，致敬所有造福人民的企业和伟大的企业家，致敬雷军，小米，致敬马云，致敬尚硅谷，致敬所有为人民谋福的英雄人物和企业，再次献上我诚挚的敬意，致敬！尚硅谷大数据全套111个技术1.Java从入门到精通JDK版链接：https://pan.baidu.com/s/1GAc610SYSMmZBuOX4D
大模型核心概念 | 嵌入模型（Embedding）、向量模型（Vector Model）
一、核心概念解析1.1嵌入模型（Embedding）作为AI领域的核心基础技术，嵌入模型通过将非结构化数据映射为低维稠密向量，实现语义特征的深度捕捉：文本嵌入：如将语句转换为1536维向量，使"机器学习"与"深度学习"的向量余弦相似度达0.92跨模态嵌入：支持图像与文本的联合向量空间映射，如CLIP模型实现文图互搜1.2向量模型（VectorModel）作为嵌入技术的下游应用体系，主要包含两大方向
使用LangChain构建多代理系统实现复杂任务自动化 LCG元工具 langchain 自动化运维
目录一、系统架构设计模块说明：二、核心工作流程（双流程图对比）横向对比：单代理vs多代理纵向核心流程三、企业级实现方案1.Python核心代码（LangChain0.1.8+）2.TypeScript前端集成代码四、性能对比测试五、生产级部署方案安全审计要点：高可用部署拓扑：六、技术前瞻性分析附录：完整技术图谱摘要：本文深度解析如何基于LangChain框架构建企业级多代理系统，通过模块化架构设计
2025年最流行跑分最高的图片理解大模型调研报告
2025年最流行跑分最高的图片理解大模型调研报告引言当前，图片理解大模型正处于快速演进阶段，其技术发展呈现多维度深化与融合的特征。从技术演进方向来看，多模态融合已成为核心趋势之一，文本、图像、视频等不同模态的交互与协同能力显著提升。大型视觉-语言模型（LVLMs）作为人工智能领域的重要突破，标志着多模态理解与交互进入变革性发展阶段，尽管当前模型在各类任务中表现出色，但在细粒度视觉任务等基础能力层面
Paimon对比基于消息队列（如Kafka）的传统实时数仓方案的优势 lifallen Paimon 大数据数据库数据结构 java 分布式 apache 数据仓库
弊端：数据重复->优势：Paimon主键表原生去重原方案弊端(Kafka)问题:消息队列（Kafka）是仅支持追加（Append-Only）的日志流。当Flink作业发生故障恢复（Failover）或业务逻辑迭代重跑数据时，同样的数据会被再次写入消息队列，形成重复数据。影响:下游应用（如DWS层、ADS层或直接对接的BI报表）必须自己实现复杂的去重逻辑，这不仅消耗大量计算资源（“资源消耗至少增加一
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现神经网络15044 仿真模型神经网络机器学习图像处理 cnn 人工智能机器人
基于DTLC-AEC与DTLN的轻量级实时语音增强系统设计与实现前些天发现了一个巨牛的人工智能学习网站，通俗易懂，风趣幽默，忍不住分享一下给大家。点击跳转到网站。1.引言在当今的互联网通信时代，实时语音通信已成为人们日常生活中不可或缺的一部分。然而，语音通信质量常常受到回声、背景噪声等因素的严重影响。为了解决这些问题，我们需要高效的语音增强技术。本文将详细介绍如何将DTLC-AEC（深度学习回声消
torch numpy sort排序出现索引顺序不正常明天,今天,此时 numpy
问题torch调用numpy,numpy的sort排序值的顺序没发现问题，但是排序的索引argsort()是有明显问题。方案多一次取索引arr.argsort().argsort()参考：https://blog.csdn.net/qq_50571974/article/details/123173118说明：argsort其实是没问题的，理解有点复杂，以序号的角度去测试和思考
2025年UDP应用抗洪指南：从T级清洗到AI免疫，实战防御UDP洪水攻击
一次未防护的UDP暴露，可能让日活百万的应用瞬间瘫痪，损失超千万2025年，随着物联网僵尸网络规模指数级增长及AI驱动的自适应攻击工具泛滥，UDP洪水攻击峰值已突破8Tbps，单次攻击成本却降至50元以下。更致命的是，70%的UDP攻击伴随CC攻击形成混合打击，传统防护体系几近失效。本文将揭秘攻击者最新武器库，并分享一套经头部企业验证的立体化防御方案。一、2025年UDP洪水攻击的三大致命升级1.
cdh6.3.2的hive使用apache paimon格式只能创建不能写报错的问题明天,今天,此时 hive paimon
前言根据官网paimon安装教程，看上去简单，实则报错阻碍使用的信心。解决方法原带的jars下的zstd开头的包旧了，重新下载zstd较新的包单独放到每个节点的hive/lib下; 然后将hdfsyarn用户下的mr-framework.tar.gz中的zstdjar包替换成新的版本。重启就可以了总结国外软件问题，尽量使用英文搜索，特别是google.。方法来源：http
2025阿里云黑洞自救指南：从分钟级恢复到长效免疫的实战方案
一次未防护的DDoS攻击，可致业务停摆72小时，损失超千万！2025年，随着AI驱动的DDoS攻击工具泛滥及僵尸网络商业化，阿里云服务器被拉入黑洞的案例激增300%。当攻击流量超过实例阈值（5Gbps-300Gbps）时，阿里云会强制屏蔽IP公网访问——这不是惩罚，而是保全云平台整体的“断臂求生”。本文将提供一套经过头部企业验证的应急方案，涵盖从5分钟快速恢复到构建免疫体系的全流程。一、2025黑
XFS 文件系统异常处理与修复全流程指南
XFS文件系统异常处理与修复全流程指南目录初始问题：无法挂载磁盘确认物理连接与设备状态尝试自动挂载失败后的排查步骤安装与编译新版本xfsprogs使用最新版xfs_repair进行检查与修复数据恢复后的建议操作总结1.初始问题：无法挂载磁盘现象系统启动后，原本自动挂载的数据分区/data无法正常挂载。尝试手动挂载时出现错误提示。解决方案首先确认磁盘是否存在物理连接，并检查设备状态。2.确认物理连接
AI算力网络中的5大网络安全威胁及应对策略 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据网络人工智能 web安全 ai
AI算力网络中的5大网络安全威胁及应对策略关键词：AI算力网络、网络安全威胁、数据隐私、模型安全、可信计算摘要：随着AI技术与算力网络的深度融合，AI算力网络已成为智能社会的“数字引擎”。但这一新型基础设施面临着比传统网络更复杂的安全挑战。本文将用“快递网”“做菜”等生活化类比，拆解AI算力网络中最常见的5大安全威胁，并结合前沿技术给出可落地的应对策略，帮助读者理解如何为AI算力网络构建“安全防护
AI交互新范式：MCP（模型上下文协议）场景化应用与科普，收藏这一篇就够了！！ AI大模型-bugyinyin 人工智能交互 microsoft AI大模型语言模型 MCP Agent
前言当AI大模型浪潮席卷而来，我们惊喜于其强大的语言理解和生成能力，却也常常囿于传统交互方式的低效与割裂。如何让AI真正融入我们的工作流，高效地与各类工具和服务协同？模型上下文协议(ModelContextProtocol,MCP)的诞生，正是为了打破这一瓶颈，构建AI交互的新范式。本文将深入浅出地为您解读MCP，揭示其场景化应用，并提供一份全面的科普指南，带您领略MCP的魅力与潜力。一、MCP：
Nginx负载均衡 510888780 nginx 应用服务器
Nginx负载均衡一些基础知识: nginx 的 upstream目前支持 4 种方式的分配 1)、轮询（默认）每个请求按时间顺序逐一分配到不同的后端服务器，如果后端服务器down掉，能自动剔除。 2)、weight 指定轮询几率，weight和访问比率成正比
RedHat 6.4 安装 rabbitmq bylijinnan erlang rabbitmq redhat
在 linux 下安装软件就是折腾，首先是测试机不能上外网要找运维开通，开通后发现测试机的 yum 不能使用于是又要配置 yum 源，最后安装 rabbitmq 时也尝试了两种方法最后才安装成功机器版本： [root@redhat1 rabbitmq]# lsb_release LSB Version: :base-4.0-amd64:base-4.0-noarch:core
FilenameUtils工具类 eksliang FilenameUtils common-io
转载请出自出处：http://eksliang.iteye.com/blog/2217081 一、概述这是一个Java操作文件的常用库，是Apache对java的IO包的封装，这里面有两个非常核心的类FilenameUtils跟FileUtils，其中FilenameUtils是对文件名操作的封装;FileUtils是文件封装，开发中对文件的操作，几乎都可以在这个框架里面找到。非常的好用。
xml文件解析SAX 不懂事的小屁孩 xml
xml文件解析:xml文件解析有四种方式， 1.DOM生成和解析XML文档(SAX是基于事件流的解析) 2.SAX生成和解析XML文档(基于XML文档树结构的解析) 3.DOM4J生成和解析XML文档 4.JDOM生成和解析XML 本文章用第一种方法进行解析，使用android常用的DefaultHandler import org.xml.sax.Attributes;
通过定时任务执行mysql的定期删除和新建分区，此处是按日分区酷的飞上天空 mysql
使用python脚本作为命令脚本，linux的定时任务来每天定时执行 #!/usr/bin/python # -*- coding: utf8 -*- import pymysql import datetime import calendar #要分区的表 table_name = 'my_table' #连接数据库的信息 host,user,passwd,db =
如何搭建数据湖架构？听听专家的意见蓝儿唯美架构
Edo Interactive在几年前遇到一个大问题：公司使用交易数据来帮助零售商和餐馆进行个性化促销，但其数据仓库没有足够时间去处理所有的信用卡和借记卡交易数据 “我们要花费27小时来处理每日的数据量，”Edo主管基础设施和信息系统的高级副总裁Tim Garnto说道：“所以在2013年，我们放弃了现有的基于PostgreSQL的关系型数据库系统，使用了Hadoop集群作为公司的数
spring学习——控制反转与依赖注入 a-john spring
控制反转（Inversion of Control，英文缩写为IoC）是一个重要的面向对象编程的法则来削减计算机程序的耦合问题，也是轻量级的Spring框架的核心。控制反转一般分为两种类型，依赖注入（Dependency Injection，简称DI）和依赖查找（Dependency Lookup）。依赖注入应用比较广泛。
用spool+unixshell生成文本文件的方法 aijuans xshell
例如我们把scott.dept表生成文本文件的语句写成dept.sql,内容如下: 　　set pages 50000; 　　set lines 200; 　　set trims on; 　　set heading off; 　　spool /oracle_backup/log/test/dept.lst; 　　select deptno||','||dname||','||loc
1、基础--名词解析(OOA/OOD/OOP) asia007 学习基础知识
OOA:Object-Oriented Analysis（面向对象分析方法）是在一个系统的开发过程中进行了系统业务调查以后，按照面向对象的思想来分析问题。OOA与结构化分析有较大的区别。OOA所强调的是在系统调查资料的基础上，针对OO方法所需要的素材进行的归类分析和整理，而不是对管理业务现状和方法的分析。　　OOA（面向对象的分析）模型由5个层次（主题层、对象类层、结构层、属性层和服务层）
浅谈java转成json编码格式技术百合不是茶 json编码 java转成json编码
json编码;是一个轻量级的数据存储和传输的语言在java中需要引入json相关的包,引包方式在工程的lib下就可以了 JSON与JAVA数据的转换（JSON 即 JavaScript Object Natation，它是一种轻量级的数据交换格式，非常适合于服务器与 JavaScript 之间的数据的交
web.xml之Spring配置(基于Spring+Struts+Ibatis) bijian1013 java web.xml SSI spring配置
指定Spring配置文件位置 <context-param> <param-name>contextConfigLocation</param-name> <param-value> /WEB-INF/spring-dao-bean.xml,/WEB-INF/spring-resources.xml, /WEB-INF/
Installing SonarQube（Fail to download libraries from server） sunjing Install Sonar
1. Download and unzip the SonarQube distribution 2. Starting the Web Server The default port is "9000" and the context path is "/". These values can be changed in &l
【MongoDB学习笔记十一】Mongo副本集基本的增删查 bit1129 mongodb
一、创建复本集假设mongod,mongo已经配置在系统路径变量上，启动三个命令行窗口，分别执行如下命令： mongod --port 27017 --dbpath data1 --replSet rs0 mongod --port 27018 --dbpath data2 --replSet rs0 mongod --port 27019 -
Anychart图表系列二之执行Flash和HTML5渲染白糖_ Flash
今天介绍Anychart的Flash和HTML5渲染功能 HTML5 Anychart从6.0第一个版本起，已经逐渐开始支持各种图的HTML5渲染效果了，也就是说即使你没有安装Flash插件，只要浏览器支持HTML5，也能看到Anychart的图形（不过这些是需要做一些配置的）。这里要提醒下大家，Anychart6.0版本对HTML5的支持还不算很成熟，目前还处于
Laravel版本更新异常4.2.8-> 4.2.9 Declaration of ... CompilerEngine ... should be compa bozch laravel
昨天在为了把laravel升级到最新的版本，突然之间就出现了如下错误： ErrorException thrown with message "Declaration of Illuminate\View\Engines\CompilerEngine::handleViewException() should be compatible with Illuminate\View\Eng
编程之美-NIM游戏分析-石头总数为奇数时如何保证先动手者必胜 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class Nim { /**编程之美 NIM游戏分析问题：有N块石头和两个玩家A和B，玩家A先将石头随机分成若干堆，然后按照BABA...的顺序不断轮流取石头，能将剩下的石头一次取光的玩家获胜，每次取石头时，每个玩家只能从若干堆石头中任选一堆，
lunce创建索引及简单查询 chengxuyuancsdn 查询创建索引 lunce
import java.io.File; import java.io.IOException; import org.apache.lucene.analysis.Analyzer; import org.apache.lucene.analysis.standard.StandardAnalyzer; import org.apache.lucene.document.Docume
[IT与投资]坚持独立自主的研究核心技术 comsci it
和别人合作开发某项产品....如果互相之间的技术水平不同,那么这种合作很难进行,一般都会成为强者控制弱者的方法和手段..... 所以弱者,在遇到技术难题的时候,最好不要一开始就去寻求强者的帮助,因为在我们这颗星球上,生物都有一种控制其
flashback transaction闪回事务查询 daizj oracle sql 闪回事务
闪回事务查询有别于闪回查询的特点有以下3个：（1）其正常工作不但需要利用撤销数据，还需要事先启用最小补充日志。（2）返回的结果不是以前的“旧”数据，而是能够将当前数据修改为以前的样子的撤销SQL（Undo SQL）语句。（3）集中地在名为flashback_transaction_query表上查询，而不是在各个表上通过“as of”或“vers
Java I/O之FilenameFilter类列举出指定路径下某个扩展名的文件游其是你 FilenameFilter
这是一个FilenameFilter类用法的例子，实现的列举出“c:\\folder“路径下所有以“.jpg”扩展名的文件。 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
C语言学习五函数，函数的前置声明以及如何在软件开发中合理的设计函数来解决实际问题 dcj3sjt126com c
# include <stdio.h> int f(void) //括号中的void表示该函数不能接受数据，int表示返回的类型为int类型 { return 10; //向主调函数返回10 } void g(void) //函数名前面的void表示该函数没有返回值 { //return 10; //error 与第8行行首的void相矛盾 } in
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Pl dcj3sjt126com centos
今天在测试环境使用yum安装，遇到一个问题： Error: Cannot retrieve metalink for repository: epel. Please verify its path and try again 处理很简单，修改文件“/etc/yum.repos.d/epel.repo”，将baseurl的注释取消， mirrorlist注释掉。即可。 &n
单例模式 shuizhaosi888 单例模式
单例模式懒汉式 public class RunMain { /** * 私有构造 */ private RunMain() { } /** * 内部类，用于占位，只有 */ private static class SingletonRunMain { priv
Spring Security（09）——Filter 234390216 Spring Security
Filter 目录 1.1 Filter顺序 1.2 添加Filter到FilterChain 1.3 DelegatingFilterProxy 1.4 FilterChainProxy 1.5
公司项目NODEJS实践0.1 逐行分析JS源代码 mongodb nginx ubuntu nodejs
一、前言前端如何独立用nodeJs实现一个简单的注册、登录功能，是不是只用nodejs+sql就可以了？其实是可以实现，但离实际应用还有距离，那要怎么做才是实际可用的。网上有很多nod
java.lang.Math liuhaibo_ljf java Math lang
System.out.println(Math.PI); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1.2)); System.out.println(Math.abs(1)); System.out.println(Math.abs(111111111)); System.out.println(Mat
linux下时间同步 nonobaba ntp
今天在linux下做hbase集群的时候，发现hmaster启动成功了，但是用hbase命令进入shell的时候报了一个错误 PleaseHoldException: Master is initializing，查看了日志，大致意思是说master和slave时间不同步，没办法，只好找一种手动同步一下，后来发现一共部署了10来台机器，手动同步偏差又比较大，所以还是从网上找现成的解决方
ZooKeeper3.4.6的集群部署 roadrunners zookeeper 集群部署
ZooKeeper是Apache的一个开源项目，在分布式服务中应用比较广泛。它主要用来解决分布式应用中经常遇到的一些数据管理问题，如：统一命名服务、状态同步、集群管理、配置文件管理、同步锁、队列等。这里主要讲集群中ZooKeeper的部署。 1、准备工作我们准备3台机器做ZooKeeper集群，分别在3台机器上创建ZooKeeper需要的目录。数据存储目录
Java高效读取大文件 tomcat_oracle java
　　读取文件行的标准方式是在内存中读取，Guava 和Apache Commons IO都提供了如下所示快速读取文件行的方法：　　Files.readLines(new File(path), Charsets.UTF_8); 　　FileUtils.readLines(new File(path)); 　　这种方法带来的问题是文件的所有行都被存放在内存中，当文件足够大时很快就会导致
微信支付api返回的xml转换为Map的方法 xu3508620 xml map 微信api
举例如下： <xml> <return_code><![CDATA[SUCCESS]]></return_code> <return_msg><![CDATA[OK]]></return_msg> <appid><