人机与认知实验室

AIGC周报｜周鸿祎：GPT-6到GPT-8或将产生意识，成为新物种；OpenAI：我们将重建信任；“让他看起来像梵高”...

学术头条 2023-03-27 12:14 发表于北京

AIGC（AI Generated Content）即人工智能生成内容。近期爆火的 AI 聊天机器人 ChatGPT，以及 Dall·E 2、Stable Diffusion 等文生图模型，都属于 AIGC 的典型案例，它们通过借鉴现有的、人类创造的内容来快速完成内容创作。

“新晋流量”ChatGPT的背后，AIGC是“昙花一现”？还是将引领人工智能进入新的时代？「AIGC 周报」将从【技术前瞻】【企业动态】【政策法规】【专家观点】带你快速跟进 AIGC 世界。

01 技术前瞻

“让他看起来像梵高”，文本编辑3D场景

为了使用指令编辑 3D 场景，这项研究提出了 Instruction-NeRF2NeRF，给定一个场景的 NeRF（Neural Radiance Fields）和用于重建它的图像集合，使用图像条件扩散模型（InstructPix2Pix）进行迭代编辑输入图像，同时优化基础场景，从而产生遵循编辑指令的 3D 场景。

这项研究所提出的方法能够编辑人、物体和大型场景，完成比以前工作更真实、更有针对性的编辑。例如，下图展示了将给定的 NeRF 场景基于文本指令（“给它一个牛仔帽”、“把他变成一个小丑”等）生成的结果。

图片

然而，这一方法存在一定局限性。如果 InstructPix2Pix 无法在 2D 中正确地执行编辑，这一方法会在 3D 中失败；有时尽管在 2D 中完成正确编辑，但存在很大的不一致性，这一方法同样无法在 3D 中有效整合信息。

论文链接：

https://arxiv.org/abs/2303.12789

微软研究院154页报告：“看到了通用人工智能的火花”

AI 研究人员一直在开发和改进大型语言模型，这些模型在各种领域和任务中展现出卓越的能力，挑战了公众对学习和认知的理解。OpenAI 开发的新模型 GPT-4 使用前所未有的计算和数据规模进行训练。这项研究证明，GPT-4 达到了一种通用智能的形式，确实展示了通用人工智能（AGI）的火花。

GPT-4 的核心心理能力（如创造力和推理）、获得专业知识的主题范围（如文学、医学和编程）以及能够执行的各种任务（如玩游戏、使用工具等）都证明了这一点。

例如，下图中第一张图片是 Wassily Kandinsky 的艺术作品 Composition 8，第二张和第三张图片分别由 GPT-4 和 ChatGPT 制作，提示为 “生成 Javascript 代码，创建一个看起来像 Wassily Kandinsky 画作的随机图形图像”。

图片

然而，要创建一个符合完整 AGI 条件的系统，还有很多工作要做：置信度校准；长期记忆；持续学习；个性化；规划和概念飞跃；透明度、可解释性和一致性；认知谬误与非理性；对输入敏感的挑战。

论文链接：

https://arxiv.org/abs/2303.12712

大模型该怎样理解现实世界的会话？

视觉信息是对话的核心。例如，身体特征和面部表情有助于超越语言的理解。然而，到目前为止，大多数神经会话模型仅限于文本。如今，一项新的研究提出了一种可以解释视觉上下文的对话生成模型——CHAMPAGNE。

为了训练 CHAMPAGNE，研究团队收集并发布了 YTD-18M，一个基于 18M 视频对话的大规模语料库，来自于公共视频及其相关转录本。人工评估表明，YTD-18M 比之前的资源更加敏感和具体，同时保持了视觉基础。

实验表明：CHAMPAGNE 在各种现实世界的对话任务中表现出了强大的性能，这表明基于视频的对话可以帮助模型了解现实世界。当进行微调时，它在四个侧重于真实世界对话的视觉语言任务中取得了最好的结果。

图片

论文链接：

https://arxiv.org/abs/2303.09713

生成一双更“邪恶”的运动鞋，GAN+符号学

一项新的研究表明，由生成对抗网络（GAN）生成的图像可以使用符号和抽象概念进行修改。正如可以修改图像的色调和饱和度等物理属性一样，使用这一方法也可以修改其非物理的抽象属性。

例如，可以修改空乘人员制服的设计，使其看起来更 “警觉”、不那么 “严肃” 或更 “实用”。房子的形式可以被修改以显得更 “未来主义”，汽车更 “友好”，一双运动鞋更 “邪恶”。这一方法揭示了与感兴趣的符号属性相关的潜在视觉图像，从而实现了使用抽象概念进行视觉形式查找的过程。

如下图所示，采集的种子图像被变换以显示更多（右）或更少（左）的符号属性呈现。上排代表 “邪恶” 的跑鞋，下排代表 “最小” 的猫。

图片

参考链接：

https://arxiv.org/abs/2303.12731

未完成的建筑怎么办？AI帮助“修复”

AI 的发展为完成未完工建筑的可能性的提出开辟了新的途径。具体来说，最近出现的 DALL·E、Midjourney、Stable Diffusion 等工具，使用数亿或数十亿的文本/图像对进行训练，并使用具有数千万或数亿参数的模型，能够在文本描述的指导下完成图像。

研究显示，DALL·E 2 工具为完成未完成的立面而生成的结果通常与基于 AI 能够在网络上识别的图形资源的真实感重建的预期结果一致，它有更加规律的操作方式并能系统地提出恢复建议。例如，针对圣洛伦佐大教堂（佛罗伦萨），从左到右分别是当前状态和使用 DALL·E 2 生成的两个连续恢复建议。

然而，就像 19 世纪时一样，当建筑师相信他们有能力为未完成的项目推导出正确的解决方案时，图像完成工具所产生的期望似乎正引导我们走上类似的道路。

图片

参考链接：

https://arxiv.org/abs/2303.12732

谷歌新模型“以假乱真”，主题驱动的文本到3D生成

谷歌发布的一项新研究提出了 DreamBooth 3D，这是一种基于 3-6 张普通拍摄的图像、个性化的 “文生3D” 的方法。这一方法将 “文生图” 个性化模型（DreamBooth）以及“文生3D”模型（DreamFusion）进行了有效结合。

研究发现，由于 “文生图” 模型过度拟合了被试的输入观点，将这些方法简单地结合在一起无法产生令人满意的特定主题的 3D 资源。研究团队通过三阶段优化策略——利用 NeRF（将全连接神经网络引入到物体的 3D 场景表示中）的 3D 一致性和 “文生图” 模型的个性化能力，解决了这一问题，从而可以通过文本驱动的修改来生成高质量的、针对特定对象的 3D 资源，如在任何对象的输入图像中都看不到的新颖姿势、颜色和属性。

下图展示了这一方法可以基于给定图像（3 张）和文本提示（“蓝领带” 或 “睡眠”）产生的不同 3D 主题。

图片

参考链接：

https://arxiv.org/abs/2303.13508

在ChatGPT上的评估不太可信

ChatGPT 是第一个被大众大量使用的大型语言模型，在许多自然语言任务中表现出了亮眼的性能。尽管 ChatGPT 具有明显的实用性，但由于模型的封闭性及其通过从人类反馈中强化学习的持续更新，评估它在不同问题领域的性能仍然具有挑战性。因此，为了确保模型的公平可评估性，建议模型创建者：

（1）更加关注训练数据集并记录潜在的数据污染；

（2）创建机制，通过该机制可以仔细检查训练数据集和模型的数据泄露情况；

（3）建立系统，防止用户输入造成的数据污染。

参考链接：

https://arxiv.org/abs/2303.12767

02 企业动态

OpenAI：我们将重建信任

3 月 24 日，OpenAI 发布声明，向用户和整个 ChatGPT 社区道歉，表示将重建信任。声明表示，本周早些时候，该公司将 ChatGPT 下线，原因是开源库中存在漏洞。该漏洞目前已被修复，同时 OpenAI 也披露了更多的技术细节。

具体而言，存在的漏洞致使一些用户可以看到另一用户的聊天记录标题。如果两个用户大约同时处于活动状态，那么新创建的对话的第一条消息也可能在其他人的聊天记录中可见。经过更深入的调查，发现同样的错误可能导致 1.2% 的 ChatGPT Plus 订阅者在特定的 9 小时窗口内处于活跃状态，从而无意中看到了与支付相关的信息。

参考链接：

https://openai.com/blog/march-20-chatgpt-outage

微软警告：新推的AI工具不得使用必应数据库，否则限制访问

据财联社报道，微软对其搜索引擎竞争对手发出警告，称如果对手公司继续将微软的搜索索引数据库作为其 AI 聊天产品的基础，微软将切断这些公司对其数据的访问。

目前，微软已将其必应搜索索引中的数据授权给了几家提供网络搜索的公司，如阿波罗全球管理公司旗下的雅虎和 DuckDuckGo。

据知情人士透露，微软已经告诉至少两名客户，使用必应搜索索引为他们的 AI 聊天工具提供信息违反了他们的合同条款，微软可能会终止向这些企业提供访问数据库的许可证。

美国数据仓库巨头发布开源模型，公开挑战ChatGPT

据第一财经报道，总部位于美国旧金山的初创公司 Databricks 于 3 月 24 日发布了一款 AI 聊天机器人的代码。Databricks 称公司可以像 OpenAI 一样，使用这些代码创建自己的聊天机器人，并将代码开源。

Databricks 首席执行官 Ali Ghodsi 表示，将该模型开源的意图很明确，就是为了展示一种可行的 ChatGPT 的替代方案。不过，该公司还没有发布正式的基准测试，来比较该模型与 ChatGPT 的性能高低。

OpenAI官宣：ChatGPT可以联网了

3 月 23 日，OpenAI 官方宣布，ChatGPT 终于可以联网了。据官方博客介绍，此次 “联网” 功能的实现得益于 OpenAI 为 ChatGPT 增加了插件使用功能，“插件是专门为语言模型设计的工具，以安全为核心原则，并帮助 ChatGPT 访问最新的信息、运行计算或使用第三方服务。”除了检索实时信息外，ChatGPT 还获得了检索知识库信息（如公司文件、个人笔记等）、代表用户执行操作（如订机票、订餐等）的能力。（点击查看详情）

Adobe发布AIGC工具：将想象带入现实世界

3 月 22 日，Adobe 推出了创意生成式 AI 模型集 Adobe Firefly，并宣布未来不久将其集成到 Adobe 的产品中。用户可以使用 Adobe Firefly 进行实验、想象和无限范围的创作，在不取代人类想象力的情况下扩大创造力和智慧，在数码成像和摄影、插图、艺术品和平面设计、视频、营销和社交媒体、3D 建模等方面探索各种可能性。（点击查看详情）

03 政策法规

美国作家协会：AI 是对被“喂养”内容的回流

3 月 23 日，WGA（美国作家协会）发布公告称，其在与电影电视制片人联盟（AMPTP）的合同谈判中提出一项提案，该提案确保了电影公司不能使用 AI 来破坏编剧的工作标准，包括薪酬、剩余报酬、独立权利和演职员表。

WGA 的提案将禁止把 AI 生成的内容用作源材料或重写 WGA 与 AMPTP 达成的协议所涵盖的工作，理由是 AI 生成的内容是通过摄取公共领域中受版权保护的内容和文本来创建的。WGA 和 AMPTP 关于该合同的谈判将在未来两周内继续进行。

参考链接：

https://twitter.com/WGAEast/status/1638643976109703168

04 专家观点

周鸿祎：预计GPT-6到GPT-8将会产生意识

据《科创板日报》报道，360 集团创始人周鸿祎表示，中国大型语言模型技术水平和 GPT-4 的差距在 2 到 3 年的时间，目前 GPT 的技术方向已经明确，不存在难以逾越的技术障碍，中国企业应当坚持长期主义精神，迎头赶上。

周鸿祎预计，GPT-6 到 GPT-8 将会产生意识，变成新物种。未来，AI 大语言模型有可能实现自我进化，自动更新系统和自我升级，或者指数级进化能力，人类将会面临不可预知的安全挑战。

Geoffrey Hinton：或许更快进入AGI时代

近日，AI 教父 Geoffrey Hinton 表示：“直到最近，我还认为我们仍需要 20 到 50 年的时间才能拥有 AGI。现在，我认为可能只需要 20 年或更短的时间……” 谈及 AI 试图消灭人类的可能性，Hinton 认为，“这并非难以置信，更大的问题是人们需要学会管理一项可以赋予少数公司或政府巨大权力的技术。”

参考链接：

https://www.cbsnews.com/news/godfather-of-artificial-intelligence-weighs-in-on-the-past-and-potential-of-artificial-intelligence/

比尔·盖茨：一个新时代已经开始

“AI 与手机和互联网一样具有革命性。在我的一生中，我见过两次让我印象深刻的革命性技术演示。第一次是在 1980 年，当时我接触到了图形用户界面——每个现代操作系统的先驱，包括 Windows；第二个大惊喜发生在去年，我看到 OpenAI 的 ChatGPT 通过大学预修生物学考试。无论如何，在可预见的未来，AI 主题将主导公众讨论。”

同时，盖茨提出了三个原则：“首先，我们应该尝试平衡对 AI 缺点的恐惧与它改善人们生活的能力。其次，市场力量不会自然而然地生产出帮助最贫困人群的 AI 产品和服务。有了可靠的资金和正确的政策，政府和慈善机构可以确保 AI 被用来减少不平等。正如世界需要最聪明的人专注于解决最大的问题一样，我们也需要让世界上最好的 AI 专注于解决最大的问题。最后，我们才刚刚开始了解 AI 的成就，它今天的任何限制都会在我们知道之前消失。”

参考链接：

https://www.gatesnotes.com/The-Age-of-AI-Has-Begun

Cristiano Amon：5G将助力AI扩展，使数据可与其他设备及云端共享

据澎湃新闻报道，高通公司总裁兼首席执行官 Cristiano Amon 在中国发展高层论坛 2023 年会上演讲称，5G 是实现数字社会的重要基础设施，将助力 AI 扩展，为边缘计算和端侧 AI 带来诸多益处。数字化转型将实现人与万物智能互联。这也意味着超高速、可靠连接随时随地、始终连接到云端，具有嵌入式处理器和 AI 的一系列设备，以及数字孪生的普及。

｜点击关注我记得标星｜

阅读原文

阅读 952

TensorFlow为AI人工智能航空航天领域带来变革 AI原生应用开发人工智能 tensorflow python ai
TensorFlow为AI人工智能航空航天领域带来变革关键词：TensorFlow、人工智能、航空航天、机器学习、深度学习、神经网络、自主系统摘要：本文探讨了TensorFlow这一强大的机器学习框架如何推动航空航天领域的创新。我们将从基础概念入手，逐步深入分析TensorFlow在航天器导航、卫星图像处理、飞行器自主决策等关键应用场景中的实现原理。通过实际代码示例和架构图解，展示TensorFl
多语言文本分类在AI应用中的实践 AI原生应用开发人工智能分类数据挖掘 ai
多语言文本分类在AI应用中的实践关键词：多语言文本分类、自然语言处理、机器学习、深度学习、BERT、迁移学习、跨语言模型摘要：本文深入探讨多语言文本分类在AI领域的应用实践。我们将从基础概念出发，逐步讲解其核心原理、技术架构和实现方法，并通过实际案例展示如何构建一个高效的多语言文本分类系统。文章将涵盖从传统机器学习方法到最先进的深度学习技术，特别关注跨语言迁移学习在实际业务场景中的应用。背景介绍目
从零开始构建AI原生应用的认知架构 AI原生应用开发 AI-native 架构 ai
从零开始构建AI原生应用的认知架构关键词：AI原生应用、认知架构、机器学习、知识图谱、神经网络、智能决策、系统设计摘要：本文深入探讨如何从零开始构建AI原生应用的认知架构。我们将从基本概念出发，逐步解析认知架构的核心组件，包括知识表示、推理机制和学习能力等。通过生动的比喻和实际代码示例，帮助读者理解如何设计一个能够模拟人类认知过程的AI系统。文章还将介绍当前最先进的认知架构模型，并展望未来发展趋势
MATLAB在工业缺陷检测中的应用
本文还有配套的精品资源，点击获取简介：缺陷检测、伤痕检测、瑕疵检测和划痕检测是工业自动化和质量控制中至关重要的环节，MATLAB作为一种高级编程环境，在图像处理和计算机视觉任务中扮演了重要角色。本文详细介绍了如何使用MATLAB实现这些检测过程，包括图像采集、预处理、特征提取和决策制定等步骤。通过介绍内置图像处理工具箱中的应用，色彩转换技术、边缘检测算法以及形态学操作等方法，我们阐述了如何识别和处
【缺陷检测】基于计算机视觉实现电路板智能检测系统附Matlab代码 matlab科研助手计算机视觉 matlab 人工智能
✅作者简介：热爱科研的Matlab仿真开发者，擅长数据处理、建模仿真、程序设计、完整代码获取、论文复现及科研仿真。往期回顾关注个人主页：Matlab科研工作室个人信条：格物致知,完整Matlab代码及仿真咨询内容私信。内容介绍随着信息技术的飞速发展和电子产品的日益普及，印刷电路板（PCB）作为电子产品的核心组件，其质量直接关系到整个系统的性能和可靠性。传统的电路板检测主要依赖人工目检，存在效率低下
Orange3实战教程：图像分析---图像嵌入 err2008 Orange3 实战教程数据挖掘神经网络自然语言处理机器学习计算机视觉深度学习 orange3中文版
图像嵌入通过深度神经网络实现图像嵌入。输入图像：图像列表。输出嵌入向量：用数字向量表示的图像。跳过的图像：未计算嵌入向量的图像列表。图像嵌入功能读取图像并将其上传至远程服务器或本地计算。深度学习模型用于为每张图像计算特征向量。该功能返回一个增强的数据表，包含额外的列（图像描述符）。图像可以通过导入图像小部件导入，也可以通过电子表格中的图像路径导入。在这种情况下，包含图像路径的列需要一个三行表头，第
宗毅说 | 乌卡瑟时代的生存思考裂变学院
今天，互联网经济、人工智能、全球化发展对我们的影响，要比我们想象得大得多。在多股合力的相互作用下，这个时代的社会特征、商业特征与之前相比显著不同，我称之为乌卡瑟“VUCASE”。备注：乌卡瑟（VUCASE）这个术语是我自创的，来自于乌卡(VUKA）。VUCA是Volatility(易变性)，Uncertainty(不确定性)，Complexity(复杂性)、Ambiguity（模糊性）这四个英文单
[论文阅读] 人工智能 + 软件工程 | 单会话方法论：一种以人类为中心的人工智能辅助软件开发协议张较瘦_ 前沿技术论文阅读人工智能软件工程
单一对话法（SCM）：AI辅助软件开发的“全局对话”新思路SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSoftwareDevelopmentarXiv:2507.12665SingleConversationMethodology:AHuman-CenteredProtocolforAI-AssistedSo
如何安全使用人工智能大模型
人工智能大模型的安全漏洞在推送，你只要有不一样的解决方案他就会通过学习学会，在别人讨论相同问题时，就会作为解决问题的推荐方案。这种机制是没办法防的。鉴于此我们只能采取如下措施:1.绝对本地部署，就是部署好以后断网，因为你使用时他还是会手机数据往后台传送，我本地部署的大模型在推理时看性能，网络也是有数据流的。也不知道在交换什么。2.既然搞不清楚那就彻底不相信，断网。那么我们要加快进度，快速完成任务，
PyTorch生成式人工智能（18）——循环神经网络详解与实现盼小辉丶 pytorch rnn 自然语言处理
PyTorch生成式人工智能（18）——循环神经网络详解与实现0.前言1.文本生成的挑战2.循环神经网络2.1文本数据2.2循环神经网络原理3.长短期记忆网络3.自然语言处理基础3.1分词3.2词嵌入3.3词嵌入在自然语言处理中的应用小结系列链接0.前言我们已经学习了如何生成数字和图像等内容。从本节开始，我们将主要聚焦于文本生成。人类语言极其复杂且充满细微差别，不仅仅涉及语法和词汇的理解，还包括上
【人工智能99问】卷积神经网络（CNN）的结构和原理是什么？(10/99)
文章目录卷积神经网络（CNN）的结构及原理一、CNN的核心结构1.输入层（InputLayer）2.卷积层（ConvolutionalLayer）2.卷积层的核心机制：局部感受野与权值共享3.池化层（PoolingLayer）4.全连接层（FullyConnectedLayer）5.输出层（OutputLayer）6.辅助层二、CNN的工作原理三、CNN的使用场景1.计算机视觉（最核心场景）2.其
Deep Multi-scale Convolutional Neural Network for Dynamic Scene Deblurring 论文阅读钟屿论文阅读计算机视觉人工智能
用于动态场景去模糊的深度多尺度卷积神经网络摘要针对一般动态场景的非均匀盲去模糊是一个具有挑战性的计算机视觉问题，因为模糊不仅来源于多个物体运动，还来源于相机抖动和场景深度变化。为了去除这些复杂的运动模糊，传统的基于能量优化的方法依赖于简单的假设，例如模糊核是部分均匀或局部线性的。此外，最近的基于机器学习的方法也依赖于在这些假设下生成的合成模糊数据集。这使得传统的去模糊方法在模糊核难以近似或参数化的
基于Paillier同态加密算法的金融数据安全共享机制研究【附数据】
金融数据分析与建模专家金融科研助手|论文指导|模型构建✨专业领域：金融数据处理与分析量化交易策略研究金融风险建模投资组合优化金融预测模型开发深度学习在金融中的应用擅长工具：Python/R/MATLAB量化分析机器学习模型构建金融时间序列分析蒙特卡洛模拟风险度量模型金融论文指导内容：金融数据挖掘与处理量化策略开发与回测投资组合构建与优化金融风险评估模型期刊论文✅具体问题可以私信或查看文章底部二维码
吴恩达机器学习cs229-学习笔记-更新中是娜个二叉树！机器学习学习笔记
吴恩达机器学习cs22901基础概念语言：Matlab/python监督学习定义：获取一组数据集拟合数据从X到Y的映射回归问题：预测的Y是连续的，Y是实数分类问题：分类指的是Y取离散值，输出是离散的两组，正示例和负示例，把所有样本推到这条直线上，用0，1，标识逻辑回归算法，拟合直线区分正，负示例处理相对大量特征的回归算法或者分类算法支持向量机算法：它使用的不是1,2,3,10个输入特征，而是使用无
YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测
在深度学习领域，手写数字识别是一个经典问题，也是入门计算机视觉的重要案例。本文将介绍一个基于YOLOv8和MNIST数据集的手写数字识别系统，该系统不仅能识别静态图像中的数字，还能通过摄像头实时检测手写数字。个人博客：YOLOv8实现手写数字识别系统：从MNIST到实时摄像头检测-iDing's博客项目概述这个项目结合了传统的MNIST数据集和现代的目标检测算法YOLOv8，实现了以下功能：将MN
「日拱一码」033 机器学习——严格划分胖达不服输「日拱一码」机器学习人工智能严格划分组划分
目录简单随机划分（train_test_split）分组划分（GroupSplitting）简单分组划分(GroupSplitting)分层分组划分(StratifiedGroupSplitting)交叉验证法（Cross-Validation）分组K折交叉验证（GroupKFold）留一组法（LeaveOneGroupOut）简单随机划分（train_test_split）简单随机分组通过随机分
基于深度学习的手写数字和符号识别系统：YOLOv5/v6/v7/v8/v10模型实现与UI界面集成 YOLO实战营深度学习 YOLO ui 人工智能目标检测计算机视觉
1.引言随着人工智能和深度学习技术的发展，手写数字和符号识别已经成为计算机视觉领域的重要研究方向。手写识别在很多实际应用中扮演着关键角色，例如邮政编码识别、表单自动处理和智能教育系统等。传统的手写识别方法通常依赖于复杂的特征工程，而深度学习则能够自动从数据中学习到特征，极大地提高了识别精度和速度。本文将介绍如何构建一个基于YOLO系列模型（YOLOv5、YOLOv6、YOLOv7、YOLOv8、Y
【人工智能艺术革命：科技灵感与艺术创新的交融纪元】陈辰学长人工智能科技
【人工智能艺术革命：科技灵感与艺术创新的交融纪元】在21世纪的科技浪潮中，人工智能（AI）作为一股不可忽视的力量，正以前所未有的速度渗透并重塑着我们的生活、工作乃至艺术创作领域。其中，AI绘画作为科技与艺术深度融合的产物，不仅挑战了传统艺术的边界，更开启了一个充满无限想象与可能的新时代。本文将从AI绘画的定义与发展历程、技术原理、对艺术创作的影响、面临的挑战与机遇以及未来展望等多个维度，深入探讨这
从零开始：搭建你的人工智能开发环境人工智能教程人工智能 YOLO 机器学习 transformer 线性回归动态规划排序算法
前言在人工智能和机器学习的旅程中，一个稳定且高效的开发环境是成功的关键第一步。无论是初学者还是经验丰富的开发者，一个配置良好的开发环境都能大大提高工作效率，减少遇到的问题。本文将从零开始，逐步指导你如何搭建一个完整的人工智能开发环境，包括操作系统选择、Python安装、常用库的配置以及开发工具的选择。一、选择合适的操作系统（一）主流操作系统介绍在搭建人工智能开发环境时，首先需要选择一个合适的操作系
骗局揭露：光远投研会马光远，环境排放3.0被骗不靠谱！不可信！真相震惊！易星辰分享普法
关于曝光网上光远投研会马光远在炒股群推荐智慧农业中粮仓平台骗局的文章，其内容主要揭示了近期频发的一种投资诈骗手段。以下是该骗局的主要特点和步骤：为什么明明跟老师对过视频，确认是本人，怎么还会被骗了?你有没有想过一个名人大咖怎么会有时间给你们一对一视频，其次我来给大家揭露一下，这个套路AI换脸骗局是一种利用人工智能技术，通过替换视频中的人脸来伪造身份或进行诈骗的行为。你的账户“余额”是真的吗？为什么
【Grafana】Prometheus指标可视化Grafana，手把手教你如何自定义图形景天科技苑 grafana prometheus prometheus可视化 grafana自定义图形手撕grafana 自定义监控图形
✨✨欢迎大家来到景天科技苑✨✨养成好习惯，先赞后看哦~作者简介：景天科技苑《头衔》：大厂架构师，华为云开发者社区专家博主，阿里云开发者社区专家博主，CSDN全栈领域优质创作者，掘金优秀博主，51CTO博客专家等。《博客》：Python全栈，前后端开发，小程序开发，人工智能，js逆向，App逆向，网络系统安全，数据分析，Django，fastapi，flask等框架，云原生k8s，Prometheu
SpringBoot单元测试全攻略：MockMVC+Testcontainers+覆盖率分析 fanxbl957 Web spring boot 单元测试后端
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot单元测试全攻略：
AI作画：AI人工智能激发艺术创作灵感 AGI大模型与大数据研究院 AI作画人工智能 ai
AI作画：AI人工智能激发艺术创作灵感关键词：AI作画、生成艺术、深度学习、神经网络、艺术创作、人工智能、创意工具摘要：本文深入探讨AI作画技术如何激发艺术创作灵感。我们将从基础概念出发，解释AI如何"学习"艺术风格并生成新作品，分析核心技术原理，提供实际应用案例，并展望这一领域的未来发展趋势。通过通俗易懂的讲解和实际代码示例，帮助读者理解这项融合科技与艺术的创新技术。背景介绍目的和范围本文旨在向
基于机器学习的加密货币资金费率预测与套利策略云梦量化科技 python
一、资金费率机制解析永续合约的资金费率是加密货币衍生品市场独有的机制，旨在使永续合约价格锚定现货价格。资金费率每8小时结算一次，结算时多空双方互相支付资金费用：费率为正时，多头支付给空头；费率为负时，空头支付给多头。此机制既促使永续合约价格回归现货价格，也反映市场多空情绪。某安永续合约资金费率计算公式通常为：资金费率 F = 平均溢价指数 P + Clamp(综合利率 I − 溢价指数 P, +0
从文本到语音：使用 ElevenLabs 和 FFmpeg 实现语音合成与播放曦紫沐语音模型 ffmpeg ElevenLabs 语音合成
摘要在当今的人工智能时代，语音合成技术正变得越来越普及。ElevenLabs是一个强大的语音合成平台，能够生成高质量的语音音频。本文将详细介绍如何结合Python、ElevenLabsAPI和FFmpeg工具集，实现从文本到语音的转换，并通过ffplay播放生成的音频文件。同时，我们将解决常见的问题，如ffplay未找到或音频无法播放等。1.引言随着人工智能技术的发展，语音合成（Text-to-S
DK遇见未来：机器人祖爸
人工智能、AI、机械设计、BigData……这些听起来就很高端的专业究竟是什么？这些前沿学科相遇又会碰撞出什么？机器人，将这些前沿领域结合在一起越来越多的融入到我们的工作与生活中可问题来了机器人究竟是什么呢？又该如何给孩子讲机器人呢？这本《DK遇见未来：机器人》完美解决您的烦恼最新数据、系统知识、精美插图可以说这是一本儿童机器人大百科让孩子在这里遇见未来在讲读版视频中与您共同思考未来社会中机器人与
ORACLE 11g 使用ROWNUM完美解决ORA-00600 内部错误代码有点智慧
分享一下我老师大神的人工智能教程！零基础，通俗易懂！http://blog.csdn.net/jiangjunshow也欢迎大家转载本篇文章。分享知识，造福人民，实现我们中华民族伟大复兴！1，ORA-00600：内部错误代码Oracle从11.2.0.1升级到11.2.0.4，开发人员报告说一个job运行失败，调试有报错信息，ORA-00600:内部错误代码，参数：[rwoirw:checkret
Kimi-Audio：最佳音LLM, 如何免费使用 Kimi-Audio AI 模型？知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 kimi
简介继DeepSeek之后，字节跳动（现名MoonShotAI，又名Kimi）也在生成式人工智能领域加速发展，并发布了自己的音频模型Kimi-Audio，据说是迄今为止最好的音频模型。推荐文章《NvidiaGPU入门教程之02ubuntu安装A100显卡驱动(含8步快速浓缩教程)》权重2，安装A100显卡驱动《本地大模型知识库OpenWebUI系列之如何解决知识库上传文件故障Extractedco
Python就业薪资好不好，学Python工作机会多吗？ Python小辰
Python就业薪资好不好？学Python工作机会多吗？人工智能时代的来临让Python崭露头角，各大企业纷纷加大对相关人才的招聘力度吸引了很多人入行学习Python。近年来Python开发发展迅猛，吸引了很多科技公司入驻，且看小编的分析。Python薪资好不好?数据是最有力的答案。职友集统计数据显示，全国Python工程师的平均月资达19160，其中20-30K的工程师数量超过了四成。来自智联招
Jetson平台编译Tengine space01 AIoT Jetson 人工智能深度学习计算机视觉
1.Tengine简介Tengine于2017年在GitHub（https://github.com/OAID/Tengine）开源，是OPENAILAB（开放智能）推出的自主知识产权的边缘AI计算框架，致力于解决AIoT产业链碎片化问题，加速AI产业化落地。Tengine兼容多种操作系统和深度学习算法框架，简化和加速面向场景的AI算法在嵌入式边缘设备上快速迁移，以及实际应用部署落地，可以十倍提升
怎么样才能成为专业的程序员？ cocos2d-x小菜编程 PHP
如何要想成为一名专业的程序员？仅仅会写代码是不够的。从团队合作去解决问题到版本控制，你还得具备其他关键技能的工具包。当我们询问相关的专业开发人员，那些必备的关键技能都是什么的时候，下面是我们了解到的情况。关于如何学习代码，各种声音很多，然后很多人就被误导为成为专业开发人员懂得一门编程语言就够了？！呵呵，就像其他工作一样，光会一个技能那是远远不够的。如果你想要成为
java web开发高并发处理 BreakingBad java Web 并发开发处理高
java处理高并发高负载类网站中数据库的设计方法（java教程,java处理大量数据，java高负载数据）一：高并发高负载类网站关注点之数据库没错,首先是数据库,这是大多数应用所面临的首个SPOF。尤其是Web2.0的应用，数据库的响应是首先要解决的。一般来说MySQL是最常用的，可能最初是一个mysql主机，当数据增加到100万以上，那么，MySQL的效能急剧下降。常用的优化措施是M-S（
mysql批量更新 ekian mysql
mysql更新优化：一版的更新的话都是采用update set的方式，但是如果需要批量更新的话，只能for循环的执行更新。或者采用executeBatch的方式，执行更新。无论哪种方式，性能都不见得多好。三千多条的更新，需要3分多钟。查询了批量更新的优化，有说replace into的方式，即： replace into tableName(id,status) values
微软BI（3） 18289753290 微软BI SSIS
1) Q：该列违反了完整性约束错误；已获得 OLE DB 记录。源:“Microsoft SQL Server Native Client 11.0” Hresult: 0x80004005 说明:“不能将值 NULL 插入列 'FZCHID'，表 'JRB_EnterpriseCredit.dbo.QYFZCH'；列不允许有 Null 值。INSERT 失败。”。 A：一般这类问题的存在是
Java中的List g21121 java
List是一个有序的 collection（也称为序列）。此接口的用户可以对列表中每个元素的插入位置进行精确地控制。用户可以根据元素的整数索引（在列表中的位置）访问元素，并搜索列表中的元素。与 set 不同，列表通常允许重复
读书笔记永夜-极光读书笔记
1. K是一家加工厂,需要采购原材料,有A,B,C,D 4家供应商,其中A给出的价格最低,性价比最高,那么假如你是这家企业的采购经理,你会如何决策? 传统决策: A:100%订单 B,C,D:0% &nbs
centos 安装 Codeblocks 随便小屋 codeblocks
1.安装gcc,需要c和c++两部分,默认安装下,CentOS不安装编译器的,在终端输入以下命令即可yum install gccyum install gcc-c++ 2.安装gtk2-devel,因为默认已经安装了正式产品需要的支持库,但是没有安装开发所需要的文档.yum install gtk2* 3. 安装wxGTK yum search w
23种设计模式的形象比喻 aijuans 设计模式
1、ABSTRACT FACTORY—追MM少不了请吃饭了，麦当劳的鸡翅和肯德基的鸡翅都是MM爱吃的东西，虽然口味有所不同，但不管你带MM去麦当劳或肯德基，只管向服务员说“来四个鸡翅”就行了。麦当劳和肯德基就是生产鸡翅的Factory 　　工厂模式：客户类和工厂类分开。消费者任何时候需要某种产品，只需向工厂请求即可。消费者无须修改就可以接纳新产品。缺点是当产品修改时，工厂类也要做相应的修改。如：
开发管理 CheckLists aoyouzi 开发管理 CheckLists
开发管理 CheckLists(23) -使项目组度过完整的生命周期开发管理 CheckLists(22) -组织项目资源开发管理 CheckLists(21) -控制项目的范围开发管理 CheckLists(20) -项目利益相关者责任开发管理 CheckLists(19) -选择合适的团队成员开发管理 CheckLists(18) -敏捷开发 Scrum Master 工作开发管理 C
js实现切换百合不是茶 JavaScript 栏目切换
js主要功能之一就是实现页面的特效,窗体的切换可以减少页面的大小,被门户网站大量应用思路: 1,先将要显示的设置为display:bisible 否则设为none 2,设置栏目的id ,js获取栏目的id,如果id为Null就设置为显示 3,判断js获取的id名字;再设置是否显示代码实现: html代码: <di
周鸿祎在360新员工入职培训上的讲话 bijian1013 感悟项目管理人生职场
这篇文章也是最近偶尔看到的，考虑到原博客发布者可能将其删除等原因，也更方便个人查找，特将原文拷贝再发布的。“学东西是为自己的，不要整天以混的姿态来跟公司博弈，就算是混，我觉得你要是能在混的时间里，收获一些别的有利于人生发展的东西，也是不错的，看你怎么把握了”，看了之后，对这句话记忆犹新。 &
前端Web开发的页面效果 Bill_chen html Web Microsoft
1.IE6下png图片的透明显示： <img src="图片地址" border="0" style="Filter.Alpha(Opacity)=数值(100),style=数值(3)"/> 或在<head></head>间加一段JS代码让透明png图片正常显示。 2.<li>标
【JVM五】老年代垃圾回收：并发标记清理GC(CMS GC) bit1129 垃圾回收
CMS概述并发标记清理垃圾回收(Concurrent Mark and Sweep GC）算法的主要目标是在GC过程中，减少暂停用户线程的次数以及在不得不暂停用户线程的请夸功能，尽可能短的暂停用户线程的时间。这对于交互式应用，比如web应用来说，是非常重要的。 CMS垃圾回收针对新生代和老年代采用不同的策略。相比同吞吐量垃圾回收，它要复杂的多。吞吐量垃圾回收在执
Struts2技术总结白糖_ struts2
必备jar文件早在struts2.0.*的时候，struts2的必备jar包需要如下几个： commons-logging-*.jar Apache旗下commons项目的log日志包 freemarker-*.jar
Jquery easyui layout应用注意事项 bozch jquery 浏览器 easyui layout
在jquery easyui中提供了easyui-layout布局，他的布局比较局限，类似java中GUI的border布局。下面对其使用注意事项作简要介绍：如果在现有的工程中前台界面均应用了jquery easyui，那么在布局的时候最好应用jquery eaysui的layout布局，否则在表单页面（编辑、查看、添加等等）在不同的浏览器会出
java-拷贝特殊链表：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？ bylijinnan java
public class CopySpecialLinkedList { /** * 题目：有一个特殊的链表，其中每个节点不但有指向下一个节点的指针pNext，还有一个指向链表中任意节点的指针pRand，如何拷贝这个特殊链表？拷贝pNext指针非常容易，所以题目的难点是如何拷贝pRand指针。假设原来链表为A1 -> A2 ->... -> An，新拷贝
color Chen.H JavaScript html css
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd"> <HTML> <HEAD>&nbs
[信息与战争]移动通讯与网络 comsci 网络
两个坚持:手机的电池必须可以取下来光纤不能够入户,只能够到楼宇建议大家找这本书看看:<&
oracle flashback query(闪回查询) daizj oracle flashback query flashback table
在Oracle 10g中，Flash back家族分为以下成员： Flashback Database Flashback Drop Flashback Table Flashback Query(分Flashback Query,Flashback Version Query，Flashback Transaction Query) 下面介绍一下Flashback Drop 和Flas
zeus持久层DAO单元测试 deng520159 单元测试
zeus代码测试正紧张进行中,但由于工作比较忙,但速度比较慢.现在已经完成读写分离单元测试了,现在把几种情况单元测试的例子发出来,希望有人能进出意见,让它走下去. 本文是zeus的dao单元测试: 1.单元测试直接上代码 package com.dengliang.zeus.webdemo.test; import org.junit.Test; import o
C语言学习三printf函数和scanf函数学习 dcj3sjt126com c printf scanf language
printf函数 /* 2013年3月10日20:42:32 地点：北京潘家园功能：目的：测试%x %X %#x %#X的用法 */ # include <stdio.h> int main(void) { printf("哈哈！\n"); // \n表示换行 int i = 10; printf
那你为什么小时候不好好读书? dcj3sjt126com life
dady, 我今天捡到了十块钱, 不过我还给那个人了 good girl! 那个人有没有和你讲thank you啊没有啦....他拉我的耳朵我才把钱还给他的, 他哪里会和我讲thank you 爸爸, 如果地上有一张5块一张10块你拿哪一张呢.... 当然是拿十块的咯... 爸爸你很笨的, 你不会两张都拿爸爸为什么上个月那个人来跟你讨钱, 你告诉他没
iptables开放端口 Fanyucai linux iptables 端口
1，找到配置文件 vi /etc/sysconfig/iptables 2，添加端口开放，增加一行，开放18081端口 -A INPUT -m state --state NEW -m tcp -p tcp --dport 18081 -j ACCEPT 3，保存 ESC :wq! 4，重启服务 service iptables
Ehcache（05）——缓存的查询 234390216 排序 ehcache 统计 query
缓存的查询目录 1. 使Cache可查询 1.1 基于Xml配置 1.2 基于代码的配置 2 指定可搜索的属性 2.1 可查询属性类型 2.2 &
通过hashset找到数组中重复的元素 jackyrong hashset
如何在hashset中快速找到重复的元素呢?方法很多，下面是其中一个办法： int[] array = {1,1,2,3,4,5,6,7,8,8}; Set<Integer> set = new HashSet<Integer>(); for(int i = 0
使用ajax和window.history.pushState无刷新改变页面内容和地址栏URL lanrikey history
后退时关闭当前页面 <script type="text/javascript"> jQuery(document).ready(function ($) { if (window.history && window.history.pushState) {
应用程序的通信成本 netkiller.github.com 虚拟机应用服务器陈景峰 netkiller neo
应用程序的通信成本什么是通信一个程序中两个以上功能相互传递信号或数据叫做通信。什么是成本这是是指时间成本与空间成本。时间就是传递数据所花费的时间。空间是指传递过程耗费容量大小。都有哪些通信方式全局变量线程间通信共享内存共享文件管道 Socket 硬件（串口，USB）等等全局变量全局变量是成本最低通信方法，通过设置
一维数组与二维数组的声明与定义恋洁e生二维数组一维数组定义声明初始化
/** * */ package test20111005; /** * @author FlyingFire * @date:2011-11-18 上午04:33:36 * @author ：代码整理 * @introduce :一维数组与二维数组的初始化 *summary： */ public c
Spring Mybatis独立事务配置 toknowme mybatis
在项目中有很多地方会使用到独立事务，下面以获取主键为例（1）修改配置文件spring-mybatis.xml  <tx:annotation-driven transaction-manager="transactionManager" /> &n
更新Anadroid SDK Tooks之后，Eclipse提示No update were found xp9802 eclipse
使用Android SDK Manager 更新了Anadroid SDK Tooks 之后，打开eclipse提示 This Android SDK requires Android Developer Toolkit version 23.0.0 or above, 点击Check for Updates 检测一会后提示 No update were found

AIGC周报｜周鸿祎：GPT-6到GPT-8或将产生意识，成为新物种；OpenAI：我们将重建信任；“让他看起来像梵高”...

你可能感兴趣的:(AIGC,人工智能,计算机视觉,深度学习,机器学习)