数据猿

【金猿案例展】智谱AI——基于全闪分布式并行文件存储打造高速大模型训练平台...

‍

焱融科技案例

本项目案例由焱融科技投递并参与“数据猿年度金猿策划活动——2023大数据产业年度创新服务企业榜单/奖项”评选。

大数据产业创新服务媒体

——聚焦数据 · 改变商业

自 ChatGPT 爆火以来，中国的 AI 产业已经进入名副其实的“百模大战”。《中国人工智能大模型地图研究报告》显示，截至 2023 年 5 月底，国内 10 亿级参数规模以上基础大模型至少已经发布 79 个，大模型所需数据丰富，而海量数据需要强悍的储存性能。

目前焱融科技全闪分布式文件存储一体机已经与多家大模型厂商达成合作，其中，与北京智谱华章科技有限公司（简称“智谱AI”）的合作极具代表性。智谱AI成立于2019年，于2022年推出千亿参数大模型，并在2023年累计完成25亿融资，是国内大模型市场的第一梯队厂商。

大模型计算量庞大，计算复杂度高，参与计算的数据规模巨大，大模型越成熟所需数据越丰富，而海量数据需要更强悍的存储性能。因此在大模型的推动下，数据存储已成为AI大模型的关键基础设施，贯穿大模型全流程。焱融高性能分布式文件存储构建智谱数据底座，与 NVIDIA 一起组成大模型算力存储方案，提升智谱业务迭代速度和模型精度。

YRCloudFile 在大模型应用场景具有独到的产品能力，焱融的数据全生命周期管理理念将更加有助于海量规模化的大模型应用。双方此次合作在 AI 大模型数据全生命周期管理等技术方向上联合创新，焱融全闪存储方案具备海量数据支持、超高性能及可靠性等特性，满足智谱 AI 的业务性能需求，助推模型精度提升，为 AIGC 产业提供了可借鉴的成功经验。

实施时间：

项目开始时间：2023年11月29日

中间重要时间节点：2023年11月30日

项目完结时间：2023年12月21日

应用场景

此次构建高速大模型训练平台，采用了焱融全闪一体机F8000X搭建的分布式并行文件存储集群，满足千亿参数模型训练推理中高并发、高性能和低延时性能需求，结合NVIDIA计算和Infiniband网络，共同构建智谱AI高性能算力基础平台，帮助算法逻辑快速迭代，形成竞争优势。

焱融全闪一体机F8000X采用全NVMe SSD硬件架构，通过YRCloudFile软件系统将硬件性能极致发挥，并结合Infiniband 200Gb网络，将存储能力提供给NVIDIA GPU集群，形成存储、网络、计算的全链路高性能配比。与传统数据核心建设不同，该方案在硬件选型和软件系统选型上均采用了高性能架构，客户可以获得存储、网络和计算三种核心资源的最佳配置，消除了IT基础资源的限制，确保资源投资得到最大的回报，避免了浪费，可作为智算中心建设成功样板。

在 AI 全业务流程内，数据需要经历预处理、训练、推理等过程，焱融全闪一体机F8000X根据智谱AI大模型训练的不同业务阶段特点，调用不同的存储服务能力，满足各个阶段业务对数据服务能力的要求，摒弃了传统分立建设，避免数据孤岛问题。

在业务全过程中，数据始终处于 YRCloudFile 全生命周期管理中，相比传统存储的竖井架构，数据流转成本大大降低，同步提升了计算GPU 的利用率，将业务等待时间剔除，提升效率，业务连续性也得到保障。

多模态 AI 数据来源维度众多，YRCloudFile 采用分布式并行架构及元数据路径分离技术，让百亿级混合文件（大文件和小文件并存场景）数据读写和元数据查询性能稳定，并且可线性扩展，满足智谱AI 业务性能需求，快速提升迭代能力。

YRCloudFile具备强大升级能力，当前配置可随业务在线快速升级，无论IO能力或是网络适配能力，在客户数据规模持续增长的过程中可灵活调整性能配置，将建设成本优化，降低TCO。

面临挑战

在智谱AI 业务发展的需求中，当构建百亿级别的模型时，算力、网络、存储这三要素共同决定了模型最终的成熟度和产品先进性。现阶段，算力的发展已经从单纯依靠GPU数量的堆积转向了全面提升存储和网络性能，以满足不断增长的计算需求和人工智能等先进应用的需求。

存储的选择需要贴合业务要求，此次存储建设目标不但需要满足业务层百亿文件存储，还需要满足模型全流程生产要求。即从数据分类、模型训练、仿真等环节考虑，存储必须满足不同类别文件的高性能响应。智谱AI 在选型存储时最为关注以下几点：

需求一：百亿级别数据读写性能与元数据操作性能，在业务中，频繁操作数据，形成规模效应，存储性能需要保证稳定性；

需求二：业务数据包含大量的文本文件、视频文件、音频文件等多维度数据，存储作为数据的载体需要非常高的 IOPS 能力，例如，普通机械硬盘性能不超过 200 IOPS，如果要支持百亿级数据业务模型，那么需要大量的磁盘用于存储，容量和性能不匹配，显然这样的硬件选型是不合理的。目前业界主流高性能硬件已经普及全闪的 NVMe SSD，单盘 IOPS 即可达到数万。

需求三：在模型运算中，不仅仅存储需要高 IOPS，还要同时兼容高性能网络，将存储能力通过网络供给到计算层，完成数据的高速流转。

基于以上三点业务需求分析，智谱AI选择了全闪存储架构。

数据支持

在 AI 全业务流程内，数据需要经历的预处理、训练、仿真等过，焱融科技全闪文件存储 F8000X 根据不同业务阶段的特点，调用不同的存储服务能力，满足各个阶段业务对数据服务能力的要求。且业务全过程中，数据始终处于 YRCloudFile 的全生命周期管理中，相比传统存储的分离架构，数据流转成本大大降低，业务连续性得到保障。

在服务泛AI客户过程中，对大多数进行AI模型训练的客户而言，数据具有阶段性热点访问的特点，超过一定时间后，80% 以上的数据逐步趋冷。因此，如何实现统一的数据管理，根据数据访问热度，对冷、热数据进行全局调度，达到数据存储和管理的最佳效率，是降低数据存储成本的关键。焱融科技存储系统提供智能分层功能，客户可根据策略定义冷热数据层，冷数据自动流动至本地或公有云对象存储中，向上仍然为业务提供标准的文件访问接口，数据在冷热数据层之间流动对业务完全透明。在保证热层数据高性能的同时，降低了数据存储成本，提升了数据可靠性。

应用技术与实施过程

本次项目建设采用了焱融全闪一体机F8000X搭建的分布式并行文件存储集群，满足千亿参数模型训练推理中高并发、高性能和低延时性能需求，结合NVIDIA计算和Infiniband网络，共同构建智谱AI高性能算力基础平台，帮助算法逻辑快速迭代，形成竞争优势。焱融科技凭借丰富的产品实施经验及极简化的安装部署过程，使得项目在入场第二天即可完成部署实施工作。下面将详细描述本次项目实施过程中的关键步骤和特点。

1、项目准备阶段：

在项目启动前，首先进行了详细的项目准备工作。这包括对硬件设备、网络环境、NVIDIA GPU集群等进行全面的评估和规划。确保硬件和软件的兼容性，以及项目所需的资源得到充分准备。

2、硬件设备选型：

焱融全闪一体机F8000X采用全NVMe SSD硬件架构，通过YRCloudFile软件系统将硬件性能极致发挥，并结合Infiniband 200Gb网络，将存储能力提供给NVIDIA GPU集群，形成存储、网络、计算的全链路高性能配比。与传统数据核心建设不同，该方案在硬件选型和软件系统选型上均采用了高性能架构，因此得到了客户的高度认可，可作为智算中心建设成功样板。

YRCloudFile采用scale-out架构，所有存储节点同步提供存储服务，具备先天性能优势。通过数据切片形式存储数据，解决了IO高并发需求；结合副本和EC算法，解决了数据可靠性问题；在强一致算法的支持下，数据完整性得到了充分保障。基于业务多种阶段和状态的要求，YRCloudFile通过配额功能以及目录级QoS功能，将存储资源按需分配到不同业务区间，有效保障了各项业务的顺利开展。

在存储原子能力方面，YRCloudFile在数据IO操作上提供多种详细策略的支持：数据的增、删、改、查及元数据的增删改查；针对IOPS和带宽的控制能力；基于元数据操作的IOPS的管理能力。支持多种模式设定，充分满足当前业务及后续业务发展需要。

YRCloudFile存储小文件和大文件混合的能力强，结合智谱AI大模型业务：在小文件训练场景下，提供千万级IOPS存储能力；在大文件带宽性能要求高的场景下，可以充分利用200Gb Infiniband网络的能力，实现高效的数据传输。这些关键能力主要归功于YRCloudFile系统在内部进行了小文件和大文件的逻辑优化，使得YRCloudFile能够适应两种极端场景的性能需求。这也是本方案选择采用YRCloudFile的核心因素。

YRCloudFile提供基于CSI的容器持久化存储能力、NFS/SMB及大数据访问能力，满足智谱AI训练/推理外的业务存储需要，存储作为AI大模型的数据基石，承担起了AI生命“起源”的角色。

大模型场景下全闪存储F8000X解决方案

综上所述，本方案焱融全闪一体机F8000X具备如下特点如下：

● 基于scale-out架构的全闪并行分布式文件存储，具备横向扩展能力，自动负载均衡，满足日渐增长的容量及性能需求；

● 提供POSIX私有协议、CSI、大数据、NFS/SMB多种访问接口，满足多种业务存储需要；

● 与Infiniband网络协议充分适配，彻底解决传统网络“卡脖子”问题；

● 小文件和大文件混合的能力强，满足智谱AI的核心业务场景需求；

● 能够在单业务存储数据量超百亿规模场景下，平稳运行，性能不衰减；

● 适配NVIDIA GPUDirect Storage（GDS）技术，具备对NVIDIA GPU集群对接的技术优势。

YRCloudFile作为全闪分布式并行文件系统，在适配Infiniband高速网络协议方面具有业界领先的技术实力。本方案中，适配200Gb Infiniband作为当时最先进的业务实践，已成为了业界的榜样。并且，YRCloudFile具备聚合Infiniband多通道的能力，能够响应更大的存储网络需求。

YRCloudFile能够将硬件层NVMe SSD能力充分发挥，满足当前AI大模型业务发展种对数据IO的性能和原子操作能力要求，在多模态和大模型类型的业务中，推动核心算法加速迭代，助力智谱AI客户业务快速发展。YRCloudFile是国内首个支持NVIDIA GPUDirect Storage（GDS）技术的存储软件，具备与NVIDIA GPU集群对接的技术优势，这一特点使其在智算中心建设中展现出领先地位。

YRCloudFile支持千亿级模型的训练推理，同时向模型训练其他阶段数据提供可靠、稳定的数据存储服务，保障业务数据全生命周期管理与服务。结合其自身具备的数据加载和智能分层功能，可轻松实现异构云数据架构，无需借助其他技术或设备，将数据管理从平面转向立体式多维度的管理模式，提升整体业务效率。

结合项目经验，焱融科技在海量数据管理能力上具备成熟项目经验，产品适配能力。

3、网络规划：

YRCloudFile采用高并发的POSIX私有协议作为主体服务，相较于传统的NFS/SMB网关架构，其计算并发访问存储规模提高了数十倍，能够支持前端数百台GPU计算服务器并发访问。并且，由于POSIX私有客户端任具备预读和逻辑简单的特点，结合YRCloudFile与Infiniband协议充分的技术对接，能够有效满足大模型训练中对高IOPS和低延时的需求。在这一步骤中，进行了网络拓扑设计，确保Infiniband 200Gb网络能够提供足够的带宽和低延时，充分满足NVIDIA GPU集群与存储之间的高效数据传输需求。

4、YRCloudFile软件安装与配置：

YRCloudFile的安装过程被设计得相当简单，凭借其极简化的部署流程，实现了项目入场第二条即可完成部署。具体步骤如下：

● 安装操作系统：在每个存储节点上安装操作系统，确保系统与YRCloudFile的兼容性。

●安装YRCloudFile软件：通过提供的安装包，轻松部署YRCloudFile软件。安装过程中，用户只需按照提示进行简单的配置，包括节点角色、存储路径等。

● 网络配置：进行Infiniband网络的配置，确保存储节点之间的高速通信。

● 集群配置：将各个存储节点加入集群，形成一个分布式的文件存储集群。

● 高级配置和优化：

YRCloudFile提供了一系列高级配置选项，以满足不同业务需求。在这一步骤中，根据实际情况进行配置优化，包括配额管理、QoS功能的设置，以及数据加载和智能分层功能的调整，以确保存储资源按需分配，满足各项业务的性能和容量需求。

● 集成NVIDIA GPUDirect Storage技术：

YRCloudFile作为国内首个支持NVIDIA GPUDirect Storage（GDS）技术的存储软件，集成过程相对简单。通过与NVIDIA GPU集群的对接，充分发挥GPU与存储之间的直接数据传输技术优势，提高数据传输效率。

● 测试与验证：

在完成安装和配置后，进行系统的测试与验证是至关重要的一步。通过模拟高并发、大规模模型训练推理等场景，确保整个系统在生产环境中能够稳定运行。包括性能测试、容错测试、数据一致性测试等多个方面的验证。

● 培训与文档：

为了确保项目的可维护性和持续运营，进行相关团队的培训是不可或缺的。此外，提供详细的文档，包括安装手册、配置指南、故障排除等，以供用户在日常维护和操作中参考。

● 上线与运维：

完成测试验证后，项目正式上线。在正式上线后，建立定期的运维流程，监控系统的性能、容量，进行必要的维护和优化，确保系统在长时间内稳定运行。

● 项目总结与优化：

在项目实施完毕后，进行全面的总结和优化。收集用户反馈，识别可能的改进点，不断优化系统性能和稳定性，保证系统能够持续适应业务的发展。

通过上述步骤，YRCloudFile在项目实施中展现了其丰富的产品实施经验和高效的部署流程。简化的安装过程、高度集成的硬件和软件配置，使得项目能够在较短时间内完成部署，为智谱AI高性能算力基础平台的搭建提供了坚实的基础。

商业变化

在实施整体解决方案后，客户可以获得存储、网络和计算三种核心资源的最佳配置，消除了IT基础资源的限制，确保资源投资得到最大的回报，避免了浪费。焱融全闪一体机F8000X根据智谱AI大模型训练的不同业务阶段特点，调用不同的存储服务能力，满足各个阶段业务对数据服务能力的要求，摒弃了传统分立建设，避免数据孤岛问题。

在业务全过程中，数据始终处于 YRCloudFile 全生命周期管理中，相比传统存储的分离架构，数据流转成本大大降低，同步提升了计算GPU 的利用率，将业务等待时间剔除，提升效率，业务连续性也得到保障。YRCloudFile具备强大升级能力，当前配置可随业务在线快速升级，无论IO能力或是网络适配能力，在客户数据规模持续增长的过程中可灵活调整性能配置，将建设成本优化，降低TCO。

相关企业介绍

·焱融科技

焱融科技是一家专注于软件定义存储技术及数据服务的高新技术企业，采用分布式存储架构为企业级用户及应用提供高效的数据存储和管理服务，致力于打造 AIGC 时代的高性能存储系统。

YRCloudFile是焱融科技自主创新研发的分布式文件存储系统，支持容量和性能的弹性水平扩展，具备高性能、高可用、高可靠、云上部署等产品特性。目前，焱融科技分布式文件存储在 AI、智能汽车行业市场占有率排名领先。凭借在 AI 领域的先发优势，快速形成行业突破，落地百余家智慧高校、人工智能、自动驾驶、互联网、智能制造、能源、国家实验室等行业标杆客户。

·智谱AI

智谱AI致力于打造新一代认知智能大模型，专注于做大模型的中国创新。公司合作研发了双语千亿级超大规模预训练模型GLM-130B，推出了千亿基座的对话模型ChatGLM及开源单卡版模型ChatGLM-6B，并打造大模型产品矩阵，包括生成式AI助手智谱清言、高效率代码模型CodeGeeX、高精度文图生成模型CogView、多模态对话语言模型VisualGLM-6B等。公司践行Model as a Service（MaaS）的市场理念，推出大模型MaaS开放平台，基于领先的千亿级多语言、多模态预训练模型，实现高效率、通用化的“模型即服务”AI开发新范式。

微软：全球每天网络攻击超6亿次 FreeBuf- 资讯 microsoft
《2024年微软数字防御报告》揭示了一个复杂的全球网络安全格局，每天发生超过6亿次网络攻击。报告强调了勒索软件、网络钓鱼和身份泄露事件的增加，以及网络犯罪团伙和国家行为者之间的合作。它强调了人工智能在攻击和防御中的重要作用，敦促组织采取主动的、多层次的策略来应对这些不断演变的威胁。核心观点每天有6亿次网络攻击针对微软客户。勒索软件攻击比去年增加了2.75倍。技术诈骗激增400%，每天发生超过10万
AI如何帮助电商企业进行数据分析 AI大模型应用之禅计算机软件编程原理与应用实践 java python javascript kotlin golang 架构人工智能
电商数据分析，人工智能，机器学习，深度学习，推荐系统，预测模型，客户画像1.背景介绍在当今数字化时代，电商行业蓬勃发展，数据成为企业最重要的资产。电商企业每天都会产生海量的数据，包括用户行为、商品信息、交易记录等。如何有效地分析这些数据，挖掘其中的价值，对于电商企业的运营、营销和发展至关重要。传统的数据分析方法往往难以应对海量数据的处理和复杂分析需求，而人工智能（AI）技术的出现为电商数据分析带来
中间件以及主流中间件产品:IBM MQSeries和BEA Tuxedo介绍 CoderIsArt 架构设计研究中间件
中间件简介中间件（Middleware）是一类位于操作系统和应用程序之间的软件层，负责提供通用服务，简化分布式系统开发和集成。中间件的目标是屏蔽底层操作系统和网络的复杂性，为应用程序提供统一的接口和支持。中间件的功能消息传递：提供可靠的消息队列服务，支持异步通信。事务管理：支持分布式事务管理，保证数据一致性。服务集成：连接不同的应用程序和系统，促进跨平台和多语言环境下的协作。负载均衡和高可用性：确
当下是否入行AI ? 一场关于未来的赌注与机遇 dami_king 随笔人工智能
当下是否入行AI：一场关于未来的赌注与机遇在科技的浪潮中，人工智能（AI）无疑是最为汹涌的一波。它不仅改变了我们与机器互动的方式，还重塑了各行各业的面貌。面对这样的变革，许多人站在十字路口犹豫不决——现在进入AI领域还来得及吗？这个问题的答案，并非简单的“是”或“否”。今天，让我们一起深入探讨这个话题，看看对于想要投身AI的人来说，当下是不是一个好的时机。AI行业的现状与发展2024年，AI已经从
RabbitMQ，RocketMQ，Kafka 事务性，消息丢失，消息顺序性和消息重复发送的处理策略 90后小伙追梦之路面试 java 架构 kafka rabbitmq 分布式 redis 数据库
消息队列常见问题处理分布式事务什么是分布式事务我们的服务器从单机发展到拥有多台机器的分布式系统，各个系统之前需要借助于网络进行通信，原有单机中相对可靠的方法调用以及进程间通信方式已经没有办法使用，同时网络环境也是不稳定的，造成了我们多个机器之间的数据同步问题，这就是典型的分布式事务问题。在分布式事务中事务的参与者、支持事务的服务器、资源服务器以及事务管理器分别位于不同的分布式系统的不同节点之上。分
大数据新视界 -- 大数据大厂之 Impala 性能优化：融合人工智能预测的资源预分配秘籍（上）（29 / 30）青云交大数据新视界 #Impala 之道大数据 Impala 人工智能预测资源预分配数据收集模型构建查询性能优化
亲爱的朋友们，热烈欢迎你们来到青云交的博客！能与你们在此邂逅，我满心欢喜，深感无比荣幸。在这个瞬息万变的时代，我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而我的博客，正是这样一个温暖美好的所在。在这里，你们不仅能够收获既富有趣味又极为实用的内容知识，还可以毫无拘束地畅所欲言，尽情分享自己独特的见解。我真诚地期待着你们的到来，愿我们能在这片小小的天地里共同成长，共同进步。本博客的精华专栏：大数
AI代码生成器赋能软件原型快速构建：吴恩达的最佳实践指南前端
快速构建软件原型对于验证想法、迭代产品至关重要。而随着人工智能技术的飞速发展，AI代码生成器等AI辅助编程工具的出现，为开发者提供了前所未有的效率提升。本文将结合吴恩达教授的观点，探讨如何利用AI工具，高效构建软件原型。吴恩达教授强调选择合适的技术栈并有效利用AI工具是关键，这将帮助开发者在短时间内完成原型开发，快速验证其想法。选择并精通“有主见”的技术栈：效率为王吴恩达教授推荐的技术栈——Pyt
从RNN到Transformer：生成式AI技术演变与未来展望非著名架构师人工智能 rnn transformer
生成式人工智能（GenerativeAI）近年来取得了令人瞩目的进展，其背后的核心技术是自回归模型的不断演进。从传统的递归神经网络（RNN）到革命性的Transformer架构，本文将全面剖析这一技术发展历程。一、RNN：生成式模型的起点1.RNN的基本原理递归神经网络（RecurrentNeuralNetwork,RNN）是一种专为处理序列数据设计的神经网络架构。其核心思想是通过循环连接的隐藏状
开源多模态推理模型QVQ：视觉推理能力的突破与未来展望前端
近年来，AI代码生成器等人工智能技术飞速发展，多模态推理模型作为其中一个重要分支，正展现出越来越强大的能力。它能够理解和处理多种类型的数据，例如图像、文本、音频等，并进行复杂的推理和决策。阿里云通义千问团队近日发布的QVQ-72B-Preview模型，就是一个极具代表性的例子。该模型开源且在视觉推理方面表现突出，为多模态模型的发展树立了新的里程碑。QVQ模型的核心能力与突破QVQ-72B-Prev
Python网络爬虫入门教程：从抓取数据到应用实现冷夜雨. python
引言在大数据时代，信息就是力量。各种网站每天产生着海量的数据，这些数据中蕴藏着巨大的商业价值和研究价值。如何快速、自动化地从互联网上获取这些信息，成为了数据科学、人工智能、市场分析等领域中的一个重要课题。Python，作为一门易于学习且功能强大的编程语言，其丰富的库和工具使得构建网络爬虫变得非常简单。网络爬虫（WebScraper）是一种自动化程序，用来从网页中提取信息。无论是用于数据分析、竞争对
编程语言大揭秘：各显神通的编程世界冷夜雨. python java c++c#javascript
在当今数字化的时代，编程语言犹如一把把神奇的钥匙，打开了通往不同技术领域的大门。从网页开发到人工智能，从数据分析到游戏制作，每一种编程语言都有其独特的优势与适用场景。今天，就让我们一同深入探索几种主流编程语言的奥秘，看看在什么情况下它们能发挥最大的威力。Python：万能胶水，快速开发的利器Python以其简洁、易读的语法著称，仿佛是用自然语言编写代码一般，新手程序员也能快速上手。它拥有庞大且丰富
XXL-JOB v2.5.0 | 分布式任务调度平台
ReleaseNotes1、【优化】框架基础守护线程异常处理逻辑优化，避免极端情况下因Error导致调度终止问题；2、【优化】底层通讯超时时间支持自定义，默认3秒，缓解网络抖动导致任务通讯超时问题；可参考xxl-job-admin和samples示例代码自行配置；3、【修复】调度中心快慢线程池优化拒绝策略，避免因默认AbortPolicy导致调度结果丢失问题；4、【优化】调度中心快慢线程池队列长度
跨Android、iOS、鸿蒙多平台框架ArkUI-X 鸿蒙系统小能手Mr.Li HarmonyOS open Harmony ios harmonyos android 华为
ArkUI是一套构建分布式应用界面的声明式UI开发框架。它使用极简的UI信息语法、丰富的UI组件、以及实时界面预览工具，帮助您提升移动应用界面开发效率30%。您只需使用一套ArkTSAPI，就能在Android、iOS、鸿蒙多个平台上提供生动而流畅的用户界面体验。一、配套关系表1版本软件和平台配套关系目标平台项目编译使用OSSDK版本备注OpenHarmony4.0(APIVersion10)Be
MongoDB 学习指南与资料分享来恩1003 MongoDB mongodb 数据库
MongoDB学习资料MongoDB学习资料MongoDB学习资料在数据爆炸的当下，MongoDB作为非关系型数据库的佼佼者，以其独特优势在各领域发光发热。无论是海量数据的存储，还是复杂数据结构的处理，MongoDB都能轻松应对。接下来，让我们一同深入探索MongoDB的学习路径，并分享一些实用的学习资料。学习指南入门基础核心概念掌握MongoDB基于分布式文件存储，采用文档型数据模型。它将数据以
《C++ 赋能强化学习：Q - learning 算法的实现之路》 c++人工智能深度学习
在当今科技飞速发展的时代，人工智能无疑是最热门的领域之一，而强化学习作为其中的重要分支，正逐渐改变着我们解决复杂问题的方式。Q-learning算法作为强化学习中的经典算法，在众多领域如游戏、机器人控制、资源管理等有着广泛的应用前景。本文将深入探讨如何用C++实现强化学习中的Q-learning算法，带您领略C++在人工智能领域的强大魅力。一、强化学习与Q-learning算法概述强化学习是一种通
《C 语言向量运算：点亮人工智能几何计算之路》 c人工智能深度学习
在人工智能蓬勃发展的时代，数学运算作为其坚实的基石发挥着不可替代的作用。而向量的点积与叉积运算，更是在人工智能的几何计算领域有着独特且关键的地位。今天，就让我们一同深入探讨如何在C语言中实现向量的点积、叉积运算，并领略其在人工智能几何计算中的精彩应用。向量，作为既有大小又有方向的量，在几何世界里是极为重要的元素。点积，也被称为数量积，它的几何意义与向量的投影密切相关。当我们计算两个向量的点积时，其
10分钟快速扫盲：以太坊与Layer2
在介绍以太坊前，我们先来了解一些区块链技术的基础知识。什么是区块链？区块链是一种分布式账本技术，它通过去中心化的方式，将交易记录以区块的形式链接在一起，并通过共识算法确保数据的安全和一致性。区块链的最著名应用就是比特币。区块链的核心特点是去中心化和安全性。去中心化：没有中心机构控制整个系统，而是由网络中的节点共同维护和验证数据。安全性：通过共识算法和加密技术来保证，使得数据不可篡改和抵御恶意攻击。
微软TTS(text-to-speech)文字转语音免费开源库edge-tts语音合成实践(Python3.10)
不能否认，微软Azure在TTS(text-to-speech文字转语音)这个人工智能细分领域的影响力是统治级的，一如ChatGPT在NLP领域的随心所欲，予取予求。君不见几乎所有的抖音营销号口播均采用微软的语音合成技术，其影响力由此可见一斑，仅有的白璧微瑕之处就是价格略高，虽然国内也可以使用科大讯飞语音合成进行平替，但我们只想要最好的那一个，本次我们使用免费的开源库edge-tts来实现文本转语
AI Prompt 设计指南：从基础构建到高质量生成的全面解析网罗开发 AI 大模型人工智能 OpenAI 深度学习
网罗开发（小红书、快手、视频号同名）大家好，我是展菲，目前在上市企业从事人工智能项目研发管理工作，平时热衷于分享各种编程领域的软硬技能知识以及前沿技术，包括iOS、前端、HarmonyOS、Java、Python等方向。在移动端开发、鸿蒙开发、物联网、嵌入式、云原生、开源等领域有深厚造诣。图书作者：《ESP32-C3物联网工程开发实战》图书作者：《SwiftUI入门，进阶与实战》超级个体：CO
JAVA：Spring Boot 集成 JWT 实现身份验证的技术指南拾荒的小海螺 JAVA java spring boot 开发语言
1、简述在现代Web开发中，安全性尤为重要。为了确保用户的身份，JSONWebToken（JWT）作为一种轻量级且无状态的身份验证方案，广泛应用于微服务和分布式系统中。本篇博客将讲解如何在SpringBoot中集成JWT实现身份验证，并列出具体代码示例和常见应用场景。2、什么是JWT？JWT是一种开放标准（RFC7519），定义了一种紧凑且自包含的方式，用于在各方之间安全地传输信息作为JSON对象
未来展望：等保测评在网络安全领域的持续创新与发展亿林数据 web安全安全等保测评网络安全
在数字化浪潮席卷全球的今天，网络安全已成为维护国家安全、社会稳定和经济发展的关键基石。作为网络安全保障体系的核心组成部分，等级保护测评（简称“等保测评”）在应对日益复杂多变的网络威胁中发挥着不可替代的作用。展望未来，等保测评将在技术、管理、生态等多个维度持续创新与发展，为构建更加安全可信的网络环境提供有力支撑。一、技术创新引领等保测评智能化升级随着人工智能（AI）、大数据、云计算等技术的快速发展，
幕墙工程管理新趋势工程项目管理软件的应用益企联工程项目管理软件项目管理软件工程
随着建筑行业的快速发展，幕墙工程作为现代建筑的重要组成部分，其管理方式也正经历着深刻的变革。幕墙工程管理新趋势主要体现在数字化转型、人工智能（AI）和自动化、远程工作的持续增长等方面。而工程项目管理软件的应用则在提高项目管理效率、优化资源配置、增强团队协作等方面发挥着重要作用。以下是对幕墙工程管理新趋势的分析：1.数字化转型：数字化转型已成为幕墙工程管理的重要趋势之一。企业越来越依赖于数字工具来协
PHP 与 AI 的强力组合，PHP 如何积极拥抱 AI 的 Ai 编码 Ai编码工具 idea插件 php教程 php 人工智能开发语言
PHP与AI的结合正在成为开发者探索的一个新领域。虽然PHP传统上并不是人工智能和机器学习应用的首选语言，但通过现代工具和技术的结合，PHP已经能够积极拥抱AI，推动创新和应用开发。点击：phpstorm里的JetBrainsAI有哪些好用的功能以下是几种方法和实践，通过它们PHP可以与AI强力结合。1.集成现有的AI服务和API对于很多开发者来说，最简单的方法是通过集成现有的AI服务和API。
《AI赋能光追：开启图形渲染新时代》人工智能深度学习
光线追踪技术是图形渲染领域的重大突破，能够通过模拟光的传播路径，精准渲染反射、折射、阴影和间接光照等效果，实现高度逼真的场景呈现。而人工智能的加入，更是为光线追踪技术带来了前所未有的变革，主要体现在以下几个方面：降噪传统光线追踪为减少计算量，向场景发射少量光线样本，会产生带噪点的斑点图像，需人工设计降噪器通过多帧累积或空间插值来处理，但存在增加开发成本、降低帧率等问题。AI驱动的降噪技术则引入神经
YashanDB完成中国信通院关系型数据库安全能力专项测试数据库sql
崖山数据库YashanDB产品简介崖山数据库系统是深圳计算科学研究院(简称“深算院”)和深圳崖山科技有限公司(简称“崖山科技”)自主研发设计的新型数据库管理系统，提供包括单机主备、共享集群、空间数据库、分布式实时数仓等系列数据库产品及配套开发、迁移、运维等工具体系，覆盖OLTP/HTAP/OLAP交易和分析混合负载场景，全面兼容私有化及云基础设施，为客户提供一站式的企业级融合数据管理解决方案。崖山
《鸿蒙Next微内核：解锁人工智能决策树并行计算的加速密码》人工智能深度学习算法
在当今人工智能飞速发展的时代，提升运算速度是推动其进步的关键。鸿蒙Next以其独特的微内核特性，为设计决策树的并行计算框架提供了新的思路和契机。鸿蒙Next微内核特性概述鸿蒙Next的微内核架构将核心功能模块化，仅保留进程管理、内存管理和通信机制等基础功能在内核中，文件系统、网络协议等都作为独立模块在用户空间运行。这种架构使内核精简、稳定且安全，模块间低耦合也让系统可扩展性和维护性更强，能根据不同
人工智能时代的岗位变革人工智能
随着人工智能技术的飞速发展，它正深刻地改变着就业市场的格局，引发了一系列的岗位变革。一方面，人工智能的兴起使得一些重复性、规律性强的工作岗位面临被替代的风险。例如，在数据录入领域，以往需要大量人工手动输入数据的工作，如今借助人工智能的数据识别和自动化录入技术，能够快速、准确地完成。这导致许多数据录入员岗位需求减少。同样，在一些简单的生产装配环节，智能机器人凭借其高精度和高效率的优势，逐渐取代了部分
AI Agent：当年年都是爆发元年时人工智能算法
随着人工智能技术的不断进步，AIAgent的概念已经成为业界的热点。尽管许多公司推出了所谓的“Agent产品”，但这些产品往往只具备基本的自然语言理解能力，远未达到真正的Agent水平。从海外市场来看，科技巨头们无疑是这场角逐中的主力军。OpenAI、Anthropic、微软、谷歌等企业凭借深厚的技术积累与强大的研发实力，争先展示各自在AIAgent领域的阶段性成果，将其视为彰显企业竞争力的关键要
6. NLP自然语言处理（Natural Language Processing）啊波次得饿佛哥 AI人工智能自然语言处理人工智能
自然语言是指人类日常使用的语言，如中文、英语、法语等。自然语言处理是人工智能（AI）领域中的一个重要分支，它结合了计算机科学、语言学和统计学的方法，通过算法对文本和语音进行分析，使计算机能够理解、解释和生成自然语言。随着深度学习技术的发展，NLP在文本分类、机器翻译、情感分析、对话系统等任务中取得了显著进展，推动了人工智能技术在多个领域的广泛应用。自然语言处理的核心任务涉及如何使计算机理解和处理语
人工智能在医疗领域的应用人工智能
人工智能在医疗领域的应用前景广阔。医疗机器人是其中之一，如智能假肢、外骨骼等可修复受损身体，IBM的达・芬奇手术系统等则能承担手术或医疗保健功能.智能药物研发借助深度学习技术，可快速准确挖掘筛选化合物或生物，缩短新药研发周期、降低成本、提高成功率，在心血管药、抗肿瘤药等研发中已取得突破.智能诊疗让计算机学习专家医疗知识，模拟思维和诊断推理，给出可靠诊断与治疗方案.智能影像识别可对医学影像进行图像识
PHP，安卓，UI，java，linux视频教程合集 cocos2d-x小菜 java UI linux PHP android
╔-----------------------------------╗┆
zookeeper admin 笔记 braveCS zookeeper
Required Software 1) JDK>=1.6 2)推荐使用ensemble的ZooKeeper(至少3台)，并run on separate machines 3)在Yahoo!，zk配置在特定的RHEL boxes里，2个cpu，2G内存，80G硬盘数据和日志目录 1)数据目录里的文件是zk节点的持久化备份，包括快照和事务日
Spring配置多个连接池 easterfly spring
项目中需要同时连接多个数据库的时候，如何才能在需要用到哪个数据库就连接哪个数据库呢？ Spring中有关于dataSource的配置： <bean id="dataSource" class="com.mchange.v2.c3p0.ComboPooledDataSource" &nb
Mysql 171815164 mysql
例如，你想myuser使用mypassword从任何主机连接到mysql服务器的话。 GRANT ALL PRIVILEGES ON *.* TO 'myuser'@'%'IDENTIFIED BY 'mypassword' WI TH GRANT OPTION; 如果你想允许用户myuser从ip为192.168.1.6的主机连接到mysql服务器，并使用mypassword作
CommonDAO（公共/基础DAO） g21121 DAO
好久没有更新博客了，最近一段时间工作比较忙，所以请见谅，无论你是爱看呢还是爱看呢还是爱看呢，总之或许对你有些帮助。 DAO(Data Access Object)是一个数据访问（顾名思义就是与数据库打交道）接口，DAO一般在业
直言有讳永夜-极光感悟随笔
1.转载地址:http://blog.csdn.net/jasonblog/article/details/10813313 精华: “直言有讳”是阿里巴巴提倡的一种观念，而我在此之前并没有很深刻的认识。为什么呢？就好比是读书时候做阅读理解，我喜欢我自己的解读，并不喜欢老师给的意思。在这里也是。我自己坚持的原则是互相尊重，我觉得阿里巴巴很多价值观其实是基本的做人
安装CentOS 7 和Win 7后，Win7 引导丢失随便小屋 centos
一般安装双系统的顺序是先装Win7，然后在安装CentOS，这样CentOS可以引导WIN 7启动。但安装CentOS7后，却找不到Win7 的引导，稍微修改一点东西即可。一、首先具有root 的权限。即进入Terminal后输入命令su，然后输入密码即可二、利用vim编辑器打开/boot/grub2/grub.cfg文件进行修改 v
Oracle备份与恢复案例 aijuans oracle
Oracle备份与恢复案例一. 理解什么是数据库恢复当我们使用一个数据库时，总希望数据库的内容是可靠的、正确的，但由于计算机系统的故障（硬件故障、软件故障、网络故障、进程故障和系统故障）影响数据库系统的操作，影响数据库中数据的正确性，甚至破坏数据库，使数据库中全部或部分数据丢失。因此当发生上述故障后，希望能重构这个完整的数据库，该处理称为数据库恢复。恢复过程大致可以分为复原(Restore)与
JavaEE开源快速开发平台G4Studio v5.0发布無為子
我非常高兴地宣布,今天我们最新的JavaEE开源快速开发平台G4Studio_V5.0版本已经正式发布。访问G4Studio网站 http://www.g4it.org 2013-04-06 发布G4Studio_V5.0版本功能新增 (1). 新增了调用Oracle存储过程返回游标，并将游标映射为Java List集合对象的标
Oracle显示根据高考分数模拟录取百合不是茶 PL/SQL编程 oracle例子模拟高考录取学习交流
题目要求: 1,创建student表和result表 2,pl/sql对学生的成绩数据进行处理 3,处理的逻辑是根据每门专业课的最低分线和总分的最低分数线自动的将录取和落选 1,创建student表,和result表学生信息表; create table student( student_id number primary key,--学生id
优秀的领导与差劲的领导 bijian1013 领导管理团队
责任优秀的领导：优秀的领导总是对他所负责的项目担负起责任。如果项目不幸失败了，那么他知道该受责备的人是他自己，并且敢于承认错误。差劲的领导：差劲的领导觉得这不是他的问题，因此他会想方设法证明是他的团队不行，或是将责任归咎于团队中他不喜欢的那几个成员身上。努力工作优秀的领导：团队领导应该是团队成员的榜样。至少，他应该与团队中的其他成员一样努力工作。这仅仅因为他
js函数在浏览器下的兼容 Bill_chen jquery 浏览器 IE DWR ext
做前端开发的工程师，少不了要用FF进行测试，纯js函数在不同浏览器下，名称也可能不同。对于IE6和FF，取得下一结点的函数就不尽相同： IE6：node.nextSibling,对于FF是不能识别的； FF：node.nextElementSibling,对于IE是不能识别的；兼容解决方式：var Div = node.nextSibl
【JVM四】老年代垃圾回收：吞吐量垃圾收集器(Throughput GC) bit1129 垃圾回收
吞吐量与用户线程暂停时间衡量垃圾回收算法优劣的指标有两个：吞吐量越高，则算法越好暂停时间越短，则算法越好首先说明吞吐量和暂停时间的含义。垃圾回收时，JVM会启动几个特定的GC线程来完成垃圾回收的任务，这些GC线程与应用的用户线程产生竞争关系，共同竞争处理器资源以及CPU的执行时间。GC线程不会对用户带来的任何价值，因此，好的GC应该占
J2EE监听器和过滤器基础白糖_ J2EE
Servlet程序由Servlet，Filter和Listener组成，其中监听器用来监听Servlet容器上下文。监听器通常分三类：基于Servlet上下文的ServletContex监听，基于会话的HttpSession监听和基于请求的ServletRequest监听。 ServletContex监听器 ServletContex又叫application
博弈AngularJS讲义(16) - 提供者 boyitech js AngularJS api Angular Provider
Angular框架提供了强大的依赖注入机制，这一切都是有注入器(injector)完成. 注入器会自动实例化服务组件和符合Angular API规则的特殊对象，例如控制器，指令，过滤器动画等。那注入器怎么知道如何去创建这些特殊的对象呢？ Angular提供了5种方式让注入器创建对象，其中最基础的方式就是提供者(provider), 其余四种方式(Value, Fac
java-写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 bylijinnan java
public class CommonSubSequence { /** * 题目：写一函数f(a,b)，它带有两个字符串参数并返回一串字符，该字符串只包含在两个串中都有的并按照在a中的顺序。 * 写一个版本算法复杂度O(N^2)和一个O(N) 。 * * O(N^2)：对于a中的每个字符，遍历b中的每个字符，如果相同，则拷贝到新字符串中。 * O(
sqlserver 2000 无法验证产品密钥 Chen.H sql windows SQL Server Microsoft
在 Service Pack 4 (SP 4), 是运行 Microsoft Windows Server 2003、 Microsoft Windows Storage Server 2003 或 Microsoft Windows 2000 服务器上您尝试安装 Microsoft SQL Server 2000 通过卷许可协议 (VLA) 媒体。这样做, 收到以下错误信息CD KEY的 SQ
[新概念武器]气象战争 comsci
气象战争的发动者必须是拥有发射深空航天器能力的国家或者组织.... 原因如下: 地球上的气候变化和大气层中的云层涡旋场有密切的关系,而维持一个在大气层某个层次
oracle 中 rollup、cube、grouping 使用详解 daizj oracle grouping rollup cube
oracle 中 rollup、cube、grouping 使用详解 -- 使用oracle 样例表演示转自namesliu -- 使用oracle 的样列库，演示 rollup, cube, grouping 的用法与使用场景 --- ROLLUP ，为了理解分组的成员数量，我增加了分组的计数 COUNT(SAL)
技术资料汇总分享 Dead_knight 技术资料汇总分享
本人汇总的技术资料，分享出来，希望对大家有用。 http://pan.baidu.com/s/1jGr56uE 资料主要包含： Workflow->工作流相关理论、框架(OSWorkflow、JBPM、Activiti、fireflow...) Security->java安全相关资料(SSL、SSO、SpringSecurity、Shiro、JAAS...) Ser
初一下学期难记忆单词背诵第一课 dcj3sjt126com english word
could 能够 minute 分钟 Tuesday 星期二 February 二月 eighteenth 第十八 listen 听 careful 小心的，仔细的 short 短的 heavy 重的 empty 空的 certainly 当然 carry 携带；搬运 tape 磁带 basket 蓝子 bottle 瓶 juice 汁，果汁 head 头；头部
截取视图的图片, 然后分享出去 dcj3sjt126com OS Objective-C
OS 7 has a new method that allows you to draw a view hierarchy into the current graphics context. This can be used to get an UIImage very fast. I implemented a category method on UIView to get the vi
MySql重置密码 fanxiaolong MySql重置密码
方法一: 在my.ini的[mysqld]字段加入： skip-grant-tables 重启mysql服务，这时的mysql不需要密码即可登录数据库然后进入mysql mysql>use mysql; mysql>更新 user set password=password('新密码') WHERE User='root'; mysq
Ehcache（03）——Ehcache中储存缓存的方式 234390216 ehcache MemoryStore DiskStore 存储驱除策略
Ehcache中储存缓存的方式目录 1 堆内存（MemoryStore） 1.1 指定可用内存 1.2 驱除策略 1.3 元素过期 2 &nbs
spring mvc中的@propertysource jackyrong spring mvc
在spring mvc中，在配置文件中的东西，可以在java代码中通过注解进行读取了： @PropertySource 在spring 3.1中开始引入比如有配置文件 config.properties mongodb.url=1.2.3.4 mongodb.db=hello 则代码中 @PropertySource(&
重学单例模式 lanqiu17 单例 Singleton 模式
最近在重新学习设计模式，感觉对模式理解更加深刻。觉得有必要记下来。第一个学的就是单例模式，单例模式估计是最好理解的模式了。它的作用就是防止外部创建实例，保证只有一个实例。单例模式的常用实现方式有两种，就人们熟知的饱汉式与饥汉式，具体就不多说了。这里说下其他的实现方式静态内部类方式: package test.pattern.singleton.statics; publ
.NET开源核心运行时，且行且珍惜 netcome java .net 开源
背景 2014年11月12日，ASP.NET之父、微软云计算与企业级产品工程部执行副总裁Scott Guthrie，在Connect全球开发者在线会议上宣布，微软将开源全部.NET核心运行时，并将.NET 扩展为可在 Linux 和 Mac OS 平台上运行。.NET核心运行时将基于MIT开源许可协议发布，其中将包括执行.NET代码所需的一切项目——CLR、JIT编译器、垃圾收集器（GC）和核心
使用oscahe缓存技术减少与数据库的频繁交互 Everyday都不同 Web 高并发 oscahe缓存
此前一直不知道缓存的具体实现，只知道是把数据存储在内存中，以便下次直接从内存中读取。对于缓存的使用也没有概念，觉得缓存技术是一个比较”神秘陌生“的领域。但最近要用到缓存技术，发现还是很有必要一探究竟的。缓存技术使用背景：一般来说，对于web项目，如果我们要什么数据直接jdbc查库好了，但是在遇到高并发的情形下，不可能每一次都是去查数据库，因为这样在高并发的情形下显得不太合理——
Spring+Mybatis 手动控制事务 toknowme mybatis
@Override public boolean testDelete(String jobCode) throws Exception { boolean flag = false; &nbs
菜鸟级的android程序员面试时候需要掌握的知识点 xp9802 android
熟悉Android开发架构和API调用掌握APP适应不同型号手机屏幕开发技巧熟悉Android下的数据存储熟练Android Debug Bridge Tool 熟练Eclipse/ADT及相关工具熟悉Android框架原理及Activity生命周期熟练进行Android UI布局熟练使用SQLite数据库；熟悉Android下网络通信机制，S

【金猿案例展】智谱AI——基于全闪分布式并行文件存储打造高速大模型训练平台...

你可能感兴趣的:(人工智能,分布式)