AI科技大本营

将成为数据库主流的HTAP，它能替代Oracle吗？

11 月 17 日，金山办公登陆科创版，圆了小米集团创始人、金山软件董事长雷军和金山所有员工的“英雄梦”。算下来，从 1999 年以金山办公为业务主体准备上市算起到今天，雷军足足等了 20 年。

WPS 上市之际，除了引起了人们关于办公软件市场和前景的热烈讨论之外，还牵扯出人们对另一个更加深刻的问题——国产化软件及其安全可靠性的思考。受益于国产化趋势，WPS 的 PE 估值升至 35 倍，维持“买入”评级。正如天云数据 CEO 雷涛所说，这背后的深层次原因，核心实际上在于国内要“去 office”的趋势，所以，这个沉寂了多年，几乎被边缘化的办公软件产品才得以抖落尘埃，涅槃重生。

至于这款国产办公软件的水平，在虎扑论坛上大多数网友表示比较满意，有人认为与微软 office 相比，WPS 具有体积更小，比微软办公软件更安全的优势，甚至发出了“华人之光”的感慨。从中可以看到，只要功能、安全性等有保障，国人似乎非常乐于支持国产化。

“国产化”、”去 IOE”，国产浪潮来袭

在 IT 国产化浪潮下的影响下，“去 IOE”这个概念逐渐流行起来。这一概念最早由阿里巴巴提出，其本意是，在阿里巴巴的 IT 架构中，去掉 IBM 的小型机、Oracle 数据库、EMC 存储设备，代之以自己在开源软件基础上开发的系统。去 IOE 意味着接下来政府必须将数据安全牢牢掌握在国内企业手中，以防止数据丢失造成的一系列严重后果。

具体来说，去 IOE 还有以下两个解释：

第一个是指 IT 架构的更新换代，具体说就是以 IBM 为代表的主机、以 ORACLE 为代表的关系型数据库，以及以 EMC 为代表的高端存储设备，被新型的云计算技术所替换，也就是我们常说的“云化”。其中，主机被X86设备所取代，传统数据库被开源数据库产品替换，而SAN结构的高端存储也受到云化的存储产品和体系的冲击。这三方面中任何一项工作，都可以被冠以“去IOE”的具体表现。

第二个是指针对外国 IT 设备，特别是美国产品的“严打”，减少甚至不再购买 IBM、ORACLE、EMC 等企业的产品。

2008 年阿里提出去 IOE 时不少人觉得是痴人说梦，但经过多年运营，阿里云已经彻底完成了去 IOE 工作，即阿里云的硬件投入彻底抛弃了这三家传统企业，经历几次双十一的挑战之后该技术也趋于成熟。

HTAP概念横空出世

值得注意的是，这“去 IOE”中的“O”，乃是真正实现国内 IT 技术独立的关键所在，即去除对以 Oracle 为代表的关系型数据库的依赖，如 Oracle、SQLServer、Sybase、Informix、Access、DB2、MySQL 等。

由于关系型数据库具有保持数据的一致性（事务处理），以标准协议为前提，数据更新的开销很小，可以进行Join等复杂查询等特点，一直是数据库领域的关键一环。

多年以来，国内企业多使用这些国外数据公司主导的数据库产品，很少有一款产品能够与之抗衡。

直到2005 年，Gartner提出了 HTAP（Hybrid transactional/analytical processing，在线事务处理/在线分析处理数据库）这一概念，并迅速成为引起一些企业的关注，被很多人视为未来数据库领域发展趋势之一。

2014 年，Gartner 对 HTAP 数据库给出了明确的定义，HTAP 数据库需要同时支持 OLTP 和OLAP 场景。基于创新的计算存储框架，在同一份数据上保证事务的同时支持实时分析，省去了费时的 ETL 过程。

与传统 IT 架构有一些事务处理需要联机分析和分开处理不同，HTAP 数据库能够在一份数据上同时支撑业务系统运行并做 OLAP 场景，这样就避免在传统架构中，在线与离线数据库之间大量的数据交互。

它会代替 Oracle 吗？

既然 HTAP 有这样的优势，它能够替代 Oracle 吗？

数据资源发生变化的当今时代，生产数据发生了哪些变化？数据消费者随之发生了什么改变？数据架构、计算、信息发生了哪些改变？带着这些疑问，CSDN 采访了天云数据 CEO 雷涛，请他来谈一谈关于 HTAP 和大数据技术的那些事。

记者：在从 IT 向 DT 时代的转换过程中，产品和技术得以飞速发展，行业需求或痛点发生了哪些变化？

雷涛：回到刚才 WPS 的故事。我们看到，WPS 上市代表一种国产化的趋势，WPS 替代了Windows Office，但事实上真是 WPS 做端到端的复制替代 Windows 吗？从我作为一个消费者的体验上来看，我个人会在手机上和 pad 上使用像印象笔记这样的软件，不再使用编辑软件了，我不再关注到底用粗体还是斜体来排版，我关注的是，拿起任何一个设备，它都是同步的，能够保持信息的一致性。所以真正替代 OA 的升级，并不是找到一个完整的 Word 的替代品——WPS，而是找到了下一代产品大的迭代需求。

而这个大的迭代需求，就是我们针对“去O”这个问题，我们做了一两个大型商业银行的 Oracle 替代，但很快发现，它的真实市场并不是点对点替代，而是在整个需求发生升级迭代的过程里出现一个新的消费市场，即 Oracle 在做的是几百万条交易规格的强一致性，不仅是性能，更重要的是数据的移动性、计算框架的变化，比如我们的联机事务同时要做大规模并行计算。以前大数据挖掘的机器学习也要跑到这个数据平台，对计算场景的通用性、即时性和全量数据的这些要求都是传统架构无法适应的。我们现在看到的更多的是，不是替代 Oracle，而是如何升级 Oracle 的市场需求，即我们所说的混布数据库。

记者：“去IOE”开始，有关数据库国产化的话题就一直是市场关注的焦点，您认为国产数据库的安全可靠如何量化，据了解很多银行、政府的关键业务还在用外企的产品，国产数据库的破局点在哪？

雷涛：之前，从运营商到银行核心系统，大的架构都垄断在西方的 IOE（IBM、Oracle、EMC）这三座大山里，而“去 IOE”，最难的是去“O”。

记者：为什么要提 HTAP？天云数据的 HTAP 产品 Hubble 会直接替代 Oracle 吗？

雷涛：不是不可能。数字中心的核心交易系统，我们已经在银行实施，实现了 Oracle 最贵的一体机的替代。

记者：有没有实际落地、应用的行业案例可以分享？

雷涛：用一个案例的数据可以说明。我们的切入点是以金融为核心的系统。现在，混布数据库处理其中超过两千的核心表，400 多亿条交易数据，56 个在线服务交易，满足了 500 个用户并发，500 毫秒的交易响应，每天的在线交易额，包括柜台、手机银行、网银，两百多万，占整个 A 类银行核心系统交易种类的10%。现在，国内少数几家商业银行都换成分布式系统了，但还都是在 MySQL 开源体系中，我们是唯一一个在分布式的 New SQL 下面去做的。这个是“去 IOE” 最根本和彻底的。

记者：替换成本银行承担得起吗？

雷涛：就是谁愿意先尝试创新，这个系统已经在银行上线了三年，但是银行很低调。很多人以为银行的信息化比互联网慢，但其实不是这样。我们原来做互联网和运营商，每天新增交易规模1700 亿记录，就觉得已经是包打天下了，到银行，一个交易跨一千多张表的复杂度、关联度，动辄四千多行 SQL 语句一个交易，而且交易规则是非常复杂的，所以，银行不仅数据规模量大，而且银行体系还面临着银监会的监督，不容出错，对于交易系统的投资大太多了。

记者：OLAP（On-Line Analytical Processing，联机分析技术）和 OLTP（on-line transaction processing，联机事务处理）真的是资源矛盾的需求么？

雷涛：现在国内外有企业在做新型的 HTAP 产品，事实上是在解决联机事务和密集计算，以前TP、AP 是分开场景来算，必须做选择，鱼和熊掌不可兼得。

AP 的操作和 TP 操作的矛盾在存储里早就有表达，存储的SPC性能设计只能满足其一，AP 就像我选一个大巴来接人，来一支球队，我派一辆大巴全接走了，而 TP 就像是一辆随叫随走的礼宾车，每来一个人，派一辆高档的礼宾车把人接走，它对随机访问能够即时服务和响应，讲究服务质量和高并发，但是不讲究吞吐和带宽。所以，AP 是体量的计算的复杂度问题，它可以容忍服务的下降，而 TP 是强调高并发服务的低延迟响应，以及强一致性的事务保证。似乎在存储上也是这样，它的底层也是Random IO和sequence IO，这两个随机的和持续的连续 IO，完全是两套矛盾的服务，为什么最后出现了像 EMC、cymatrics、HDS 的 HP 的 XP 高端旗舰级存储，它就是把这个问题拆解，可配置量化，一个高端存储可以进行内部位图设计的定制化，还可以互相调整和Balance，做复制时可以基于位图的元数据控制，而不用动真实的数据，所以旗舰级存储轻量、快速，能满足多种目标。所以融合型产品最终体现在企业高端上可控和可被颗粒化。

HTAP 提的这个方案就是这样，纵观 Google 的技术发展历程，从最早的 Big Table 就是基于HDFS 这种模式，它特别适合 AP，即有大规模数据吞吐，但它是批处理操作，到后来的F1 Spanner架构，基于 Paxos 协议，密集同步，强一致性保护，它开始逐渐地拆解得非常细，也就是在 HTAP 场景下，我们会把控制的颗粒度，如整个交易的IO流程和交易流程拆到不同的层级，从如何做存储，每一张表对应 AP 和 TP 场景的问题和存储，到调度层等逐渐分解。Impala 的 AP 做得很好，但是为什么不能解决并发？因为它是进程级的，没有拆解到线程，线程就可以控制到很微小的颗粒度，可以解决并发和很多资源调度问题。然后再往上的逻辑层，基于MVCC机制和像 Raft 这样的协同机制，可以在交易逻辑层来完成更细颗粒度的表达。这很像十年前，旗舰级存储出现时能适应不同的场景，满足不同的需求。

记者：如何满足不同的场景需求，move code or move data？

雷涛：满足的目的是什么呢？不要去动数据，而是动代码，这是我们提出的一个概念：move code，还是 move data。为什么 HTAP 现在这么关键？因为我们现在在大型的银行，现在有一些迫切的刚需出现了，move code 还是 move data 这个问题源于现在的数据发生了变化，数据资源发生变化了，现在我们谈的 4 个变化，核心就是从交易转向行为和机器生产，大量IOT、物联网的数据产生，数据密集度高、体量大，产生速度又快，这让计算框架结构产生根本变化。这是第一个变化因素。

第二个 Driver 是数据消费者变化，原来的数据消费者是少量的报表、仪表盘，BI 和数据仓作为消费者。对于 TP，其实没有数据消费，TP 是流程，数据是产生的副产品，挖掘数据的价值会随着交易流程的结束而结束。一般都会复制到数仓，甚至复制到 SAS。数据挖掘，就是机器学习这块消费数据，以前AP很少量的数据消费，比如一个仪表盘，就是一两个数仓的管理员在看，但现在，我们碰到大量的需求是什么呢？原来上大屏的数据可视化的那些项目，全部推送到了了移动端，就是个性化数仓/个性化价值仓提高单兵服务能力。比如一个营业厅应用有六万多人，同时在线需要至少五百个并发/秒，理财经理要在某一时刻看到大客户的结息、净值等一系列的数据服务，且都是个性化的。所以，这意味着，以前的 AP 需要提供高并发服务，因为数据消费者一下子增多，从以前的几个老板，看 BI 的东西，变成了很多一线员工要进行数据消费，这对并发的要求把 AP 推到 TP 场景里。

记者：因为移动化了？

雷涛：因为数仓消费化，所以，一下子把大量数据计算内容推到了 TP 场景里。同样，现在 TP 越来越复杂，大量交易都带着权益，且要求交易要即时服务，比如权益类业务，很多现在都是Online，所以使得 TP 场景越来越重，核心系统的交易部分要做得计算的跨越的表越来越多。如此大量的 TP AP 化，AP TP 化，这是场景问题。

这提出了一个问题：我们如何合并这个过程呢？即我们要处理好两个核心要素，一个是计算，一个是数据，这两个角色开始发生变化，原来是以计算为核心，现在要以数据为核心。但说的容易，这其中涉及到架构的变化，即 move data 还是 move code 的问题。

互联网来临时，PC、desktop 时代和互联网时代两者之间比较的是 file和page，FTP 和 HTML，一对比就知道，以前是把文件搬来搬去，code 不动，应用服务器就在 FTP Server 上，代码不动，动数据。但是在互联网时代，我们发现页面不动，访问请求在不断地链接，所以我们在 move code，这是发生在信息层面本身的。

第二次革命发生在计算框架本身，就是 MapReduce 和 IOE 的区别，MapReduce 是Google Big table 这套体系，data 被切碎放在所有的磁盘上，每一个数据的计算都是 CPU 在计算，所以代码被切碎了送进去，数据不动，就是 move data。而现在是把 code 送进去，在存储上计算 data，代码切碎了送进去，而不是把数据拿出来，在一个大型或小型机上算好。MapReduce、Big table 这次的迁移实际上是计算框架的变化。

而这一次，HTAP 事实上是数据中心架构的变化。

原来有一个 Oracle 做交易，完成了整个流程性应用的内容，自动化写的代码，数据是它交易的副产品，交易结束了，数据的生命周期也结束。要想把数据价值做二次表达，我们要每天做ETL，跑批作业，存到数据仓库中，然后在数据仓库中建模、挖掘、数据集市、ODS，一层一层地构建起数据仓库报表。如果还回答不出更细节、隐含的问题，比如非线性问题，还要把数据复制到SAS中做机器学习，再做统计的指标体系，去做进一步的挖掘。数据要在这里搬动三次，复制三份冗余，还要管理数据一致性，每天数据中心运维的大量工作在做数据搬家。现在，数据中心也开始要做一个融合性的计算框架。比如，现在AI要做online训练，淘宝推荐引擎，滴滴打车的路径动态规划都在做即时数据，数据闭环是数据基础设施的一个很大的要求。BI和AI操作都要Online化，也就是AP操作要变成TP场景。

回到我刚才说的需求，现在的AP都是高并发的数据服务，都是要TP的应用场景出现了，但是这是一个体量巨大的密集计算，以前我们认为是AP的东西，现在要求，并发和即时，以前的机器学习，比如快速做逻辑回归，贝叶斯、规划、动态规划算法等都需要online做，这些都要求底层有一个融合的数据平台，这是第一个需求，即不能再搬家了，这是融合性数据库的根本性需求。

这种需求不是让你在AP和TP之间做选择，新的架构要解决TP AP化和AP TP化的问题。HTAP会成为未来的一个主导性趋势，而不是一个边缘的补充，因为以数据驱动业务为核心的，会越来越落回生产事件。

记者：这是一个真正具有业务场景需求的功能。

雷涛：而且未来三五年它是主导趋势型的，它不会再区分出一个小TP加上一个重的离线的批处理 AP了，未来，要想让你的前端和企业有弹性、灵活，现在的数据中台服务底层都应该是混布的。

记者：未来，HTAP 还会有更多待开发的场景，您认为它将会向哪个方向发展？

雷涛：我们大量的机器学习也是要跑HTAP的，因为现在很多算法都是即时的，我们能够替代SAS的机器学习的服务，不是靠算法的优势来替代，深度学习真正在流程替代里不多，通用机器学习是最多的，而通用机器算法几十年前就存在，今天要获得其最大的价值，要把数据的价值挖掘出来。

真正做AI的人都会特别依赖HTAP，数据供上来，算法就没有价值了。我们做数据驱动分为几个阶段：

第一阶段是发生了什么？我们做报表、监测、统计等；第二个阶段是为什么会发生？我们做数仓，能够回答一些多视角的问题；第三阶段是做预测，做机器学习，预测将来会发生什么。

记者：HTAP 的需求如此强烈，未来的独角兽会出现在哪里呢？

雷涛：现在大家首先会看到几个场景的需求，第一个爆发出来的需求是数据库的国产化，这一波是由政策推动的一个巨大的市场红利，尤其是在资本市场已经显示出来了潜力，比如 WPS这个边缘的办公应用组件都能有如此巨大的市值，大家的预期很高。我们是要找一个上世界的替代品呢，还是用发展的眼光去看，找到新世界的需求？因为这个世界总是在变化的。

就像在早期，互联网发展大多基于LAMP（Linux、Apache、MySQL、PHP）架构，是向企业级架构学习，对照着企业级的“婴儿版”、“幼儿版”产品，做出对应的便宜、开源、轻量、廉价的互联网，比如Facebook最早的Lamp架构。但很快，Facebook LAMP架构就推倒重来了，因为它扛不住。互联网带来的不是廉价，而是更迅猛的数据资源爆发。交易数据是最早的数据属性，数据是流通的副产品，但是互联网驱动的是行为数据，行为数据要远大于交易数据，行为数据带来的系统架构绝对不是靠廉价，而是靠高并发、高扩展、更松耦合的高服务能力来完成的。我们很少看到Google宕机，它不是靠高可用性来保证，而是靠整个服务的容错。在行为数据中诞生了新的架构，不是LAMP抄了一个企业级的版本，而是生成了一个新的分布式架构。同样地，今天我们看Oracle替代这个问题，我们不是找了一个像WPS替代Office的版本，而是要找到Oracle下面的分布式，能够碾压一体机，能够适应万亿记录规则场景的方法。这是一个新的营销的市场，一个新的蓝海。

更多技术干货现场听！

关于数据库和 HTAP 涉及到的话题和问题，远远不止于雷涛在此次采访中所谈，比如很多企业和技术人员都在思考的数据库转型问题。

随着 5G 技术迅速发展，数据增长越来越快，对分布式数据库、实时数据库、图数据库的需求也越来越多。在今年中国大数据技术大会（BDTC 2019）的新一代数据库转型论坛上，雷涛带来题为《大数据体系下HTAP数据库》的演讲，对 HTAP 数据库和天云数据的 HTAP 数据库产品 Hubble 进行全方位的解读，让企业和技术人员更加了解这项将对大数据领域产生重大影响的技术，洞悉 HTAP 未来发展的趋势。

本论坛主要讨论了分布式数据库特性，包括Key/Value，Schema-less等数据库（OLTP、OLAP、HTAP等），重点介绍列存储数据库、行存储数据库，文档型数据库以及图数据库，并具体介绍MySQL、OceanBase、Greenplum、TiDB、Neo4J、ThinkerPop等，并且会深度分析他们在各种行业的应用实践。

雷涛个人简介：

雷涛现任天云融创数据科技（北京）有限公司（简称天云数据）首席执行官。雷涛拥有 20 余年北美信息科技公司从业经验，2005 年入席 SNIA 存储工业协会中国区技术委员会联合主席；2013 年首批 CCF 中国计算机学会大数据专委会委员；长江商学院特聘导师，博士后工作站企业导师。2019年第九届“吴文俊人工智能科学技术奖”获得者。

巅峰对决，超三十万奖金等你挑战！第十届信也科技杯全球AI算法大赛火热开赛！中杯可乐多加冰前沿资讯分享科技人工智能算法计算机视觉机器学习深度学习
信也科技今年跟IJCAI和CIKM这两大全球顶级AI会议合作，这场比赛被全球人工智能顶会CIKM收录为官方赛事单元，获奖选手有机会全球人工智能顶会创造更大的影响力。一、赛事概况随着深度伪造技术的高度发展，人工智能产业走深向实，生成合成技术开始呈现工具化和普及化趋势。在生成合成内容质量显著提升的当下，基于换脸攻击的身份冒用和欺诈事件在全球范围内激增，严重威胁个人隐私和公共数据安全。第十届信也科技杯全
大模型 AI智能体Coze知识库从使用到实战详解非著名架构师大模型知识文档人工智能 Coze知识库
一、Coze知识库核心价值解析1.1知识库技术架构创新Coze知识库采用四层混合架构设计，在2025年大模型应用中展现出独特优势：存储层：支持向量数据库（Qdrant）+图数据库（Neo4j）双引擎处理层：集成PDF/PPT/Excel等23种文件解析器检索层：混合检索算法（BM25+稠密检索+语义路由）应用层：RAG（检索增强生成）优化接口与传统方案相比，查询准确率提升42%，特别擅长处理：专业
【AI智能推荐系统】第二篇：深度学习在推荐系统中的架构设计与优化实践 DeepFaye 人工智能深度学习
第二篇：深度学习在推荐系统中的架构设计与优化实践提示语：“从Wide&Deep到Transformer，深度推荐模型如何突破性能瓶颈？本文将揭秘Netflix、淘宝都在用的深度学习推荐架构，手把手教你设计高精度推荐系统！”目录深度学习推荐系统的核心优势主流深度学习推荐架构解析2.1Wide&Deep模型2.2DeepFM与xDeepFM2.3神经协同过滤(NCF)2.4基于Transformer的
Assistant API 流式传输中的事件流原理细节上有晨光大模型Agent开发人工智能算法大模型 OpenAI Agent
一、AssistantAPI流式传输事件流基础OpenAIAssistantAPI的流式输出在特定操作时会生成新事件，每个事件由event和data构成。data存放如大模型回复等关键数据，event则表明大模型的处理阶段，像运行、排队、完成等状态信息。二、事件流核心流程整体流程：从创建assistant对象、thread对象并追加message开启run状态（即start模式）起，到获取模型回复
Assistant API 进阶应用方法介绍上有晨光大模型Agent开发人工智能算法大模型 Agent OpenAI
一、课程回顾之前博客内容围绕OpenAIAssistantAPI展开，详细讲解了其基本原理、构建对话或代理的完整生命周期，以及Assistant、Thread、Message和Run这四个抽象概念之间的关系。在此基础上，搭建了用户与大模型对话的基础通路，不过这只是该API最基础的应用形式。二、AssistantAPI概述（一）优势与特点AssistantAPI在性能和易用性方面表现卓越，超越了市面
Python设置国内镜像教程 wh3933 python 开发语言
####引言Python是一种广泛使用的高级编程语言，用于各种编程任务，从简单的脚本到复杂的机器学习算法。在安装Python包时，通常需要从Python包索引（PyPI）下载。由于网络原因，直接从PyPI下载可能速度较慢，因此，使用国内的镜像源可以显著提高下载速度。本文将详细介绍如何在Python中设置国内镜像。####文章目的本篇文章旨在指导用户如何将Python的包管理工具`pip`的默认源切
python中使用pyinstaller将python项目打包为exe可执行文件不吃西红柿丿 python windows
1、安装pyinstallerpipinstallpyinstaller-ihttps://pypi.tuna.tsinghua.edu.cn/simple2、打包应用2.1、使用命令行直接打包pyinstaller-F-w-iyour_path/log.icomain.py命令：-F将项目打包为单个exe文件，没有其它文件-D将项目打包为一个文件夹里面又有一个exe文件以及其它依赖，启动速度比-
OPENAI中Assistants API的实现原理及示例代码python实现 dzend aigc python ai
OPENAI中AssistantsAPI的实现原理及示例代码前言OPENAI是一家人工智能公司，致力于研究和开发人工智能技术。其中，AssistantsAPI是OPENAI推出的一项人工智能服务，可以帮助开发者快速构建智能助手。本文将介绍AssistantsAPI的实现原理，并提供使用Python实现的示例代码。AssistantsAPI实现原理AssistantsAPI的实现原理主要包括以下几个
Java+Python智能化云盘【Day5-1】关沐吖 Java+Python Ai智能云盘项目开发专栏 python java 开发语言
RAG系统链路和数据加载Loaders技术OK啊昨天Day4-2，最后提及了很多的一些Loader加载器，有文档类型、数据库类型、网页加载器类型等等，它们其实都是属于langchain_community.document_loaders这个包下的类。今天来先复习一下都有哪些，再讲讲其中的代码运行的基本框架，和文档中有图片的处理方式。Loader的分类与常见类型文件加载器（FileLoaders）
Java+Python智能化云盘【Day3】关沐吖 Java+Python Ai智能云盘项目开发专栏 java python 开发语言
提示词工程Prompt简介：大模型必备Prompt提示词工程讲解什么是PromptEngineering提示词工程通过特定格式的文本输入引导AI模型生成期望输出的技术，明确地告诉模型你想要解决的问题或完成的任务也是大语言模型理解用户需求并生成相关、准确回答或内容的基础类比：给Java程序员的任务需求文档（越清晰明确，结果越符合预期）为什么需要学习？大模型就是你的员工，你可以有多个助手，OpenAI
Java+Python智能化Ai云盘[Day2]
OK啊，为了完成学校老师布置的UML作业主播也是开始拿自己的项目开始当成期末大作业来交了。顺道的我也把自己的项目整个的梳理了一通，如果大家最近有UML的大作业要交也可以自取，到时候我把文章word版本直接发到百度网盘上去。里面我只有类图、用例图、活动图、顺序图、状态图。这次也算是一个提前复习了一下项目了把，整个的文档文字都是拿ai去写的，图的话也是我先看了一遍代码，然后给ai说了一遍也算是自己理通
2025年6月AIGC发展全景：技术轻量化、Agent产业化与伦理新挑战 Loving_enjoy 计算机学科论文创新点深度学习人工智能经验分享 facebook
>**当一块消费级GPU能解高考数学题，当AI智能体接管医院诊断流程，我们正站在人机协作新纪元的门槛上**2025年6月，AIGC领域迎来关键转折点——**模型轻量化**让百亿参数算法飞入寻常设备，**多模态融合**打破文本与视觉的次元壁，而**Agent智能体**正从实验室概念蜕变为产业核心引擎。这场变革不仅重塑技术范式，更在重构商业逻辑与人类创造力边界。---###一、技术突破：垂直化、轻量化
【批处理脚本】bat解决谷歌浏览器跨域问题一殊酒网络安全文档解析前端开发服务器 linux 运维网络安全
新建TXT文件，复制粘贴以下代码@echooff:Startsetindex=""for/f"delims=="%%iin('wherechrome')dosetindex="%%i"echo"%index%"if%index%==""(gotoA)else(gotoGOON):GOONfor/f"delims=\,tokens=1,*"%%ain(%index%)do(::echo%%a%%bs
weapp-tailwindcss 使用教程薄正胡Plains
weapp-tailwindcss使用教程weapp-tailwindcssbringtailwindcsstoweapp!把`tailwindcss`原子化思想带入小程序开发吧!原`weapp-tailwindcss-webpack-plugin`项目地址:https://gitcode.com/gh_mirrors/we/weapp-tailwindcss项目介绍weapp-tailwindc
基于uniapp小程序的诗词学习系统附带文章源码部署视频讲解等
文章目录前言详细视频演示具体实现截图核心技术介绍小程序框架Uniapp前端框架Vue持久层框架MyBaits为什么选择我代码参考数据库参考测试用例参考源码获取前言博主介绍：✌CSDN特邀作者、资深全栈开发程序员，曾在互联网大厂担任高级职位、码云/掘金/华为云/阿里云/InfoQ/StackOverflow/github等平台优质作者、专注于Java、小程序、前端、python等技术领域毕业项目实战
鸿蒙设备开发OpenHarmony深度解读之设备认证：HiChain机制部分源码解析1（推荐模块之外）
往期推文全新看点（文中附带最新·鸿蒙全栈学习笔记）鸿蒙（HarmonyOS）北向开发知识点记录~鸿蒙（OpenHarmony）南向开发保姆级知识点汇总~鸿蒙应用开发与鸿蒙系统开发哪个更有前景？嵌入式开发适不适合做鸿蒙南向开发？看完这篇你就了解了~对于大前端开发来说，转鸿蒙开发究竟是福还是祸？鸿蒙岗位需求突增！移动端、PC端、IoT到底该怎么选？记录一场鸿蒙开发岗位面试经历~持续更新中……一、概述H
在屏幕中心显示定位点
letposition=this.map.getCenter();this.$ownerInstance.callMethod('savePoint',{//调用Vue组件中的方法position});//转换屏幕坐标varpixel=this.map.lngLatToContainer(position);this.$ownerInstance.callMethod('saveMap',{//调
C# Cefsharp 获取cookie 和设置cookie Little_Code cookie cefsharp
设置cookievarcook=Cef.GetGlobalCookieManager();cook.SetCookieAsync(url,newCefSharp.Cookie{Domain="",Name="",Value="",});读取cookieprivatevoidBrowser_FrameLoadEnd(objectsender,FrameLoadEndEventArgse){Cooki
java面向对象02：回顾方法
回顾方法及加深定义方法修饰符返回类型break：跳出switch和return的区别方法名参数列表packagecom.oop.demo01;//Demo01类publicclassDemo01{//main方法publicstaticvoidmain(String[]args){}/*修饰符返回值类型方法名(...){//方法体return返回值;}*///return结束方法，返回一个结果！p
文娱产业数字化转型的隐秘战场数据与人工智能律师人工智能大数据网络区块链云计算
（首席数据官高鹏律师数字经济团队创作，AI辅助）当《黑神话》用虚幻引擎点燃全球玩家热情时，当《长安三万里》以数字资产重构国风美学时，中国文娱产业的数字化革命已悄然进入深水区。这场没有硝烟的战争里，有人手握流量红利高歌猛进，有人却在数据迷局中折戟沉沙。某现象级手游曾因用户协议条款引发千万索赔，某头部影视公司AI生成素材陷入版权漩涡，这些看似偶然的危机背后，藏着文娱产业数字化转型的致命暗礁——数据权属
我国在AI、元宇宙、生成式AI赛道的竞争带来的投资机会数据与人工智能律师大数据区块链人工智能网络数据库
首席数据官高鹏律师团队编著中国在AI、元宇宙、生成式AI赛道的竞争已进入技术深化与商业落地并行的关键阶段，未来投资机会可围绕以下五大方向展开：一、基础设施与算力支撑1.云计算与混合云服务生成式AI对算力和云服务需求激增，联想集团等布局混合云的企业受益于企业数字化转型需求。IDC预测，到2025年，50%的企业将与生成式AI云提供商建立战略联系，云服务商需优化数据治理和成本控制能力。2.AI芯片与算
2025数字经济新政策解码：这五个黄金赛道，正在改写财富分配规则数据与人工智能律师人工智能大数据网络算法区块链
首席数据官高鹏律师团队创作，AI辅助一、政策东风下的财富重构：当免税清单变成“造富密码”2025年的春天，数字经济领域的政策“礼包”如同春雷炸响。从跨境电商的“阳光化新政”到智慧农业的“技术普惠”，从汽车零部件的“出海红利”到工业升级的“智能改造”，再到文旅餐饮的“消费重构”，五大行业正在经历一场财富分配的底层变革。这不是普通的政策调整，而是国家战略级的资源再分配——免税+补贴的组合拳，正在为先行
ElasticSearch中的分片是什么? java1234_小锋 java elasticsearch 大数据搜索引擎
大家好，我是锋哥。今天分享关于【ElasticSearch中的分片是什么?】面试题。希望对大家有帮助；ElasticSearch中的分片是什么?超硬核AI学习资料，现在永久免费了！在Elasticsearch中，分片（Shard）是将数据拆分成更小的部分，允许在分布式环境中并行处理和存储数据的机制。它是Elasticsearch在水平扩展时用于管理大量数据的关键概念。主要概念：主分片（Primar
机器学习宝典——第6章爱看烟花的码农机器学习人工智能
第6章：聚类算法(Clustering)你好，同学！欢迎来到无监督学习的世界。与监督学习不同，这里的我们没有“标准答案”（标签），我们的目标是在数据中发现隐藏的、内在的结构。聚类算法就是实现这一目标的核心工具，它试图将数据集中的样本划分为若干个不相交的子集，我们称之为“簇”(cluster)。本章我们将深入探讨三种最具代表性的聚类算法：K-均值(K-Means)、层次聚类(Hierarchical
深度报告：中老年AI陪伴机器人需求分析 MidJourney中文版 AI机器人人工智能机器人
银发经济新赛道：中老年陪伴聊天AI机器人需求价值与发展路径分析1老龄化社会的隐性需求全球人口结构加速老龄化背景下，老年孤独问题日益凸显为公共健康挑战。传统家庭结构变迁导致独居老人比例持续上升，情感支持缺位与社交隔离形成双重压力，而现有社会服务难以满足高频次、个性化的陪伴需求。在此现实困境中，具备自然语言交互能力的AI机器人玩具展现出独特价值——通过技术手段填补情感空缺，成为应对银发群体精神健康问题
数据资产确权的法律路径：从原始数据到衍生产品的权利归属
首席数据官高鹏律师数字经济团队创作，AI辅助在数字经济时代，数据已成为堪比石油的战略资源。某新能源车企因驾驶数据归属争议损失数十亿，某电商平台用户画像被竞争对手“合法”窃取的案例频发，暴露出数据这座“金山银山”背后隐藏的法律暗礁。当原始数据的采集边界模糊不清，当衍生数据的价值裂变引发权属混战，如何用法律之钥打开数据资产的财富之门？这不仅是技术命题，更是数字时代的法律革命。一、原始数据：数字土壤上的
景联文科技完成数千万元Pre-A轮融资，布局公共数据生产运营｜36氪首发景联文科技人工智能
景联文的目标是，成为地方政府的公共数据生产、运营商，帮助挖掘公共数据的最大价值。36氪获悉，数据服务公司「景联文科技」于近期完成了数千万元Pre-A轮融资，投资方为杭州金投集团旗下基金。据悉，景联文科技本轮融资将用于公共数据生产运营的布局、智能化语料工程平台构建、以及自建垂直领域高质量标注基地，打造“平台+基地+行业”的数据链闭环生态。景联文科技成立于2012年，是一家AI数据服务运营商。据景联文
从维基百科到知识图谱：用 DSPy、OpenAI 和 TiDB 构建 GraphRAG 的奇妙旅程步子哥 AGI通用人工智能知识图谱 tidb 人工智能
在信息爆炸的时代，如何快速从海量数据中提取有用信息，成为了技术发展的重要方向。传统的RAG（Retrieval-AugmentedGeneration）方法虽然在信息检索领域表现出色，但随着需求复杂度的提升，GraphRAG（基于知识图谱的RAG）逐渐成为更优的解决方案。本文将带您一步步了解如何利用DSPy、OpenAI和TiDBVectorDatabase，从维基百科数据构建一个GraphRAG
浙江省经信厅数据算力与基础设施处处长庞为兴带队调研景联文科技，共探工业数据驱动智造新路径！景联文科技科技
7月2日上午，浙江省经信厅数据算力与基础设施处处长庞为兴、产业数字化处处长张君等一行领导带队莅临景联文科技调研指导工作，景联文科技CEO刘云涛参加调研并做汇报讲解，双方就数据服务公司业务，工业高质量数据集建设及政企合作方向展开深入探讨。景联文科技作为“懂模型、懂业务”的AI数据服务商，业务模式涵盖按需标注、预置数据集供应及平台部署服务，并积极汇聚公共数据资源，携手华为构建语料知识库，赋能数据标注产
结构型智能科技的关键可行性——信息型智能向结构型智能的转变（修改提纲）刘海东刘海东人工智能机器学习算法
结构型智能科技的关键可行性——信息型智能向结构型智能的转变1.信息型智能科技概述1.1传统计算机科技的信息型继承者1.2信息型智能环境1.3信息型智能主体1.4机器学习创造的智能1.5信息型智能科技的缺陷2.结构型智能科技概述2.1传统计算机科技向生命结构的发展2.2结构型智能科技的环境2.3结构型智能科技创造的机器生命2.4结构型智能科技的科学性3.结构型智能科技的关键可行性——信息型智能向结构
关于旗正规则引擎中的MD5加密问题何必如此 jsp MD5 规则加密
一般情况下，为了防止个人隐私的泄露，我们都会对用户登录密码进行加密，使数据库相应字段保存的是加密后的字符串，而非原始密码。在旗正规则引擎中，通过外部调用，可以实现MD5的加密，具体步骤如下： 1.在对象库中选择外部调用，选择“com.flagleader.util.MD5”，在子选项中选择“com.flagleader.util.MD5.getMD5ofStr({arg1})”； 2.在规
【Spark101】Scala Promise/Future在Spark中的应用 bit1129 Promise
Promise和Future是Scala用于异步调用并实现结果汇集的并发原语，Scala的Future同JUC里面的Future接口含义相同，Promise理解起来就有些绕。等有时间了再仔细的研究下Promise和Future的语义以及应用场景，具体参见Scala在线文档：http://docs.scala-lang.org/sips/completed/futures-promises.html
spark sql 访问hive数据的配置详解 daizj spark sql hive thriftserver
spark sql 能够通过thriftserver 访问hive数据，默认spark编译的版本是不支持访问hive，因为hive依赖比较多，因此打的包中不包含hive和thriftserver,因此需要自己下载源码进行编译，将hive，thriftserver打包进去才能够访问，详细配置步骤如下： 1、下载源码 2、下载Maven,并配置此配置简单，就略过
HTTP 协议通信周凡杨 java httpclient http 通信
一：简介 HTTPCLIENT，通过JAVA基于HTTP协议进行点与点间的通信！二：代码举例测试类： import java
java unix时间戳转换 g21121 java
把java时间戳转换成unix时间戳： Timestamp appointTime=Timestamp.valueOf(new SimpleDateFormat("yyyy-MM-dd HH:mm:ss").format(new Date())) SimpleDateFormat df = new SimpleDateFormat("yyyy-MM-dd hh:m
web报表工具FineReport常用函数的用法总结（报表函数）老A不折腾 web报表 finereport 总结
说明：本次总结中，凡是以tableName或viewName作为参数因子的。函数在调用的时候均按照先从私有数据源中查找，然后再从公有数据源中查找的顺序。 CLASS CLASS(object):返回object对象的所属的类。 CNMONEY CNMONEY(number,unit)返回人民币大写。 number:需要转换的数值型的数。 unit:单位，
java jni调用c++ 代码报错墙头上一根草 java C++jni
# # A fatal error has been detected by the Java Runtime Environment: # # EXCEPTION_ACCESS_VIOLATION (0xc0000005) at pc=0x00000000777c3290, pid=5632, tid=6656 # # JRE version: Java(TM) SE Ru
Spring中事件处理de小技巧 aijuans spring Spring 教程 Spring 实例 Spring 入门 Spring3
Spring 中提供一些Aware相关de接口，BeanFactoryAware、 ApplicationContextAware、ResourceLoaderAware、ServletContextAware等等，其中最常用到de匙ApplicationContextAware.实现ApplicationContextAwaredeBean，在Bean被初始后，将会被注入 Applicati
linux shell ls脚本样例 annan211 linux linux ls源码 linux 源码
#! /bin/sh - #查找输入文件的路径 #在查找路径下寻找一个或多个原始文件或文件模式 # 查找路径由特定的环境变量所定义 #标准输出所产生的结果通常是查找路径下找到的每个文件的第一个实体的完整路径 # 或是filename :not found 的标准错误输出。 #如果文件没有找到则退出码为0 #否则即为找不到的文件个数 #语法 pathfind [--
List,Set,Map遍历方式 (收集的资源,值得看一下) 百合不是茶 list set Map遍历方式
List特点：元素有放入顺序，元素可重复 Map特点：元素按键值对存储，无放入顺序 Set特点：元素无放入顺序，元素不可重复（注意：元素虽然无放入顺序，但是元素在set中的位置是有该元素的HashCode决定的，其位置其实是固定的） List接口有三个实现类：LinkedList，ArrayList，Vector LinkedList：底层基于链表实现，链表内存是散乱的，每一个元素存储本身
解决SimpleDateFormat的线程不安全问题的方法 bijian1013 java thread 线程安全
在Java项目中，我们通常会自己写一个DateUtil类，处理日期和字符串的转换，如下所示： public class DateUtil01 { private SimpleDateFormat dateformat = new SimpleDateFormat("yyyy-MM-dd HH:mm:ss"); public void format(Date d
http请求测试实例（采用fastjson解析） bijian1013 http 测试
在实际开发中，我们经常会去做http请求的开发，下面则是如何请求的单元测试小实例，仅供参考。 import java.util.HashMap; import java.util.Map; import org.apache.commons.httpclient.HttpClient; import
【RPC框架Hessian三】Hessian 异常处理 bit1129 hessian
RPC异常处理概述 RPC异常处理指是，当客户端调用远端的服务，如果服务执行过程中发生异常，这个异常能否序列到客户端？如果服务在执行过程中可能发生异常，那么在服务接口的声明中，就该声明该接口可能抛出的异常。在Hessian中，服务器端发生异常，可以将异常信息从服务器端序列化到客户端，因为Exception本身是实现了Serializable的
【日志分析】日志分析工具 bit1129 日志分析
1. 网站日志实时分析工具 GoAccess http://www.vpsee.com/2014/02/a-real-time-web-log-analyzer-goaccess/ 2. 通过日志监控并收集 Java 应用程序性能数据(Perf4J) http://www.ibm.com/developerworks/cn/java/j-lo-logforperf/ 3.log.io 和
nginx优化加强战斗力及遇到的坑解决 ronin47 nginx 优化
　　　先说遇到个坑，第一个是负载问题，这个问题与架构有关，由于我设计架构多了两层，结果导致会话负载只转向一个。解决这样的问题思路有两个：一是改变负载策略，二是更改架构设计。　　　由于采用动静分离部署，而nginx又设计了静态，结果客户端去读nginx静态，访问量上来，页面加载很慢。解决：二者留其一。最好是保留apache服务器。　　　来以下优化：　　　
java-50-输入两棵二叉树A和B，判断树B是不是A的子结构 bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/25411174201011445550396/ import ljn.help.*; public class HasSubtree { /**Q50. * 输入两棵二叉树A和B，判断树B是不是A的子结构。例如，下图中的两棵树A和B，由于A中有一部分子树的结构和B是一
mongoDB 备份与恢复开窍的石头 mongDB备份与恢复
Mongodb导出与导入 1: 导入/导出可以操作的是本地的mongodb服务器,也可以是远程的. 所以,都有如下通用选项: -h host 主机 --port port 端口 -u username 用户名 -p passwd 密码 2: mongoexport 导出json格式的文件
[网络与通讯]椭圆轨道计算的一些问题 comsci 网络
如果按照中国古代农历的历法，现在应该是某个季节的开始，但是由于农历历法是3000年前的天文观测数据，如果按照现在的天文学记录来进行修正的话，这个季节已经过去一段时间了。。。。。也就是说，还要再等3000年。才有机会了，太阳系的行星的椭圆轨道受到外来天体的干扰，轨道次序发生了变
软件专利如何申请 cuiyadll 软件专利申请
软件技术可以申请软件著作权以保护软件源代码，也可以申请发明专利以保护软件流程中的步骤执行方式。专利保护的是软件解决问题的思想，而软件著作权保护的是软件代码（即软件思想的表达形式）。例如，离线传送文件，那发明专利保护是如何实现离线传送文件。基于相同的软件思想，但实现离线传送的程序代码有千千万万种，每种代码都可以享有各自的软件著作权。申请一个软件发明专利的代理费大概需要5000-8000申请发明专利可
Android学习笔记 darrenzhu android
1.启动一个AVD 2.命令行运行adb shell可连接到AVD,这也就是命令行客户端 3.如何启动一个程序 am start -n package name/.activityName am start -n com.example.helloworld/.MainActivity 启动Android设置工具的命令如下所示： # am start -
apache虚拟机配置，本地多域名访问本地网站 dcj3sjt126com apache
现在假定你有两个目录，一个存在于 /htdocs/a，另一个存在于 /htdocs/b 。现在你想要在本地测试的时候访问 www.freeman.com 对应的目录是 /xampp/htdocs/freeman ,访问 www.duchengjiu.com 对应的目录是 /htdocs/duchengjiu。 1、首先修改C盘WINDOWS\system32\drivers\etc目录下的
yii2 restful web服务[速率限制] dcj3sjt126com PHP yii2
速率限制为防止滥用，你应该考虑增加速率限制到您的API。例如，您可以限制每个用户的API的使用是在10分钟内最多100次的API调用。如果一个用户同一个时间段内太多的请求被接收，将返回响应状态代码 429 (这意味着过多的请求)。要启用速率限制, [[yii\web\User::identityClass|user identity class]] 应该实现 [[yii\filter
Hadoop2.5.2安装——单机模式 eksliang hadoop hadoop单机部署
转载请出自出处：http://eksliang.iteye.com/blog/2185414 一、概述 Hadoop有三种模式单机模式、伪分布模式和完全分布模式，这里先简单介绍单机模式，默认情况下，Hadoop被配置成一个非分布式模式，独立运行JAVA进程，适合开始做调试工作。二、下载地址 Hadoop 网址http:
LoadMoreListView+SwipeRefreshLayout（分页下拉）基本结构 gundumw100 android
一切为了快速迭代 import java.util.ArrayList; import org.json.JSONObject; import android.animation.ObjectAnimator; import android.os.Bundle; import android.support.v4.widget.SwipeRefreshLayo
三道简单的前端HTML/CSS题目 ini html Web 前端 css 题目
使用CSS为多个网页进行相同风格的布局和外观设置时，为了方便对这些网页进行修改，最好使用（）。http://hovertree.com/shortanswer/bjae/7bd72acca3206862.htm 在HTML中加入<table style=”color:red; font-size:10pt”>，此为（）。http://hovertree.com/s
overrided方法编译错误 kane_xie override
问题描述：在实现类中的某一或某几个Override方法发生编译错误如下： Name clash: The method put(String) of type XXXServiceImpl has the same erasure as put(String) of type XXXService but does not override it 当去掉@Over
Java中使用代理IP获取网址内容（防IP被封，做数据爬虫） mcj8089 免费代理IP 代理IP 数据爬虫 JAVA设置代理IP 爬虫封IP
推荐两个代理IP网站： 1. 全网代理IP：http://proxy.goubanjia.com/ 2. 敲代码免费IP：http://ip.qiaodm.com/ Java语言有两种方式使用代理IP访问网址并获取内容，方式一，设置System系统属性 // 设置代理IP System.getProper
Nodejs Express 报错之 listen EADDRINUSE qiaolevip 每天进步一点点学习永无止境 nodejs 纵观千象
当你启动 nodejs服务报错： >node app Express server listening on port 80 events.js:85 throw er; // Unhandled 'error' event ^ Error: listen EADDRINUSE at exports._errnoException (
C++中三种new的用法 _荆棘鸟_ C++new
转载自：http://news.ccidnet.com/art/32855/20100713/2114025_1.html 作者: mt 其一是new operator，也叫new表达式；其二是operator new，也叫new操作符。这两个英文名称起的也太绝了，很容易搞混，那就记中文名称吧。new表达式比较常见，也最常用，例如： string* ps = new string("
Ruby深入研究笔记1 wudixiaotie Ruby
module是可以定义private方法的 module MTest def aaa puts "aaa" private_method end private def private_method puts "this is private_method" end end

将成为数据库主流的HTAP，它能替代Oracle吗？

“国产化”、”去 IOE”，国产浪潮来袭

HTAP概念横空出世

它会代替 Oracle 吗？

你可能感兴趣的:(AI,人工智能,机器学习)