亚马逊云开发者

从 S3 到 DataZone，亚马逊云科技用16年讲完一个数据的故事

点击上方【凌云驭势重塑未来】

一起共赴年度科技盛宴！

2022亚马逊云科技 re:Invent 全球大会在 Las Vegas 刚落下帷幕，和去年疫情刚结束后举行的 re:Invent 2021相比，这次的现场参展人数规模空前，官方统计超过5万。这也是 Adam Selipsky 作为亚马逊云科技掌门人的第二次线下 re:Invent 亮相，在 Adam 的 Keynote 中，他以浩渺星辰作为开场铺垫了3分多钟，只为了引出 Keynote 的第一个主题 —— Data。

亚马逊云科技的数据产品线起点也是亚马逊云科技的起点。Keynote 上，Adam 说亚马逊云科技拥有业界最全面的数据产品矩阵，那就借着这次 re:Invent 发布会，我们来一起回顾一下亚马逊云科技数据产品线的演进历程。

亚马逊云科技数据产品的演进

S3 - Simple Storage Service

注：亚马逊云科技把 S3 归在了存储（Storage），而不是数据（Data），但 S3 和数据关联紧密，所以是放在一起讨论。

S3 发布于2006年3月，是亚马逊云科技最古老的服务，标志着亚马逊云科技的诞生。S3 也是最核心的服务，假设要给亚马逊云科技服务做减法的话，最后一个留下的肯定也会是 S3。所以说，亚马逊云科技迈入云市场的第一步是正确的。S3 确如其名，提供的服务是很简单的，就是把文件托管到云上。

当然，提供简单服务的背后并不简单，Amazon.com 副总裁兼首席技术官 Werner Vogels 博士是服务化的铁杆粉丝，在他每次的 Keynote 里都会用 S3 作为案例。今年他又再次提到 S3 的微服务数量超过了235个（作为对比，通常一个互联网服务的微服务数是5个左右）。

不过在 2019年，S3 的微服务数量是262个。看来 S3 内部还是做了一系列的瘦身工作。

S3 的重要性也可以从另一个角度来印证。2017年 S3 在美东区的事故，造成了大面积的互联网服务瘫痪，也让许多人第一次意识到，S3 其实已经成为了互联网的基础设施（backbone）。

而也正是因为 S3 提供了简单，或者说基础原子的能力，在其之上才有了千变万化的可能。我想当初 S3 的设计者们，也一定没想到 S3 会成为数据湖（Data Lake）的基础，毕竟当年还没有数据湖这个概念呢。

现代数据架构

由 S3 开始，亚马逊云科技的数据产品线逐渐壮大，发育成了「五纵三横」的现代数据架构（Modern Data Architecture）：「五纵」代表的是垂直产品，就是图上的5个圈——Databases、Analytics、Business Intelligence (BI)、Data Lakes、Machine Learning。

「三横」代表的是横向产品，即图中间的 Catalog 和 Governance 以及连接线隐含的 Integration。

五纵

1.Databases：支撑在线业务的应用数据库，这其中最核心的是关系型（RDBMS）和非关系型（NoSQL），各自都经历了一次产品演进：

关系型：2009.10 RDS -> 2014.11 Aurora
非关系型：2007.12 SimpleDB -> 2012.1 DynamoDB

2.Analytics：分析型数据库/数据仓库，Redshift 一直是唯一的产品，而今年也正好是 Redshift 推出的第10年。其实 Redshift 最早是一款被收购来的产品，它的前身是 ParAccel 基于 PostgreSQL 的魔改。

3.Business Intelligence (BI)：2015 年推出的 QuickSight，这块相对不是亚马逊云科技的强项。

4.Data Lakes：这两年数据领域最火的概念，亚马逊云科技在这块也早早地布了局：

存储：2006.3 发布的 S3，前面提过了，有点无心插柳成了数据湖领域的根基。
计算：2009.4 发布的 EMR (Elastic MapReduce)，当然它也不再是只能跑 Hadoop 的 MapReduce 了，Spark、Flink、 TensorFlow、 Ray 各种执行引擎都能可以应用。
查询：2016.11 发布的 Athena，提供了通过 SQL 查询 S3 及其他数据源的接口。

5.Machine Learning：最早入列的是 re:Invent 2016上推出的三剑客：图像识别 Rekognition、文字识别 Polly、语音识别 LEX。

1年之后，亚马逊云科技推出了在 AI / ML 战线的基石产品 SageMaker。

三横

Integration：让用户把数据从系统 A 转移到系统 B，以及就在单一系统里做数据变换。这也是一条经过了迭代的产品线，从 2012.12 Data Pipeline 升级到2016.12 Glue。
Governance：2018.11 Lake Formation，是面向数据湖的产品。因为数据湖相比数据仓库，数据量大得多，又缺少结构化信息，不加以管理的话，就像是一堆乱积木丢在那里，既没有意义，哪里被人顺走一块也不知道。不过它的边界和 DataZone 之间会有些模糊，后续会谈到。
Catalog：2022.11 DataZone。这次 re:Invent 推出的产品，在后面新产品解读中会展开。

Data Gravity - 数据引力 / 重力

这也是 Keynote 上听到的一个概念，尤其是对应到中文翻译也很贴切。Gravity 在中文翻译里既有引力，也有重力的意思：

引力：资源是跟着数据跑的，数据在哪里，其他东西就在哪里。所以几大公有云厂商对于进来的数据流量都是不收费的（截图来自亚马逊云科技官网）。

而出去的数据，则收得异常之高，Cloudflare 去年就此还专门写过一篇针对亚马逊云科技的文章（截图来自 https://blog.cloudflare.com/aws-egregious-egress/)。

重力：数据越积越多，数据种类和数据库类型也越来越丰富。驾驭数据的能力是自然下坠的趋势。

亚马逊云科技早期产品决策有关键的三点：

亚马逊云科技最先进入云市场，在2006年先后推出 S3、EC2。
押注在基于 VM 的 EC2方案，而不是直接跳到 PaaS。事实证明，用户上云的姿势还是 lift-and-shift，而不是直接一步到位（leapfrog）到云原生架构。
基于对数据引力的认知，尽早推出了各种独立的数据产品，这使亚马逊云科技很快成为公有云市场领跑者。在亚马逊云科技的体系里，数据和计算是两个独立的服务，先把数据弄上来，而又因为数据引力的作用，计算自然而然跟着数据也上来。

除了尊重数据引力的客观事实，亚马逊云科技另外做的就是对抗数据重力（Data AntiGravity），这次请来 Intuit 站台讲的也是这个主题，我们接下来就开始介绍围绕这个主题的几个新发布。

2022亚马逊云科技

re:Invent 全球大会

数据产品新发布功能的解读

DataZone

DataZone 是这次亚马逊云科技 re:Invent 数据线上最重磅的发布，也出现在了 Adam 的 Keynote 之中。DataZone 的介绍语是「A data management service to catalog, discover, share and govern data」，它的推出补上了整个数据线上唯一缺失的一个大模块——数据资产的管理。它的产品介绍里也提到了 Govern，前面讲 Lake Formation 是专门针对数据湖场景的 Governance 方案，所以在这块上，DataZone 和 Lake Formation 会存在一些边界上的重合，后续应该需要进行一下整合。不过我相信，DataZone 会是未来亚马逊云科技数据线上的基石产品——DataOps 的承载者，承担着打通各个数据系统任督二脉的角色。而基于 DataZone 之上，会再开发出数据安全、业务洞察等更加上层的应用。

不过亚马逊云科技发布 DataZone 的时间还是有些晚。在2018年的时间点才选择发布了只针对数据湖的 Lake Formation，而没有直接一步到 DataZone ，我能想到这么几个原因：

要做一个整合所有数据系统的数据平台，需要协调太多的资源，那时亚马逊云科技的组织架构没有准备好。
那时数据湖大火，Databricks、Snowflake 给了很大的压力，所以快速先出一个针对数据湖的产品。

Lake Formation 接下来的演进可以有两条路径：

类似 SageMaker，发展成 Lake Studio，成为数据湖的开发平台，Governance、Catalog 这些底层能力还是交给 DataZone。
和 Redshift 工作台进行整合，开发出湖仓一体的 Lakehouse 开发平台。

Aurora Zero ETL integration with

Redshift

不需要用户手工配置 ETL 任务，就能把 Aurora 的数据进行 ETL 同步到 Redshift 里面。

Auto-copy from Amazon S3 to

Redshift

和上面那个类似，不过数据源换成了 S3，也暂时没有 ETL 功能。不过这也是解决了一个刚需高频场景，也为未来进一步的 ETL 方案铺路。

以上两个功能整体揭开了亚马逊云科技往 Zero ETL 方向发展的序幕。数据的归属可以分成四大类：

在线事务数据库的数据
数仓里的数据
数据湖里的数据
在 Salesforce、HubSpot 这些第三方系统里的数据

那为了达成 Zero ETL，整合数据的思路有两种，一种是整合数据库系统，比如像 HTAP 数据库，底下有一套 TP 和 AP 引擎，至于数据是否是一套和两套，用户则并不需要关心，这其中的代表是 PingCAP 的 TiDB 以及 Google 的 AlloyDB。另一种思路还是让数据在各自的系统（the best of the breed），但是尽可能优化数据之间的流转，亚马逊云科技目前是后一种思路的代表。前一种思路具备架构先进性，而后一种则更为务实。

说完数仓这块，我们再介绍两个在线数据库方面的新发布。

RDS 蓝绿发布

针对数据库变更场景的一个实用功能，现场在介绍到这个功能时，底下爆发出了热烈的欢呼。今年不少数据库都开始投入到开发工作流上，像 PlanetScale、Neon，而 RDS 也终于在推出13年后，开始在这块有所动作。针对 Schema Changes 的场景虽然和我们的 Bytebase 有重合，但行业里有更多公司提供这类场景的解决方案，是一个好事情，能让更多人意识到直接连上数据库做 schema 变更是不 OK 的。当然 RDS 做这套方案还有一个好处，就是它可以多卖一倍的 RDS 实例，而 RDS 本身的 margin 已经很高了。

Trusted Language Extensions for

PostgreSQL

据笔者了解，亚马逊云科技是所有公有云里，PostgreSQL 内核开发经验储备最丰富的厂商。这次他们就给社区带来了一套开发 Extension 的新框架 TLE。出于安全和稳定性考虑，本来云上的 PostgreSQL 实例只能装亚马逊云科技指定的 Extension，如果业务团队有自己的业务需求，要写新的 Extension 就没有办法了。这就是 TLE 希望解决的问题，TLE 提供了一些 hook 点，在保证安全和稳定性的前提下，可以让开发团队在这套框架里自己开发插件，然后再由 DBA 帮忙安装到实例上去。TLE 本身也是开源的 https://github.com/aws/pg_tle，项目还处于早期，目前只开放了用于密码检查的一个 hook。

这也算是亚马逊云科技回馈给开源社区的一点工作，而近10年来，整个亚马逊云科技数据产品线和开源商业公司们之间发生了不少故事，我们就接着讲一下他们之前的关系演进。

亚马逊云科技

和开源商业公司的博弈

目前比较成功的开源商业公司，大多数都集中在数据产品线。这些公司合在一起的体量也有资格和亚马逊云科技进行博弈，而亚马逊云科技和这些开源商业公司的关系演进可以用 Tuckman 团队发展模型来概括：

模式探索的组建期

第一次亚马逊云科技和开源商业公司的交手是围绕在 Hadoop 生态上，当时整个业界也还在探索开源商业模式，比如到底是提供公有云服务还是做私有化部署。亚马逊云科技因为本身就只有公有云，所以推出了 EMR （Elastic MapReduce），而 EMR 则给 Amazon EC2 带来了第一根增长曲线。MapReduce 简单粗暴的计算模型，随便跑一个任务就掀起几十上百个 EC2 实例，后来 Hive 提供了 SQL 查询能力，又进一步扩大了受众面。

Hadoop 本身是一个平价版的 MapReduce 实现，而恰恰是这个不那么高效的实现，却给 Amazon EC2 带来了最好的场景。

无论是有意还是无意，总之在开源商业化方兴未艾之时，亚马逊云科技利用别人研发的开源软件在商业上取得了巨大的成功。

四面楚歌的震荡期

Hadoop之后，又涌现了一批优秀的开源数据产品，以及基于这些产品成立的商业公司。而因为一开始大家都采用了开放的（permissive）开源证书，比如 Apache、MIT，这些协议规定比较宽松，大的云厂商都可以直接使用，再集成上自身平台上的其他服务，很快就能推出一个非常有竞争力的发行版。这使得那些开源商业公司坐不住了，因为毕竟绝大多数开源产品的研发工作是由他们完成的，而其他公司却能直接使用，并且还能加上自身平台优势和这些开源商业公司直接竞争。这其中最激烈的要数 Elastic 改协议事件「Amazon: NOT OK -why we have to change Elasticlicensing」，因为部分协议对使用要求过于开放，商业利益限制不够明确，在那段时间，开源项目也纷纷修改证书，以不断修正公有云厂商的和自己的这种直接竞争。

亚马逊云科技和开源商业公司存在一定的竞争是行业发展的必然。大家发现开源产品，尤其是数据域的开源产品，靠产品 +Cloud 而不是走 Redhat 的服务模式也能产生巨大的商业价值，自然就一拥而上。开源社区已有的规则无法适应新的开源商业模式，双方也只能互相试探，尽可能占据道德制高点，给自己多争取点地盘。毕竟像 PostgreSQL 这样纯社区运营的开源项目，大家不就处得很好么。

Marketplace 支撑的稳定期

所幸近两年双方的对立开始缓和。开源商业公司本身也是云厂商的用户，他们自己的服务要跑在云厂商提供的 VM、k8s 这些服务上面，他们也要和云厂商的服务做集成，以提供更具竞争力的产品，他们也需要亚马逊云科技这样的分发采购渠道，提高他们的商业效率。而对于云厂商来说，首先市场也并不是只有一家服务商，同时云市场的增长空间依然巨大，所以也没有必要现在选择零和博弈。而在有合作基础的情况下，Marketplace 给双方提供了一个合作的平台，从亚马逊云科技的 Marketplace 可以看到，第三方服务还排在它自家服务的前面。

求同存异的成效期？

今年 re:Invent 举办时，MongoDB 发了一篇热情洋溢的文章，回顾了和亚马逊云科技过去十年的合作。虽然这篇文章和作者 Matt Asay 本人经历有关，他之前先在 Mongo，后去了亚马逊云科技，这次又回到 Mongo，但在官博上写一篇这样的文章还是挺意外的。只能说像 Mongo 这样的开源商业公司和亚马逊云科技这样的云平台的关系是微妙的，但看起来大家逐渐找到了求同存异的方法（像雇佣 Matt 这样两边都有人情的人也绝对是好招）。

有人觉得掺杂商业元素的开源就不纯粹了。但你情愿自己依赖的开源软件是个人爱好者躲在小黑屋里，用爱发电，利用业余时间维护的产品？还是有明确的商业模式，有全职团队维护的产品？

以商业为目的的开源是否也是另一种的纯粹呢？

未来展望

随着这次 DataZone 的推出，亚马逊云科技数据产品矩阵补上了最后一块缺失的拼图，而接下来我还有两大期待：

面向终局的 Zero ETL

re:Invent 上亚马逊云科技已经表达了会往 Zero ETL 的方向走，不过这次推出的 Zero ETL 相关功能，底层还是要在不同数据存储系统间做转移。另一边我们也可以看到，亚马逊云科技的 RDBMS 和 NoSQL 都已经迭代了一次（RDS -> Aurora，SimpleDB ->DynamoDB），而同为三剑客之一的 OLTP 数仓 Redshift 大体还是10年前的样子（这个还不算上它的前身，从 2006 年开始的 ParAccel）。数据湖的数据是放在 S3 上的，而 AlloyDB 已经把基于类 S3 存储的 OLAP/OLTP 混合引擎给实现了。所以我在猜想亚马逊云科技的下一个大招是否会推出一个基于 S3，集合 TP、AP 和 Lake 的全新数据库，名字嘛，可以就叫 ALT=A（nalytical）+L（ake）+T（ransactional）。

更成熟的 Marketplace 和生态合作

除了开幕 Keynote 外，亚马逊云科技首席执行官 Adam Selipsky 唯一还参与的就是 Partner 的 Keynote，从这点也可以看出亚马逊云科技对于生态合作伙伴的重视。而 Partner 中的 Marketplace 板块则是让亚马逊云科技从提供单纯的技术赋能，延伸到商业赋能的核心阵地。Marketplace 使得亚马逊云科技和开源商业公司之间，可以在技术产品层面保持竞争，但在商业层面实现共赢。当然这着实考验平台的格局、操盘者的智慧以及合作方之间化学反应的运气。

接下来的故事

从一个简单的文件存储服务 S3 到这次 re:Invent 推出的一站式数据资产管理平台 DataZone，亚马逊云科技花了16多年的时间讲完了一个数据的故事。当年 S3 的创立者想必也没有预见到，本来只是用于存放文件的云服务，催生了云数仓，数据湖这些新的品类，还很有可能成为下一代数据库的基石。

而在技术之上，如今的亚马逊云科技更肩负着平台的责任。这次 Adam keynote 上选择的 Guest Speakers，一个是探索绿色能源的 Engie，一个是探索太空的西门子，还有一个是探索分子靶向治疗癌症的 Lyell。相较于 re:Invent 2019 请 Vanguard 来讲金融系统的上云，亚马逊云科技这次想传达给观众的，是它的平台正在承载拓展文明边界的事业。

而一个能够平衡眼前商业利益和长期理想主义的平台才能引导整个行业走向远方，让我们一起跟随亚马逊云科技，进入它下一个数据的故事。

撰写本文的素材主要来自：

亚马逊云科技 re:Invent 2022 - Keynote with Adam Selipsky -
https://www.youtube.com/watch?v=Xus8C2s5K9A
亚马逊云科技 re:Invent 2022 - Keynote with Swami Sivasubramanian -
https://www.youtube.com/watch?v=TL2HtX-FmiQ
亚马逊云科技 re:Invent 2022 - Keynote with Dr. Werner Vogels -
https://www.youtube.com/watch?v=RfvL_423a-I
亚马逊云科技 re:Invent 2022 - Keynote with Ruba Borno -
https://www.youtube.com/watch?v=jT92JD6KIH8
亚马逊云科技 re:Invent 2022 - Unlock the value of your data with Amazon analytics -
https://www.youtube.com/watch?v=A6DG_Afe07I
亚马逊云科技 re:Invent 2022 - Your data: How you need it, where you need it, when you need it -
https://www.youtube.com/watch?v=AJlsAin7_rQ
A History of Amazon Web Services -
https://www.awsgeek.com/AWS-History

同时笔者也参考了如下 re:Invent 相关的公众号文章：

2019亚马逊云科技 re:Invent 之旅：
https://mp.weixin.qq.com/s/MnqTHEZ_adqAB0hAwf-_MQ
亚马逊云科技 re:Invent 2022讲了什么：
https://mp.weixin.qq.com/s/WL2HlmlHhQDE2ZrSEL7SuA
亚马逊云科技 re:Invent 2022的一些发布：
https://mp.weixin.qq.com/s/WlZLirzZ0mFDQ1lyypxcsA
飞总带大家解读亚马逊云科技 re:Invent 2022大数据相关的发布：
https://mp.weixin.qq.com/s/7YWHIzY-IRYXJgfhzJYSCw
Amazon CodeCatalyst 走马观花：
https://mp.weixin.qq.com/s/1aIQmC0-s9s8ks8u6zUQTg

最后也感谢 Fei Xue，Monica Xie 对本文细致的审阅。

2022亚马逊云科技 re:Invent 全球大会

中国行现已开启！

点击下方图片即刻注册

听说，点完下面4个按钮

就不会碰到bug了！

【人工智能之大模型】思维链（Chain of Thought，CoT）在大模型中是如何引导模型逐步推理的？ 985小水博一枚呀人工智能 pytorch 语言模型大模型
【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？文章目录【人工智能之大模型】思维链（ChainofThought，CoT）在大模型中是如何引导模型逐步推理的？前言思维链（CoT）在大模型中的应用示例示例任务：应用思维链提示：模型输出：分析：思维
雪豹速清：智能清理，释放手机空间非凡ghost 智能手机软件需求 android 生活
在智能手机的日常使用中，随着时间的推移，手机内存往往会逐渐被各种垃圾文件占据，导致手机运行缓慢、存储空间不足。为了解决这一问题，南宁酷比网络科技有限公司推出了雪豹速清这款功能强大的手机清理软件。它通过智能筛选垃圾文件、保护重要数据、查找卸载残留等功能，为用户提供了一个高效、安全的手机清理解决方案，让手机内存空间更加清洁，运行更加流畅。雪豹速清为用户带来轻松的文件管理功能，你可以对手机的内存进行清理
什么是智能体（Agent）？用什么都重名大模型相关人工智能 Agent 大模型
目录前言一、大语言模型1.什么是大语言模型？2.应用领域二、什么是Agent三、Agent核心特点1.感知能力2.规划能力3.行动能力4.记忆能力总结前言目前智能体市场正处于快速发展阶段，呈现出市场规模增长迅猛、应用领域广泛、竞争格局多元化等特点。基于此，让我们一起来学习一下何为智能体。一、大语言模型1.什么是大语言模型？大语言模型是一种采用大量数据进行训练的人工智能模型，主要用于理解和生成自然语
Python深度学习实践：建立端到端的自动驾驶系统 AI天才研究院 Agentic AI 实战计算 AI人工智能与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
Python深度学习实践：建立端到端的自动驾驶系统1.背景介绍自动驾驶系统是当今科技领域最具挑战性和前景的应用之一。它融合了计算机视觉、深度学习、规划与控制等多个领域的先进技术,旨在实现车辆的自主感知、决策和操控。随着人工智能技术的不断发展,越来越多的公司和研究机构投入了大量资源来开发自动驾驶系统。Python作为一种高效、易学且开源的编程语言,在这一领域扮演着重要角色。本文将探讨如何利用Pyth
AIGC空间智能在服装设计领域的颠覆性变革 AI天才研究院 ChatGPT 实战 ChatGPT AI大模型应用入门实战与进阶 AIGC ai
AIGC空间智能在服装设计领域的颠覆性变革关键词：AIGC、空间智能、服装设计、数字孪生、生成式AI、3D人体建模、智能设计系统摘要：本文深入探讨AIGC（人工智能生成内容）与空间智能技术在服装设计领域的融合创新，揭示其如何通过三维人体建模、场景模拟、智能生成算法重构传统设计流程。从技术原理层解析空间智能的核心模块，结合生成对抗网络（GAN）、Transformer模型等前沿算法，展示从创意生成到
Docker快速部署Hive服务长路 ㅤ 运维 Docker配置 Hive环境大数据远程调试
文章目录前言Docker快速配置hive环境资料获取前言博主介绍：✌目前全网粉丝4W+，csdn博客专家、Java领域优质创作者，博客之星、阿里云平台优质作者、专注于Java后端技术领域。涵盖技术内容：Java后端、大数据、算法、分布式微服务、中间件、前端、运维等。博主所有博客文件目录索引：博客目录索引(持续更新)CSDN搜索：长路视频平台：b站-Coder长路Docker快速配置hive环境Ap
从UI设计到数字孪生实战：构建智慧教育的个性化学习平台
hello宝子们...我们是艾斯视觉擅长ui设计、前端开发、数字孪生、大数据、三维建模、三维动画10年+经验!希望我的分享能帮助到您!如需帮助可以评论关注私信我们一起探讨!致敬感谢感恩!一、引言：数字孪生重构智慧教育的技术范式在教育数字化转型加速推进的背景下，传统在线教育正面临"个性化不足、学习体验单一、效果评估滞后"的瓶颈。教育部数据显示，采用数字孪生技术的智慧教育平台，学生学习效率平均提升35
编程效率的飞跃、创新驱动的测试与行业应用的新篇章
###引言在人工智能技术飞速发展的今天，AI工具、大模型及行业应用正在深刻改变着开发者的工作模式与各领域的发展格局。从智能编码助手到自动化测试平台，从大模型落地实践到垂直行业解决方案，AI正成为提升效率、驱动创新的核心引擎。本文将围绕“AI技术如何重塑你的工作与行业”这一主题，探讨AI工具、AI编程、AI测试以及AI行业应用和大模型落地等方面的影响。 ###一、AI工具重塑开发工作 #
每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户_用户每日登陆脉脉会访问app不同的模块,现有两个表表1记录了每日脉脉活跃用户的ui(1)
文章目录每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户每日语录第25题：1.需求列表1.初级题:每日活跃用户思路分析(1)创建表(2)思路答案获取加技术群讨论附表文末SQL小技巧后记每天一道大厂SQL题【Day25】脉脉真题实战(一)每日活跃用户大家好，我是Maynor。相信大家和我一样，都有一个大厂梦，作为一名资深大数据选手，深知SQL重要性，接下来我准备用100天时间，基于大
中电金信：十问高质量数据集：金融大模型价值重塑有“据”可循
2025年，随着大模型在金融领域的深度应用，高质量数据集已逐渐成为决定模型性能的“基石”。面对数据要素价值释放的关键机遇期，国家政策不断深入推进：2月，国务院国资委启动“AI+”专项行动，着力攻克数据难题；5月，数字中国峰会发布了首批30项央企AI高质量数据集成果；6月，在央国企金融领域人工智能高质量数据集工作推进会上，14家企业共同签署了“央国企金融数据产业共同体倡议书”，旨在推动人工智能与数据
毕业论文 | 人工智能侵权责任法律问题研究——以无人驾驶汽车为例北斗猿毕业论文设计人工智能无人驾驶法律侵权责任法民法典
===========================================github：https://github.com/MichaelBeechanCSDN：https://blog.csdn.net/u011344545===========================================人工智能侵权责任法律问题研究——以无人驾驶汽车为例目录摘要一、绪论(一)课
人工智能发展简史——未来是属于AI人工智能的。 AI天才研究院 ChatGPT AI人工智能与大数据人工智能
目录人工智能发展简史第一章：起步期-20世纪50年代及以前1.1计算机象棋博弈（Programmingacomputerforplayingchess）1.2图灵测试（TuringTest）1.3达特茅斯学院人工智能夏季研讨会（DartmouthSummerResearchConferenceonArtificialIntelligence）1.4感知机（Perceptrons）第二章：第一次浪潮
算法化资本——智能投顾技术重构金融生态的深度解析田园Coder 人工智能科普人工智能科普
金融市场的数字化进程正经历着本质性跃迁。当传统交易大厅的开放式喊价被服务器集群的低频嗡鸣取代，当投资决策从人类直觉转向概率矩阵计算，一场由人工智能驱动的资本范式革命已悄然降临。智能投顾作为这场变革的核心载体，其技术架构不仅重塑财富管理的运作逻辑，更在认知层面挑战着金融市场的存在根基。理解这场变革的深度与广度，需要穿透技术表象，审视算法与资本结合引发的复杂生态嬗变。智能投顾系统的技术支柱建立于三重认
打破AI落地困局：易路iBuilder的“垂直深耕+开箱即用”破壁之道 weixin_54980836 人工智能大数据
中国企业的数字化转型已步入深水区，人力资源管理作为企业核心竞争力的关键引擎，正经历从“信息化”向“智能化”的范式跃迁。在这场以AI为驱动的组织效能革命中，易路人力资源科技凭借前瞻性的“软件+AI+服务”战略，推出国内首个HR智能体平台iBuilder，不仅重新定义了人力资源管理的技术边界，更引领着从“碳基管理”向“硅基协作”的产业升级。本文将深度解析中国人力资源数字化现状、AI技术应用进程、市场成
AI“大航海”时代：企业人力资源的AI-HR实践与效能提升策略
在数字化浪潮的推动下，人工智能（AI）正以前所未有的速度渗透各行各业，人力资源管理（HR）领域也不例外。AI技术的引入与应用落地，不仅提升HR管理效率，更在深层次上带来人力资源运作模式的变革。什么是AI-HR所谓AI-HR，是指将人工智能技术应用于人力资源管理，并通过机器学习、自然语言处理、数据挖掘等技术，优化招聘、培训、绩效评估、员工关系等人力资源各个业务模块。近年来，随着AI技术的成熟和普及，
生成式人工智能认证（GAI认证）含金量怎么样？技能咖 GAI认证生成式人工智能认证人工智能
当生成式人工智能（GenerativeAI）的浪潮以摧枯拉朽之势重塑职业版图时，一个尖锐的问题正悬在无数人的心头：在技术迭代比眨眼更快的时代，如何证明自己具备驾驭AI的核心能力？这场认知革命的背后，一张认证证书的价值早已超越了纸面——它既是个人能力的“信用背书”，也是企业筛选人才的“技术密码”。而生成式人工智能认证（GAI认证）的诞生，恰似一把打开未来之门的密钥，其含金量究竟几何？答案藏在三个维度
SpringBoot多数据源动态切换方案：AbstractRoutingDataSource详解 fanxbl957 Web spring boot 后端 java
博主介绍：Java、Python、js全栈开发“多面手”，精通多种编程语言和技术，痴迷于人工智能领域。秉持着对技术的热爱与执着，持续探索创新，愿在此分享交流和学习，与大家共进步。DeepSeek-行业融合之万象视界(附实战案例详解100+)全栈开发环境搭建运行攻略：多语言一站式指南(环境搭建+运行+调试+发布+保姆级详解)感兴趣的可以先收藏起来，希望帮助更多的人SpringBoot多数据源动态切换
Spring Boot 项目启动时按需初始化加载数据我叫晨曦啊 spring boot spring boot java 后端
1、新建类，类上添加注解@Component，该类用于在项目启动时处理数据加载任务；2、该类实现ApplicationRunner接口，并重写run方法；3、在重写的run方法里处理数据加载任务；注意：有定时加载数据需求的话，添加定时任务即可；一次性加载大数据量时可能内存溢出；同一个项目中，可以定义多个ApplicationRunner的实现类；存在多个ApplicationRunner的实现类时
云原生--微服务、CICD、SaaS、PaaS、IaaS 青秋. 云原生 docker 云原生微服务 kubernetes serverless service_mesh ci/cd
往期推荐浅学React和JSX-CSDN博客一文搞懂大数据流式计算引擎Flink【万字详解，史上最全】-CSDN博客一文入门大数据准流式计算引擎Spark【万字详解，全网最新】_大数据spark-CSDN博客目录1.云原生概念和特点2.常见云模式3.云对外提供服务的架构模式3.1IaaS（Infrastructure-as-a-Service）3.2PaaS（Platform-as-a-Servi
深入解读MaaS技术架构：从模型服务到智能部署的全流程分析 Cc不爱吃洋葱架构人工智能大语言模型大模型智能部署 MaaS技术架构 LLM
随着人工智能（AI）的迅速发展，MaaS（ModelasaService，模型即服务）技术架构应运而生。它通过将复杂的AI模型封装为标准化服务，降低了模型的开发和部署门槛，帮助企业快速实现业务场景的智能化升级。本文将深入解析MaaS技术架构，详细阐述其各个组成部分以及如何在实际应用中高效发挥其功能。一、使用方层：从应用接入到业务赋能MaaS技术架构的顶层是使用方层，它主要面向第三方应用，是企业与M
人工智能LLM | 基础配置 | 通过环境变量配置API-KEY 一文通教程 H-大叔人工智能大模型实战与教程人工智能
在实战开发大语言模型的过程中，经常会遇到各种API-KEY的配置问题，例如GPTOpenAIKEY的配置，而且目前大部分都要求将其配置在环境变量中，下面将会讲解如何在Linux、macOS、Windows中配置，本文一文通教程。您可以使用配置环境变量的方法，避免在调用各种SDK时显式地配置API-KEY，从而降低泄漏风险。环境变量是操作系统中用于存储有关系统环境的信息的变量。您可以通过环境变量来配
【人工智能】ChatGPT、DeepSeek-R1、DeepSeek-V3 辨析 G皮T #大语言模型人工智能 LLM 大语言模型 chatgpt deepseek DeepSeek-R1 DeepSeek-V3
ChatGPT、DeepSeek-R1、DeepSeek-V3辨析1.ChatGPT对比DeepSeek1.1技术相似点1.2主要差异1.3关键区别1.4如何选择1.5总结2.DeepSeek-R1对比DeepSeek-V32.1DeepSeek-R12.2DeepSeek-V32.3核心区别总结2.4如何选择3.R1和V3有什么含义3.1DeepSeekR1的"R"3.2DeepSeekV3的"
微算法科技（NASDAQ: MLGO）探索Grover量子搜索算法，利用量子叠加和干涉原理，实现在无序数据库中快速定位目标信息的效果。 MicroTech2025 算法科技数据库
在信息爆炸的时代，数据的海量化带来了前所未有的挑战，如何从庞大的数据库中迅速找到所需信息，成为信息技术领域亟待解决的问题。传统的搜索算法在面对大规模数据时，效率逐渐下降，难以满足现代社会的需求。量子计算的出现为解决这一问题带来了新的思路和方法，Grover量子搜索算法作为量子计算领域的重要算法之一，在快速搜索目标信息方面具有巨大潜力。Grover量子搜索算法是一种基于量子力学原理的搜索算法，它利用
在学校研究学习的偏算法，秋招投递开发岗位还有希望吗程序员
前言Thelasttime,Ihavelearned这是星球同学，在周五晚上答疑聊天的时候对我的提问：如果简历上的项目偏算法，但是自学了一些操作系统和计网的知识，秋招的时候投递偏开发的岗位有希望吗？简历上是否也要加上相关项目？估计也是很多朋友的疑问，毕竟很多同学读研，有些老师疯狂push，要成果，发论文。要想尽快发论文，那只能“研究”人工智能、算法的一些东西了。但是众所周知，算法要求很高，不仅要求
Apache SeaTunnel × Hive 深度集成指南：原理、配置与实践数据库
在大数据处理的复杂生态中，数据的高效流转与整合是实现数据价值的关键。ApacheSeaTunnel作为一款高性能、分布式、易扩展的数据集成框架，能够快速实现海量数据的实时采集、转换和加载；而ApacheHive作为经典的数据仓库工具，为结构化数据的存储、查询和分析提供了坚实的基础。将ApacheSeaTunnel与Hive进行集成，能够充分发挥两者的优势，构建起高效的数据处理链路，满足企业多样化的
【AI论文】基于图像思维的多模态推理：理论基础、方法及未来前沿东临碣石82 人工智能
摘要：近期，文本思维链（Chain-of-Thought，CoT）显著推动了多模态推理的进展。在这一范式下，模型在语言层面进行推理。然而，这种以文本为中心的方法将视觉信息视为静态的初始语境，从而在丰富的感知数据与离散的符号思维之间造成了根本性的“语义鸿沟”。人类认知往往超越语言的局限，将视觉作为动态的心理草图板加以利用。如今，人工智能领域也正经历着类似的演变，标志着从仅能对图像进行思考的模型向真正
DeepSeek 帮助自己的工作
引言简述人工智能助手在职场中的普及趋势DeepSeek作为智能创作助手的核心功能概述DeepSeek的核心能力信息检索与整合：基于用户意图精准搜索并生成答案多场景应用：技术文档撰写、数据分析、代码生成等交互优化：遵循用户指定的格式与内容规范职场应用场景与实操案例技术文档撰写自动生成API文档框架根据需求补充技术细节示例代码块与公式的规范化输出数据分析支持快速检索行业数据并生成可视化建议数学建模中的
我要做计划APP：萌趣打卡，高效管理时间非凡ghost 软件需求 android 智能手机
在快节奏的现代生活中，时间管理变得尤为重要。无论是学生、上班族还是自由职业者，都需要一个高效且实用的工具来帮助自己合理安排时间、完成任务。重庆赋比兴科技有限公司推出的《我要做计划APP》正是这样一款集时间管理与日程提醒于一体的应用程序。它不仅功能强大，还拥有超级可爱的界面，让用户在打卡的同时享受萌趣的风格，让时间管理变得更加轻松有趣。软件特色【好用的四象限】四象限时间管理太复杂？不要担心，0学习成
大数据平台之ranger与ldap集成，同步用户和组无级程序员大数据大数据 hadoop
ranger可以通过ranger-usersync与linux系统同步用户，但是，还有个问题，就是我们的hiveserver一般是集群，可以是多台服务器，那么我们空间同步哪一台呢，而且如果用户多了，如何管理用户登录密码呢，所以，还是要用ldap比较合理。首先是安装openldap:yum-yinstallopenldapcompat-openldapopenldap-clientsopenldap
时序数据库：高效处理时间序列数据的核心技术时序数据说时序数据库数据库开源物联网 iotdb
时序数据库概述时序数据库（TimeSeriesDatabase，TSDB）是一种专门为存储、处理和查询时间序列数据而优化的数据库系统。随着物联网、金融科技、工业互联网等领域的快速发展，时序数据呈现出爆炸式增长，传统的关系型数据库在处理这类数据时面临诸多挑战，时序数据库应运而生并成为关键技术解决方案。时序数据的特点时序数据具有几个显著特征，这些特征直接影响了时序数据库的设计理念：时间属性：每条记录都
java类加载顺序 3213213333332132 java
package com.demo; /** * @Description 类加载顺序 * @author FuJianyong * 2015-2-6上午11:21:37 */ public class ClassLoaderSequence { String s1 = "成员属性"; static String s2 = "
Hibernate与mybitas的比较 BlueSkator sql Hibernate 框架 ibatis orm
第一章 Hibernate与MyBatis Hibernate 是当前最流行的O/R mapping框架，它出身于sf.net，现在已经成为Jboss的一部分。 Mybatis 是另外一种优秀的O/R mapping框架。目前属于apache的一个子项目。 MyBatis 参考资料官网：http:
php多维数组排序以及实际工作中的应用 dcj3sjt126com PHP usort uasort
自定义排序函数返回false或负数意味着第一个参数应该排在第二个参数的前面, 正数或true反之, 0相等usort不保存键名uasort 键名会保存下来uksort 排序是对键名进行的 <!doctype html> <html lang="en"> <head> <meta charset="utf-8&q
DOM改变字体大小周华华前端
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
c3p0的配置 g21121 c3p0
c3p0是一个开源的JDBC连接池，它实现了数据源和JNDI绑定，支持JDBC3规范和JDBC2的标准扩展。c3p0的下载地址是：http://sourceforge.net/projects/c3p0/这里可以下载到c3p0最新版本。以在spring中配置dataSource为例：  <bean name="prope
Java获取工程路径的几种方法 510888780 java
第一种： File f = new File(this.getClass().getResource("/").getPath()); System.out.println(f); 结果: C:\Documents%20and%20Settings\Administrator\workspace\projectName\bin 获取当前类的所在工程路径; 如果不加“
在类Unix系统下实现SSH免密码登录服务器 Harry642 免密 ssh
1.客户机 (1)执行ssh-keygen -t rsa -C "[email protected]"生成公钥，xxx为自定义大email地址 (2)执行scp ~/.ssh/id_rsa.pub root@xxxxxxxxx:/tmp将公钥拷贝到服务器上，xxx为服务器地址 (3)执行cat
Java新手入门的30个基本概念一 aijuans java java 入门新手
在我们学习Java的过程中,掌握其中的基本概念对我们的学习无论是J2SE,J2EE,J2ME都是很重要的,J2SE是Java的基础,所以有必要对其中的基本概念做以归纳,以便大家在以后的学习过程中更好的理解java的精髓,在此我总结了30条基本的概念。　　Java概述:　　目前Java主要应用于中间件的开发(middleware)---处理客户机于服务器之间的通信技术,早期的实践证明,Java不适合
Memcached for windows 简单介绍 antlove java Web windows cache memcached
1. 安装memcached server a. 下载memcached-1.2.6-win32-bin.zip b. 解压缩，dos 窗口切换到 memcached.exe所在目录，运行memcached.exe -d install c.启动memcached Server,直接在dos窗口键入 net start "memcached Server&quo
数据库对象的视图和索引百合不是茶索引 oeacle数据库视图
视图视图是从一个表或视图导出的表，也可以是从多个表或视图导出的表。视图是一个虚表，数据库不对视图所对应的数据进行实际存储，只存储视图的定义，对视图的数据进行操作时,只能将字段定义为视图,不能将具体的数据定义为视图为什么oracle需要视图; &
Mockito(一) --入门篇 bijian1013 持续集成 mockito 单元测试
Mockito是一个针对Java的mocking框架，它与EasyMock和jMock很相似，但是通过在执行后校验什么已经被调用，它消除了对期望行为（expectations）的需要。其它的mocking库需要你在执行前记录期望行为（expectations），而这导致了丑陋的初始化代码。 &nb
精通Oracle10编程SQL(5)SQL函数 bijian1013 oracle 数据库 plsql
/* * SQL函数 */ --数字函数 --ABS(n):返回数字n的绝对值 declare v_abs number(6,2); begin v_abs:=abs(&no); dbms_output.put_line('绝对值：'||v_abs); end; --ACOS(n):返回数字n的反余弦值，输入值的范围是-1~1，输出值的单位为弧度
【Log4j一】Log4j总体介绍 bit1129 log4j
Log4j组件：Logger、Appender、Layout Log4j核心包含三个组件：logger、appender和layout。这三个组件协作提供日志功能：日志的输出目标日志的输出格式日志的输出级别(是否抑制日志的输出) logger继承特性 A logger is said to be an ancestor of anothe
Java IO笔记白糖_ java
public static void main(String[] args) throws IOException { //输入流 InputStream in = Test.class.getResourceAsStream("/test"); InputStreamReader isr = new InputStreamReader(in); Bu
Docker 监控 ronin47 docker监控
目前项目内部署了docker，于是涉及到关于监控的事情，参考一些经典实例以及一些自己的想法，总结一下思路。 1、关于监控的内容监控宿主机本身监控宿主机本身还是比较简单的，同其他服务器监控类似，对cpu、network、io、disk等做通用的检查，这里不再细说。额外的，因为是docker的
java-顺时针打印图形 bylijinnan java
一个画图程序要求打印出： 1.int i=5; 2.1 2 3 4 5 3.16 17 18 19 6 4.15 24 25 20 7 5.14 23 22 21 8 6.13 12 11 10 9 7. 8.int i=6 9.1 2 3 4 5 6 10.20 21 22 23 24 7 11.19
关于iReport汉化版强制使用英文的配置方法 Kai_Ge iReport汉化英文版
对于那些具有强迫症的工程师来说，软件汉化固然好用，但是汉化不完整却极为头疼，本方法针对iReport汉化不完整的情况，强制使用英文版，方法如下：在 iReport 安装路径下的 etc/ireport.conf 里增加红色部分启动参数，即可变为英文版。 # ${HOME} will be replaced by user home directory accordin
[并行计算]论宇宙的可计算性 comsci 并行计算
现在我们知道,一个涡旋系统具有并行计算能力.按照自然运动理论,这个系统也同时具有存储能力,同时具备计算和存储能力的系统,在某种条件下一般都会产生意识...... 那么,这种概念让我们推论出一个结论 &nb
用OpenGL实现无限循环的coverflow dai_lm android coverflow
网上找了很久，都是用Gallery实现的，效果不是很满意，结果发现这个用OpenGL实现的，稍微修改了一下源码，实现了无限循环功能源码地址： https://github.com/jackfengji/glcoverflow public class CoverFlowOpenGL extends GLSurfaceView implements GLSurfaceV
JAVA数据计算的几个解决方案1 datamachine java Hibernate 计算
老大丢过来的软件跑了10天，摸到点门道，正好跟以前攒的私房有关联，整理存档。 -----------------------------华丽的分割线------------------------------------- 数据计算层是指介于数据存储和应用程序之间，负责计算数据存储层的数据，并将计算结果返回应用程序的层次。J &nbs
简单的用户授权系统,利用给user表添加一个字段标识管理员的方式 dcj3sjt126com yii
怎么创建一个简单的(非 RBAC)用户授权系统通过查看论坛，我发现这是一个常见的问题，所以我决定写这篇文章。本文只包括授权系统.假设你已经知道怎么创建身份验证系统(登录)。数据库首先在 user 表创建一个新的字段(integer 类型),字段名 'accessLevel',它定义了用户的访问权限扩展 CWebUser 类在配置文件(一般为 protecte
未选之路 dcj3sjt126com 诗
作者:罗伯特*费罗斯特黄色的树林里分出两条路, 可惜我不能同时去涉足, 我在那路口久久伫立, 我向着一条路极目望去, 直到它消失在丛林深处. 但我却选了另外一条路, 它荒草萋萋,十分幽寂; 显得更诱人,更美丽, 虽然在这两条小路上, 都很少留下旅人的足迹. 那天清晨落叶满地, 两条路都未见脚印痕迹. 呵,留下一条路等改日再
Java处理15位身份证变18位蕃薯耀 18位身份证变15位 15位身份证变18位身份证转换
15位身份证变18位，18位身份证变15位 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 201
SpringMVC4零配置--应用上下文配置【AppConfig】 hanqunfeng springmvc4
从spring3.0开始，Spring将JavaConfig整合到核心模块，普通的POJO只需要标注@Configuration注解，就可以成为spring配置类，并通过在方法上标注@Bean注解的方式注入bean。 Xml配置和Java类配置对比如下： applicationContext-AppConfig.xml <!-- 激活自动代理功能参看：
Android中webview跟JAVASCRIPT中的交互 jackyrong JavaScript html android 脚本
在android的应用程序中,可以直接调用webview中的javascript代码,而webview中的javascript代码,也可以去调用ANDROID应用程序(也就是JAVA部分的代码).下面举例说明之: 1 JAVASCRIPT脚本调用android程序要在webview中,调用addJavascriptInterface(OBJ,int
8个最佳Web开发资源推荐 lampcy 编程 Web 程序员
Web开发对程序员来说是一项较为复杂的工作，程序员需要快速地满足用户需求。如今很多的在线资源可以给程序员提供帮助，比如指导手册、在线课程和一些参考资料，而且这些资源基本都是免费和适合初学者的。无论你是需要选择一门新的编程语言，或是了解最新的标准，还是需要从其他地方找到一些灵感，我们这里为你整理了一些很好的Web开发资源，帮助你更成功地进行Web开发。这里列出10个最佳Web开发资源，它们都是受
架构师之面试------jdk的hashMap实现 nannan408 HashMap
1.前言。如题。 2.详述。 (1)hashMap算法就是数组链表。数组存放的元素是键值对。jdk通过移位算法（其实也就是简单的加乘算法），如下代码来生成数组下标(生成后indexFor一下就成下标了）。 static int hash(int h) { h ^= (h >>> 20) ^ (h >>>
html禁止清除input文本输入缓存 Rainbow702 html 缓存 input 输入框 change
多数浏览器默认会缓存input的值，只有使用ctl+F5强制刷新的才可以清除缓存记录。如果不想让浏览器缓存input的值，有2种方法：方法一：在不想使用缓存的input中添加 autocomplete="off"; <input type="text" autocomplete="off" n
POJO和JavaBean的区别和联系 tjmljw POJO java beans
POJO 和JavaBean是我们常见的两个关键字，一般容易混淆，POJO全称是Plain Ordinary Java Object / Pure Old Java Object，中文可以翻译成：普通Java类，具有一部分getter/setter方法的那种类就可以称作POJO，但是JavaBean则比 POJO复杂很多， Java Bean 是可复用的组件，对 Java Bean 并没有严格的规
java中单例的五种写法 liuxiaoling java 单例
/** * 单例模式的五种写法： * 1、懒汉 * 2、恶汉 * 3、静态内部类 * 4、枚举 * 5、双重校验锁 */ /** * 五、双重校验锁，在当前的内存模型中无效 */ class LockSingleton { private volatile static LockSingleton singleton; pri

从 S3 到 DataZone，亚马逊云科技用16年讲完一个数据的故事

你可能感兴趣的:(科技,人工智能,大数据)