亲爱的数据

大模型“搅局”，数据湖，数据仓库，湖仓选型会先淘汰谁？

事情总是这样：

压力初露端倪，暗自考虑改变。

压力高能爆表，立马做出改变。

我们从一家叫做Databricks的美国知名公司聊起。

这家Databricks公司很有创新基因。

其创始人阿里·戈西（Ali Ghodsi）作为“2022年福布斯全球亿万富豪榜”排名第1645位的瑞典富豪，不缺钱，也舍得为公司花钱。

他多次公开表示，不会考虑降低研发投入。

此前（距大模型问世还有几年时间），Databricks就具备一种很重要的能力，我们姑且称之为“二合一”的能力吧：

大数据能力，以及传统人工智能能力。

总称为：“Data+AI”的能力。

更准确地称为：“Data+AI”平台的能力。

传统AI平台的功能，Databricks也早有了。

毕竟，号称一站式商店。

以前，传统AI还可以被归类为“高级”数据分析服务，比如用于预测等场景。

大模型出现后，这样归类就不合时宜了。

大模型不仅仅是分析，人家高低是有智能的。

于是，如今对AI平台的基本要求“水涨船高”：能训练大模型。

而Databricks 公司这样一个Data+AI 平台横跨两界的三好学生优秀班干部，虽然早早具备“二合一”的能力，但也没有在其所辖“四海之内率土之滨”，长出一个生成式AI大模型的功能。

该有的都有呀，居然，眼睁睁看着自己落后了。

大模型需要多大的数据，讲一个训练时候的事实好了。

千亿参数的大模型一次微调，用时大约两个月，消费数据大约20个T。

这意味着，大模型问世之后，大数据“身价”变了，“富贵骄人”。

因为大模型能把大数据里面的价值用得更彻底了。

以前存了多久不要紧，

落了多少灰不要紧。

要紧的是，赶紧喂给大模型。

让大模型把这些尘封已久的知识都“学会”。

一朝变化生，百端头绪出。

轮到大模型给“二合一”平台出难题了。

第一，数据类型多了。

数据不同，模态不同，多种数据，多个模态，大模型向多模态演进。

虽说一般的多模型大模型，训练图文音三种数据；但是，美国大模型这把领先之后，诸君都很激进。手里有好牌，就连续出王炸。

2023年5月9号，

美国厂商Meta大模型ImageBind以视觉为核心，结合文本、声音、深度、热量（红外辐射）、运动（惯性传感器），覆盖6个模态。

无独有偶。

2023年5月26日下午，

国产“紫东太初”2.0全模态大模型发布，特色为可实现文本、图片、语音、视频、3D点云、传感信号等不同模态。

行文至此，不得不感慨，同一个5月份，仅仅从9号到26号，多模态急管繁弦的节奏感了。

第二，计算引擎多了。

按照贾扬清的说法，从技术的角度来看，数据和AI计算是分开的。

数据用数据平台，AI用AI的平台。

今天，无论数据平台，还是 AI 平台，都没法用自己的经验解决对方的问题。因为数据平台和AI平台，背后的技术是截然不同的。

以前的大数据计算引擎主要是支持结构化数据的计算。

不同计算引擎的优化方向（数据新鲜度、查询性能、成本）不同，开发语言、计算语义、存储系统亦不同，组装难度极大。

而AI需要自己的引擎。

一个计算引擎不够，在大数据系统产品时代，就出现这个问题了；

一类计算引擎不够，在传统人工智能时代，也出现这个问题了。

这下好了，多个计算引擎。

看你的Data+AI架构怎么支撑？

大模型时代，Data+AI架构问题恶化，肉眼可见。

第三，大模型迭代太快。

时而以周为单位，时而以天为单位，大模型主打一个“表演型人格”，玩的就是“高速演进”。

这么多新东西，看得人瑟瑟发抖，学得人点灯熬油。

第四，大模型的计算负载只会增多，不会减少。

人们可能倾向于认同：

在可预见的将来，大模型带来的AI负载会占据主导地位。

所以，会为“增多的计算”做准备。

以前的情况是，传统AI负载占比少。

比如，5%，能把AI当做单独的组件来处理。

现在地位今非昔比，

大模型AI计算负载占比由10%增长到80%。

性质变了。

这是一个新家伙对旧事物施加压力，逼迫其做出改变的故事。

DataBricks内心OS是：

家人们，谁懂啊？

大数据平台架构复杂，Data+AI平台架构很复杂。

大模型来了，Data+AI平台架构更复杂。

而重中之重在于，这类平台的架构水平决定了技艺的高度。

怎么解决？

现在没有一步到位的成熟解决方案，

我们试图回顾一下平台架构的历史，寻找启发。

大数据，依然站在大模型的背后。其技术也有年头了。

2023年是大数据技术发展的第 23 个年头（从2001年谷歌开始构建大数据平台做搜索业务算起）。

纯做大数据系统的那套架构，弄起来也非常复杂。

要么，互联网大厂，以开源为基础自建；

台词：“干就完了。”

要么，用公共云平台架构，买 PaaS 服务；

台词：“有钱还得会花，选型很费事。”

要么，外包了事。

台词是：“有钱买服务。虽然对技术栈，技术选型不敏感，但这不妨碍他们对稳定性要求很高。”

从平台技术架构的角度来观察，更能揭示本质。

因为“二合一”平台架构大致分成两部分，计算，存储。

AI还在高速迭代，Data+AI架构的迭代速度没有那么快。

那么我们真的需要一个强大且可扩展的架构。

计算部分就不重要了吗？

并不是，而是计算可以搬迁，加GPU、加CPU没有那么难。

但是数据存储之后不好搬移，参考数据中心间的长传带宽的昂贵。

所以存储理应更受重视。

于是乎，Data+AI平台绕不过“老三样”：

数据湖，数据仓库，湖仓。

观察它们，本质上是从存储的视角观察Data+AI平台。

其实，它们都不能算纯粹的单一产品，而且都包含了“存储架构”。

因为通常来说，这种“二合一”平台包括多个组件。

不同的组件组合会带来多种系统架构形态，让事情非常难办。

而计算机系统软件架构本质上是耐用品，

能谓之“好”的架构核心在于：

它能持续很久。如果每隔半年，或者一年就冒出一个新架构来，

那这个架构可能有大病。

所以，其迭代的时间轴刻度可能很长。

可以观察到，一开始，江湖里就有两派势力并行发展。

一派，数据仓库，已经发展了 40 多年，主流的计算范式就是二维关系表达。

于是，十几年以来，数据仓库都是以关系型计算的架构为主。

所以，它的架构迭代时间轴刻度可能是十年。

另一派，数据湖。

大数据缘起于数据湖上（2006年），

而数据湖的解决方案诞生于领先的技术公司，谷歌和雅虎。

数据湖派先行者是谷歌文件系统（Google File System，GFS），生来就是数据湖架构。

谷歌文件系统的一个开源版Hadoop Distributed File System也是如此。

数据湖派的共同之处是都有一个标准数据湖架构，上面是计算引擎，底下有一套标准存储（是一个文件系统，放什么都行），里面有统一的元数据。

数据湖派的追随者颇多，Spark，Presto（Facebook开发的数据查询引擎），这些都是数据湖上的计算能力。

它们主打一个：存储与计算分离。

可用于灵活组合的内容很多，

比如存储系统、资源调度系统，

多种不同的计算引擎都可以灵活组合。

两个流派，两个车道，同时并举，发展都不错。

从花销来讲，无花销的开源偏向数据湖，有花销的企业级的付费服务偏向数据仓库。

大概再过一段时间，磨合出来一个新架构。

主要是大家突然发现，哎，这个在数据库上做数据分析不够高效，

涉及存储计算一体化联动这样的一些问题。

于是，大数据整体架构往数据仓库那个车道的方向里发展。

所以，像ClickHouse这些东西用了新架构，带着存储，不用分离式的架构，而用更一体化的架构来做里面的事情。

近几年，湖仓（一体）的发展刚刚起步，放在十年的时间刻度轴上观察，

也就往前发展了一小段路，湖仓还是相对较新的架构。

本质上，湖仓是把数据湖的开放性和灵活性，与数据仓库这种高效和管理的能力，结合在一起。

2022年第一季度，硅谷著名投资机构A16Z“Data50榜单”表明，Databricks公司所处细分赛道（查询和处理，Query & Processing）所获投资惊人，几乎占数据企业类赛道资金总量的50%。

尽管Databricks自己的高额融资占掉了很大一部分，但是细究原因，数据分析（查询处理）太慢会影响业务，这是一种关乎客户生死存亡的刚需。

也就是说，在大模型流行之前，AI负载占比不算多，很多企业把它当成一个相对独立的大组件。

大模型问世后，

客户企业会考虑数据库里这些成堆的数据，怎么能被AI消费掉。

而“二合一”平台公司的技术核心点转而成为：

能不能很好地支持AI负载。

此时AI，非彼时AI。

AI今非昔比，已是一等公民。

至少，AI跟数据分析，平起平坐。

所以，在湖仓一体的存储架构的发展大趋势里，AI相当于是往数据湖方向投了一票。

因为数据仓库处理的是结构化和半结构化的数据，但AI强调了这个非结构、半结构数据的处理能力。

因此，你可以理解成大模型在给湖仓一体架构压力，推动它向前走。

故事还在那家叫做Databricks的公司身上结束。

Databricks公司自掏腰包13 亿美元，收购人工智能初创公司 MosaicML。

MosaicML产品成为 Databricks Lakehouse AI组件里的一部分。

最近的“Data + AI Summit 2023（峰会）”上，能看到Databricks也在其大模型工具链上加码。

与此同时，“百模大战”中的大模型公司也飙发电举。

两边都想尽早争取客户。

错失，或者踏空，毕竟都不是好事情。

有的人总能迅速做出改变。

（完）

One More thing

不做标题党，再直接一点回答文章标题问题：

大模型问世后，在面向未来的数据平台选型中，会先淘汰仅面向结构化关系表达设计的传统数仓产品。

带货ing

《我看见了风暴》谭老师新书，京东有售

更多阅读

AI大模型与ChatGPT系列：

1. ChatGPT大火，如何成立一家AIGC公司，然后搞钱？

2. ChatGPT：绝不欺负文科生

3. ChatGPT触类旁通的学习能力如何而来？

4. 独家丨从大神Alex Smola与李沐离职AWS创业融资顺利，回看ChatGPT大模型时代“底层武器”演进

5. 独家丨前美团联合创始人王慧文“正在收购”国产AI框架OneFlow，光年之外欲添新大将

6. ChatGPT大模型用于刑侦破案只能是虚构故事吗？

7. 大模型“云上经济”之权力游戏

8. 云从科技从容大模型：大模型和AI平台什么关系？为什么造行业大模型？

9. 深聊第四范式陈雨强丨如何用AI大模型打开万亿规模传统软件市场？

10. 深聊京东科技何晓冬丨一场九年前的“出发”：奠基多模态，逐鹿大模型

11. 老店迎新客：向量数据库选型与押注中，没人告诉你的那些事

AI大模型与学术论文系列：

1.开源“模仿”ChatGPT，居然效果行？UC伯克利论文，劝退，还是前进？

2. 深聊王金桥丨紫东太初：造一个国产大模型，需用多少篇高质量论文？（二）

3. 深聊张家俊丨 “紫东太初”大模型背后有哪些值得细读的论文（一）

漫画系列

1. 是喜，还是悲？AI竟帮我们把Office破活干完了

2. AI算法是兄弟，AI运维不是兄弟吗？

3. 大数据的社交牛气症是怎么得的？

4. AI for Science这事，到底“科学不科学”？

5. 想帮数学家，AI算老几？

6. 给王心凌打Call的，原来是神奇的智能湖仓

7. 原来，知识图谱是“找关系”的摇钱树？

8. 为什么图计算能正面硬刚黑色产业薅羊毛？

9. AutoML：攒钱买个“调参侠机器人”？

10. AutoML：你爱吃的火锅底料，是机器人自动进货

11. 强化学习：人工智能下象棋，走一步，能看几步？

12. 时序数据库：好险，差一点没挤进工业制造的高端局

13. 主动学习：人工智能居然被PUA了？

14. 云计算Serverless：一支穿云箭，千军万马来相见

15. 数据中心网络：数据还有5纳秒抵达战场

16. 数据中心网络：迟到不可怕，可怕的是别人都没迟到

AI框架系列：

1.搞深度学习框架的那帮人，不是疯子，就是骗子（一）

2.搞AI框架那帮人丨燎原火，贾扬清（二）

3.搞 AI 框架那帮人（三）：狂热的 AlphaFold 和沉默的中国科学家

4.搞 AI 框架那帮人（四）：AI 框架前传，大数据系统往事

注：（三）和（四）仅收录于《我看见了风暴》。

Unity基础包刚体FPS RigidbodyFirstPersonController 脚本研究暗光之痕 Unity起航 unity u3d 基础包脚本
版本：unity5.3.4语言：C#今天又研究了一个脚本。刚体的第一人称，不过这个脚本没有像之前的FPS脚本一样，加那么多另外的脚本，唯一一个就是MouseLook，这个脚本我们之前分析过了，就不再赘述了。所以整个看下来都是一个比较完整的FPS模型，个人喜欢用这个刚体实现，因为以后用其他什么力都比较方便。下面上代码：//刚体FPS移动主脚本，用刚体和胶囊组件代替了CharacterControll
校招154W！DeepSeek待遇和核心成员曝光！ AI生成曾小健人工智能
校招154W！DeepSeek待遇和核心成员曝光！DeepSeek的薪酬模式极为慷慨，提供员工一年14薪的福利。其高薪职位如深度学习研究员，年薪最高可达税前154万元。同时，该公司也注重给予其他职位合理薪酬，如客户端研发工程师年薪30万，实习生日薪500元，并提供转正机会及房补。更有平台显示，DeepAGI大模型实习生日薪高达500-1000元。尽管这些待遇与硅谷相比仍有差距，但已相当优厚。Dee
我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！ AI生成曾小健自然语言处理人工智能
我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！关于NLP那些你不知道的事2025年01月29日13:08我把DeepSeek-R1推理能力知识蒸馏到Qwen2，效果真的炸裂！！！一、什么是知识蒸馏？知识蒸馏是一种模型压缩技术，用于将大型复杂模型（教师模型）的知识迁移到小型模型（学生模型）。其核心原理是教师模型通过预测结果（如概率分布或推理过程）向学生模型传授知识，学生模
Python 开发者：如何养成良好编码习惯？很酷的站长 Python python 开发语言
当你已经是一名Python开发人员时，可能养成了一些习惯：有好的，也有坏的。编码本质是一种艺术形式。我们鼓励灵活性与可定制性。我们可以在编程语言的上下文中按照自己想要的方式编码。而现在需要面对的问题是，实际你正在公开与计算机通信，因此需要以一种其他人可以理解的方式编写代码。另外，使用不正确的语法或没有有效编写代码也会导致编程错误。混乱的代码使得以后很难发现这些错误。而可读、整洁的编码才是王道，这意
程序员护眼指南：Windows设置护眼色英国老鼠_ 安装配置 windows 护眼色
白领工作难免长期面对电脑屏幕，时间长了会导致眼镜干涩、视力加深等问题，推荐走以下几步：（1）为显示器贴上防蓝光膜，可在淘宝上搜索“显示器防蓝光膜”（2）降低屏幕亮度，安装护眼软件，如f.lux，或在腾讯电脑管家中打开工具箱-健康小助手-护眼卫士来调整护眼色的色调。个人推荐后者。（3）佩戴防蓝光眼镜，可在京东上搜索“小米防蓝光眼镜”，在小米旗舰店上购买99元的防蓝光眼镜。近视的朋友建议下次配眼镜时加
LAMMPS实操系列（四）: 高熵合金FCC-CoCrCuFeNi的退火模拟测试狗科研科研测试材料测试统一建模语言
我们前几期文章内容详细介绍了通过LAMMPS程序进行大量FCC-CoCrCuFeNi高熵合金建模与最稳定结构的筛选，并最终赛选出了我们所建1000个模型中能量最小也就是最稳定的结构。本章我们将继续通过LAMMPS程序对我们筛选出来的最稳定结构进行退火处理。退火是一种对材料的热处理工艺，指的是将材料缓慢加热到一定温度，保持足够时间，然后以适宜速度冷却。其目的是降低材料的残余应力，减少变形与裂纹倾向，
虚幻基础09：帧运算 qq_42863961 虚幻基础虚幻游戏引擎
能帮到你的话，就给个赞吧文章目录帧运算tick事件delaynexttick子弹帧运算ue的运算包括碰撞都是每帧运算一次。tick事件每帧运算一次，性能消耗大delaynexttick延迟到下一帧计算，可以解决许多帧运算的bug子弹子弹不应用碰撞，因为速度过大会导致检测不到。引用射线检测。
Python简单实用的连点器仍稽 python
python中可以控制鼠标和键盘的库有很多个，这个连点器使用的是pynput库。首先，我们要先安装pynput库。pipinstallpynput如果觉得太慢了或者报错了，可以使用国内镜像。pipinstallpynput-ihttps://pypi.tuna.tsinghua.edu.cn/simple废话不多说，直接上程序。frompynput.keyboardimportKey,Contro
bgp协议怎么知道相邻路由的ip地址_【计算机网络】-边界网关协议(BGP) 段丞博 bgp协议怎么知道相邻路由的ip地址
bgp边界网关协议(BorderGatewayProtocol，BGP)是互联网上一个核心的去中心化自治路由协议bgp本身就是一个多地址的协议簇(mp-bgp，多协议bgp)–地址族(ipv4)bgp刷新很慢，需要手工刷新，加快收敛AS，自治性系统域(16位的号码空间—>会扩展到32位)1、bgp基本概述bgp作用AS内部使用IGP来计算和发现路由，如OSPF，ISIS，RIP等。AS之间使用BG
如何寻找好用的GPTs模型？小宝哥Code ChatGPT与AIGC 人工智能
要有效地寻找和使用好用的GPT模型，可以按照以下步骤来选择和应用最合适的模型，尤其是在科研或工作中需要完成特定任务时：1.明确需求和任务在寻找适合的GPT模型之前，首先需要明确你要解决的任务或需求。不同的GPT模型在处理各种任务时表现不一样。常见的任务包括：文本生成：创作文章、生成报告、写作论文等。问答系统：快速解答科研问题、技术问题等。翻译和润色：翻译论文、改进文章语言质量等。数据分析和图表生成
Java Stream API中的状态性操作与陷阱 2501_90323865 java python 开发语言个人开发
在Java编程中，StreamAPI为我们提供了一种高效且简洁的方式来处理集合数据。然而，在使用StreamAPI时，开发者常常会遇到状态性（stateful）操作和行为参数的问题。这些问题如果不加以注意，可能会导致代码的非确定性结果，甚至引发线程安全问题。本文将详细介绍状态性操作的原理、潜在问题以及如何避免这些问题，同时结合实例进行说明。一、状态性操作与无状态操作在StreamAPI中，操作可以
logstash（自动拉取，过滤，推送日志的应用，也是elk架构中的l）长东737 elk 架构
elk是指elasticsearch，logstash，kibana三款软件搭配组成的架构logstash是一个数据采集加工处理以及传输的工具logstash类似于流水线，有三个模块，分辨是input>filter>output，input模块负责收集数据，filter负责处理数据，output负责输出数据logstash需要先保证web集群和ela集群运行正常才能搭建，运行logstash需要先
Day29（补）-【AI思考】-精准突围策略——从“时间贫困“到“效率自由“的逆袭方案一个一定要撑住的学习者 #AI深度思考学习方法人工智能 unity 游戏引擎
文章目录精准突围策略——从"时间贫困"到"效率自由"的逆袭方案**第一步：目标熵减工程（建立四维坐标）**与其他学习方法的结合**第二步：清华方法本土化移植**与其他工具对比**~~第三步：游戏化改造方案~~****第四步：环境重塑工程****第五步：技术杠杆矩阵****第六步：风险对冲策略**可行性验证模型甘特图OKR看板精准突围策略——从"时间贫困"到"效率自由"的逆袭方案让思想碎片重焕生机的
团体程序设计天梯赛-练习集——L1-027 出租 SY师弟 GPLT天梯赛数据结构 c语言 GPLT 算法 c++c#
前言有点难，博主做了好长时间才做出来，测试点过了，但是还是有点懵蹬，20分的题目，大家看一下吧先L1-027出租下面是新浪微博上曾经很火的一张图：一时间网上一片求救声，急问这个怎么破。其实这段代码很简单，index数组就是arr数组的下标，index[0]=2对应arr[2]=1，index[1]=0对应arr[0]=8，index[2]=3对应arr[3]=0，以此类推……很容易得到电话号码是1
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
【Oracle篇】使用impdp导入报错ORA-39001:ORA-39000:ORA-39142:incompatible version number xxx in dump file的问题解决奈斯DB Oracle专栏 oracle 数据库
《博主介绍》：✨又是一天没白过，我是奈斯，从事IT领域✨《擅长领域》：✌️擅长阿里云AnalyticDBforMySQL(分布式数据仓库)、Oracle、MySQL、Linux、prometheus监控；并对SQLserver、NoSQL(MongoDB)有了解✌️大佬们都喜欢静静的看文章，并且也会默默的点赞收藏加关注如标题所示这篇文章是记录并分享一下使用数据泵导入时的报错，这个报错是博主在一年之
深度学习过程是什么小松要进步李哥深度学习深度学习
问：深度学习是：一组原始数据，经过线性变换、非线性变换、偏差加和等操作后得到一组预测数据，再根据损失函数计算预测数据和原始数据的差值，用差值数据对权重和偏差求偏导，这里的偏导数的值也就是使得损失减小的最佳方向，然后根据偏导数的方向和步长更新权重和偏差，对吗答：您的描述大致正确，但有一些细节需要澄清和修正，以更准确地反映深度学习中模型训练的过程。以下是详细的解释：1.原始数据处理：一组原始数据首先通
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
多线程与高并发（6）——CAS详解（包含ABA问题）李王家的翠花 java 多线程 java 开发语言
一、乐观锁和悲观锁乐观锁和悲观锁都是用于解决并发场景下的数据竞争问题，不局限于某种编程语言或数据库。1、乐观锁：就是很乐观，每次去拿数据的时候都认为别人不会修改，所以不会上锁，但是在更新的时候会判断一下在此期间别人有没有去更新这个数据。乐观锁的实现方式：主要有两种，一种是CAS机制，一种是版本号机制。（1）版本号机制：在数据中增加一个version字段用来表示该数据的版本号，每当数据被修改版本号就
Java并发CAS中的ABA问题 fragrans Java Java 并发编程 CAS ABA
1.ABA产生的原因CAS会导致“ABA问题”。CAS算法实现一个重要前提需要取出内存中某时刻的数据并在当下时刻比较并替换，那么在这个时间差类会导致数据的变化。比如说一个线程1从内存位置V中取出A，这时候另一个线程2也从内存中取出A，并且线程2进行了一些操作将值变成了B，然后线程2又将V位置的数据变成了A，这时候线程1进行CAS操作发现内存中仍然是A，然后线程1操作成功。只关注开始和结尾，不关心中
第05章 12 可视化热量流线图一例捕鲸叉 VTK编程学习 VTK 信息可视化
下面是一个使用VTK（VisualizationToolkit）和C++编写的示例代码，展示如何在一个厨房模型中可视化热量流线图，并按照热量传递速度着色显示。这个示例假设你已经安装了VTK库，并且你的开发环境已经配置好来编译和运行VTK程序。示例代码#include#include#include#include#include#include#include#include#include#in
大sql如果不能加索引，还能怎么优化 —— hint学习 ckh_user 数据库 sql 数据库 oracle
大sql如果不能加索引，还能怎么优化当前问题：要执行简单查询sql【select字段1，字段2，……，字段40from表where条件groupby字段1，字段2，……，字段40】，但对应表里数据量大，且查询字段和groupby字段是由动态配置的，于是这里不方便加索引，普通查询耗时2个小时以上。解决方案：这里便用hint的并行解决，新的sql【select/*+parallel(8)*/字段1，字
TensorBoard可视化工具支持哪些类型的图表？ alankuo 人工智能
TensorBoard支持多种类型的图表，以下是详细介绍：标量图（Scalars）定义与用途：用于展示单个数值随时间（通常是训练步骤或迭代次数）的变化情况。在深度学习模型训练中，最常见的是损失函数值和评估指标（如准确率、精确率、召回率等）的变化曲线。示例：例如，在训练一个图像分类模型时，记录训练集和测试集上的损失函数值。通过标量图，可以直观地看到随着训练轮次（epochs）的增加，损失函数值是如何
《企业网络安全架构与实战指南：从蓝队防御到零信任网络部署》 Yimuzhizi 网络安全 web安全安全网络安全人工智能架构网络搜索引擎
项目：《企业网络安全架构与实战指南：从蓝队防御到零信任网络部署》姓名：飞花似梦Flydream日期：2024年11月21日目录蓝队基础企业网络架构高层管理IT管理中央技术团队安全部门企业管理技术信息安全管理成熟度模型（ISM3）安全职能安全团队成员典型企业网络分区模糊的边界外部攻击面身份管理识别Windows典型应用识别Linux典型应用识别WEB服务识别客户端设备身份和访问管理目录服务企业数据存
数据库用户管理比特知识工坊 MySQL专栏数据库 adb android
数据库用户管理1.创建用户MySQL在安装是，会默认创建一个名位root的用户，该用户拥有超级权限，可以控制整个MySQL服务器。在对MySQL的日常管理和操作中，通常创建一些具有适当权限的用户，尽可能的不用或少用root登录系统，以此来确保数据的安全访问。可以使用createuse语句创建用户，并设置相应密码：createuser用户[indentifiedby[password]'passwo
《攻克语言密码：教AI理解隐喻与象征》程序猿阿伟人工智能
在自然语言处理（NLP）领域，让计算机理解人类语言中的隐喻和象征，是迈向更高语言理解水平的关键一步。从“时间就是金钱”这样的概念隐喻，到文学作品里象征着坚韧的“寒梅”，这些非字面意义的表达方式承载着丰富的情感与文化内涵。然而，对于基于规则和数据驱动的NLP模型来说，理解隐喻和象征一直是块难啃的硬骨头。理解隐喻与象征：人类语言的独特魅力隐喻和象征作为常见的修辞手法，为语言表达增添了生动性与深度。隐喻
python系列：如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？坦笑&&life #python python fastapi windows
如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？如何在FastAPI中使用Pydantic的BaseModel上传文件和字典列表？问题：回答：虽然`Pydantic模型`过去不允许使用`Query字段`，并且必须在单独的依赖类中实现查询`parameter-parsing`，如本答案和本答案所示，但这一点最近发生了变化，因此，可以使用`BaseModel类`将`Q
Python使用FastApi开发接口冉成未来 python fastapi 开发语言
文章目录python开发web框架简介FastApi安装安装依赖包代码编写创建数据库连接模块database.py创建数据库实体模块model.py创建实体类模型模块schemas.py创建操作数据库模块curd.py创建接收请求模块main.py创建运行模块run.py项目运行编写完以上代码，通过以下命令进行项目启动查看项目接口pyinstalle打包FastApi项目项目通过uvicorn运行
6.3、OTN 保护费光同步数字传送网络信息与通信传送网
一、光线路保护图示：图中上方部分展示了光线路保护的结构。可以看到有工作通道和保护通道，两端都有OLP（光线路保护）模块。原理：业务信号在工作通道传输，同时有一个独立的保护通道作为备份。当工作通道出现光纤失效等故障时，OLP模块会自动将业务切换到保护通道，实现业务的不间断传输。特点：适用组网：适用于链型组网，这种组网方式结构相对简单，成本较低。保护范围：主要针对线路光纤失效进行保护，能够有效应对因光
FastApi 练习之请求体子类模型之Set传参五指山西 python api
代码片段，注意tags是Set类型传参教程代码：fromtypingimportOptional,SetfromfastapiimportFastAPIfrompydanticimportBaseModelapp=FastAPI()classItem(BaseModel):name:strdescription:Optional[</
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

大模型“搅局”，数据湖，数据仓库，湖仓选型会先淘汰谁？

你可能感兴趣的:(大模型“搅局”，数据湖，数据仓库，湖仓选型会先淘汰谁？)