E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库数据中台数据湖
数据中台
产品经理初探三
从去年12月份开始做
数据中台
PD以来,已经九个月了,其中不断反思,到底这个
数据中台
的PD职责在哪里,应该做哪些工作,通过《三节课》的课程学习,和自己执行中遇到的问题,做了以下总结。
Frank舟
·
2023-09-12 22:38
企业如何转动自己的命运齿轮,实现数字化转型
数据仓库
-派可数据BI可视化分析平台同时,企业需要部署业务信息系统来实现业务
派可数据BI可视化
·
2023-09-12 20:02
数字化转型
商业智能
数据仓库
大数据
数据分析
商业智能BI
数据仓库
数字化转型
火山引擎 ByteHouse:两个关键技术,揭秘 OLAP 引擎中的数据导入技术
作为一款OLAP引擎,火山引擎云原生
数据仓库
ByteHouse源于开源ClickHouse,在字节跳动多年打磨下,提供更丰富的能力和更强性能,能为用户带来极速分析体验,支撑实时数据分析和海量离线数据分析
·
2023-09-12 14:14
大数据云原生活动
关于
数据中台
,你要知道的三个“大”和“小”
凯哥讲故事-关于
数据中台
你要知道的三个"大和小"一、大数据思维,小数据落地从2018年开始,大数据这个词,我在企业端已经提的很少了,因为一提大数据,就会带来一些客户的困扰,“我们这里没有大数据,我们这里都是小数据
凯哥讲故事
·
2023-09-12 12:41
实时分析、融合统一及云原生,现代化
数据仓库
未来发展必经之路|专访飞轮科技 CEO 马如悦
在国内拥有2500+中大型企业用户,用户社群聚集开发者超3万人,活跃贡献者数连续数月稳居全球大数据开源项目排行榜第一。毋庸置疑,ApacheDoris已成为全国数据库和大数据领域最为活跃的开源项目之一。ApacheDoris历经近十年的发展,为何还能持续保持竞争力和活力?其背后的核心推动力又是什么?在QCon全球软件开发大会·北京站的现场,基于ApacheDoris的商业化公司飞轮科技的CEO、A
·
2023-09-12 12:36
阿里云云原生
数据湖
分析DLA Serverless Spark重磅发布,助力企业低成本挖掘OSS数据价值
一、背景概述1.1什么样的客户需要
数据湖
在数据处理领域,
数据湖
相对来说是一个比较新的概念,它的提出可以很好地帮助企业应对当前数据场景越来越多、数据结构越来越复杂、数据处理的需求越来越多样化的问题。
阿里云数据库
·
2023-09-12 07:08
【数仓建设系列之三】数仓建模方式及如何评估数仓完善性
一、数仓维度建模数仓维度建模是一种强大的方法,用于将复杂的业务现实映射到易于理解的数据结构中,它是构建
数据仓库
的核心技术之一,能够帮助企业将分散和不一致的数据整合到一个一致性高、可查询
码猿小站
·
2023-09-12 07:05
数据仓库
数仓建设
大数据
数据仓库
bigdata
big
data
一文彻底搞懂实时数仓如何选型和构建
数仓分层的必要性04从Lambda架构说起05Kappa架构解决哪些问题06深入实时数仓架构方案1:Kappa架构方案2:基于标准分层+流计算方案3:标准分层体现+流计算+批量计算方案4:标准分层体系+流计算+
数据湖
方案
csdn-延
·
2023-09-12 06:33
数仓
大数据
架构
数据仓库
大数据
数据挖掘
实时数仓
Flink
什么是
数据中台
,关于
数据中台
的6问6答6方法
在大数据/数字孪生时代,
数据中台
已经成为企业治理数据的核心平台。
数据中台
不仅处理和整合大量数据,还负责数据的存储、管理和保护工作,确保数据的准确性和可用性。
数字孪生家族
·
2023-09-12 02:24
智汇云舟
人工智能
数据可视化
使用MERGE语句,这里简单总结一下 (一个语句解决update 和 insert 功能)
在
数据仓库
中的转换和装载过程中,经常会使用MERGE语句,这里简单总结一下。MERGE语句是Oracle9i新增的语法,用来合并UPDATE和INSERT语句。
djs00717
·
2023-09-12 00:32
merge
insert
sql
table
oracle
delete
Impala相较于hive的优劣
hive是基于Java编写的开源
数据仓库
和分析包,目的是将特定的SQL语句编译为MapReducejar包扔给hadoop去执行,本质上是一个代码转换编译的工具,适用于逻辑复杂的查询,简单查询考虑impala
一只当归
·
2023-09-11 12:27
MQTTC数据桥接上云
私有化部署已经不能满足当前的发展趋势了,因此dgiot在原有基础上进行创新,将私有化部署的区域数控一体机上的数据通过mqtt桥接的方式上传到云服务器上,完成数据的实时同步备份场景解析:工厂设备的数据如何稳定的传输到
数据中台
以便后续的数据分析一直是各大企业头痛的问题之一
DGIOT平台
·
2023-09-11 09:37
物联网
大数据
服务器
数据仓库
--代理键
[转]
数据仓库
设计——代理键转载2015-12-0612:12:22标签:it
数据仓库
代理键在关系型数据库设计中,代理键是在当资料表中的候选键都不适合当主键时,例如资料太长,或是意义层面太多,就会用一个
yimubanggong
·
2023-09-11 06:10
数据仓库
数据仓库
代理键
数仓建模
数据仓库
-主数据管理
本文来源于网络,如有侵权,联系本人删除:tianyachangkong来源:BAT大数据架构导读:企业主数据指企业内一致并共享的业务主体。主数据管理,不仅包括硬件和软件,还是将数据作为重要资产管理的思想和办法,是指一整套的用于生成和维护企业主数据的规范、技术和方案,以保证主数据的完整性、一致性和准确性。一、企业数据类型企业数据类型主要包括交易数据、主数据和元数据,如下图所示:元数据是企业数据资产管
zhubeili
·
2023-09-11 06:39
数仓专栏
数据仓库
数据仓库
(DATA Warehouse)核心概念
数据仓库
的个性概念理解自从1991年
数据仓库
之父BillInmon提出了
数据仓库
概念以来,
数据仓库
已从早期的探索走向实用阶段,进入了一个快速发展阶段。
mishidemudong
·
2023-09-11 06:39
数据仓库与联机分析处理
数据仓库
【无标题】
数据仓库
-学习
1、
数据仓库
基础知识1.1什么是数仓数仓的概念:
数据仓库
简称数仓,在《建立
数据仓库
》中是这样定义
数据仓库
的:
数据仓库
是面向主题的,数据集成的,相对稳定的(非易失的),反映历史变化(时变)的数据集合,用于支持管理决策
白&夜
·
2023-09-11 06:09
数据仓库
学习
数据库
数据仓库
中的一些核心概念
1、什么是
数据仓库
数据仓库
技术是随着人们对大型数据库系统研究的不断深入,在传统数据库技术基础之上发展而来的,其主要目的就是为决策提供支持,为OLAP、数据挖掘深层次的分析提供平台。
IMezZ
·
2023-09-11 06:38
数据仓库
数据仓库
数据仓库
--- 概述
A.
数据仓库
—概述概述信息操作型系统:以事务为主。以可预测的方式完成同样的操作型任务。分析型系统:以评估效果为主。
micklongen
·
2023-09-11 06:08
数据中台
数据仓库
数据库
database
数据仓库
分层概念
一、分层一般来讲,主要分为五层,数据模型分为三层数据加载层:ETL(Extract-Transform-Load)数据运营层:ODS(OperationalDataStore)
数据仓库
层:DW(DataWarehouse
王秋实Q
·
2023-09-11 06:37
大数据
数据仓库
数据仓库
建设一(核心概念)
核心概念与步骤维度模型:1.雪花模型:事实表-join-维度1-join-维度2-join-..一个实事表关联多级维度表2.星型模型:事实表-join-维度表一个实事表关联维度表,维度表没有级联关联3.星座模型:事实表-join-维度表-join事实表一个维度表被多个事实表关联数据分层(公司的业务需求,一般):ods:用于保存同步的业务库与应用日志数据,一般采用snappy或者gz压缩,格式采用o
另一个世界Azure
·
2023-09-11 06:07
数据仓库
大数据
数据仓库
数据仓库
--DWM层
DWM(DataWareHouseMiddle)数据中间层,该层会在DWD层的数据基础上,对数据做轻度的聚合操作,生成一系列的中间表,提升公共指标的复用性,减少重复加工。一般而言,针对dwm层的设计开发是建立在,积累一定数量DM和APP相关需求后,将设计到重复的指标和维度下沉到DWM的表中,因此在数仓建立初期,可能会有直接跳过DWM来开发的情况,但是随着相似的需求不断的增加,DWM的开发势在必行,
江淮杰
·
2023-09-11 06:07
big
data
数据挖掘
数据仓库
数据仓库
-核心概念
数据仓库
数据仓库
,英文名称为DataWarehouse,可简写为DW或DWH。
数据仓库
,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
驾数者
·
2023-09-11 06:34
数据仓库
数据仓库
大数据
指标体系
数据质量
中台崛起的本质是“去ERP化”
本文将从微观宏观双视角展开阐述,微观层面以一个典型的订单服务的演进,展示
数据中台
业务中台的价值和联系;宏观层面,纵览企业后ERP时代的问题,分析中台崛起背后的企业诉求。中台崛起的意义201
凯哥讲故事
·
2023-09-11 05:16
ClickHouse场景及其原理
这里直接从原始数据开始消费,通过Flink清洗任务将数据洗入
数据仓库
存储,在
数据仓库
经过作业清洗并在ClickHouse生成用户行为明细,可以称作无模型化明细数据。利用Click
有时需要偏执狂
·
2023-09-11 04:16
Java架构
clickhouse
数据中台
如何驱动智能商品运营
南弈老师从「货」出发,分享「
数据中台
提升智能商品运营能力」。数据时代重新定义商品运营
奇点云
·
2023-09-11 01:54
奇点学院
数据中台
大数据
智能商品运营
当我们谈「以消费者为中心」时,实际上在谈什么?| 消费者数字化运营从0到1
在数智·泛零售系列直播第9课中,奇点云副总裁、解客科技CEO鬓客带来《
数据中台
支撑经营逻辑变革:从经营流量到经营人》,解读消费者运营的WHY、WHAT、HOW。鬓客,奇点云副总裁,解客科技CEO。
奇点云
·
2023-09-11 01:54
奇点学院
数据中台
大数据
人工智能
消费者
消费者运营
chatgpt赋能python:Python连接Hive:深度剖析
因此,
数据仓库
系统(如Hive)的需求也越来越迫切。对于数据分析工程师和开发人员而言,Hive提供了一种基于Hadoop的SQL查询引擎,使他们能够进行大规模数据集的分析和处理。
www_xuhss_com
·
2023-09-11 01:09
ChatGpt
hive
chatgpt
python
计算机
使用Python读写Hive:简化大数据处理的利器
Hive作为一种强大的
数据仓库
解决方案,能够处理大规模数据,并提供灵活的查询能力。而Python作为一种流行的编程语言,拥有丰富的数据处理库和易用性,成为许多数据科学家和工程师的首选。
CDA·数据分析师
·
2023-09-11 01:09
python
hive
开发语言
天津专业大数据培训班 教你分析大数据行业前景
大数据分析是IT行业挺火的词汇,围绕大数据分析产生的
数据仓库
、数据安全、数据挖掘等商业价值也渐渐地被挖掘了出来,大数据时代渐渐来临......大数据是什么随着科技的发展,尤其是互联网的深入,新兴了大数据这个行业
qq_38453958
·
2023-09-10 21:27
大数据培训
天津大数据培训
天津大数据培训班
天津大数据培训机构
天津大数据培训学校
大数据培训
Mysql(一) 数据库实现-DDL-DML-DQL及各种函数用法
1、初识数据库1.1、什么是数据库数据库:DB(DataBase)概念:
数据仓库
,软件,安装在操作系统之上作用:存储数据,管理数据1.2、数据库分类1.2.1、关系型数据库:SQL(StructuredQueryLanguage
lingering fear
·
2023-09-10 19:35
mysql
数据库
DML
DQL
DDL
数据库
mysql
《阿里大数据之路》读书笔记:第三章 数据同步
应用场景:同类型不同集群数据库之间的数据同步主数据库与备份数据库之间的数据备份主系统与子系统之间的数据更新不同地域、不同数据库类型之间的数据传输交换大数据系统中的数据同步数据从业务系统同步进入
数据仓库
数据从
数据仓库
同步进入数据服务或数据应用一
蓦然_
·
2023-09-10 17:14
数据仓库
大数据
数据仓库
PostgreSQL实战-010-性能优化
PostgreSQL数据库的SQL服务器应用通常分为OLTP
数据仓库
数据库性能分析【硬件】:最先到达瓶颈的,通常是磁盘IO1.建议使用固定存储SSD如目前使用广泛的SATASSD
longailk
·
2023-09-10 16:07
tester
postgresql
数据库
sql
L2
数据仓库
和Hive环境配置
1.
数据仓库
架构
数据仓库
DW主要是一个用于存储,分析,报告的数据系统。
数据仓库
的目的是面向分析的集成化数据环境,分析结果为企业提供决策支持。
lee2813
·
2023-09-10 16:24
数据仓库
hive
hadoop
基于flink实时
数据仓库
-第二讲flinkcdc
flinkcdc1.FlinkCDC1.CDC是什么2.CDC的种类3.Flink-CDC3.1flink-cdcstreaming3.2flinkcdcflinksql1.FlinkCDC1.CDC是什么CDC是ChangeDataCapture(变更数据获取),CDC是ChangeDataCapture(变更数据获取)。2.CDC的种类CDC主要分为基于查询和基于Binlog两种方式,我们主要
大数据学习爱好者
·
2023-09-10 15:35
Flink
开发
hbase
java
数据库
基于flink实时
数据仓库
-第一讲基本情况介绍
实时
数据仓库
1、电商实时数仓分层介绍1.1普通实时计算和实时
数据仓库
比较1.2实时
数据仓库
,项目分层2.实时需求概述2.1离线计算和实时计算比较2.2实时需求种类3.统计架构分析3.1离线架构3.2实时架构
大数据学习爱好者
·
2023-09-10 15:34
Flink
开发
java
flink
AWS Glue Pyspark+Athena基础学习汇总
Pyspark基础学习汇总篇一、AWS架构①AWSGlue:工作平台,包括脚本的编写以及管理脚本的运行状态以及调度等(主要:数据库配置、ETL和数据转换脚本编写、调度)②AmazonS3
数据湖
(数仓):
每日小新
·
2023-09-10 15:50
每日小新-笔记篇
aws
学习
云计算
【Hudi
数据湖
应用】Flink作业同名类强转异常ClassCastException修复
一、异常描述近日升级到hudi0.11后,在flink应用中遭遇了一个神级异常:java.lang.ClassCastException:org.apache.hudi.common.fs.HoodieWrapperFileSystemcannotbecasttoorg.apache.hudi.common.fs.HoodieWrapperFileSystem。没看错吧?同名类转换失败?揉揉眼睛,
大数据点灯人
·
2023-09-10 13:10
Hudi
Flink
Java
flink
java
大数据
高效
数据湖
构建与
数据仓库
融合:大规模数据架构最佳实践
文章目录
数据湖
和
数据仓库
:两大不同理念
数据湖
数据仓库
数据湖
与
数据仓库
的融合统一数据目录数据清洗和转换数据安全和权限控制数据分析和可视化
数据湖
与
数据仓库
融合的优势未来趋势云原生
数据湖
自动化数据处理边缘计算与
数据湖
融合结论欢迎来到云计算技术应用专栏
IT·陈寒
·
2023-09-10 09:37
架构设计
云原生
云计算技术应用
数据分析
数据仓库
架构
Hive总结
hive是基于hadoop的一个
数据仓库
工具,可以将结构化数据文件映射为一张表,并提供类sql查询功能本质是:将hql转化成MapReduce程序hive优缺点1.优点1)操作接口采用类SQL语法,提供快速开发的能力
凉介﹊
·
2023-09-10 06:48
hive
hadoop
big
data
hive解决了什么问题
hive出现的原因Hive出现的原因主要有以下几个:传统
数据仓库
无法处理大规模数据:传统的
数据仓库
通常采用关系型数据库作为底层存储,这种数据库在处理大规模数据时效率较低。
demo123567
·
2023-09-10 06:15
hive
大数据导论 笔记
年大数据模型人工智能元年2、基础课程hadoop大数据基础三大件:HDFS分布式存储、MapReduce并行计算框架、yarn分布式资源调度框架hbaseHadoopDataBase分布式列式数据库NoSQLhive
数据仓库
兼容
暗托涅瓦
·
2023-09-10 02:12
大数据导论
大数据
笔记
centos
人大金仓分析型数据库系统扩容(一)
随着额外的数据被收集以及现有数据的保留时间增加,
数据仓库
会随着时间而增大。有时,可能需要额外的计算能力(CPU)来适应新增加的分析项目。
天宫空间站
·
2023-09-10 01:58
数据库
Hadoop生态圈中的Hive
数据仓库
技术
Hadoop生态圈中的Hive
数据仓库
技术一、Hive
数据仓库
的基本概念二、Hive的架构组成三、Hive和数据库的区别四、Hive的安装部署五、Hive的基本使用六、Hive的元数据库的配置问题七、Hive
Augenstern K
·
2023-09-10 01:46
Hadoop
hadoop
数据仓库
hive
Web3.0时代,挖掘数据价值的第一步是网络数据采集
常用的大数据采集方式离线采集在
数据仓库
的语境下,ETL基本上就是数据采集的代表,包括数据的提取(Extract)、转换(Transform)和加载(Load)。在转换的过程中,需要针对具体的业务场景
雨与田
·
2023-09-09 21:48
Azure Synapse Analytics和Power BI的性能改进
www.jamesserra.com/archive/2019/12/azure-synapse-analytics-power-bi/最近,AzureSynapseAnalytics(原名AzureSQL
数据仓库
醍醐灌顶
·
2023-09-09 18:35
数据仓库
面试总结大全,深度解析底层逻辑
数据仓库
一、
数据仓库
概述首先,我们先来看下数据库、数据集市、
数据仓库
以及
数据湖
的概念。1、什么是数据库?数据库(Database)是按照一定格式和数据结构在计算机保存数据的软件,属于物理层。
蜀州凯哥
·
2023-09-09 17:24
Java面试系列
java
面试
经验分享
数据仓库
【AWS实验】 使用 Lake Formation 设置
数据湖
文章目录实验概览目标实验环境任务1:探索实验环境任务1.1:在S3存储桶中创建文件夹任务1.2:加载AWSCloud9IDE任务1.3:将数据复制到S3存储桶任务2:设置AWSLakeFormation任务2.1:注册AmazonS3存储任务2.2:更新权限任务2.3:验证数据库和表的权限任务2.4:创建数据库任务3:使用AWSGlue对评论数据进行爬网任务3.1:使用爬网程序添加表任务3.2:运
xybDIY
·
2023-09-09 16:56
亚马逊云
aws
云计算
【大数据】思维导图-数据采集、存储、
数据仓库
、计算框架、资源管理&任务调度、部署、可视化
【大数据】思维导图大数据常用流程图思维导图大数据常用流程图大数据技术分为多个层次思维导图大数据相关学习路线分为:数据保存到数据库中,分为关系型数据库(常用mysql)以及非关系型数据库(Hbase分布式列式数据库),redis键值对数据库,以及clickhouse列式数据库。数据采集工具:实时产生的日志或者文件视频等数据、以及已经存储到数据库里的数据需要查询出来进行计算,涉及到的一些工具,例如sq
风吹海洋浪
·
2023-09-09 11:47
思维导图&知识体系
big
data
数据仓库
hbase
Kylin
Kylin这里目录标题Kylin1、
数据仓库
1.1.核心概念1.2.
数据仓库
DW1.3.`OLAP`和`OLTP`1.4.维度和度量1.5.`Cube`和`cuboid`1.5.1.
忄凝^
·
2023-09-09 00:20
大数据
kylin
数据仓库
Hadoop生态之hive
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
数据咩
·
2023-09-08 22:57
Hadoop生态
hadoop
hive
大数据
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他