E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据湖数据仓库
【
数据仓库
】hadoop生态圈与
数据仓库
文章目录1.大数据定义2.Hadoop与
数据仓库
3.关系数据库的可扩展性瓶颈4.CAP理论5.Hadoop
数据仓库
工具5.1.RDS和TDS5.2.抽取过程5.3.转换与装载过程5.4.过程管理和自动化调度
roman_日积跬步-终至千里
·
2023-10-19 11:12
数据仓库
数据仓库
hadoop
大数据
数据研发面经
数据仓库
12.658同城面经多益网络1.数据库索引的类型包括:**唯一索引、主键索引、聚集
只会收藏他人资料的卑微嘎
·
2023-10-19 07:42
链表
数据结构
算法
滴滴 OrangeFS
数据湖
存储关键技术揭秘!
2015年,滴滴为解决小文件和图片的存储,成立GIFT小对象存储项目。伴随着业务不断成长,我们面临的挑战也越来越多,经历多次非结构化存储架构演进,具体如下图所示:随着公司不断发展,滴滴的业务有两个发展的趋势:云原生技术战略和新业务涌现,都给存储系统带来了新的挑战。在云原生战略中,业务的极致弹性是提高资源利用率降低成本的一个目标。保障极致弹性的基础是容器的轻量化,而要实现容器的轻量化就必须实现存算分
滴滴技术
·
2023-10-19 06:32
数据仓库
技术
数据仓库
基础
数据仓库
的价值
数据仓库
的源数据类型
数据仓库
的基本架构
数据仓库
的多维数据模型数据立方体与OLAP维(Dimension)和立方(Cube)
数据仓库
的基本特征
数据仓库
元数据管理
数据仓库
概述
数据仓库
与数据集市建模
数据仓库
系统的实现与使用基于
o黄裳元吉o
·
2023-10-19 05:49
Hadoop之MapReduce基本简介
目录1、MapReduce的基本概念2、MapReduce的工作流程3、MapReduce与Yarn5、基于
数据仓库
的Hive1、MapReduce的基本概念1.1基本概念Mapreduce是一个分布式运算程序的编程框架
下一秒,待续
·
2023-10-19 04:19
大数据
浅谈
数据仓库
(DW & BI)(三)
回顾一下之前的内容:#42浅谈
数据仓库
(DW&BI)(一):
数据仓库
发展起源及概述#43浅谈
数据仓库
(DW&BI)(二):粒度、存储、3NF、星型模型、雪花模型
数据仓库
相关内容,现在我还没有形成一个逻辑清晰的叙述思路
小杨_1858
·
2023-10-19 02:24
hadoop和hive、spark、presto、tez是什么关系
Hive是一个基于Hadoop的
数据仓库
系统,它允许用户使用SQL语言来查询和分析大型数据集。Hive通过将SQL查询转换为MapReduce任务来实现。
草履虫稽亚娜
·
2023-10-19 02:55
hadoop
hive
spark
大数据
分布式
大数据数仓搭建-大数据用户画像推荐系统搭建
虽然有一个存储部分,但是该存储更多的以窗口的形式进行存储,所以该存储并非发生在
数据湖
,而
老姜的数据江湖
·
2023-10-18 21:10
大数据
大数据数仓搭建
大数据用户画像
大数据架构
大数据推荐算法
基于hive的日志数据统计实战
基于hive的日志数据统计实战一、hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
ych0108
·
2023-10-18 20:56
BigData
hive
hive入门
hive日志分析
hive读取mysql日志_基于hive的日志分析系统
hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
Aviationbamboo
·
2023-10-18 20:25
hive读取mysql日志
基于Hadoop的
数据仓库
Hive的介绍、安装与基本应用
文章目录基于Hadoop的
数据仓库
Hive的介绍、安装与基本应用一、概述二、Hive系统架构三、Hive工作原理四、HiveHA基本原理五、Impala六、Hive安装七、Hive编程实战附一:管理表(
珞清殇
·
2023-10-18 20:53
大数据
Note
hive
Hive
前言Hive是建立在Hadoop基础上的
数据仓库
基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
两只手
·
2023-10-18 20:23
Hive简介
一、Hive简介Hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
needle2
·
2023-10-18 20:51
hadoop
2010
csv
数据库
table
xml
基于 hive 的日志数据统计实战
基于hive的日志数据统计实战一、hive简介hive是一个基于hadoop的开源
数据仓库
工具,用于存储和处理海量结构化数据。
jiangkai_nju
·
2023-10-18 20:20
hadoop学习之路
hadoop
2010
csv
数据库
table
xml
AWS Boto3 S3对象上传与下载
各种规模和行业的客户都可以使用AmazonS3存储和保护任意数量的数据,用于
数据湖
、网站、移动应用程序、备份和恢复、归档、企业应用程序、IoT设备和大数据分析。
东子z
·
2023-10-18 17:21
Python
aws
python
大数据
从理论到实践,实时湖仓功能架构设计与落地实战
在上篇文章中,我们向大家解释了为什么实时湖仓是当前企业数字化转型过程中的解决之道,介绍了实时计算和
数据湖
结合的应用场景。(“数据驱动”时代,企业为什么需要实时湖仓?)
袋鼠云数栈
·
2023-10-18 13:51
大数据
回顾 | Apache Flink x Iceberg Meetup · 上海站精彩回顾 (附PPT下载)
本次Meetup,社区邀请了来自阿里巴巴、腾讯、Dell科技集团、汽车之家的4位技术专家分享了超多关于Flink&
数据湖
的内容,全方位解析
数据湖
生产应用难题。
Apache Flink
·
2023-10-18 11:46
人工智能
编程语言
flink
数据分析
数据可视化
系统架构师上午题部分知识点汇总
系统架构师系统架构师上午题知识树系统架构师计算机组成与体系结构计算机系统组成存储器系统流水线操作系统操作系统的类型与结构操作系统的基本原理数据库系统数据库管理系统的类型数据库的模式与范式数据库设计事物管理分布式数据库系统
数据仓库
数据挖掘
Miaow.Y.Hu
·
2023-10-18 11:50
软考
系统架构
联邦学习中的攻击手段和防御机制
联邦学习产生的背景:海量数据的生成和这些数据的后续处理往往需要一个
数据仓库
并在仓库内汇总数据。
白兔1205
·
2023-10-18 08:34
笔试
人工智能
数据仓库
系列4-维度表
一.维度表技术基础1.1维度表结构 每个维度表都包含单一的主键列。维度表的主键可以作为与之关联的任何事实表的外键,维度表行的描述环境应与事实表行完全对应。维度表通常比较宽,是扁平型非规范表,包含大量的低粒度的文本属性。操作代码与指示器可作为属性对待,最强有力的维度属性采用冗余的描述填充。维度表属性是查询及BI应用的约束和分组定义的主要目标。报表的描述性标识通常是维度表属性领域值。image.pn
只是甲
·
2023-10-18 07:55
BI数据工程师--55、SSAS在商业决策中的重要性
BI数据工程师--医疗数据源下载BI数据工程师--医疗绩效PPT与医疗指标文档下载BI数据工程师--医疗
数据仓库
模型下载BI数据工程师--01、教程介绍BI数据工程师--02、BI数据工程师的特点BI数据工程师
focusBI
·
2023-10-18 06:42
数仓建设(三)
4.DWS公共汇总层设计规范
数据仓库
的性能是
数据仓库
建设是否成功的重要标准之一。聚集主要是通过汇总明细粒度数据来获得改进查询性能的效果。
未来在这儿
·
2023-10-18 06:10
数仓
大数据
数据库
数据仓库
121-124-Hadoop-MapReduce-etl:
ETL一词较常用在
数据仓库
,但其对象并不限于
数据仓库
在运行核心业务MapReduce程序之前,往往要先对数据进行清洗,清理掉不符合用户要求的数据。清理的过
镇魂Boby
·
2023-10-18 03:35
hadoop
大数据
hadoop
mapreduce
etl
【大数据之Hadoop】十七、MapReduce之数据清洗ETL
ETL是将业务系统的数据经过抽取、清洗转换之后加载到
数据仓库
的过程,目的是将分散、零乱、标准不统一的数据整合到一起,为决策提供分析依据。ETL的设计分三部分:数据抽取、数据的清洗转换、数据的加载。
阿宁呀
·
2023-10-18 03:04
hadoop
大数据
hadoop
mapreduce
etl
Hadoop3教程(十九):MapReduce之ETL清洗案例
ETL主要应用于
数据仓库
,但不只是应用于
数据仓库
,毕竟这个更像是一类思想。在运行核心的MR程序之前,往往要对数据进行清理,清除掉不符合用户要求的数据,
经年藏殊
·
2023-10-18 03:01
大数据技术
mapreduce
大数据
hadoop
BI工具-DataEase(2) 基础使用
先讲下工具栏,分别是仪表盘,数据集,数据源,模板市场等等.和大多数的BI工具一样,首先配置的就是数据源1.数据源:支持OLTP,OLAP,数仓/
数据湖
,我们这边还是使用的mysql新建mysql数据源,
大曲·蜗牛
·
2023-10-17 18:53
大数据
搜狐智能媒体
数据仓库
体系建设实践
分享嘉宾:翟东波搜狐媒体编辑整理:王洪达出品平台:DataFunTalk、AI启蒙者导读:本次分享的主题为搜狐智能媒体
数据仓库
体系建设实践,会对
数据仓库
中的基本概念进行简单梳理,明确
数据仓库
体系建设涵盖的相关流程
浪尖聊大数据-浪尖
·
2023-10-17 17:28
数据仓库
kafka
数据仓库
大数据
编程语言
数据库
数据分析
GBase 8a MPP产品简介
2、应用场景GBase8aMPPCluster用于支撑各类
数据仓库
系统、BI系统和决策支持系统。3、技术特点GBase8a
wangzhejijie
·
2023-10-17 17:18
国产数据库
数据仓库
big
data
数据库
MyCAT:回顾当年的热潮,探寻这款备受欢迎的数据库中间件的核心特性
可以替代MySQL的加强版数据库一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQLServer结合传统数据库和新型分布式
数据仓库
的新一代
技术琐事
·
2023-10-17 16:13
分布式
数据库
java
maven
数据库、数据中台、
数据仓库
、
数据湖
区别
数据时代,各行业的企业都已经开始通过数据库来沉淀数据,但是真的论起数据库、
数据仓库
、数据中台,还是新出现的
数据湖
,它们的概念和区别,可能知道的人就比较少了,今天我们详细来比较了解一下。
那小子、真烦
·
2023-10-17 13:06
数据库
数据仓库
与ETL
什么是
数据仓库
一种用于存储和管理数据的系统,提供一种统一方式,将不同来源、不同方式、不同时间的数据集成在一起。
数据仓库
结构主题域:一个特定领域的数据集,比如营销、销售、客户、库存等。
超级无敌暴龙战士塔塔开
·
2023-10-17 13:03
数据
数据仓库
etl
数据挖掘 (二)
一,体系结构典型数据挖掘系统数据的来源数据库服务器,数据库数据挖掘的引擎数据挖掘的模式数据可视化技术的展示二,数据类型关系数据库使用最广泛
数据仓库
各个分立的数据库统一事务数据库高级数据库系统和信息库空间数据库时间数据库和时间序列数据库时间数据库和时间序列数据库都存放与时间有关的数据
行走记忆时光
·
2023-10-17 12:13
Maxcompute批量分区删除
ps:Maxcompute
数据仓库
建设的分享。
Wesin
·
2023-10-17 10:41
大数据开发复习(1)
就业岗位介绍面试流程最重要的是简历基础复习JavamysqlLinuxday02HDFSMapReducehive(sqlboy)HBASEday03kafkaredisesday04scalasparkflinkday05etl
数据仓库
小码上线
·
2023-10-17 09:55
JavaSE
java
数据批处理速度慢?不妨试试这个
大部分业务统计都会要求以某日作为截止点,而且为了不影响生产系统的运行,跑批任务一般会在夜间进行,这时候才能将生产系统当天产生的新明细数据导出来,送到专门的数据库或
数据仓库
完成跑批
字母哥课堂
·
2023-10-17 08:47
金融用户实践|分布式存储支持
数据仓库
业务系统性能验证
作者:深耕行业的SmartX金融团队闫海涛估值是指对资产或负债的价值进行评估的过程,这对于投资决策具有重要意义。每个金融公司资管业务人员都期望能够实现实时的业务估值,快速获取最新的数据和指标,从而做出更明智的投资决策。为了更好地实现实时估值,某金融客户使用SmartX分布式块存储产品SMTXZBS进行系统性能优化探索,并与本地硬盘环境进行了对比测试。本文将重点分享客户在估值业务系统效率提升方向上所
志凌海纳SmartX
·
2023-10-17 01:22
金融
分布式
数据仓库
什么是商业智能(BI),就看这篇文章足够了
百度商业智能BI有很多很多官方的定义,各种解释,实际上从这么多年的经验出发,对商业智能BI的定义我认为不需要弄得很复杂,就三条:第一,商业智能BI是一套完整的由
数据仓库
、查询报表、数据分析等组成的数据类技术解决方案
派可数据BI可视化
·
2023-10-17 00:50
数据要素
商业智能
数字化转型
商业智能BI
数据分析
数据仓库
数据仓库
的基本概述之扫盲系列
数据仓库
的诞生原因随着互联网的普及,信息技术已经深入到各行各业,并逐步融入到企业的日常运营中。然而,当前企业在信息化建设过程中遇到了一些困境与挑战。1、历史数据积存。
派可数据BI可视化
·
2023-10-17 00:50
商业智能
数据要素
数字化转型
数据仓库
spark
大数据
商业智能BI
数字化转型
数据分析
数字化时代,
数据仓库
究竟是干什么的?
无论你是否专门从事大数据开发,作为一个开发人员,应该都听说过
数据仓库
的概念,那你知道为什么会出现
数据仓库
?
数据仓库
究竟是干嘛的吗?有什么价值和意义呢?那么本文就带到入门,揭开
数据仓库
的面纱。
派可数据BI可视化
·
2023-10-17 00:16
数据可视化
商业智能
数据仓库
数据仓库
商业智能BI
数据分析
信息可视化
大数据
数仓建设规范说明书
概述本⽂档是
数据仓库
规范设计说明书,旨在规范化、统⼀化
数据仓库
整体建设。通过数仓架构设计、数仓模型设计、数仓开发规范、数据质量规范这四个⽅⾯对整体数仓建设做好规范化的指导。
贾斯汀玛尔斯
·
2023-10-16 18:39
hadoop
数据湖
大数据
分布式
hadoop
LAS Spark 在 TPC-DS 的优化揭秘
TPC-DS是一个模拟复杂
数据仓库
环境的测试基准,LASSpark通过采用规则优化、缓存优化和运行时优化三类优化策略,实现了超越社区版本的巨大性能提升,且已在内部生产环境得到验证。文末更有专属彩
字节数据平台
·
2023-10-16 14:26
大数据
分布式
数据库
火山引擎
云原生
数据研发
「数仓建设」主题域划分
一、前言
数据仓库
具有面向主题的特性,那么就会有主题的概念,数仓建设是遵循纵向分层开发,横向划分主题域设计,数仓分层就不在这次谈了,这次我会结合本人数仓工作实践总结的经验来聊聊数仓主题域划分,同时会引申出主题划分
大数据阶梯之路
·
2023-10-16 12:38
阿里云“玩转云上 StarRocks3.0 湖仓分析”,开启数据分析新范式
通过存算分离架构,帮助用户降低存储成本、提升计算弹性;通过
数据湖
阿里云大数据AI技术
·
2023-10-16 12:27
阿里云
数据分析
云计算
SQL Server 2005 中的商务智能和
数据仓库
SQLServer2005中的商务智能和
数据仓库
(1)【导读】本文概述了SQLServer2
yangwl
·
2023-10-16 09:19
DataMining
with
SqlServer
sql
server
数据仓库
microsoft
数据库
数据挖掘
服务器
【大数据】 Hive安装 【学习笔记】
什么是HiveHive是一个
数据仓库
基础设施工具,用于处理Hadoop中的结构化数据。它位于Hadoop的顶部,用于汇总大数据
一个平凡de人
·
2023-10-16 06:31
大数据
hadoop
hive
大数据
Hive-SQL学习笔记
HIVE-SQLDDL(DataDefinationLanguage)DML(Datamanipulationlanguage)DQL(dataquerylanguage)Hive是基于Hadoop的一个
数据仓库
工具
Sais_Z
·
2023-10-16 06:00
数据库相关
大数据相关
hive
大数据
数据库
大数据--hive学习笔记
一、Hive简介建立在Hadoop之上的
数据仓库
架构hive的设计目标:可伸缩、可扩展、容错及输入格式松耦合!一套方便的实施数据抽取(ETL)的工具。一种让用户对数据描述其结构的机制。
TaroLee
·
2023-10-16 06:29
大数据系列
hive
hadoop
大数据
缩略语
MV-MachineVision-机器视觉DL-DeepLearning-深度学习;DM-DataMining-数据挖掘;DS-DataSciences-数据科学;DW-DataWarehousing-
数据仓库
小白学步
·
2023-10-16 03:49
Doris入门了解
Doris(以前称为Palo)是一种用于大规模数据存储和分析的开源分布式
数据仓库
,它允许您高效地存储和查询大量数据,是大数据处理生态系统的一部分。
花开终为谢
·
2023-10-16 01:15
大数据
doris
大数据
【大数据】Apache Hive数仓(学习笔记)
一、
数据仓库
基础概念1、数仓概述
数据仓库
(数仓、DW):一个用于存储、分析、报告的数据系统。OLAP(联机分析处理)系统:面向分析、支持分析的系统。
rexhao_wmh
·
2023-10-15 15:36
大数据
apache
hive
上一页
19
20
21
22
23
24
25
26
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他