E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
阿里
数据仓库
搭建实践分享
内容来源:2017年7月8日,阿里云高级技术专家后稷在“阿里云—数据化运营实践分享【7上海站】”进行《阿里
数据仓库
搭建实践分享》演讲分享。
IT大咖说
·
2024-01-18 05:24
关联规则分析(Apriori算法
啤酒和尿布的关联规则故事沃尔玛公司
数据仓库
里集中了其各门店的详细原始交
天玑y
·
2024-01-18 02:09
#
机器学习
算法
数学建模
大数据
机器学习
人工智能
数据分析
数据挖掘
离线数仓二
数据仓库
维度模型设计维度建模基本概念维度模型是
数据仓库
领域大师RalphKimall所倡导,他的《
数据仓库
工具箱》,是
数据仓库
工程领域最流行的数仓建模经典。
pauls
·
2024-01-18 00:26
数据仓库
面试题
1思维导图&数仓常见面试题2题目1.
数据仓库
是什么?
韩顺平的小迷弟
·
2024-01-17 21:53
大数据面试题
数据仓库
大数据
离线
数据仓库
-关于增量和全量
数据同步策略
数据仓库
同步策略概述一、数据的全量同步二、数据的增量同步三、数据同步策略的选择
数据仓库
同步策略概述应用系统所产生的业务数据是
数据仓库
的重要数据来源,我们需要每日定时从业务数据库中抽取数据,传输到
数据仓库
中
Aimyon_36
·
2024-01-17 20:38
数据仓库
数据仓库
spark
oracle
GaussDB(DWS)查询优化技术大揭秘
GaussDB(DWS)查询优化技术大揭秘大数据时代,数据量呈爆发式增长,经常面临百亿、千亿数据查询场景,当
数据仓库
数据量较大、SQL语句执行效率低时,
数据仓库
性能会受到影响。
炒香菇的书呆子
·
2024-01-17 15:52
活动征文
华为云
gaussdb
Hive数据导出的四种方法
hive
数据仓库
有多种数据导出方法,我在本篇文章中介绍下面的四种方法供大家参考:Insert语句导出、Hadoop命令导出、Hiveshell命令导出、Export语句导出。
冬瓜的编程笔记
·
2024-01-17 08:31
大数据
hive
hadoop
数据仓库
hive除数取整
简介Hive是一个构建在Hadoop上的
数据仓库
基础设施,它提供了一个类似于SQL的查询语言,用于处理大规模的结构化数据。在Hive中,我们常常需要对数据进行数学运算,包括除法操作。
cuisidong1997
·
2024-01-17 08:30
hive
hadoop
数据仓库
HashData湖仓一体方案:方案概览与Hive数据同步
随着云计算、大数据、AI的发展和普及,各行各业的业务场景日益复杂,数据呈现出大规模、多样性的特点,企业对
数据仓库
的需求也进一步拓展至对多元化数据实时处理的场景。
HashData酷克数据
·
2024-01-17 07:55
hive
hadoop
数据仓库
数据仓库
建模
要将这些数据转化为有意义的信息,并为企业智能决策提供支持,一个重要的步骤是进行
数据仓库
建模。本文将深入探讨
数据仓库
建模的意义、建模分类和步骤。
临界爵迹
·
2024-01-17 06:12
数据仓库
数据仓库
工作十年总结的六条面试技巧,助力你拿到理想的offer
大数据开发的领域不同,面试的锚定点也不同,从我过往的经验来说,可以大致来将大数据领域的开发分为如下几种:离线开发:
数据仓库
、离线计算、ETL开发实时开发:流计算开发基础架构:组件二次开发,底层组件稳定性维护大数据运维方向数据平台开发一
KubeData
·
2024-01-17 02:12
个人成长
面试
职场和发展
大数据
一文了解数据库vs
数据仓库
vs数据湖
为什么会有
数据仓库
?拆解几个OLAP核心概念大数据技术架构演进过程什么是数据湖?数据库、
数据仓库
、数据湖:哪个更合适?什么是数据库?
KubeData
·
2024-01-17 02:11
云原生大数据
大数据技术
数据库
数据仓库
大数据
数据库架构
一文了解数据库,
数据仓库
,数据湖,数据集市,数据湖仓
目录一、定义1.数据库(Database)2.
数据仓库
(DataWarehouse)3.数据湖(DataLake)4.数据集市(DataMart)5.数据湖仓(DataLakehouse)二、相同、异同
giszz
·
2024-01-17 02:27
学习笔记
人工智能
数据库
数据仓库
oracle
Hive数学函数讲解
Hive是一个基于Hadoop的
数据仓库
工具,它支持类似于SQL的查询语言HiveQL,并且提供了许多内建的数学函数来处理数值数据。下面我将逐一讲解您提到的这些数学函数,并提供一些使用案例和注意事项。
田晖扬
·
2024-01-17 02:55
hive内置函数讲解
hive
hadoop
数据仓库
Python操作数据库
可以方便地支持关系型数据库如DB2、InFormix、MySQL、MsSQL、Access、Sybase,以及非关系型数据库如XML、MetaKit、Durus等的访问操作,支持嵌入式数据库SQLite、ThinkSQL,支持
数据仓库
系统
酷飒de小姐姐
·
2024-01-16 23:54
《21天晋级大数据实战营》小结汇总
【DAY17】轻松探索数据背后的价值-数据湖探索实验小结点击查看【DAY15】让数据产生价值--
数据仓库
服务实验小结点击查看【DAY14】机器学习实战-销售预测实验小结点击查看【DAY13】车联网应用之轨迹分析实验小结点击查看
技术火炬手
·
2024-01-16 12:48
BIOS知识枝桠——RAID 磁盘阵列
磁盘A和B,放在A中的文件与B磁盘没有关系,两块磁盘是完全独立的两个
数据仓库
,这种传统的没有联系的关系简称JBOD(Justabunch
Hi,Hubery
·
2024-01-16 08:14
BIOS硬件部分
bios
Hive知识点
基本概念:由Facebook开源,构建在Hadoop之上的
数据仓库
,数据计算是mapreduce,数据存储是HDFS目的是构建面向分析的集成的数据环境,为企业提供决策支持(面向分析的存储系统)主要特征:
꧁༺朝花夕逝༻꧂
·
2024-01-16 07:25
hive
hadoop
数据仓库
大数据技术原理与应用 第三版 林子雨 期末复习(四) Hive
大数据技术原理与应用第三版林子雨期末复习(四)Hive概念
数据仓库
层次传统
数据仓库
面临的挑战Hive简介Hive与传统数据库对比概念Hive是一个基于Hadoop的
数据仓库
工具。
头发多多,肆意生长
·
2024-01-16 05:22
大数据技术
数据仓库
big
data
hive
Clickhouse实时指标加工
Starwift实时指标加工方案方案介绍Starwift(ClickHouse)是京东云上的一款云原生
数据仓库
,为用户带来极速分析体验,能够支撑实时数据分析和海量数据离线分析。
麦田里的守望者·
·
2024-01-16 04:10
clickhouse
大数据
ClickHouse - 01
Sqoop)将数据抽取到HDFS中,这个过程可以使用MapReduce、Spark、Flink技术对数据进行ETL清洗处理,也可以直接将数据抽取到Hive数仓中,一般可以将结构化的数据直接抽取到Hive
数据仓库
中
ArthurHC
·
2024-01-16 02:17
数据库,
数据仓库
, 数据集市,数据湖,数据中台
转载声明本文大量内容系转载自以下文章,有删改,并参考其他文档资料加入了一些内容:
数据仓库
和数据集市的区别作者:修鹏李出处:CSDN大数据:
数据仓库
和数据库的区别作者:南宫蓉出处:简书第一篇:
数据仓库
概述第二篇
cxzhq2002
·
2024-01-16 01:26
数据库
LR.JAVA平台商业可视化大屏(BI)设计演示
关于BI商业智能(BusinessIntelligence,简称:BI),又称商业智慧或商务智能,指用现代
数据仓库
技术、线上分析处理技术、数据挖掘和数据展现技术进行数据分析以实现商业价值。
IT加班狗啊
·
2024-01-15 12:56
数据库系统(重点,上午下午都会考)
模型关系代数与元组规范化理论函数依赖价值与用途·键题目答案:A,ABCD,B范式(重点)第一范式第二范式第三范式BC范式题目模式分解列表公式法并发控制基本概念并发中存在的问题封锁协议数据库完整性约束数据库安全数据备份
数据仓库
与数据挖掘反规范化大数据
努力发光的程序员
·
2024-01-14 16:49
软考
数据库
软件设计师
数据仓库
(3)-模型建设
本文从以下9个内容,介绍数据参考模型建设相关内容。1、OLTPVSOLAPOLTP:全称OnLineTransactionProcessing,中文名联机事务处理系统,主要是执行基本日常的事务处理,比如数据库记录的增删查改,例如mysql、oracleOLAP:全称OnLineAnalyticalProcessing,中文名联机分析处理系统,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询
XianMing的博客
·
2024-01-14 11:57
数据仓库
数据仓库
数据仓库
(1)-总览
从事
数据仓库
工作已经7年了。整理下这个行业的相关知识。整体大纲如下,分为8个部分,包括认识数仓,数仓模型建设,元数据管理,指标体系,数据质量,数据安全,数据治理,实时技术。
XianMing的博客
·
2024-01-14 11:27
数据仓库
数据仓库
数据仓库
(2)-认识数仓
1、
数据仓库
是什么
数据仓库
,由
数据仓库
之父比尔·恩门(BillInmon)于1990年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过
数据仓库
理论所特有的资料储存架构
XianMing的博客
·
2024-01-14 10:53
数据仓库
数据仓库
spark
大数据
Hive数据定义(2)
hive数据定义是hive的基础知识,所包含的知识点有:
数据仓库
的创建、
数据仓库
的查询、
数据仓库
的修改、
数据仓库
的删除、表的创建、表的删除、内部表、外部表、分区表、桶表、表的修改、视图。
冬瓜的编程笔记
·
2024-01-14 06:25
大数据
hive
hadoop
数据仓库
数据仓库
-离线数仓(基于物流数仓)
1、
数据仓库
概述1.1、
数据仓库
概念
数据仓库
是一个为数据分析而设计的企业级数据管理系统。
数据仓库
可集中、整合多个信息源的大量数据,借助
数据仓库
的分析能力,企业可从数据中获得宝贵的信息进而改进决策。
小鱼干换酒钱
·
2024-01-14 06:39
#
物流数仓
数据仓库
hive
美团点评实时数仓平台演进与实践
1.摘要
数据仓库
的建设是“数据智能”必不可少的一环,也是大规模数据应用中必然面临的挑战,而Flink实时数仓在数据链路中扮演着极为重要的角色。
笔名辉哥
·
2024-01-14 02:50
数仓建模—埋点设计与管理
数据仓库
系列文章(部分已出,持续更新)数仓架构发展史数仓建模方法论数仓建模分层理论数仓建模—宽表的设计数仓建模—指标体系
数据仓库
之拉链表数仓—数据集成数仓—数据集市数仓—商业智能系统数仓—埋点设计与管理数仓
大数据技术派
·
2024-01-14 01:22
mycat中间件+mysql集群
可以替代MySQL的加强版数据库一个可以视为MySQL集群的企业级数据库,用来替代昂贵的Oracle集群一个融合内存缓存技术、NoSQL技术、HDFS大数据的新型SQLServer结合传统数据库和新型分布式
数据仓库
的新一代企业级数据库产品一个新颖的数据库中间件产品
小样想当当
·
2024-01-14 01:19
数据库
中间件
mysql
java
Shell ETL 操作
删除文件第一行记录,即字段名称处理的文件第一行都是字段名称,我们在文件中的数据导入到
数据仓库
Hive中时,不需要第一行字段名称,因此,这里在做数据预处理时,删除第一行。
数据小白鼠
·
2024-01-13 23:54
大数据
广义来说,hadoop通常指一个更广泛的概念,hadoop生态圈:image.pngHive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将
哈斯勒
·
2024-01-13 19:30
Hive安装部署
安装好对应版本的hadoop集群,并启动hadoop的HDFS以及YARN服务安装了MySQL服务,并启动MySQL的服务Hive的安装部署注意hive就是==一个构建
数据仓库
的工具==,只需要在==一台服务器上
我还不够强
·
2024-01-13 13:35
Hive及各组件功能介绍
Hive是一个开源的
数据仓库
基础设施,是构建在Hadoop之上的。它提供了一种类似于SQL的查询语言,称为HiveQL,用于查询和分析存储在Hadoop中的大规模数据集。
思旭�
·
2024-01-13 12:32
hive
hadoop
数据仓库
如何在VS 2019里安装SQL Server
数据仓库
开发工具
SQLServer的AnalyticService提供了强大的
数据仓库
功能,开发者可以使用VS2019来开发这些功能,但是VS2019即使安装了SQLServerDataTools开发者也找不到创建MultidimensionalProject
surfirst
·
2024-01-13 10:39
架构
sqlserver
数据仓库
数据仓库
Apache Hive
数据仓库
ApacheHive内容大纲#
数据仓库
基础核心知识1、
数据仓库
是什么为何而来?
江枫渔火R
·
2024-01-13 09:29
数据仓库
apache
hive
大数据
2022-02-01大数据学习日志——Hadoop离线阶段——
数据仓库
、Apache Hive
学习目标理解数仓概念、起源由来理解数仓(OLAP)与数据库(OLTP)区别掌握数仓分层架构思想掌握ApacheHive功能与架构组件理解ApacheHive远程模式部署安装内容大纲#
数据仓库
基础核心知识
王络不稳定
·
2024-01-13 09:28
数据仓库
big
data
hive
数据仓库
& Apache Hive
一、数据分析1、
数据仓库
数据仓库
(英语:DataWarehouse,简称数仓、DW),是一个用于存储、分析、报告的数据系统。
杀神lwz
·
2024-01-13 09:52
大数据
数据分析
数据仓库
apache
hive
ETL详解--
数据仓库
技术
一、ETL简介ETL,是英文Extract-Transform-Load的缩写,用来描述将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,是
数据仓库
的生命线
小菠萝Mm
·
2024-01-13 07:45
数据仓库
etl
学习
数据库
年终总结各类表格模板Excel,大屏可视化,PPT总结等
AIGCChatGPT职场案例AI绘画与短视频制作PowerBI商业智能68集数据库Mysql8.054集数据库Oracle21C142集Office2021实战应用Python数据分析实战,ETLInformatica
数据仓库
案例实战
阿里数据专家
·
2024-01-13 06:15
ChatGPT实战案例
ChatGPT
与
Python
ChatGPT
excel
powerpoint
prompt
chatgpt
AIGC
oracle
数据仓库
研发规范
数据仓库
研发规范本文将介绍
数据仓库
研发规范的阶段规划、角色职责和整体流程。在大数据时代,规范地进行数据资产管理已成为推动互联网、大数据、人工智能和实体经济深度融合的必要条件。
左美美  ̄
·
2024-01-13 06:55
数据仓库
基于大数据与时间序列预测的的书籍数据分析(内含spark+hive+mysql+kettle+echart+tensorflow)
tensorflow简介(二)前端相关技术1.HTML简介2.echarts简介(三)相关数据库1.Mysql简介2.hive简介三.需求分析三.系统设计项目框架:系统目的:数据库设计:四.系统实现1.预处理:
数据仓库
左岸2420
·
2024-01-13 05:59
数据库
大数据
深度学习
大数据
spark
hive
mysql
tensorflow
echarts
Hive学习笔记(Hive数据的定义与操作)
管理表外部表修改表删除表分区表静态分区动态分区HiveQL数据操作向管理表中装载数据经查询语句向表中插入数据单个查询语句中创建表并加载数据导入数据导出数据Hive数据定义与操作HiveQL数据定义语言Hive
数据仓库
中的
ジ時光不老
·
2024-01-13 04:22
Hive学习
java
开发语言
后端
Hive数据定义(1)
hive数据定义是hive的基础知识,所包含的知识点有:
数据仓库
的创建、
数据仓库
的查询、
数据仓库
的修改、
数据仓库
的删除、表的创建、表的删除、表的修改、内部表、外部表、分区表、桶表、表的修改、视图。
冬瓜的编程笔记
·
2024-01-13 04:47
大数据
hive
hadoop
数据仓库
2022字节跳动【
数据仓库
工程师】日常实习面经-----一面
文章目录一,自我介绍二,问答阶段三,代码阶段四,反问五,总结背景:今年金三银四,看着大家都在疯狂找实习offer,不甘落后的我也信心满满(毫无把握)的去字节面试(现在想想真是胆大,都还没学扎实)一,自我介绍二,问答阶段shuffle阶段详细介绍回答环形缓冲区,分区排序,溢写磁盘,reduce再抽取归并等等计算单元和实际block存储单元不在一个机器节点上,这样会带来大量的IO操作,Hadoop如何
dyson不只是吹风机
·
2024-01-13 03:34
面试
数据仓库
大数据
第三阶段、
数据仓库
一、
数据仓库
的基本定义:1.
数据仓库
:简称DW或DWH,是数据库的一种概念上的升级,是为企业所有级别的决策制定过程,出于分析性报告和决策支持目的而创建。
ATPX4869l
·
2024-01-13 01:14
如何解决NAND系统性能问题?--NAND分类
一、故事引言想象一下,你正在管理一座神奇的
数据仓库
,这个仓库没有沉重的门、旋转的磁盘和机械手臂,而是由一群训练有素的“数据小飞侠”组成。
古猫先生
·
2024-01-13 01:15
NAND
大数据
linux
性能优化
服务器
从 AutoMQ Kafka 导出数据到 Databend
作者:韩山杰DatabendCloud研发工程师https://github.com/hantmacDatabend是使用Rust研发、开源的、完全面向云架构、基于对象存储构建的新一代云原生
数据仓库
,为企业提供湖仓一体化
Databend
·
2024-01-12 20:44
开源
数据库
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他