E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
041-数据仓库
pyspark案例系列5-Spark ETL将MySQL数据同步到Hive
文章目录一.需求二.解决方案2.1全量同步2.2增量同步备注:Spark2.4.0一.需求最近做
数据仓库
项目的时候,觉得sqoop有点慢,然后想尝试使用Spark来做ETL。
只是甲
·
2023-11-21 10:33
大数据和数据仓库
#
Spark
hive
spark
mysql
pyspark案例系列6-将Hive表数据写入MySQL
文章目录一.需求二.解决方案一.需求我们做
数据仓库
的时候,一般是将源系统的数据(如MySQL)抽取到Hive中,然后在Hive中做ETL后,最后将处理完的数据从Hive再抽回到MySQL。
只是甲
·
2023-11-21 10:33
大数据和数据仓库
#
Spark
hive
mysql
spark
Deep Patient: An Unsupervised Representation to Predict the Future of Patients from the Electroni...
特别是,使用三层去噪自动编码器堆栈来捕获来自西奈山
数据仓库
的约700,000名患者的汇总EHR中的分层规律性和依存关系。结果就是我们称为“深层患者”的表示。我们通过评估患者
一二两清酒
·
2023-11-21 07:14
AIGC ChatGPT4对Gbase数据库进行总结
AIGCChatGPT职场案例AI绘画与短视频制作PowerBI商业智能68集数据库Mysql8.054集数据库Oracle21C142集Office2021实战应用Python数据分析实战,ETLInformatica
数据仓库
案例实战
阿里数据专家
·
2023-11-21 05:26
ChatGPT实战案例
ChatGPT
AIGC
数据分析
信息可视化
数据挖掘
excel
人工智能
数据库
数据仓库
hive本地/远程模式安装
文章目录1.简述2.本地模式2.1安装包准备2.2解压安装mysql2.2.1解压mysql安装包2.2.2安装mysql相关组件2.2.3修改my.cnf配置文件2.2.4更改所属组2.2.5启动mysql服务2.3hive解压安装及配置2.3.1解压2.3.2改名2.3.3配置环境变量2.3.4添加hive-site.xml配置文件2.3.5放置mysql驱动文件2.3.6启动hive3.远程
吴糖气泡水~
·
2023-11-20 20:25
大数据资源共享
hive
数据仓库
mysql
数据库
Hive本地模式安装(详细)
Hive是建立在Hadoop文件系统上的
数据仓库
,它提供了一系列工具,能够对存储在HDFS中的数据进行数据提取、转换和加载(ETL),这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的工具。
i阿极(暂时无法回复版)
·
2023-11-20 20:48
大数据
hive
数据库
hadoop
大数据数仓建模基础理论【维度表、事实表、数仓分层及示例】
数据仓库
建模(DataWarehouseModeling)是指在
数据仓库
(DataWarehouse)中组织和设计数据的过程,
月亮给我抄代码
·
2023-11-20 20:59
大数据
数据仓库
hive
你在使用大数据技术的时候,你知道大数据语言的工具与框架吗?
对OLAP
数据仓库
的迁移,如果用Python
yoku酱
·
2023-11-20 19:25
浅谈BI
首先引用百度百科的定义:商业智能(BusinessIntelligence,简称:BI),又称商业智慧或商务智能,指用现代
数据仓库
技术、线上分
秋夜雨凉
·
2023-11-20 18:34
Hive基础
Hive
数据仓库
数据仓库
是存数据的,企业的各种数据往里存,主要目的是为了分析有效数据,后续会基于它产出供分析挖掘的数据,或者数据应用需要的数据,如企业的分析性报告和各类报表等。
升级打怪的辉哥
·
2023-11-20 16:07
hive
数据仓库
hadoop
高斯DWS数据库分页查询优化思路
除了高斯其它关系型数据可也一样可以使用官方链接:EXPLAIN_
数据仓库
服务GaussDB(DWS)_8.2.0_DML语法_华为云参考链接:MySQL大数据量分页查询方法及其优化_mysql大数据量分页查询优化
4935同学
·
2023-11-20 10:41
数据库
sql
postgresql
gaussdb
Hive效率优化记录
Hive是工作中常用的
数据仓库
工具,提供存储在HDFS文件系统,将结构化数据映射为一张张表以及提供查询和分析功能。
Forge_ahead
·
2023-11-20 03:26
work_efficiency
Study
hive
hadoop
数据仓库
亚马逊云科技AI创新应用下的托管在AWS上的数据可视化工具—— Amazon QuickSight
简介AmazonQuickSight的独特之处AmazonQuickSight注册AmazonQuickSight使用Redshift和AmazonQuickSightt平台构建数据可视化应用程序构建
数据仓库
数据可视化
lqj_本人
·
2023-11-20 01:32
科技
人工智能
aws
第二节:
数据仓库
系统的体系结构
1:引言上一篇介绍了
数据仓库
的定义:面向主题的,集成的,不可修改的,随时间不断变化的用来更好的为企业或组织决策分析的数据集合。
weixin_30278311
·
2023-11-20 01:48
Hive参数与性能企业级调优(建议收藏)
Hive作为大数据平台举足轻重的框架,以其稳定性和简单易用性也成为当前构建企业级
数据仓库
时使用最多的框架之一。
坨坨的大数据
·
2023-11-19 23:58
数据仓库
数据仓库
数据仓库
,英文名称为DataWarehuse,简写DW或DWH。
数据仓库
,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
小纠结在简书
·
2023-11-19 23:54
MySQL进阶_7.数据库的设计规范
2.3、第三范式2.4、三大范式总结第三节、反范式化3.1、反范式化简介3.2、反范式的新问题3.3、反范式适用场景3.3.1、增加冗余字段的建议3.3.2、历史快照、历史数据的需要3.3.2.1数据库和
数据仓库
在使用上的区别第一节
珍珠是蚌的眼泪
·
2023-11-19 21:43
MySQL
mysql
设计规范
第一范式
第二范式
第三范式
反范式化
大数据全攻略:10年老兵带你看尽MaxCompute大数据运算挑战与实践(下)
大数据计算服务(MaxCompute,原名ODPS)是一种快速、完全托管的TB/PB级
数据仓库
解决方案。
chuange6363
·
2023-11-19 19:05
大数据
运维
java
轻量级数据中台,大中型企业数字化转型首选
数据中台是集数据管理、数据集成和数据分析于一体的平台,可以帮助企业将零散的数据整合到统一的
数据仓库
中,实现数据的统一管理和快速查询。同时,数据中台可以通
ETLCloud数据集成社区
·
2023-11-19 19:39
大数据
数据中台
阿里巴巴电商搜索推荐实时数仓演进之路
作者:张照亮(士恒)阿里巴巴搜索事业部高级技术专家1.业务背景阿里巴巴电商搜索推荐实时
数据仓库
承载了阿里巴巴集团淘宝、淘宝特价版、饿了么等多个电商业务的实时数仓场景,提供了包括实时大屏、实时报表、实时算法训练
阿里云Hologres
·
2023-11-19 18:38
4️⃣Hive
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
WovJf
·
2023-11-19 17:39
hive
数据仓库
数据仓库
-数仓架构
1
数据仓库
建设方法论1.1项目背景
数据仓库
将建设成为融通全公司数据资产,提供便捷数据分析和数据服务,支持全公司数字化经营与创新。
终回首
·
2023-11-19 14:50
数据仓库
大数据
数据仓库
架构
spark
大数据发展历程及技术选型
大数据发展历程第一阶段2000年-2010年数仓提供方企业级
数据仓库
(EDW)IOT(IBM、Oracle、Teradata)提供
数据仓库
建设从硬件、软件到实施的整体方案需要购买大(中、小)型机 配套商用的关系型数据库
平凡人笔记
·
2023-11-19 14:47
平凡人笔记
数据仓库
之电商数仓-- 1、用户行为数据采集
目录一、
数据仓库
概念二、项目需求及架构设计2.1项目需求分析2.2项目框架2.2.1技术选型2.2.2系统数据流程设计2.2.3框架版本选型2.2.4服务器选型2.2.5集群规模2.2.6集群资源规划设计三
FunnyPrince_
·
2023-11-19 14:10
大数据
#
Hadoop
#
数据仓库
big
data
数据仓库
hadoop
zookeeper
flume
2023-Hive调优最全指南
本文基本涵盖以下内容:一、基于Hadoop的
数据仓库
Hive基础知识二、HiveSQL语法三、Hive性能优化四、Hive性能优化之数据倾斜专题五、HiveSQL优化十二板斧六、Hive面试题(一)七、
000X000
·
2023-11-19 13:43
数据仓库
性能测试和优化
HIVE
hive
hadoop
大数据
Hive调优最全指南
Hive 调优指南
Hive调优指南ApacheHive是一个基于Hadoop的
数据仓库
解决方案,用于查询和分析大量的结构化数据。为了提高Hive查询性能和效率,本文将介绍一些Hive调优的策略和方法。
小泽长不胖
·
2023-11-19 13:41
大数据
hive
hadoop
大数据
本地数仓项目(四)—— 即席查询
本文基于文章《本地
数据仓库
项目(一)——本地数仓搭建详细流程》和《本地数仓项目(二)——搭建系统业务数仓详细流程》以及《本地数仓项目(三)——数据可视化和任务调度》2Presto2.1Presto概念Presto
不以物喜2020
·
2023-11-19 08:09
大数据数仓
Druid
presto
impala
kylin
即席查询
OLAP和OLTP
OLAP联机分析处理是
数据仓库
系统的主要应用强调SQL执行市场,强调磁盘I/O
任嘉平生愿
·
2023-11-19 06:05
计算机三级数据库知识点汇总附思维导图
数据库应用系统功能设计与实施第五章:UML与数据库应用系统第六章:高级数据查询第七章:数据库及数据库对象第八章:数据库后台编编址技术第九章:安全管理第十章:数据库运行维护与优化第十一章:故障管理第十二章:
数据仓库
与数据挖掘写在前面
cx330上的猫
·
2023-11-19 04:35
数据库
mysql
Spark学习——1.代表性大数据技术
HDFS分布式文件管理系统Hive
数据仓库
数据仓库
,借助底层HDFS和HBase完成存
楓尘林间
·
2023-11-18 23:37
Spark
Spark
大数据学习
阿里云云原生一体化数仓 - 数据安全能力解读
MaxCompute产品简介MaxCompute是一款多功能、低成本、高性能、高可靠、易于使用的
数据仓库
和支持全部数据湖能力的大数据平台,支持超大规模、serverless和完善的多租户能力,内建企业级安全能力和管理功能
阿里云云栖号
·
2023-11-18 21:28
大数据
云计算
阿里云
数据治理概念解读
静态数据1、主数据2、基础数据3、静态数据四、数据标准、数据规范五、数据目录、数据分类、数据标签1、数据目录2、数据分类3、数据标签六、数据模型、数据结构、数据字典1、数据模型2、数据结构3、数据字典七、
数据仓库
灯惉
·
2023-11-18 21:57
数据治理
企业数字化过程中
数据仓库
与商业智能的目标
当前环境下,各领域企业通过数字化相关的一切技术,以数据为基础、以用户为核心,创建一种新的,或对现有商业模式进行重塑就是数字化转型。这种数字化转型给企业带来的效果就像是一次重构,会对企业的业务流程、思维文化、组织建设、管理方式和经营理念等一切原有的东西进行改变。只要企业能够持续坚持数字化转型的路径,就能通过新一代的数字化技术为企业发展赋能,不仅可以提高企业的运转效率,提高洞察决策的精准度,还能很大基
派可数据BI可视化
·
2023-11-18 18:27
数据仓库
数字化转型
商业智能
数据仓库
spark
大数据
商业智能BI
数据分析
Prometheus MySQL 性能监控
MySQL数据库对于web应用程序、企业级应用程序和
数据仓库
等应用场景都非常适用。Prometheus提供了许多适用于
davidshiz
·
2023-11-17 13:52
mysql
prometheus
数据库
什么是数据湖,数据湖和
数据仓库
的区别在哪
数据仓库
是什么
数据仓库
数据湖数据来自事务系统、运营数据库和业务线应用程序的清洗过结构化数据来自IoT设备、网站、移动应用程序、社交媒体和企业应用程序的原始数据架构设计在
数据仓库
实施之前(写入型Schema
我去探险了
·
2023-11-17 13:45
数据湖技术
数据仓库
hive
big
data
云上11.11|腾讯云大数据产品双11盛惠 爆品首单1折起大回馈
11.11云上盛惠多款大数据产品特惠专场腾讯云BI、ElasticsearchService、流计算Oceanus、腾讯云
数据仓库
TCHouse-D、移动推送、数据湖计算DLC首月秒杀1元起、新客首购1.2
腾讯云大数据
·
2023-11-17 11:24
腾讯云
大数据
云计算
《网易-数据中台》学习笔记
《网易-数据中台》学习笔记1.大数据发展历程1.1
数据仓库
1.2Hadoop-数据湖1.3大数据平台1.4数据中台1.5Next:大数据+人工智能2.
数据仓库
2.1
数据仓库
建模2.1.1E-R模型2.1.2
杰克jk船长
·
2023-11-17 07:15
数据治理
学习
笔记
数据仓库
大数据
数据仓库
相关
在阿里巴巴的数据体系中,我们建议将
数据仓库
分为三层,自下而上为:数据引入层(ODS,OperationDataStore)、数据公共层(CDM,CommonDataModel)和数据应用层(ADS,ApplicationDataService
zhixingheyi_tian
·
2023-11-17 07:55
大数据
数据仓库
大数据
spark
KingbaseDTS数据库迁移工具人大金仓国产数据库同步工具Java版本使用方法
数据库迁移工具人大金仓国产数据库同步工具Java版本使用方法金仓数据库简介人大金仓数据库管理系统KingbaseES(KES)是面向全行业、全客户关键应用的企业级大型通用数据库管理系统,适用于联机事务处理、查询密集型
数据仓库
技术很渣
·
2023-11-17 06:30
DBA运维
数据库技术
数据库
dba
【clickhouse】clickhouse 表引擎 之 AggregatingMergeTree
文章目录1.概述M.参考1.概述过
数据仓库
建设经验的读者一定知道“数据立方体”的概念,这是一个在
数据仓库
领域十分常见的模型。
九师兄
·
2023-11-17 05:16
clickhouse
clickhouse
大数据平台搭建之hive本地模式安装
Hive是一个开源的
数据仓库
基础设施,用于查询和分析大规模数据集。它建立在Hadoop上,并提供了类似于传统数据库的查询和分析功能。
bigdata从入门到放弃
·
2023-11-17 03:58
hive
大数据
hive
hadoop
linux
服务器
数据仓库
15万块机械硬盘最新质量报告:HGST零故障、可惜买不到了
三季度,BB总计拥有153727块机械硬盘,其中2780块是启动盘,
数据仓库
盘为150947块。剔除运行时间不足60天的硬盘,统计表中总计涵盖150757块。
程序员资源社区
·
2023-11-17 03:57
数据仓库
kylin
分布式存储
项目管理
less
hive数仓-数据的质量管理
版本20231116要理解数据的质量管理,应具备hive
数据仓库
的相关知识文章目录1.理解什么是数据的质量管理:2.数据质量管理的规划数据质量标准的分类3.数据质量管理解决方案1.ods层的数据质量校验
江南正晓时
·
2023-11-17 01:33
hive
hadoop
数据仓库
大数据应用开发线上班(学徒班)课程大纲
泰迪智能科技大数据应用开发线上班课程使用当下流行的Hadoop+Spark大数据框架,全面、深入地探讨了大数据开发、大数据分析、
数据仓库
等技术。
泰迪智能科技
·
2023-11-16 19:23
大数据
项目实战
大数据
人工智能
python
天津市专业大数据培训班,大数据就业岗位的多样性
大数据就业岗位多样大数据培训所涉及的就业岗位有数据工程师、
数据仓库
工程师、数据分析师、大数据架构师、等。
qq_38453958
·
2023-11-16 15:24
大数据培训
天津大数据培训
天津大数据培训班
天津大数据培训机构
天津大数据培训学校
大数据培训
火山引擎ByteHouse:4000字总结,Serverless在OLAP领域应用的五点思考
作为一款火山引擎推出的云原生
数据仓库
,ByteHo
字节数据平台
·
2023-11-16 12:16
火山引擎
serverless
云原生
Databend 与海外某电信签约:共创海外电信
数据仓库
新纪元
为什么选择Databend海外某电信面临的主要挑战是随着业务量的增加,传统的Clickhouse+Hive方案在数据存储和处理上开始显露不足。原来的大数据分析采用的Clickhouse+Hive方案进行离线的实时报表。但随着业务量的上升后,Hive的数据存储压力变大,且Hive缺乏索引设计,导致存储压力巨大,每天需要进行大量的中转和数据比对工作。同时Clickhouse随着业量上升后单机已经扩容到
Databend
·
2023-11-16 07:49
数据仓库
Flink 1.12的CDC
基于Flink构建流批一体的实时数仓是目前
数据仓库
领域比较火的实践方案。随着Flink的不断迭代,其提供的一系列技术特性使得用户构建流批一体的应用变得越来越方便。
'煎饼侠
·
2023-11-15 19:56
Flink
数据仓库
入门简介
一,数组仓库介绍
数据仓库
(英语:DataWarehouse,简称数仓、DW)是一个为数据分析而设计的企业级数据管理系统。它旨在支持企业决策过程中的数据分析和业务智能。
浮生夢
·
2023-11-15 17:12
数据仓库
企业级
数据仓库
是什么
一、
数据仓库
定义简单理解:
数据仓库
就是整合多个数据源的历史数据进行细粒度的、多维的分析,帮助高层管理者或者业务分析人员做出商业战略决策或商业报表。
靠谱杨
·
2023-11-15 17:10
数据仓库
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他