E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
--------【数据仓库】
HIVE--入门小结
Hive是基于Hadoop的一个
数据仓库
,可以将结构化的数据文件映射为一张表,并提供类sql查询功能,Hive底层将sql语句转化为mapreduce任务运行。
u:boom
·
2022-12-12 09:42
HIVE
SQL
hive
mysql
大数据
数据库
Hive-入门、安装以及基本使用
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
魔笛Love
·
2022-12-12 09:00
hive
Spark SQL 概述+RDD、DataFrame、DataSet区别+DataFrame和DataSet常用操作
:掌握DataFrame/DataSet数据结构和使用方式目标3:熟练使用SparkSQL完成计算任务1.SparkSQL概述1.1.SparkSQL的前世今生Shark是一个为Spark设计的大规模
数据仓库
系统
Transkai47
·
2022-12-12 07:48
大数据
编程语言
python
java
数据库
数据挖掘概念与技术(第三版)课后答案——第四章
==============4.1试述多个异构信息源的集成,为什么许多公司更喜欢更新驱动的方法(构造和使用
数据仓库
),而不是查询驱动的方法(适用包装器和集成器)。
进击的小绵羊
·
2022-12-11 19:17
数据挖掘
Data
Mining
《数据处理与知识发现》章节测验复习
《数据处理与知识发现》章节测验第1章绪论章节测验第2章数据预处理章节测验第3章
数据仓库
章节测验第4章关联规则挖掘章节测验第5章聚类分析方法章节测验第6章分类规则挖掘章节测验首先我们要明白关联分析、聚类分析以及分类分析这三者的概念
kiro_1023
·
2022-12-11 19:46
数据挖掘
聚类
算法
《数据处理与知识发现》作业 复习用
作业复习第2章数据预处理作业第3章
数据仓库
作业第4章关联规则挖掘作业1新第4章关联规则挖掘作业2第5章聚类分析方法作业新第6章分类规则挖掘作业1第6章分类规则挖掘作业2第2章数据预处理作业一.简答题(共
kiro_1023
·
2022-12-11 19:43
数据仓库
数据挖掘
数据分析
数据仓库
的 KPI 怎么定?
一、数仓模型优化-如何判断一个数据模型的好坏1.完善度汇总数据能直接满足多少查询需求,即应用层访问汇总层数据的查询比例跨层引用率:ODS层直接被DWS/ADS/DM层引用的表,占所有ODS层表比例可以快速响应业务方的需求比较好的模型,使用方式是可以直接从该模型获取所有想要的数据的,如果DWS,ADS,DM层直接引用ODS层的表比例太大,即跨层引用率太高,则该模型不是最优,可以继续优化2.复用度模型
四月天03
·
2022-12-11 17:43
数仓&数据中台
big
data
数据库
数据仓库
Hive 从入门到小牛(一)
目录一、
数据仓库
的介绍1.1
数据仓库
的基本概念1.2
数据仓库
的主要特征1.3
数据仓库
与数据库区别1.4
数据仓库
分层架构1.5
数据仓库
之ETL二、Hive简介2.1什么是Hive?
Amo Xiang
·
2022-12-11 11:53
大数据开发
hive
数据仓库
大数据
最详细的Hive&HBase
Hive一Hive基本概念1Hive简介1.1什么是HiveHive由Facebook实现并开源,是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据映射为一张数据库表,并提供HQL(HiveSQL
kuokay
·
2022-12-11 11:21
大数据
HBase
Hive
数据库
大数据
大数据架构之端到端方案综述(3)数据仓储&Hive
1
数据仓库
介绍1.1
数据仓库
简介
数据仓库
是一个面向主题的、集成的、随时间变化的、但信息本身相对稳定的数据集合,主要针对来自多个数据源的历史数据进行细粒度、多维度的分析,输出用于企业的数据分析、数据挖掘、
小事儿Phil
·
2022-12-11 11:20
大数据
数据仓库
主题
Hive
Hbase
Hive 3.x详细笔记
Hive
数据仓库
概念
数据仓库
(DataWarehouse,简称数仓、DW),是一个用于存储,分许,报告的数据系统。
数据仓库
的目的是构建面向分析的集成数据环境,分析结果为企业提供决策支持。
会飞的鱼269
·
2022-12-11 11:49
hive
json
sql
大数据
数据仓库
大数据分析_Hive&HBase
1594524836596)(/img/hive.jpg)]学习目标-了解什么是Hive-了解为什么使用Hive####1.1什么是HiveHive由Facebook实现并开源,是基于Hadoop的一个
数据仓库
工具
小白逆袭记
·
2022-12-11 11:19
hadoop
分布式
大数据
数据仓库
建设及数据治理总结
用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此
数据仓库
会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。
000X000
·
2022-12-10 20:46
数据仓库
数据分析
数据中台
数据仓库
大数据
数据治理
数仓建设以及数据治理
文章目录前言数仓设计数仓架构数仓建模方法建模实际业务中的数仓分层数据层的具体实现数据治理数据治理之道数据治理方式规范治理架构治理以下文章来源五分钟学大数据,作者园陌,关于数仓建设及数据治理的超全概括前言数仓分层的原因:用空间换时间,通过大量的预处理来提升应用系统的用户体验,因此
数据仓库
会存在大量冗余的数据
RyanC3
·
2022-12-10 20:42
#
系统安全
大数据
大数据演进简史:从数仓到数据中台,谈技术选型最优解
今天分享的议题主要包括几大内容:带大家回顾一下大数据在国内的发展,从传统数仓到当前数据中台的演进过程;我个人认为数据中台的核心组成,以及一些技术选型参考;数据研发是数据中台很重要的一环,会分享一些我们在数据研发方面的实践,主要是
数据仓库
架构与研发方面
天秤座的架构师
·
2022-12-10 20:42
架构微学堂
商业操作系统--企业中台实践
数据中台
数据仓库
数仓、数据湖、数据中台介绍
在数据库开发和优化、
数据仓库
、系统架构、大中型项目管理、数据治理、数据分析、大数据方面有一定研究。参与移动集团经营分析系统5.0、企业级大数
hzp666
·
2022-12-10 20:06
数据库
spark
Flink
大数据
数据仓库
数据中台
《大型综合项目-基于大数据平台的
数据仓库
》学习笔记(03):数仓概念篇1
本项目教程笔记源自多易教育《Titan综合
数据仓库
与数据运营系统》,在CSDN学院有相关视频教程购买链接,大数据企业级项目实战–Titan大型数据运营系统本项目课程是一门极具综合性和完整性的大型大数据项目实战课程
江湖人称涛哥
·
2022-12-10 20:33
大数据综合实战项目
大数据项目
数据仓库
大数据数仓
spark项目
hive项目
1W字概括数仓建设和数据治理
用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此
数据仓库
会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整
无精疯
·
2022-12-10 20:03
数据仓库
大数据
编程语言
人工智能
数据分析
数仓建设及数据治理
用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此
数据仓库
会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。
'煎饼侠
·
2022-12-10 20:31
数仓
postgresql
数据库
数据仓库
规范建设指南
数据仓库
规范建设指南1.数仓公共开发规范1.1层次调用规范稳定业务按照标准的数据流向进行开发,即ODS->DWD->DWS->APP。
༄Chlོ࿆inReོ࿆i༅
·
2022-12-10 18:09
离线数据仓库
数据仓库
大数据
数据智仓功能介绍(一)
数据仓库
的目的是构建面向分析的集成化数据环境,为企业提供基于数据的决策支持(DecisionSupport)。
jonyleek
·
2022-12-10 17:50
低代码开发系列
低代码
数据库
java
开发语言
前端
大数据处理
一、数据收集搭建
数据仓库
,数据收集就是把数据通过前端埋点,接口日志调
w程序員
·
2022-12-10 14:11
大数据
Hive基于Hadoop的一个
数据仓库
工具
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的SQL查询功能,可以将SQL语句转换为MapReduce任务进行运行。
~O2
·
2022-12-10 14:09
大数据部署
hive
hadoop
数据仓库
大数据的处理流程是怎样
大数据的处理既然是通过大数据来做一些事情,必然先把数据采集到手,第一步:数据采集,搭建
数据仓库
,数据采集就是把数据通过前端埋点,接口日
中琛源科技
·
2022-12-10 14:38
大数据
数据分析
数据挖掘
数据湖概念
数据库,
数据仓库
,数据集市,数据湖,数据中台_迷路剑客的博客-CSDN博客_
数据仓库
数据集市数据湖是一个概念,基本的架构构成:分布式对象存储+多模态计算引擎+数据管理存储的数据视角:多元异构的原始数据;
陶醉
·
2022-12-10 13:05
大数据
数据仓库
【Flink实战系列】Flink SQL 实时同步数据到 Hive
这意味着Flink可以作为一个比Hive的批处理引擎性能更好的选择,或者可以连续地在Hive表中读写数据,从而支持实时
数据仓库
应用程序。
JasonLee实时计算
·
2022-12-10 13:58
Flink
实战系列
hive
flink
sql
大数据篇--中台概念总结
文章目录一、前言二、概述三、什么是数据中台四、数据处理需求的演进历程五、数据中台和
数据仓库
、数据平台的区别六、包含模块1.数据汇聚:2.数据开发:3.数据资产管理:4.数据质量和安全:(1)数据质量:(
小强签名设计
·
2022-12-10 11:05
大数据面试
知识图谱、图数据平台、图技术如何助力零售业飞速发展
图查询|
数据仓库
|图数据平台图算法|数据扩张|图数据科学上期的公众号小编带着大家了解了什么是图数据库以及图数据库应用的十大领域。
高性能服务器
·
2022-12-10 07:35
知识图谱
数据仓库
big
data
卓越产品计划丨神策分析性能优化详解:批量导入优化
数据仓库
常采用分区的方式进行数据组织。神策将数据分区分为三层
神策数据
·
2022-12-10 00:38
数据仓库
大数据
java
数据分析
人工智能
应用实践|知乎用户画像与实时数据的架构与实践
关键词:
数据仓库
,ApacheDori
ApacheDoris
·
2022-12-09 11:23
算法
大数据
分布式
编程语言
数据库
计算机科学考点,计算机科学进考点和答案.docx
Mining)是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程.数据挖掘的广义观点:数据挖掘就是从存放在数据库,
数据仓库
或其他信息库中的大量的数据中
Bajya
·
2022-12-09 10:37
计算机科学考点
EMR-StarRocks 与 Flink 在汇量实时写入场景的最佳实践
刘腾飞汇量后端开发工程师阿里云开源OLAP研发团队EMR-StarRocks介绍阿里云EMR在年初推出了StarRocks服务,StarRocks是新一代极速全场景MPP(MassivelyParallelProcessing)
数据仓库
阿里云大数据AI技术
·
2022-12-09 09:16
flink
数据库
大数据
Spark之基本架构和工作原理
支持多种数据挖掘和机器学习算法三、适用场景1.数据处理、ETL2.迭代计算、数据重复利用通话记录分析…3.机器学习空气质量预测和评价自动判断买家好/差评客户流失预测…4.交互式分析结合hive/hbase
数据仓库
木凡空
·
2022-12-09 09:59
Spark
spark
商业智能BI在面向报表和模型开发时,有什么不同?
10%左右的人稍微暗示一下,大概就懂你想了解的是什么了,这10%的是真正有过完整的
数据仓库
设计开发经验的人。
派可数据BI可视化
·
2022-12-09 04:36
数据可视化
商业智能
数据仓库
数据仓库
数据库
数据分析
大数据工程师应聘要求高么?好找工作么
大数据开发工程师负责
数据仓库
建设、ETL开发、数据分析、数据指标统计、大数据实时计算平台及业务开发、平台建设及维护等内容。
我想去吃ya
·
2022-12-08 20:15
大数据
hadoop
spark
python
数据库
MatrixDB 落地公安领域,助力海鑫科金构建大数据平台
经常出现数据丢失的情形2.模拟业务场景,进行性能测试,性能上比Greenplum强约4倍,在线分析功能速度更快,也带来更好的用户体验3.MatrixDB在海鑫大数据平台中实现离线平台和在线平台的统一,
数据仓库
及数据模型更简单化作者张春利
YMatrix 官方技术社区
·
2022-12-08 10:06
big
data
hive
数据仓库
时序数据库
数据库
186页13万字智慧能源大数据分析平台建设方案
目录智慧能源大数据分析平台及能源集团数字化平台建设方案目录一、相关项目背景二、需求理解2.1需求理解三、方案设计3.1整体方案设计3.3.1整体架构3.3.2解决方案说明3.3.3需求应答3.2
数据仓库
数字化方案
·
2022-12-08 09:38
大数据
宗成庆《文本数据挖掘》学习笔记:第一章绪论
数据源:数据库,
数据仓库
、web、其他信息存储库或动态地流入系统的数据。文本数据挖掘:从自然语言文本中挖掘用户感兴趣的模式和知识的方法和技术,也称文本挖掘。
Attention守恒
·
2022-12-07 20:23
文本数据挖掘
学习笔记
数据挖掘
机器学习
大数据
python
人工智能
数据仓库
与数据挖掘-神经网络 个人笔记
声明:文中内容基于山东某高校数据挖掘课程的课件,本系列文章为课程内容的个人总结以及笔记内容。神经网络感知机(M-P神经元模型)感知机激活函数BP神经网络异或问题多层神经网络下的异或问题p、q为输入,OR、NAND为隐藏层,AND为输出多层神经网络的激活函数:Sigmoid(x)BP神经网络的结构BP神经网络的应用例子把整个数据集根据训练集:验证集为7:3的比例进行划分(1)设计神经网络模型:此处以
大寒_Zz
·
2022-12-07 20:48
神经网络
数据挖掘
机器学习
数据仓库
与数据挖掘-绪论 个人笔记
声明:文中内容基于山东某高校数据挖掘课程的课件,本系列文章为课程内容的个人总结以及笔记内容。数据挖掘概念:数据挖掘是从大量的、有噪声的、不完全的模糊的和随机的数据中,提取出隐含在其中的、人们实现不知道的、具有前再利用价值的信息和知识的过程。数据库中知识发现的过程(又称KDD)输入数据→数据预处理→数据挖掘→后处理→信息其中,数据与处理包括特征选择、维归纳、数据规范化、选择数据子集等。后处理包括模式
大寒_Zz
·
2022-12-07 20:18
数据挖掘
神经网络
机器学习
【概念】
数据仓库
和数仓建模
数据仓库
数仓主要特征面向主题:每个需求和表都属于一个主题,可以用主题来对数仓的表分门别类集成性:将异构数据源,比如MySQL和服务器埋点日志,统一转换成结构化的hive表数据存储到ODS层非易失性:对历史的所有数据的存储需要稳定性
Kazi_1024
·
2022-12-07 10:47
Hive
数据仓库
数据库
hive
数据库系统概论 思维导图
章关系数据理论第7章数据库设计第8章数据库编程第9章关系查询处理和查询优化第10章数据库恢复技术第11章并发控制第12章数据库管理系统第13章数据库技术发展概述第14章大数据管理第15章内存数据库系统第16章
数据仓库
与联机分析处理技术
.Youn.
·
2022-12-07 07:01
数据库
Hive+数据挖掘算法学习笔记
1.hive是基于Hadoop的一个
数据仓库
工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
阿达斯加
·
2022-12-07 05:40
学习笔记
hive
数据挖掘
大数据项目之数据采集总结(三)
一、数据采集项目总结1.
数据仓库
数据仓库
是保存数据,为企业提供数据支持2.数据的分类业务数据:记录的是订单的信息!行为数据:记录的是下单的过程发生的信息!
DSJ_smile
·
2022-12-07 00:49
数仓项目
大数据
flume
Greenplum 6.0 版本官方最强解读
十六年来,Greenplum始终致力于帮助企业更加高效地分析数据,使企业增加了收入,降低了成本,全面提升运营效率,展现了横向扩展的高性能分析
数据仓库
的惊人能力!
Greenplum中文社区
·
2022-12-06 02:04
数据库
数据仓库
大数据
人工智能
java
直播 |
数据仓库
?数据湖?停止纠结,流批融合的极速 Lakehouse来了!
然而,数据湖架构在数据分析上仍面临着许多挑战,于是解决数据湖限制、结合了数据湖和
数据仓库
优势的新系统——Lakehouse
StarRocks_labs
·
2022-12-05 14:36
数据仓库
数据库
数据领域概念横行?让我们从本质出发
数据领域也不例外,从最早的数据库、
数据仓库
、数据集市、到数据湖、湖仓一体、数据中台、以及最近出镜率较高的DataMesh、DataFabric。
IT转型指北
·
2022-12-05 14:05
数据技术
数据挖掘
数据仓库
数据库
【Flink实时数仓】
数据仓库
项目实战 《三》 维表数据写入到HBase【DIM】
这里写自定义目录标题【Flink实时数仓】
数据仓库
项目实战《三》维表数据写入到HBase【DIM】1.配置表设计**主流程流程图**:**主流数据和广播流数据处理流程图**:**写入HBase(Phoenix
一阵暖风
·
2022-12-05 13:07
hbase
flink
数据仓库
【Flink实时数仓】
数据仓库
项目实战 《Clickhouse》问题记录
文章目录《Clickhouse》问题记录1.clickhouse-client-m报错《Clickhouse》问题记录1.clickhouse-client-m报错原因:无密码时连接,忘记设置过默认密码clickhouse安装好之后,系统默认的登录账号密码是/etc/clickhouse-server/users.d/default-password.xml文件中配置的。报错信息:Code:516
一阵暖风
·
2022-12-05 13:36
数据仓库
flink
clickhouse
【Flink实时数仓】
数据仓库
项目实战 《一》 准备工作
文章目录【Flink实时数仓】实时
数据仓库
项目实战配置选择数据采集工具选择用户行为数据采集模块(Flume、Kafka)业务数据采集模块(MySQL、Maxwell、Kafka)实时
数据仓库
工具选择**
一阵暖风
·
2022-12-05 13:30
flink
数据仓库
hbase
上一页
59
60
61
62
63
64
65
66
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他