E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库工作笔记
电商数据分析-03-电商数据采集
参考最最最全
数据仓库
建设指南,速速收藏!!第1章
数据仓库
概念
数据仓库
规划1.1数仓搭建我们这里所说的
数据仓库
,是基于大数据体系的,里面包含标签类目,区别于传统的
数据仓库
。
IT从业者张某某
·
2023-12-27 11:14
数据分析入门到进阶
数据分析
《系统架构设计师教程(第2版)》第3章-信息系统基础知识-04-决策支持系统 (DSS)
系统的发展1.2决策支持系统的定义1.2.1定义一1.2.2定义二1.2.3教材归纳1.3DSS的基本模式1.4DSS的结构2.DSS的功能3.DSS的特点4.DSS的组成4.1数据的重组和确认4.2
数据仓库
的建立
玄德公笔记
·
2023-12-27 10:56
#
软考架构师笔记
系统架构
软考架构师
决策支持系统
DSS
信息系统基础知识
清华版
第2版
周周工作杂记(十三)
也不知道过了多长时间,周周回过神来,拿起笔在
工作笔记
本上写了一段话:如今我已长到开始回忆过去的年纪,如今我已不再幻想那些易碎的人鱼泡沫,如今你们已开始琐碎地生活,如今你们已开始离我那么的遥远,遥远到我只能靠想象才能触摸你们的面容
妍兮兮
·
2023-12-27 00:42
电商数仓笔记7_
数据仓库
系统(数仓搭建-DWD层,数仓搭建-DWS层,数仓搭建-DWT层,数仓搭建-ADS层)
电商数仓一、数仓搭建-DWD层1、DWD层(用户行为日志)(1)日志解析思路(2)get_json_object函数使用(3)启动日志表(4)页面日志表(5)动作日志表(6)曝光日志表(7)错误日志表(8)DWD层用户行为数据加载脚本2、DWD层(业务数据)(1)DWD层业务数据首日装载脚本(2)DWD层业务数据每日装载脚本二、数仓搭建-DWS层1、系统函数(1)nvl函数(2)日期处理函数(3)
明灭18
·
2023-12-26 17:47
笔记
大数据
hadoop
hive
电商数仓笔记6_
数据仓库
系统(数仓搭建-ODS层,数仓搭建-DIM层)
电商数仓一、数仓搭建-ODS层1、ODS层(用户行为数据)(1)创建日志表ods_log(2)Shell中单引号和双引号区别(3)ODS层日志表加载数据脚本2、ODS层(业务数据)(1)ODS层业务表首日数据装载脚本(2)ODS层业务表每日数据装载脚本二、数仓搭建-DIM层1、商品维度表(全量)2、优惠券维度表(全量)3、活动维度表(全量)4、地区维度表(特殊)5、时间维度表(特殊)6、用户维度表
明灭18
·
2023-12-26 17:17
笔记
数据仓库
hive
hadoop
大数据
四、电商
数据仓库
系统——第5章
数据仓库
设计
5.1
数据仓库
分层规划优秀可靠的数仓体系,需要良好的数据分层结构。合理的分层,能够使数据体系更加清晰,使复杂问题得以简化。以下是该项目的分层规划。5.2
数据仓库
构建流程以下是构建
数据仓库
的完整流程。
怕被各位卷死
·
2023-12-26 17:47
离线电商数仓5.0搭建
大数据
hadoop
kafka
分布式
hdfs
ETL 数据抽取有哪些常见的应用场景?
1、
数据仓库
建设,从基础差到数据集市到主题库2、数据迁移,信息系统切换新机器是需要3、数据整合,将多个数据来源整合到一个数据库中4、数据同步,为了保证信息系统的高可用或基于安全考虑,进行数据同步
王永翔
·
2023-12-26 15:21
数据库
Week 18 (07.04.30-07.05.04) LNBS
五一放假,在家里完成linux2.6.20kernelforOMAP5912的编译,以及u-boot,rootfs/busybox等的编译工作(参考这段时间的其它
工作笔记
)
shawnrong
·
2023-12-26 14:46
工作
linux
数据中台与
数据仓库
有什么区别?
数字化转型浪潮卷起各种新老概念满天飞,数据中台、
数据仓库
轮番在朋友圈刷屏,企业还没推开数字化大门,先被各种概念绊了一脚。今天咱们就来看下这两者究竟有啥区别。
WakeData惟客数据
·
2023-12-26 14:38
数据仓库
数据挖掘
人工智能
人工智能_机器学习073_SVM支持向量机_人脸识别模型建模_预测可视化_网格搜索交叉验证最优化参数对比---人工智能
工作笔记
0113
接着上一节来说,可以看到我们已经找到了合适的参数,然后我们可以看一下这里gc.best_params_就可以打印出最合适的参数然后我们把最合适串按说填入到代码中,然后进行计算,看看得分可以看到得分,训练数据是1.0然后测试数据得分是0.7857...对吧
脑瓜凉
·
2023-12-26 11:50
机器学习
人脸识别预测可视化
人脸识别
网格搜索交叉验证
人脸识别建模
【华为数据之道学习笔记】6-6从“保姆”模式到“服务+自助”模式
这也是传统意义上的
数据仓库
的标准报告生成方式,强依赖于IT人员,贯穿整个数据分析过程,从获取数据、建模到设计报告
码农丁丁
·
2023-12-26 08:22
#
数据中台
华为数据之道
读书笔记
数据中台
Hive02_基本使用,常用命令
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
程序喵猴
·
2023-12-26 08:39
hive
hive
数据仓库
【2】:架构
数据仓库
【2】:架构1、架构图2、ETL流程2.1、ETL--Extract-Transform-Load2.1.1、数据抽取(Extraction)2.1.2、数据转换(Transformation)
QQ719872578
·
2023-12-26 06:57
#
数据仓库
数据仓库
大数据从业者必知必会的Hive SQL调优技巧 | 京东云技术团队
摘要:在大数据领域中,HiveSQL被广泛应用于
数据仓库
的数据查询和分析。然而,由于数据量庞大和复杂的查询需求,HiveSQL查询的性能往往不尽人意。
京东云技术团队
·
2023-12-26 06:33
大数据
hive
sql
数据仓库
【4】:最佳实践
数据仓库
【4】:最佳实践1、表的分类1.1、事实表1.2、维度表1.3、事务事实表1.4、周期快照事实表1.5、累积快照事实表1.6、拉链表2、ETL策略2.1、全量同步2.2、增量同步3、任务调度3.1
QQ719872578
·
2023-12-26 01:59
#
数据仓库
数据仓库
数据仓库
【5】:项目实战
数据仓库
【5】:项目实战1、项目概述1.1、项目背景1.2、复购率计算2、数据描述3、架构设计3.1、
数据仓库
架构图4、环境搭建4.1、环境说明4.2、集群规划4.3、搭建流程5、项目开发5.1、业务数据生成
QQ719872578
·
2023-12-26 01:59
#
数据仓库
数据仓库
数据仓库
【3】:建模方法
数据仓库
【3】:建模方法1、基本概念1.1、OLTP系统建模方法1.2、OLAP(在线联机分析)2、ROLAP2.1、ROLAP系统建模方法2.2、维度模型2.2.1、星型模型2.2.2、雪花模型2.2.3
QQ719872578
·
2023-12-26 01:29
#
数据仓库
数据仓库
大数据
数据仓库
【1】:简介
数据仓库
【1】:简介1、诞生背景1.1、
数据仓库
诞生原因1.2、历史数据积存1.3、企业数据分析需要2、基本概述2.1、
数据仓库
(DataWarehouse,DW)2.2、
数据仓库
特点2.3、
数据仓库
VS
QQ719872578
·
2023-12-26 01:27
#
数据仓库
数据仓库
spark
大数据
大数据——技术生态体系
ApacheHive是一个用于数据查询和分析的
数据仓库
工具。
Imrea
·
2023-12-26 01:56
大数据
hadoop
分布式
喜报!酷克数据携手中移在线入选2023大数据“星河”数据库优秀案例
中移在线服务有限公司(中移在线)与酷克数据联合申报的《基于云原生化的
数据仓库
平台,实现数据算力交付效率全面提升》项目,凭借全栈自主可控、敏捷高效、安全稳定的先进特性,成为业内首个容器化部署
HashData酷克数据
·
2023-12-26 00:23
大数据
数据库
全网最全ChatGPT指令大全prompt
AIGCChatGPT职场案例AI绘画与短视频制作PowerBI商业智能68集数据库Mysql8.054集数据库Oracle21C142集Office2021实战应用Python数据分析实战,ETLInformatica
数据仓库
案例实战
阿里数据专家
·
2023-12-25 21:17
ChatGPT
与
Python
ChatGPT实战案例
ChatGPT
chatgpt
prompt
excel
AIGC
oracle
人工智能
Hive-数据模型详解(超详细)
1)创建数据库(2)使用数据库(3)创建表格(4)查看表结构3.分区与桶(1)分区(2)桶4.数据加载与查询(1)数据导入(2)查询语句5.总结一、Hive数据模型1.概述Hive是基于Hadoop的
数据仓库
工具
大数据魔法师
·
2023-12-25 16:17
Hive之旅
hive
【大数据学习笔记】新手学习路线图
第1阶段-
数据仓库
基1.MysQL关系型数据库(MySQL介绍、MySQL安装、MySQL基础语法、MySQL高级语法、MySQL系统架构、MySQL存储引擎、MySQL索引、MySQL备份恢复、MySQL
伊达
·
2023-12-25 14:54
大数据
大数据
学习
笔记
(三)hive学习笔记——1.1hive入门
介绍2.Hive的安装3.Hive数据的存储4.配置安装mysql5.配置Hive元数据保存到mysql中6.元数据的结构7.jdbc连接hive8.Hive常见属性配置1.Hive介绍Hive是一个
数据仓库
软件
我是菜鸟程序员
·
2023-12-25 11:01
大数据学习之路
hive
大数据
数据仓库
数据处理演进:EtLT崛起,ELT正在告别历史舞台
虽然Hadoop时代主要依赖ELT(Extract、Load、Transform)方法,但实时
数据仓库
和数据湖的兴起使得ELT变得过时。EtLT已成为将数据实时加载到数据湖和实时
数据仓库
的标准架构。
涤生大数据
·
2023-12-25 10:00
扯淡分享/职业职场/交流
大数据
【Flink SQL API体验数据湖格式之paimon】
前言随着大数据技术的普及,
数据仓库
的部署方式也在发生着改变,之前在部署
数据仓库
项目时,首先想到的是选择国外哪家公司的产品,比如:数据存储会从Oracle、SqlServer中或者Mysql中选择,ETL
以茉萱
·
2023-12-25 08:01
flink
sql
大数据
223页10万字大数据中心总体架构及
数据仓库
顶层设计解决方案WORD
提供智慧城市、智能制造、数据治理、信息化等领域的系统框架、总体架构、数据流架构资料,包括数据治理、信息化、精益生产改善知识。本文文档69页,因篇幅限制,以下仅展示部分资料,需要完整资料,点击右上角红色按钮关注+私信,喜欢文章,欢迎转发评论点赞。本文引用资料来源于网络,侵权立删。更多内容,查看公众号:智慧方案文库。目录第1章 概述第2章 数据中心建设原则第3章 数据中心
智慧方案文库
·
2023-12-25 08:23
数据库
大数据
数据仓库
【大数据】
数据仓库
之模型层和ETL介绍
概述ETL是
数据仓库
的后台,主要包含抽取、清洗、规范化、提交四个步骤,传统
数据仓库
一般分为四层模型。分层的作用STG层在维度建模阶段已经确定了源系统,而且对源系统进行了数据评估。
summer108
·
2023-12-25 06:06
大数据
ETL
《老秘书
工作笔记
》书评------你做好职场进阶的准备了么?
前些日子热播的电视剧《精英律师》获得了不俗的收视评价,更是有网友说出了自己的心声——吸引自己看这部电视剧的动力全在于朱珠饰演的栗娜,那么剧中的栗娜又有什么魔力能够抓牢观众的眼球呢?剧中的栗娜永远是妆容精致、谈吐优雅、处事圆融,而这些也无一不在彰示着她游刃有余的工作胜任度和工作驾驭力。要相信,影视作品有些总是取材于实际的,那么,现实中自然也会有人如剧中栗娜一样拥有这些核心能力。只是,九层高台起于累土
paro月亮
·
2023-12-25 01:11
大数据学习笔记——
数据仓库
hive重要的总结
1、外部表和内部表Hive表分为两类,即内部表和外部表。所谓内部表,即Hive管理的表,Hive内部表的管理既包含逻辑以及语法上的,也包含实际物理意义上的,即创建Hive内部表时,数据将真实存在于表所在的目录内,删除内部表时,物理数据和文件也一并删除。外部表(externaltable)则不然,其管理仅仅是在逻辑和语法意义上的,即新建表仅仅是指向一个外部目录而已。同样,删除时也并不物理删除外部目录
新宿一次狼
·
2023-12-24 23:27
大数据
大数据
【Hadoop学习笔记】(二)——Hive的原理及使用
一、Hive概述Hive是一个在Hadoop中用来处理结构化数据的
数据仓库
基础工具。
wanger61
·
2023-12-24 23:25
大数据开发
hadoop
hive
大数据
【Hive笔记】1——Hive入门
1.什么是Hivehive是由Facebook开源用于解决海量结构化日志的数据统计Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供sql查询功能。
sdut菜鸟
·
2023-12-24 23:55
hive
hive
hadoop
大数据
人工智能_机器学习071_SVM支持向量机_人脸识别算法_LFW人脸数据加载_与理解---人工智能
工作笔记
0111
然后我们继续来看这里有个lfw_home可以看到这个数据是,包含了人脸数据然后我们继续看,在我们的顶你用户目录下,如果安装了,sklearn就会有这样一个目录,scikit_learn_data目录,这个里面可以看到可以看到这个文件夹中有个lfw_home文件夹是对.zip文件夹的解压,这个下载以后放到对应的这个文件夹下面就可以了这个是人脸的图片集importnumpyasnp导入数学计算库fro
脑瓜凉
·
2023-12-24 22:57
人工智能
机器学习
LFW人脸识别数据加载
人脸识别算法
SVM支持向量机人脸识别
测试工程师常见面试题(高级)
4、什么是
数据仓库
?
数据仓库
测试应该考虑什么?以及如何进行
数据仓库
的测试?5、flink是什
打了鸡血的点狗
·
2023-12-24 22:25
测试工程师面试常见面试题
功能测试
单元测试
测试工具
测试用例
压力测试
数据仓库
-IP段关联计算优化-从优化原理到优化手段一一道来
为什么要优化?营销活动指标体系需要用日志数据进行多维度分析,其中一个维度就是通过IP段获取到用户的所属地域进行分析,但IP段与其它字段的映射方式不同,IP段是一个范围,关联时是一对多关系,在资源集中使用时段,1万左右的数据量的耗时可达一小时以上,严重影响指标的及时性,所以要进行优化,来解决任务耗时高的问题。优化手段1减少参与计算的数据量当前IP表中记录总数为772845条,但中国所使用的IP段仅有
高阳很捷迅
·
2023-12-24 19:46
电商数仓项目----笔记五(数仓架构和建模)
ODS:数据源DWD:加工数据DWS:统计数据ADS:分析数据DIM:维度层(大家都有可能用得上的部分)ER模型
数据仓库
之父BillInmon提出的建模方法是从全企业的高度,用实体关系(EntityRelationship
zmx_messi
·
2023-12-24 11:35
笔记
基于Hue,Dolphinscheduler,HIVE分析
数据仓库
层级实现及项目需求案例实践分析
目录一、数仓各个层级及作用1,ODS层(OperationDataStore-源数据层)2,DW层(DataWarehouse-
数据仓库
层)(1)DWD(DataWarehouseDetail-明细数据层
Len°
·
2023-12-24 11:32
Hadoop
hadoop
big
data
hive
人工智能_机器学习072_SVM支持向量机_人脸识别模型训练_训练时间过长解决办法_数据降维_LFW人脸数据建模与C参数选择---人工智能
工作笔记
0112
我们先来看一下之前的代码:importnumpyasnp导入数学计算库fromsklearn.svmimportSVC导入支持向量机线性分类器importmatplotlib.pyplotasplt加载人脸图片以后,我们用pyplot把人脸图片数据展示一下fromsklearn.model_selectionimporttrain_test_split人脸的数据,我们需要拆分,所以这里我们再导入t
脑瓜凉
·
2023-12-24 08:16
人工智能
支持向量机
网格搜索交叉验证
LFW人脸识别数据
数据降维
机器学习参数最优化
Python量化投资——金融数据最佳实践: 使用qteasy+tushare搭建本地金融
数据仓库
并定期批量更新【附源码】
用`qteasy`+`tushare`实现金融数据本地化存储及访问目的什么是`qteasy`什么是`tushare`为什么要本地化使用qteasy创建本地
数据仓库
qteasy支持的几种本地化仓库类型配置本地
数据仓库
配置
Shepherdppz
·
2023-12-24 07:27
量化交易
量化投资
python
python
金融
数据仓库
量化投资
量化交易
人工智能_机器学习070_SVM支持向量机_软间隔及优化_硬间隔_衡量间隔软度_引入松弛变量_理解隔离参数---人工智能
工作笔记
0110
我们继续说,之前说的C是什么意思?我们在这个软间隔优化中就可以引出C可以看到之前我们讨论的问题,都是基于样本点的,完全的线性可分的问题,我们称为硬间隔可以看到这种,一分就可以,分开,简单分割就可以分开的数据,我们称之为硬间隔但是可以看到上面这种情况,无论怎么分,都会有红色出现在蓝色部分,蓝色出现在红色部分的情况,其实就是没办法完
脑瓜凉
·
2023-12-23 19:20
支持向量机
人工智能
机器学习
SVM软隔离
硬隔离
衡量间隔软度
数据中心与数据湖与数据虚拟化 Data Hub vs Data Lake vs Data Virtualization
众所周知,集成这些数据孤岛非常困难,并且在尝试使用传统
数据仓库
方法时面临明显的挑战。因此,IT组织寻求现代方法来完成工作(应企业的紧急要求)。这种比较涵盖了三种现代的数据集成方
时见疏星
·
2023-12-23 18:40
OLAP和OLTP
OLAP是
数据仓库
系统的主要应用,支持复杂的分析操作,
biubiudog
·
2023-12-23 17:37
2018-09-13医院呼叫中心应具备的功能
它可以把从用户那里所获得的各种信息、数据全部储存在庞大的
数据仓库
(DataWareh
李飘飘_52c6
·
2023-12-23 15:40
【Hive】在博客系统中如何应用 Hive 进行离线数据管理
Hive是一个开源的
数据仓库
基础设施,它能够在博客系统中提供强大的离线数据管理能力。本文将详细介绍如何在博客系统中应用Hive进行离线数据管理,并提供一些示例。什么是Hive?
小吴同学GOGOGO
·
2023-12-23 06:54
hive
数据仓库
大数据
hadoop
【mysql】MySQL的binlog在
数据仓库
中的应用
在当今的大数据时代,
数据仓库
是一个不可或缺的部分。它是一个集中式存储和管理的平台,用于存储、管理和分析大量的数据,以支持决策制定和业务操作。
小吴同学GOGOGO
·
2023-12-23 06:23
mysql
数据仓库
数据库
系统架构设计笔记(12)——
数据仓库
传统的操作型数据库主要是面向业务的,所执行的操作基本上也是联机事务处理,但随着企业规模的增长,历史积累的数据越来越多,如何利用历史数据来为未来决策服务,就显得越来越重要了,而
数据仓库
就是其中的一种技术。
deniro
·
2023-12-23 03:42
简单了解一下当前火热的大数据 -- Kylin
多维数据分析引擎优点超快的响应速度,亚秒级支持超大数据集(PB以上,千亿记录)标准的SQL接口,简单易用的及时查询工具支持标准数据库协议,可集成各种BI分析工具二、Kylin架构前置概念(术语)DataWarehouse(
数据仓库
码农阿豪
·
2023-12-22 15:07
好“物”分享
kylin
数据仓库
-数据治理小厂实践
一、简介数据治理贯穿数仓中数据的整个生命周期,从数据的产生、加载、清洗、计算,再到数据展示、应用,每个阶段都需要对数据进行治理,像有些比较大的企业都是有自己的数据治理平台或者会开发一些便捷的平台,对于没有平台的公司,这里根据自己的亲身实践简单整理一下。二、治理方向1、数据的存储1.1数据保留周期由于数仓的前中期没有对数据的存储进行合理规范的治理,导致大量的历史数据积累,占用一定的磁盘存储开销,造成
大数据点滴
·
2023-12-22 14:03
#
数据仓库
数据仓库
数据治理
2022-07-10
(1)在
数据仓库
领域中,元数据按用途分成:业务元数据:提供基于用户的信息,如记录数据项的业务描述信息的元数据能帮助用户使用数据技术元
白中白
·
2023-12-22 11:45
二,Hive运行机制与使用
hive介绍hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
__元昊__
·
2023-12-22 11:30
上一页
7
8
9
10
11
12
13
14
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他