E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数据仓库工作笔记
(星型、雪花、星座、交叉连接)多维数据模型各种类型优劣分析
概述在
数据仓库
的建设中,一般都会围绕着星型模型和雪花模型来设计表关系或者结构,同时从模型中又衍生出星座模型和交叉模型。下面我们先来理解这几种模型的概念和比较。事实和维度我们先来了解一下事实和维度。
真不爱学习
·
2023-12-02 10:21
【乌卡时代】实用算法/数据结构
数据仓库
数据库
数据挖掘
2023.12.1 --
数据仓库
之 拉链表
目录什么是拉链表为什么要做拉链表?没使用拉链表:使用了拉链表:题中订单拉链表的形成过程实现语句什么是拉链表拉链表是缓慢渐变维的一种解决方案.拉链表,记录每条信息的生命周期,一旦一条记录的生命周期结束,就重新开始一条新的记录,并把当前日期放入生效开始日期,如果当前信息至今都有效,就在结束日期中填入一个最大值(9999-12-31)为什么要做拉链表?拉链表适合于:数据会发生变化,但是大部分是不变的比如
白白的wj
·
2023-12-02 09:19
数据仓库
sql
hive
hadoop
大数据
数据库开发
速通MySql
一、简介1、什么是数据库
数据仓库
,用来存储数据。
bunny playing games
·
2023-12-02 08:31
测试开发
经验分享
mysql
自己工作中常用Linux命令汇总(java程序员)
一、
工作笔记
tar-czvfCoreControl.tar.gz/home/ProjectNeeds/Files/CoreControl打tar包命令zip-r-q-oCoreControl.zipCoreControl
生产队队长
·
2023-12-02 08:37
Linux
linux
sklearn中tfidf的计算与手工计算不同详解
sklearn中tfidf的计算与手工计算不同详解引言:本周
数据仓库
与数据挖掘课程布置了word2vec的课程作业,要求是手动计算corpus中各个词的tfidf,并用sklearn验证自己计算的结果。
stay_foolish12
·
2023-12-02 02:17
sklearn
tf-idf
人工智能
不是秘书的我, 同样需要这本《老秘书的
工作笔记
》
小时候玩角色扮演,大家都抢着总裁,总经理,董事长什么的,具体是做什么的,其实根本不懂,就是觉得很牛的样子,而没有人会愿意当秘书,心想,不就是个打杂,跑跑腿什么的吗?工作后,由于从事的设计岗位,跟秘书也不怎么打交道,觉得不就是收发文件,上传下达,这有什么难的?直到很多秘书都升了领导,心里还暗暗不服。后来也渐渐了解了一些秘书的工作,才不由感叹:原来这些都是秘书的工作啊!要求这么高啊!对于非秘书岗位,其
小巫婆_c397
·
2023-12-02 01:22
直播电商
数据仓库
直播电商
数据仓库
一.数仓及其维度什么是数仓
数据仓库
,简称数仓,(DataWarehouse)。
李昊哲小课
·
2023-12-01 21:31
数据分析
大数据
数据库
数据仓库
大数据
数据分析
数据可视化
数据库
数据库开发
finebi
【GEO-AI】SAM-Geo库(segment-geospatial)入门教程
偶然间看到有介绍SAM-Geo工具包的文章,决定研究一番,现在的做的这些工作可能只是狗尾续貂,权当是记一下
工作笔记
了。
TopFancy
·
2023-12-01 20:07
人工智能
缓慢变化维 (Slowly Changing Dimension) 常见的三种类型及原型设计
开篇介绍在从OLTP业务数据库向DW
数据仓库
抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会遇到这样的问题:业务数据库中的一些数据发生了更改,到底要不要将这些变化也反映到
数据仓库
中?
叫我老村长
·
2023-12-01 16:57
(免费领源码)java#ssm#mysql 招聘客户管理系统78049-计算机毕业设计项目选题推荐
摘要由于数据库和
数据仓库
技术的快速发展,招聘客户管理系统建设越来越向模块化、智能化、自我服务和管理科学化的方向发展。
2301_3224142804
·
2023-11-30 21:53
python
django
mysql
java
小程序
php
c#
【
工作笔记
】Springboot集成Redis添加密码连接NOAUTH Authentication required
一个很简单的问题,使用Springboot集成Redis,并且添加Auth授权,正常配置我认为是这样的:spring:redis:database:0url:redis://127.0.0.1:6379password:123456passwordssl:falsetimeout:1000jedis:pool:max-active:1000max-wait:100smax-idle:1000min
web18224617243
·
2023-11-30 20:39
java
java
后端
c语言知识
一、内存what从硬件形态上讲,内存就是一个物理设备,从功能上讲,内存是一个
数据仓库
,程序在执行前都有被装载到内存中,才能被中央处理器处理(CPU)执行。
快乐的tomato
·
2023-11-30 18:35
电商平台
数据仓库
搭建02-Hadoop集群搭建
1,项目说明本项目来源于github电商平台
数据仓库
搭建。项目为个人学习记录,项目代码及文件可访问电商平台
数据仓库
搭建获得。2,项目准备虚拟机准备虚拟机开发工具为VMware15。
王小磊~
·
2023-11-30 13:04
电商数据仓库搭建
hadoop
数据仓库
hive
sql
大数据
数据仓库
搭建
目录1
数据仓库
概念1.1什么是
数据仓库
1.2OLTP与OLAP2项目需求及架构设计3项目框架4框架版本选型4.1Hadoop版本综述4.2社区版与第三方发行版的比较4.2.1.Apache社区版4.2.2
赵广陆
·
2023-11-30 13:32
bigdata
数据仓库
00Hadoop
数据仓库
平台
在这里是学习大数据的第一站什么是
数据仓库
常见大数据平台组件及介绍什么是
数据仓库
在计算领域,
数据仓库
(DW或DWH)也称为企业
数据仓库
(EDW),是一种用于报告和数据分析的系统,被认为是商业智能的核心组件
kk_io
·
2023-11-30 13:29
数据仓库
hadoop
数据仓库
大数据
数据仓库
数据管理模型
数据仓库
分为贴源层、
数据仓库
层、数据服务层,有人叫做数仓数据模型,或者叫"数据管理模型”。
zhulangfly
·
2023-11-30 13:52
数据仓库
大数据
历史拉链表
介绍历史拉链表历史拉链表是一种数据模型,主要针对
数据仓库
设计中表存储数据的方式而定义的。它记录一个事物从开始到当前状态的所有变化的信息。
zealscott
·
2023-11-30 12:03
2019-12-11
Hive是基于Hadoop的一个
数据仓库
工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。
diedfish_qyf
·
2023-11-30 11:41
【物联网与大数据应用】Hadoop数据处理
Hadoop利用分而治之的思想为大数据提供了一整套解决方案,如分布式文件系统HDFS、分布式计算框架MapReduce、NoSQL数据库HBase、
数据仓库
工具Hive等。
Bosenya12
·
2023-11-30 09:06
大数据
hadoop
分布式
AntDB“超融合+流式实时数仓”——快速实现企业全链路实时化
实时数据平台,快速实现企业全链路实时化引入
数据仓库
、数据挖掘、HTAP等先进理念,通过实时数据应用平台来装载庞大的信息量,进行实时分析处理,克服数据处理过程中的困难,是当下各企事业单位、互联网、金融,政务等行业核心系统建设的重点
亚信安慧AntDB数据库
·
2023-11-30 03:01
大数据
antdb数据库
antdb
数据库
人工智能基础_机器学习045_逻辑回归的梯度下降公式推导_更新公式---人工智能
工作笔记
0085
然后我们上面有了逻辑回归的损失函数,以后,我们再来看逻辑回归的梯度下降公式可以看到上面是逻辑回归的梯度下降公式,这里的阿尔法是学习率,这里的后面的部分是梯度也就是步长,这个阿尔法是,通过调节这个来控制梯度下降的快和慢对吧然后我们再来看逻辑回归可以看到这里上面是hthetax这个回归函数,可以看到结果这个逻辑回归函数我们之前就知道了,对吧,然后我们再来看他的导数,我们对他来求导,就能看到它的导数就是
脑瓜凉
·
2023-11-30 02:58
人工智能
机器学习
逻辑回归
逻辑斯蒂回归导函数推导
逻辑回归梯度下降公式推导
元数据管理|Hive Hooks和Metastore监听器介绍
元数据管理是
数据仓库
的核心,它不仅定义了
数据仓库
有什么,还指明了
数据仓库
中数据的内容和位置,刻画了数据的提取和转换规则,存储了与
数据仓库
主题有关的各种商业信息。
大数据技术与数仓
·
2023-11-29 21:58
【数据挖掘】国科大刘莹老师数据挖掘课程作业 —— 第一次作业
homewrok11.假定
数据仓库
中包含4个维:date,product,vendor,location;和两个度量:sales_volume和sales_cost。
不牌不改
·
2023-11-29 20:00
【国科大】
数据挖掘
spark
大数据
人工智能_AI服务器安装清华开源_CHATGLM大语言模型_GLM-6B安装部署_人工智能
工作笔记
0092
看到的这个开源的大模型,很牛,~关键让我们自己也可以部署体验一把了,虽然不知道具体内部怎么构造的但是,也可以自己使用也挺好.可以部署在自己的机器上也可以部署在云服务器上.安装以后,是可以使用python代码进行提问,然后返回结果的,这样就可以实现我们自己的chat应用了,非常不错.但是毕竟是6B现在已经是130B了,但是那个模型是不开源的当然也可以使用我们自己的数据集,让这个算法进行自动学习和微调
脑瓜凉
·
2023-11-29 15:06
人工智能
语言模型
ChatGLM大语言模型
ChatGLM-6B安装
ChatGLM部署
【
数据仓库
】Spark算子
第一关:转换算子之map和distinct算子输出每个元素及其长度并去重。//第一步:通过获取rdd中每个元素的长度创建新的rdd1valrdd1=rdd.map(x=>x.length())//第二步:通过zip把rdd1和rdd组合创建rdd2valrdd2=rdd.zip(rdd1)//第三步:去重valrdd3=rdd2.distinct()//第四步:输出结果rdd3.foreach(p
「已注销」
·
2023-11-29 12:05
数据仓库高级技术
scala
Spark
HCIA-Big Data华为认证大数据工程师 习题册 含答案
查看课堂笔记(含习题册)目录1.大数据发展趋势与鲲鹏大数据2.HDFS分布式文件管理系统和ZooKeeper3.Hive分布式
数据仓库
4.HBase技术原理5.MapReduce和Yarn技术原理6.Spark
k Chivalrous man
·
2023-11-29 08:16
大数据
大数据
华为
工作笔记
如果要自己尽快适应,或者说尽早在一个新环境中掌握主动权,那最好的办法是让自己尽早参与其中,去实践,去犯错,然后不断地反思复盘,不断优化升级,从而归纳出最适合自己的方式方法。越往后试错成本越高,越是畏首畏尾,不敢向前。越少情绪的处理方法往往会越理性,综合收益往往更高,但一旦进入具体的事件中,如何持续保持理性,做最优决策和执行往往最难,而能否做最优决策和执行以及关于决策和执行所谓的最优的差别又决定了最
源淼每日随笔_d0a4
·
2023-11-29 07:15
加班经验总结 2022年5月6日
清秋今天我决定把自己的日记分类写,一类是工作日记,一类是生活中的日记,我想找一本找专属的
工作笔记
本,可是我在自己的书架上看了好半天,本子是有,但是我觉得薄薄的一本本子很快就被写完了,我顺手就扔了,或者撕了
素笔描青花
·
2023-11-29 06:29
ANT324 | 升级
数据仓库
ANT324|升级
数据仓库
关键字:[AmazonWebServicesre:Invent2023,AmazonRedshift,DataWarehouseModernization,RedshiftCapabilities
just2gooo
·
2023-11-29 02:57
aws
使用Kafka、Flink、Druid构建实时数据系统架构
等待数据发送到ETL工具,等待数据批量处理,等待数据加载到
数据仓库
中,甚至等待查询完成运行。
guohuang
·
2023-11-28 23:51
kafka
flink
系统架构
大数据
hive总结
Hive是基于Hadoop的
数据仓库
工具,提供了类似SQL的查询功能,可查询存储在HDFS中的数据。Hive的架构和组件包括用户接口、驱动、元数据存储和存储处理层。Hive将HQL转
墨苏玩电脑
·
2023-11-28 18:26
hive
hadoop
数据仓库
20200802原生location.search以及vue中利用query来操作页面跳转传递参数
我是新人,这是
工作笔记
,只有我能理解。仅供参考。
Shaojun_jita
·
2023-11-28 18:18
q前端
笔记
细说
数据仓库
上篇
用空间换时间,通过大量的预处理来提升应用系统的用户体验(效率),因此
数据仓库
会存在大量冗余的数据;不分层的话,如果源业务系统的业务规则发生变化将会影响整个数据清洗过程,工作量巨大。
派可数据
·
2023-11-28 18:53
数据仓库
数据要素
商业智能
spark
大数据
分布式
商业智能BI
数据仓库
数据仓库
建模下篇
在实际业务中,给了我们一堆数据,我们怎么拿这些数据进行数仓建设呢,数仓工具箱作者根据自身多年的实际业务经验,给我们总结了如下四步。数仓工具箱中的维度建模四步走:维度建模四步走这四步是环环相扣,步步相连。下面详细拆解下每个步骤怎么做1、选择业务过程维度建模是紧贴业务的,所以必须以业务为根基进行建模,那么选择业务过程,顾名思义就是在整个业务流程中选取我们需要建模的业务,根据运营提供的需求及日后的易扩展
派可数据
·
2023-11-28 18:10
商业智能
数据要素
数据仓库
数据仓库
大数据
信息可视化
数据库
【晚间复盘日记】┆2021.7.29
在这里,我要提起一个宝贝,效率手册,它是我相伴4年的伙伴,我有记录
工作笔记
的习惯,从09年开始,每年最少1本,记得18年离职的时候,抱回家的只有抽屉里满满的十几本工作日记,在每次的日记中,记录,反思每一件事情
木子的远方
·
2023-11-28 17:13
HDFS与Hive实战 + 滴滴出行数据分析
HDFS与Hive实战+滴滴出行数据分析1.HDFS1.1分布式文件系统1.2HDFS的Shell命令行1.3启动Hadoop集群1.4大数据环境清单2.
数据仓库
2.1
数据仓库
与数据库区别3.Hive3.1
jialun0116
·
2023-11-28 16:41
大数据
Hive
数据仓库
数据库
数据仓库
数据挖掘
hadoop
大数据
大数据开发:实时数仓架构层次设计
在大数据实时计算处理领域,
数据仓库
提供重要的支持,从传统的离线数仓到实时数仓,大数据带动了相应的市场需求,而从架构层次来说,实时数仓也有新的值得挖掘的技术点。
成都加米谷大数据
·
2023-11-28 16:52
ODPS SQL优化总结
本文结合作者多年的数仓开发经验,结合ODPS平台分享
数据仓库
中的SQL优化经验。背景
数据仓库
,是一个面向主题、集成的、随时间变化的、信息本身相对稳定的数据集合。
小二上酒8
·
2023-11-28 14:09
odps
sql
hive
java
开发语言
StarRocks 的学习笔记
StarRocks的学习笔记文章目录StarRocks的学习笔记1.介绍1.1StarRocks特性1.2使用场景1.3OLAP多维分析1.4实时
数据仓库
1.5高并发查询1.6统一分析2.系统架构2.1StarRocks
白居不易.
·
2023-11-28 11:36
StarRocks
hive
数据仓库
-Hive1.
数据仓库
1.1.基本概念英文名称为DataWarehouse,可简写为DW或DWH。
淳●简蜡基●茨德
·
2023-11-28 10:14
hive
hive
为啥说用了Hbase速度会变快???
都知道
数据仓库
现在一般来说是Hive和kafka,数据平台目前还使用的是hive,但是hive的查询是很慢的,所以为了效率我们引入了Kylin,Kylin并没有大数据存储功能,它所做的只是将
数据仓库
里的数据预计算
AceCream佳
·
2023-11-28 06:44
【
工作笔记
】IOT.js适配AWorks平台通用外设接口(2):GPIO
【
工作笔记
】IOT.js适配AWorks平台通用外设接口(1):ADC;【
工作笔记
】IOT.js适配AWorks平台通用外设接口(2):GPIO;【工
天上下橙雨
·
2023-11-28 06:35
详解数仓中的数据分层:ODS、DWD、DWM、DWS、ADS
何为数仓DWDatawarehouse(可简写为DW或者DWH)
数据仓库
,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模在内的完整的理论体系。
禅与计算机程序设计艺术
·
2023-11-28 00:17
使用docker命令_进入容器_登录mysql服务_并执行sql语句---Docker
工作笔记
005
今天就用到了,不得不说用docker用到的还是少,记录一下,常用的也就这些吧.首先执行:dockerps[
[email protected]
]#dockerpsCONTAINERIDIMAGECOMMANDCREATEDSTATUSPORTSNAMES13eaa25e1ca4registry.cn-qingdao.aliyuncs.com/dataease/dataease
脑瓜凉
·
2023-11-27 23:49
docker
在容器中操作mysql
docker中操作mysql
在
数据仓库
中拉链表的使用
使用场景:在
数据仓库
中,拉链表可以用于处理维度表的历史时间变化优点:使用拉链表的优势在于能够有效地追踪维度属性的历史变化使用方法:设计拉链表结构:在维度表中添加拉链表所需字段,如开始日期,结束日期,这些字段用来表示维度属性历史变化情况初始化拉链表
linbokang
·
2023-11-27 19:15
数据仓库
数据分析
hadoop
insert overwrite table:
数据仓库
和数据分析中的常用技术
一、介绍:INSERTOVERWRITETABLE是用于覆盖(即替换)目标表中的数据的操作。它将新的数据写入表中,并删除原有的数据。这个操作适用于非分区表和分区表。二、使用场景:1、数据更新:当您需要更新表中的数据时,可以使用覆写操作。通过覆写,您可以将新的数据写入表中,替换原有的数据。这在需要定期更新或替换表中数据的情况下非常有用。2、数据重载:如果您需要重新加载表中的数据,覆写操作可以清空表并
linbokang
·
2023-11-27 19:45
数据仓库
数据分析
hive
大数据
数据仓库
,Sqoop--学习笔记
数据仓库
介绍1.
数据仓库
概念
数据仓库
概念创始人在《建立
数据仓库
》一书中对
数据仓库
的定义是:
数据仓库
(DataWarehouse)是一个面向主题的(SubjectOriented)、数据集成的(Integrated
祈愿lucky
·
2023-11-27 16:38
大数据
大数据
数据仓库
sqoop
CDP体系化建设1-CDP综述
当中会涉及到数据的集成和加工,包含对埋点、
数据仓库
的数据重定义和应用。包含标签开发管理、人群创建、人群同步等。会基于数据底层提供的查询服务,
数据产品小lee
·
2023-11-27 12:13
大数据
产品经理
数据建模
数仓分层能减少重复计算,为啥能减少?如何减少?这篇文章包懂!
很多时候,看一些数据领域的文章,说到为什么做
数据仓库
、
数据仓库
要分层,我们经常会看到一些结论:因为有ABCD…等等理由,比如降低开发成本、减少重复计算等等好处然后,多数人就记住了ABCD。
数据产品小lee
·
2023-11-27 12:42
大数据
数据仓库
数据建模
产品经理
人工智能_机器学习051_支持向量机SVM概念介绍_理解support vector machine---人工智能
工作笔记
0091
在出现深度学习,神经网络算法之前,支持向量机已经可以解决很多问题了,我们自然界中的问题,无非就是可以转换为回归问题和分类问题.然后从现在开始我们来看支持向量机,首先看一下这几个字support是支持vector是向量的意思,然后machine指的是机器那么我们之前用到的模型,比如线性回归模型,用来进行预测的模型,我们就把他称之为是机器这个supportvectormachine其实就是支持向量的各
脑瓜凉
·
2023-11-27 09:40
人工智能
支持向量机
SVM概念
理解支持向量机
上一页
10
11
12
13
14
15
16
17
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他