E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓分层架构
Spring-SpringAOP原理,手写Spring事务框架
框架的主要优势之一就是其
分层架构
,
分层架构
允许使用者选择使用哪一个组件,同时为J2EE应用程序开发提供
codeobj
·
2024-01-20 04:58
超融合之道:亚信安慧AntDB 8.0版本引领数据库创新
在当今多变的数据应用场景中,AntDB作为行业领先的超融合流式实时
数仓
,秉承着“融合+实时”的研发理念,全面应对企业日益复杂的数据处理需求。
亚信安慧AntDB数据库
·
2024-01-20 01:00
数据库
antdb数据库
antdb
华为外包数据库面试问题分享20211225
数仓
的东西了解多少。数据库开发支持这方面你做过哪些。你现在的工作中的SQL开发,具体是作了哪些。你的工作意愿是哪个方向(这么问是因为知道了我没做过DBA)在
数仓
的设
钦䲹
·
2024-01-19 16:05
数据库
华为
面试
某小外包公司线上面试-大数据开发
1.
数仓
和数据库的区别2.
数仓
建模3.hive用到的函数4.rank,dense_rank,row_number的区别5.hive数据倾斜的原因有哪些7.如何理解数据质量?
劝学-大数据
·
2024-01-19 16:03
大数据面试题
大数据
基于 Hologres+Flink 的曹操出行实时
数仓
建设
本文整理自曹操出行实时计算负责人林震基于Hologres+Flink的曹操出行实时
数仓
建设的分享,内容主要分为以下六部分:曹操出行业务背景介绍曹操出行业务痛点分析Hologres+Flink构建企业级实时
数仓
曹操出行实时
数仓
实践曹操出行业务成果分析未来展望一
Apache Flink
·
2024-01-19 08:54
flink
大数据
IM 内容分享(十八): 服务化架构IM系统
随着用户规模扩大,日活量提升(DAU=几十万),为了解决粗粒度扩容、技术栈单一、逻辑臃肿等问题,通过
分层架构
实现IM系
之乎者也·
·
2024-01-19 04:38
IM
内容分享
架构
IM
FineBI实战项目一(25):实战项目一总结
实在项目使用mysql做
数仓
库的ODS层,这仅仅是带领大家入门,用mysql做
数仓
存在很多问题。
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
数仓
架构图
阿里巴巴的数据团队把表数据模型分为三层:操作数据层(ODS)、公共维度模型层(DM)和应用数据层(DS),其中公共维度模型层包括明细数据层(DWD)和汇总数据层(DWS)。模型层次关系如9.9所示。image.png公共维度模型层(CDM):存放明细事实数据、维表数据及公共指标汇总数据其中明细事实数据、维表数一般根据ODS层数据加工生成:公共指标汇总数据般根据维表数据和明细事实数据加工生成。CDM
liuxiaolin
·
2024-01-19 01:27
Hologres + Flink 流式湖仓建设
Flink流式湖仓建设1Flink+Hologres特性1.2实时维表Lookup1.3高性能实时写入与更新1.4多流合并1.5Hologres作为Flink的数据源1.6元数据自动发现与更新2传统实时
数仓
分层方案
Direction_Wind
·
2024-01-18 21:56
hologres
技术调研
flink
大数据
白山云基于StarRocks数据库构建湖仓一体
数仓
的实践
背景随着每天万亿级别的业务数据流向数据湖,数据湖的弊端也逐渐凸显出来,例如:数据入湖时效性差:数据湖主要依赖于离线批量计算,通常不支持实时数据更新,因此无法保证数据的强一致性,造成数据不及时、不准确;查询性能差:在传统架构下,数据湖的查询速度较差,小时粒度的数据查询往往需要数分钟才能得到响应,在多个业务方同时执行数据湖查询任务时,查询响应慢的劣势更加明显;查询体验差:数据存储在多个地方,在进行联邦
StarRocks_labs
·
2024-01-18 17:04
社区投稿
数据库
大数据
DDD分架构模型介绍
一、
分层架构
1.1>概述一提到
分层架构
,大家应该都不会陌生。因为当我们开始从事软件开发这一行业的时候,接触到的企业项目基本都是采用
分层架构
的。
学亮编程手记
·
2024-01-18 08:58
后台编程
架构
DDD
技术选型|开源大数据OLAP引擎最佳实践
一、开源OLAP综述二、开源
数仓
解决方案三、ClickHouse介绍四、StarRocks介绍五、Trino介绍六、客户案例01开源OLAP综述如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求
浪尖聊大数据-浪尖
·
2024-01-18 08:14
运维
大数据
分布式
数据库
人工智能
数仓
项目6.0配置大全(hadoop/Flume/zk/kafka/mysql配置)
配置背景我使用的root用户,懒得加sudo所有文件夹在/opt/module所有安装包在/opt/software所有脚本文件在/root/bin三台虚拟机:hadoop102-103-104分发脚本fenfa,放在~/bin下,chmod777fenfa给权限#!/bin/bash#1.判断参数个数if[$#-lt1]thenechoXXXXXXXXXNoArguementXXXXXXXXX!
Int mian[]
·
2024-01-18 06:57
hadoop
flume
kafka
如何设计实时数据平台(设计篇)
在上篇设计篇中,我们首先从两个维度介绍实时数据平台:从现代
数仓
架构角度看待实时数据平台,从典型数据处理角度看待实时数据处理;接着我们会探讨实时数据平台整体设计架构、对具体问
longLiveData
·
2024-01-18 05:11
离线
数仓
二
数据仓库维度模型设计维度建模基本概念维度模型是数据仓库领域大师RalphKimall所倡导,他的《数据仓库工具箱》,是数据仓库工程领域最流行的
数仓
建模经典。
pauls
·
2024-01-18 00:26
尚硅谷离线
数仓
之采集平台
1.用户行为日志数据流向流程图如下,其中红框表示用户行为日志数据的流向图。1.1行为日志内容行为日志主要包括以下几个内容页面浏览记录动作记录曝光记录启动记录错误记录页面浏览记录动作记录曝光记录启动记录1.2用户行为日志格式页面日志启动日志页面日志,以页面浏览为单位,即一个页面浏览记录,生成一条页面埋点日志。一条完整的页面日志包含,一个页面浏览记录,用户在该页面所做的若干个动作记录,若干个该页面的曝
韩顺平的小迷弟
·
2024-01-17 21:56
大数据
python
开发语言
数据仓库面试题
1思维导图&
数仓
常见面试题2题目1.数据仓库是什么?
韩顺平的小迷弟
·
2024-01-17 21:53
大数据面试题
数据仓库
大数据
2024.1.16 用户画像day01 - 项目介绍
技术选型:技术架构:项目架构:二.名词解释一.项目介绍整体流程:项目介绍-elasticSearch-业务数据源导入-离线指标开发-Flume实时采集-Nginx日志埋点数据-结构化流实时指标-制作报表
数仓
开发用户画像实时开发
白白的wj
·
2024-01-17 15:40
spark
大数据
分布式
python
kafka
zookeeper
hive
关于CarbonData+Spark SQL的一些应用实践和调优经验分享
行业亟需一个高效、统一的融合
数仓
,从海量数据中快速获取有效信息,从而洞察机遇、规避风险。
weixin_34075551
·
2024-01-17 15:31
大数据
人工智能
后端
数仓
数据含有特殊字符,如何更方便的导出成excel文件
如果遇到数据中含有特殊字符,"\n","\r","\t",或者其他的特殊分隔符在数据导出时造成错位,都用sql替换,但是需求是导出的数据要保持原有内容格式,就不能替换剔除这些特殊字符,这种情况下使用json方式1,在hive
数仓
建一个临时的
第一次看海
·
2024-01-17 15:00
1024程序员节
spark sql实践开发后端引擎
-------------“何以解忧,唯有暴富”需求开发一个系统,主要是将
数仓
中治理完用于检索的数据灌入Elasticsearch中,一般情况,开源的一些系
第一次看海
·
2024-01-17 14:28
spark
sql
大数据
C# MVC: 简介与实践
MVC是一种
分层架构
模式,用于将应用程序的逻辑分离成三个主要组件:模型(Model)、视图(View)和控
EternalDreamer
·
2024-01-16 16:43
c#
mvc
开发语言
Spring环境搭配
框架的主要优势之一就是其
分层架构
,
分层架构
允许使用者选择使用哪一个组件,同时为J2EE应用程序开发提供集成的框架。Spri
AAACod
·
2024-01-16 11:03
spring
java
后端
架构07- 理理解架构的模式1
在网站开发中,常用的架构模式包括
分层架构
、微服务架构、消息队列架构、缓存架构等,用于解决高并发访问、大规模数据处理、系统稳定性和安全性等挑战。
我还是个少年
·
2024-01-16 09:39
架构
Hive使用shell调用命令行特殊字符处理
1.场景分析数据处理常用hive-e的方式,通过脚本操作
数仓
,过程中常常遇到特殊字符的处理,如单双引号、反斜杠、换行符等,现将特殊字符用法总结使用如下,可直接引用,避免自行测试的繁琐。
tuoluzhe8521
·
2024-01-16 07:17
Hive相关
hive
hadoop
数据仓库
ClickHouse - 01
批处理会将源业务系统中的数据通过数据抽取工具(例如Sqoop)将数据抽取到HDFS中,这个过程可以使用MapReduce、Spark、Flink技术对数据进行ETL清洗处理,也可以直接将数据抽取到Hive
数仓
中
ArthurHC
·
2024-01-16 02:17
领域驱动设计——DDD领域驱动设计进阶
摘要进阶篇主要讲解领域事件、DDD
分层架构
、几种常见的微服务架构模型以及中台设计思想等内容。如何通过领域事件实现微服务解耦?、怎样进行微服务分层设计?、如何实现层与层之间的服务协作?
庄小焱
·
2024-01-16 01:04
系统架构设计
驱动开发
数据库, 数据仓库, 数据集市,数据湖,数据中台
数据仓库和数据库的区别作者:南宫蓉出处:简书第一篇:数据仓库概述第二篇:数据库关系建模作者:穆晨出处:CNBLOS数据仓库、数据湖、数据集市、和数据中台的故事作者:Murkey学习之旅出处:csdn数据中台和
数仓
的关系作者
cxzhq2002
·
2024-01-16 01:26
数据库
mysql/oracle 数据库delete操作太慢(where ... in ...),不加索引,一招让性能提升百倍
比如在
数仓
项目中,软删虽然更快更安全,但是缺点也很多:1、软删造成数据冗余,甚至快速膨胀的后果。比如一些中间表,只是作为中转站,过两天数据就分配其他表了,不硬删的话就会造成数据快速膨胀。
大壮001
·
2024-01-15 23:30
大数据
数据库
数据库
mysql
oracle
sql
大数据
亚信安慧AntDB-S流式数据库实现企业数智化转型
AntDB-S流式数据库是一项针对实时
数仓
等场景的创新技术,旨在取代传统的流式处理引擎,从而简化开发和测试过程。该流式数据库具备强大的ACID特性和高可用性,为企业降低了流式业务开发和维护的成本。
亚信安慧AntDB数据库
·
2024-01-15 14:11
数据库
大数据
antdb数据库
antdb
国产开源优秀新一代MPP数据库StarRocks入门之旅-
数仓
新利器(上)
概述背景ApacheDoris官方地址https://doris.apache.org/ApacheDorisGitHub源码地址https://github.com/apache/incubator-dorisApacheDoris是一个现代化的MPP分析型数据库产品。仅需亚秒级响应时间即可获得查询结果,有效地支持实时数据分析。ApacheDoris的分布式架构非常简洁,易于运维,并且可以支持1
IT小神
·
2024-01-15 13:45
大数据
数据库
分布式
数据库
大数据
分布式
数仓
选型必列入考虑的OLAP列式数据库ClickHouse(中)
实战案例使用背景ELK作为老一代日志分析技术栈非常成熟,可以说是最为流行的大数据日志和搜索解决方案;主要设计组件及架构如下:而新一代日志监控选型如ClickHouse、StarRocks特别是近年来对ELK地位发起较大的挑战,不乏有许多的大公司如携程,快手已开始把自己的日志解决方案从ES迁移到了Clickhouse,将日志从ES迁移到ClickHouse可以节省更多的服务器资源,总体运维成本更低,
IT小神
·
2024-01-15 13:45
数据仓库
数据库
运维
数据库
elasticsearch
国产开源优秀新一代MPP数据库StarRocks入门之旅-
数仓
新利器(中)
概述背景ApacheDoris官方地址ApacheDorisApacheDorisGitHub源码地址GitHub-apache/incubator-doris:ApacheDoris(Incubating)isanMPP-basedinteractiveSQLdatawarehousingforreportingandanalysis.ApacheDoris是一个现代化的MPP分析型数据库产品。
Firstlucky77
·
2024-01-15 13:42
java
mysql
linux
大数据开发之Hive(基本概念、安装、数据类型、DDL数据定义、DML数据操作)
但是面对海量的数据和负责的业务逻辑,开发人员要编写MR对数据进行统计分析难度极大,所以就产生了Hive这个
数仓
工具。Hive可以帮助开发人员将SQL语句转化为MapReduce在yarn上跑。
Key-Key
·
2024-01-15 12:04
大数据
hive
hadoop
大数据开发之Hive(详细版,最后有实战训练)
但是面对海量的数据和负责的业务逻辑,开发人员要编写MR对数据进行统计分析难度极大,所以就产生了Hive这个
数仓
工具。Hive可以帮助开发人员将SQL语句转化为MapReduce在yarn上跑。
Key-Key
·
2024-01-15 12:29
hive
hadoop
大数据
传统可扩展架构模式:
分层架构
和SOA
分层架构
分层架构
也叫N层架构,一般至少是2层,如C/S、B/S;常见3层架构如MVC、MVP;4层以上架构比较少见。
短暂瞬间
·
2024-01-15 06:20
项目实战-知行教育大数据分析平台-01
目录一、业务流程二、项目架构流程三、clouderamanager(CM)基本介绍四、项目环境搭建五、维度分析六、
数仓
建模1、维度建模2、什么是事实表与维度表3、事实表与维度表的分类4、维度建模的三种模型
吆喝的翅膀
·
2024-01-15 04:22
python+大数据学习
数据仓库
教育电商
hive
hadoop
cloudera
clickhouse常规的优化方法
一、建表优化1.1日期字段避免使用String存储建表时能用数值型或日期时间型表示的字段就不要用字符串,全String类型在以Hive为中心的
数仓
建设中常见,但ClickHouse环境不应受此影响。
运维仙人
·
2024-01-15 01:08
大数据
clickhouse
大数据
统一OLAP查询平台之语义层
产品和应用讨论分析指标,并拉上
数仓
和业务一起确认指标。
数仓
理解指标,并开始数据加工。首先,从ODS层开
XianMing的博客
·
2024-01-14 11:27
olap
数据仓库
语义分析
数据仓库(1)-总览
整体大纲如下,分为8个部分,包括认识
数仓
,
数仓
模型建设,元数据管理,指标体系,数据质量,数据安全,数据治理,实时技术。
XianMing的博客
·
2024-01-14 11:27
数据仓库
数据仓库
数据仓库(2)-认识
数仓
1、数据仓库是什么数据仓库,由数据仓库之父比尔·恩门(BillInmon)于1990年提出,主要功能仍是将组织透过资讯系统之联机事务处理(OLTP)经年累月所累积的大量资料,透过数据仓库理论所特有的资料储存架构,做有系统的分析整理,以利各种分析方法如联机分析处理(OLAP)、数据挖掘(DataMining)之进行,并进而支持如决策支持系统(DSS)、主管资讯系统(EIS)之创建,帮助决策者能快速有
XianMing的博客
·
2024-01-14 10:53
数据仓库
数据仓库
spark
大数据
长龙航空HTAP实践:统一技术栈,高效构建在线服务与轻量实时
数仓
浙江长龙航空有限公司(以下简称“长龙航空”)是浙江省唯一的本土总部型客货综合公共运输航空公司,拥有国内国际、客运货运全牌照航空运输资质,属于中大型航空公司,居民营航空公司前列,自2011年成立至今,累计开通国内外客货运航线近600条,覆盖全国并通达日韩、港澳、东南亚、中亚等“一带一路”沿线国家和地区的170余个城市。在现代航空业运营中,高效的数据管理和可靠的数据库系统是成功运营的关键要素之一。长龙
OceanBase数据库官方博客
·
2024-01-14 07:30
oceanbase
数据库
数仓
搭建——DWD层
1DWD层(用户行为日志)1.1日志解析思路页面埋点日志启动日志思路1.2get_json_object函数使用数据[{"name":"大郎","sex":"男","age":"25"},{"name":"西门庆","sex":"男","age":"47"}]取出第一个json对象hive(gmall)>selectget_json_object('[{"name":"大郎","sex":"男",
丝丝呀
·
2024-01-14 06:10
java
json
开发语言
数据仓库-离线
数仓
(基于物流
数仓
)
1、数据仓库概述1.1、数据仓库概念数据仓库是一个为数据分析而设计的企业级数据管理系统。数据仓库可集中、整合多个信息源的大量数据,借助数据仓库的分析能力,企业可从数据中获得宝贵的信息进而改进决策。同时,随着时间的推移,数据仓库中积累的大量历史数据对于数据科学家和业务分析师也是十分宝贵的。1.2、数据仓库核心架构2、数据仓库建模概述2.1、数据仓库建模的意义如果把数据看作图书馆里的书,我们希望看到它
小鱼干换酒钱
·
2024-01-14 06:39
#
物流数仓
数据仓库
hive
数仓
学习笔记(5)——
数仓
搭建(DWD层)
目录一、
数仓
搭建——DWD层1、DWD层(用户行为日志)1.1日志解析思路1.2get_json_object函数使用1.3启动日志表1.4页面日志表1.5动作日志表1.6曝光日志表1.7错误日志表1.8DWD
默萧756
·
2024-01-14 06:35
学习
大数据
数仓
数仓
笔记(五)-DWD层,DWS层
数仓
搭建DWD层1)对用户行为数据解析2)对业务数据采用维度模型重新建模6.1DWD层(用户行为日志)1)日志结构回顾(1)页面埋点日志(2)启动日志2)日志解析思路6.1.2get_json_object
芝士雪豹.
·
2024-01-14 06:33
java
开发语言
hive
大数据
离线
数仓
(十三) --------- DWD 层搭建
目录前言一、DWD层(用户行为日志)1.日志解析思路2.get_json_object函数使用3.启动日志表4.页面日志表5.动作日志表6.曝光日志表7.错误日志表8.DWD层用户行为数据加载脚本二、DWD层(业务数据)1.评价事实表(事务型事实表)2.订单明细事实表(事务型事实表)3.退单事实表(事务型事实表)4.加购事实表(周期型快照事实表,每日快照)5.收藏事实表(周期型快照事实表,每日快照
在森林中麋了鹿
·
2024-01-14 06:02
大数据项目
java
json
数据库
企业级大数据项目【4】
数仓
-业务域ODS-DWD-ADS开发篇
1概要说明业务域的数据来自业务系统的数据库通过sqoop(或datax)抽取到
数仓
的ods层在ods层对有需要的表进行增量合并,字段选择,反范式话,形成dwd明细层表在明细层基础上,进行各类主题的数据统计
江湖人称涛哥
·
2024-01-14 06:32
物流实时
数仓
ODS层——Mysql到Kafka
目录1.采集流程2.项目架构3.resources目录下的log4j.properties文件4.依赖5.ODS层——OdsApp6.环境入口类——CreateEnvUtil7.kafka工具类——KafkaUtil8.启动集群项目这一层要从Mysql读取数据,分为事实数据和维度数据,将不同类型的数据进行不同的ETL处理,发送到kakfa中。代码1.采集流程2.项目架构3.resources目录下
雷神乐乐
·
2024-01-14 06:01
#
实时数仓项目
大数据
数据仓库
flink
kafka
物流实时
数仓
DWD层——1.准备工作
目录1.创建主程序——DwdOrderRelevantApp类2.创建DWD层的事实表——来源于订单表和订单明细表(1)创建订单表实体类(2)创建订单明细表实体类(3)创建交易域:下单事务事实表实体类,并整合(1)与(2),采用下单时间(4)创建交易域:支付成功事务事实表实体类,并整合(1)与(2),采用支付时间和支付状态(5)创建物流域:揽收(接单)事务事实表实体类,并整合(1)与(2),采用揽
雷神乐乐
·
2024-01-14 06:57
#
实时数仓项目
大数据
flink
java
数据仓库
交通物流
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他