E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
实时计算(数仓)
自动弹性,QPS线性提升|一文读懂云原生
数仓
AnalyticDB弹性技术原理
阿里云瑶池旗下的云原生
数仓
AnalyticDBMySQL湖仓版(以下简称AnalyticDBMySQL)在发布之初提供了定时弹性功能,帮助业务有规律的客户定时升降配计算资源以节省成本。
阿里云瑶池数据库
·
2024-01-26 06:56
云原生
数据库
阿里云
云计算
阿里云 Flink 原理分析与应用:深入探索 MongoDB Schema Inference
团队归源老师关于阿里云Flink原理分析与应用:深入探索MongoDBSchemaInference的研究,内容主要分为以下四部分:MongoDB简介社区MongoDBCDC核心特性MongoDBCDC在阿里云Flink
实时计算
产品的实践总结一
Apache Flink
·
2024-01-26 06:25
阿里云
flink
mongodb
金融评分卡项目—9.违约预测模型的后续工作
文章目录一、评分卡分数计算1.分数的分级二、模型的验证与监控1.模型的验证2.模型的监控三、评分卡的其他细节1.
实时计算
2.非
实时计算
3.拒绝推断四、申请评分卡的使用1.授信额度2.利率定价金融评分卡项目
哎呦-_-不错
·
2024-01-26 01:32
#
数据挖掘项目实战
金融评分卡
违约预测模型
后续工作
某马头条——day11+day12
实时计算
和定时计算流式计算kafkaStream入门案例导入依赖org.apache.kafkakafka-streamsconnect-jsonorg.apache.kafkaorg.apache.kafkakafka-clients
北岭山脚鼠鼠
·
2024-01-26 01:01
微服务
linq
c#
基于 Hologres+Flink 的曹操出行实时
数仓
建设
云布道师曹操出行创立于2015年5月21日,是吉利控股集团布局“新能源汽车共享生态”的战略性投资业务,以“科技重塑绿色共享出行”为使命,将全球领先的互联网、车联网、自动驾驶技术以及新能源科技,创新应用于共享出行领域,以“用心服务国民出行”为品牌主张,致力于打造服务口碑最好的出行品牌。曹操出行业务背景介绍作为一家互联网出行平台,主要提供了网约车、顺风车、专车等一些出行服务。打车为其主要的一个业务场景
云布道师
·
2024-01-25 20:23
阿里云
开源计算机视觉库OpenCV详解
一、OpenCV简介OpenCV,全称为开源计算机视觉库,是一个为
实时计算
机视觉开发的跨平台库。它包含了数百种优化过的算法,覆盖了图像处理、计算机视觉和机
Dxy1239310216
·
2024-01-25 19:34
图像处理
Python
计算机视觉
python
opencv
人工智能
大数据分析组件Hive-集合数据结构
Hive常作为离线
数仓
的分析工具,当面临Json数据时,Hive需要用到其数据结构构建出一张
Aimyon_36
·
2024-01-25 15:15
Hive
数据分析
hive
数据结构
Flink(十五)【Flink SQL Connector、savepoint、CateLog、Table API】
前言今天一天争取搞完最后这一部分,学完赶紧把Kafka和Flume学完,就要开始做实时
数仓
了。据说是应届生得把实时
数仓
搞个80%~90%才能差不多找个工作,太牛马了。
让线程再跑一会
·
2024-01-24 07:17
Flink
flink
大数据
企业建
数仓
的第一步是选择一个好用的ETL工具
而选择合适的ETL工具是构建
数仓
的关键一步。因没有高灵活度的ETL就无法构建高质量的
数仓
。数据仓库的重要性数据仓库是企业将各个部门和系统中分散的数据进行整合、清洗和分析的基础
苛子
·
2024-01-23 20:36
etl
数据仓库
I.Flink中的 状态
前言:
实时计算
如果任务失败导致中间状态丢失,将是一个可怕的事情,比如
实时计算
每天的pv,uv等指标,任务掉线之后中间状态也丢失了,那只能从凌晨数据重新计算。
莫噶
·
2024-01-23 18:29
Flink
flink
大数据
用flinkcdc debezium来捕获数据库的删除内容
但是我现在情况是doris做为
数仓
,数据写到ods,ods的数据还会通过flink计算后写入dwd层,所以此时ods的数据是删除了,但是dwd甚至ads的都没删除,这样就会有脏数据。
后季暖
·
2024-01-23 11:17
数据库
Hive 拉链表详解及实例
拉链表版本迭代:hive0.14slowlychangingdimension=>hive2.6.0merge事务管理原来采用分区表,用户分区存储历史增量数据,缺点是重复数据太多定义:
数仓
用于解决持续增长且存在一定时间时间范围内重复的数据存储
Byyyi耀
·
2024-01-23 06:45
hive
hadoop
数据仓库
拉链表
Hive
数仓
及
数仓
设计方案
数仓
(DataWarehouse)数据仓库存在的意义在于对企业的所有数据进行汇总,为企业各个部门提供一个统一、规范的出口。做
数仓
就是做方案,是用数据治理企业的方案。
Byyyi耀
·
2024-01-23 06:34
hive
hadoop
数据仓库
flume案例
在构建
数仓
时,经常会用到flume接收日志数据,通常涉及到的组件为kafka,hdfs等。下面以一个flume接收指定topic数据,并存入hdfs的案例,大致了解下flume相关使用规则。
不加班程序员
·
2024-01-23 06:48
ETL
kafka
Hadoop相关
flume
大数据
etl
数仓
建设 - 维度建模 - DIM维度
文章目录前置:准备数据库一、商品维度表1.1表结构设计1.2建表语句1.3ETL任务脚本二、优惠券维度表2.1表结构设计2.2ETL任务脚本三、活动维度表3.1表结构设计3.2ETL任务脚本四、地区维度表4.1表结构设计4.2ETL任务脚本五、日期维度表六、用户维度表6.1表结构设计6.2ETL任务脚本前置:准备数据库[
[email protected]
]$
m0_46218511
·
2024-01-23 05:14
大数据基础设施搭建
维度建模
数据仓库
Databend 开源周报第 128 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-23 03:01
开源
Databend 开源周报第 129 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2024-01-23 03:31
开源
大数据Flink实时大屏统计
今天我们就做一个最简单的模拟电商统计大屏的小例子,需求如下:1.
实时计算
出当天零点截止到当前时间
赵广陆
·
2024-01-22 19:56
flink
flink
java
big
data
数据湖技术之Paimon
一、简介Flink社区希望能够将Flink的Streaming
实时计算
能力和Lakehouse新架构优势进一步结合,推出新一代StreamingLakehouse技术,促进数据在数据湖上真正实时流动起来
小枫@码
·
2024-01-22 17:48
数据湖
大数据
Flink on yarn 实时日志收集到 kafka 打造日志检索系统
点击上方"JasonLee
实时计算
",选择"设为星标"再也不用担心错过重要文章后台回复"监控",获取grafana监控Flink最新的模板背景在Flinkonyarn的模式下,程序运行的日志会分散的存储在不同的
JasonLee实时计算
·
2024-01-22 08:33
log4j
java
kafka
hadoop
大数据
Flink背景
数仓
简介在信息爆炸的时代,为了从海量数据中洞察业务价值,驱动运营决策,企业通常会构建用于数据分析的数据仓库。
201001070
·
2024-01-22 08:31
Flink
flink
大数据
Dinky安装和部署
概述Dinky是一个开箱即用、易扩展,以ApacheFlink为基础,连接OLAP和数据湖等众多框架的一站式
实时计算
平台,致力于流批一体和湖仓一体的探索与实践。
Appreciate(欣赏)
·
2024-01-22 08:28
dinky
Flink
flink
大数据
大数据开发之电商
数仓
(hadoop、flume、hive、hdfs、zookeeper、kafka)
第1章:数据仓库1.1数据仓库概述1.1.1数据仓库概念1、数据仓库概念:为企业制定决策,提供数据支持的集合。通过对数据仓库中数据的分析,可以帮助企业,改进业务流程、控制成本,提高产品质量。数据仓库并不是数据的最终目的地,而是为数据最终的目的地做好准备,这些准备包括对数据的:清洗、转义、分类、重组、合并、拆分、统计等。2、数据仓库的数据通常包括:业务数据、用户行为数据和爬虫数据等3、业务系统数据库
Key-Key
·
2024-01-22 07:29
大数据
hadoop
flume
kafka
hive
hdfs
大数据小白初探HDFS从零到入门(一)
目录1.前言2.大数据的诞生3.发展趋势及应用4.离线计算和
实时计算
5.大数据的特性1.前言前两天把Hbase的初级入门知识整理了下,在文章中提到了“HDFS”这个大数据的基础,有同事小伙伴想要了解下这方面的知识
北京-景枫
·
2024-01-21 20:55
Hadoop
大数据
hdfs
yarn
大数据特性
数据仓库简介、数据仓库的发展、
数仓
理论简介
数仓
理论简介数据仓库解决方案诞生至今,也有2、30年的发展历史了,在这个过程中,
数仓
理论不断被更新和完善,逐步形成了目前大家普通遵守的
数仓
开发理论(概念)。
yida&yueda
·
2024-01-21 11:48
大数据
数据仓库
big
data
数据库
数据仓库简介
一、
数仓
概念数据仓库,英文名称为DataWarehouse,可简写为DW或DWH。数据仓库,是为企业所有级别的决策制定过程,提供所有类型数据支持的战略集合。
水坚石青
·
2024-01-21 11:46
数据仓库
mysql
数据库
java
数据仓库
oracle
大数据
【全局光照GI系统剖析_直接和间接光照_案例分享(附带场景下载链接)_场景】
Unity的URP渲染管线全局光照GI系统剖析全局照明(GlobalIllumination)GlobalIllumination小总结与扩展:光照关系图表GI系统直接光和间接光关系表格
实时计算
烘焙预计算上图项目场景源码链接全局照明
暴走约伯
·
2024-01-21 03:14
经验分享
unity
游戏引擎
开发语言
Hologres V2.1版本发布,新增计算组实例构建高可用实时
数仓
Highlight产品介绍Hologres是阿里云自研一站式实时
数仓
,统一数据平台架构,将OLAP查询、即席分析、在线服务、向量计算多个数据应用构建在统一存储之上,实现一份数据,多种计算场景。
阿里云大数据AI技术
·
2024-01-20 21:07
网络
java
数据库
Flink窗口与水位线不得不说的秘密
在我们的这个Flink框架中,自Flink1.12.0正式发布流批一体统一运行之后,我们的
实时计算
框架真正步入了Flink的时代,flink实现了流批一体,那么在我们的flink计算中怎么实现我们的批处理
梧桐生湘云
·
2024-01-20 19:56
flink
大数据
java
巴别时代基于 Apache Paimon 的 Streaming Lakehouse 的探索与实践
我们基于ApachePaimon(Incubating)构建StreamingLakehouse的落地实践主要分为三期:第一期是在调研验证的基础上进行
数仓
分层,并且上线一些简单的业务验证效果;第二期是实现流式
数仓
的基础设施建设
Apache Flink
·
2024-01-20 12:21
Flink
大数据
实时计算
apache
kafka
大数据
java
分布式
程序员必备的面试技巧——大数据工程师面试必备技能
目录前言一、不同工程师的职责和技能要求1、
数仓
开发工程师2、算法挖掘工程师3、大数据平台开发工程师4、大数据前端开发工程师二、大数据技术架构图三、大数据相关的技术内容四、大数据面试经验1、大数据开发岗位
Francek Chen
·
2024-01-20 11:22
话题征文
面试
职场和发展
大数据
动态路由协议(RIP协议)
动态路由协议---基于拓扑
实时计算
、收敛、生成路由表路由器间共享、协商、计算,来获取实时的未知网段路由条目一、动态路由协议的缺点:1、路由器间需要协商、沟通、计算----占用硬件资源2、选路规则为一种算法
보고.싶다
·
2024-01-20 05:07
HCIA
网络
超融合之道:亚信安慧AntDB 8.0版本引领数据库创新
在当今多变的数据应用场景中,AntDB作为行业领先的超融合流式实时
数仓
,秉承着“融合+实时”的研发理念,全面应对企业日益复杂的数据处理需求。
亚信安慧AntDB数据库
·
2024-01-20 01:00
数据库
antdb数据库
antdb
华为外包数据库面试问题分享20211225
数仓
的东西了解多少。数据库开发支持这方面你做过哪些。你现在的工作中的SQL开发,具体是作了哪些。你的工作意愿是哪个方向(这么问是因为知道了我没做过DBA)在
数仓
的设
钦䲹
·
2024-01-19 16:05
数据库
华为
面试
某小外包公司线上面试-大数据开发
1.
数仓
和数据库的区别2.
数仓
建模3.hive用到的函数4.rank,dense_rank,row_number的区别5.hive数据倾斜的原因有哪些7.如何理解数据质量?
劝学-大数据
·
2024-01-19 16:03
大数据面试题
大数据
小红书如何实现高效推荐?解密背后的大数据计算平台架构
推荐是小红书非常核心且重要的场景之一,本文主要分享在推荐业务场景中小红书的
实时计算
应用。
实时计算
在推荐业务中的场景线上推荐流程小红书线上推荐的流程主要可以分为三步。第一步,从小红书用户每
yoku酱
·
2024-01-19 09:27
基于 Hologres+Flink 的曹操出行实时
数仓
建设
本文整理自曹操出行
实时计算
负责人林震基于Hologres+Flink的曹操出行实时
数仓
建设的分享,内容主要分为以下六部分:曹操出行业务背景介绍曹操出行业务痛点分析Hologres+Flink构建企业级实时
数仓
曹操出行实时
数仓
实践曹操出行业务成果分析未来展望一
Apache Flink
·
2024-01-19 08:54
flink
大数据
一站式大数据平台XSailboat简介--Hadoop、Hive、Flink、DataStudio、数据服务、API网关、认证中心、数据可视化、离线分析、
实时计算
、应用引擎等
1.引言从2021年年底开始,笔者带领一个微型团队开始开发我们的大数据平台XSailboat,目前已经初步具备实用化条件,产品将持续性地开发、完善、迭代升级。在接下来的一段时间,笔者将陆续编写一些关于大数据平台实现相关的技术文档,有兴趣的从事大数据相关的同学,可以关注收藏一下,交流一下开发技术。如果对我们的大数据平台XSailboat感兴趣的同学比较多,希望将其应用于学习或商业项目中,我们可以在条
OkGogooXSailboat
·
2024-01-19 06:26
大数据平台开发技术
大数据
FineBI实战项目一(25):实战项目一总结
实在项目使用mysql做
数仓
库的ODS层,这仅仅是带领大家入门,用mysql做
数仓
存在很多问题。
不死鸟.亚历山大.狼崽子
·
2024-01-19 02:39
FineBI
finebi
数仓
架构图
阿里巴巴的数据团队把表数据模型分为三层:操作数据层(ODS)、公共维度模型层(DM)和应用数据层(DS),其中公共维度模型层包括明细数据层(DWD)和汇总数据层(DWS)。模型层次关系如9.9所示。image.png公共维度模型层(CDM):存放明细事实数据、维表数据及公共指标汇总数据其中明细事实数据、维表数一般根据ODS层数据加工生成:公共指标汇总数据般根据维表数据和明细事实数据加工生成。CDM
liuxiaolin
·
2024-01-19 01:27
Hologres + Flink 流式湖仓建设
Flink流式湖仓建设1Flink+Hologres特性1.2实时维表Lookup1.3高性能实时写入与更新1.4多流合并1.5Hologres作为Flink的数据源1.6元数据自动发现与更新2传统实时
数仓
分层方案
Direction_Wind
·
2024-01-18 21:56
hologres
技术调研
flink
大数据
白山云基于StarRocks数据库构建湖仓一体
数仓
的实践
背景随着每天万亿级别的业务数据流向数据湖,数据湖的弊端也逐渐凸显出来,例如:数据入湖时效性差:数据湖主要依赖于离线批量计算,通常不支持实时数据更新,因此无法保证数据的强一致性,造成数据不及时、不准确;查询性能差:在传统架构下,数据湖的查询速度较差,小时粒度的数据查询往往需要数分钟才能得到响应,在多个业务方同时执行数据湖查询任务时,查询响应慢的劣势更加明显;查询体验差:数据存储在多个地方,在进行联邦
StarRocks_labs
·
2024-01-18 17:04
社区投稿
数据库
大数据
Dinky为大数据框架Flink提供交互式平台,让你学习 FlinkSQL 更加轻松,并且掌握Flink技能!
它是一个基于ApacheFlink的一站式
实时计算
平台,致力于流批一体和湖仓一体的探索与实践。作为一个开箱即用、易扩展的平台,Dinky可以方便地连接OLAP、数据湖等众多框架。
知识分享小能手
·
2024-01-18 17:59
大数据
学习心得体会
大数据
flink
学习
技术选型|开源大数据OLAP引擎最佳实践
一、开源OLAP综述二、开源
数仓
解决方案三、ClickHouse介绍四、StarRocks介绍五、Trino介绍六、客户案例01开源OLAP综述如今的开源数据引擎多种多样,不同种类的引擎满足了我们不同的需求
浪尖聊大数据-浪尖
·
2024-01-18 08:14
运维
大数据
分布式
数据库
人工智能
数仓
项目6.0配置大全(hadoop/Flume/zk/kafka/mysql配置)
配置背景我使用的root用户,懒得加sudo所有文件夹在/opt/module所有安装包在/opt/software所有脚本文件在/root/bin三台虚拟机:hadoop102-103-104分发脚本fenfa,放在~/bin下,chmod777fenfa给权限#!/bin/bash#1.判断参数个数if[$#-lt1]thenechoXXXXXXXXXNoArguementXXXXXXXXX!
Int mian[]
·
2024-01-18 06:57
hadoop
flume
kafka
如何设计实时数据平台(设计篇)
在上篇设计篇中,我们首先从两个维度介绍实时数据平台:从现代
数仓
架构角度看待实时数据平台,从典型数据处理角度看待实时数据处理;接着我们会探讨实时数据平台整体设计架构、对具体问
longLiveData
·
2024-01-18 05:11
小红书推荐大数据在阿里云上的实践
本篇内容主要分三个部分,在第一部分讲一下
实时计算
在推荐业务中的使用场景。第二部分讲一下小红书是怎么使用Flink的一些新的功能。
aliyunhologres
·
2024-01-18 05:55
经典用户案例
flink
kafka
hdfs
大数据
数据库
离线
数仓
二
数据仓库维度模型设计维度建模基本概念维度模型是数据仓库领域大师RalphKimall所倡导,他的《数据仓库工具箱》,是数据仓库工程领域最流行的
数仓
建模经典。
pauls
·
2024-01-18 00:26
尚硅谷离线
数仓
之采集平台
1.用户行为日志数据流向流程图如下,其中红框表示用户行为日志数据的流向图。1.1行为日志内容行为日志主要包括以下几个内容页面浏览记录动作记录曝光记录启动记录错误记录页面浏览记录动作记录曝光记录启动记录1.2用户行为日志格式页面日志启动日志页面日志,以页面浏览为单位,即一个页面浏览记录,生成一条页面埋点日志。一条完整的页面日志包含,一个页面浏览记录,用户在该页面所做的若干个动作记录,若干个该页面的曝
韩顺平的小迷弟
·
2024-01-17 21:56
大数据
python
开发语言
数据仓库面试题
1思维导图&
数仓
常见面试题2题目1.数据仓库是什么?
韩顺平的小迷弟
·
2024-01-17 21:53
大数据面试题
数据仓库
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他