E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
实时计算(数仓)
Flink入门之概念介绍(一)
作为近几年甚是火爆的数据实时处理框架,吸引了一大批程序员的学习,更是凭借着流批一体化,高效实时数据计算,尤其是在数据量特别大的情况下,每秒钟的数据处理量高达7TB,受到了一大批企业的青睐,纷纷将Flink作为日常
实时计算
的核心
大数据程序员
·
2023-12-05 21:31
Flink
flink
大数据
编程语言
java
【黑马甄选离线
数仓
day06_核销主题域开发】
1.核销主题_DWD和DWM层1.0ODS层操作数据存储层:==OperateDataStore==核心理念:几乎和源数据保持一致,粒度相同注意事项:==同步方式(全量同步,全量覆盖,增量仅新增,增量新增和更新)+内部表+分区表(部分)+指定字符分隔符+orc+zlib==第二天的时候已经完成了从mysql以及sqlserver抽取数据到ods层的过程1.1DWD层数据仓库细节层:==DataWa
LKL1026
·
2023-12-05 21:00
黑马甄选离线数仓项目
大数据
笔记
数据仓库
【Flink从入门到精通 01】流式处理概念
“Flink中流式处理的概念是
实时计算
的基石,也是你踏入Flink的第一步。”今天和大家一起聊聊流式处理的通用概念。如果还不清楚这些概念的同学,今天的分享一定会给你带来收获的。
编程理想国
·
2023-12-05 21:30
大数据
#
Flink
flink
大数据
big
data
java
kafka
【黑马甄选离线
数仓
day07_常见优化手段及核销主题域开发】
1.常见优化手段1.1分桶表基本介绍分桶表:分文件的,在创建表的时候,指定分桶字段,并设置分多少个桶,在添加数据的时候,hive会根据设置分桶字段,将数据划分到N个桶(文件)中,默认情况采用HASH分桶方案,分多少个桶,取决于建表的时候,设置分桶数量,分了多少个桶最终翻译的MR也就会运行多少个reduce程序(HIVE的分桶本质上就是MR的分区操作)如何构建一个分桶表呢?createtable表名
LKL1026
·
2023-12-05 21:26
笔记
大数据
数据仓库
黑马一站制造
数仓
实战1
1.项目目标一站制造企业中项目开发的落地:代码开发代码开发:SQL【DSL+SQL】SparkCoreSparkSQL
数仓
的一些实际应用:分层体系、建模实现2.内容目标项目业务介绍:背景、需求项目技术架构
ZhaoXiangmoStu
·
2023-12-05 15:20
Python
制造
大数据
gRPC 负载均衡算法
目录一、负载均衡算法二、gRPC与负载均衡算法结合三、gRPC负载均衡算法1、轮询2、加权轮询(平滑加权轮询算法)3、负载均衡:随机4、最小链接数一、负载均衡算法不
实时计算
负载的算法:轮询、加权轮询、随机
xingjigongsi
·
2023-12-05 08:10
golang
grpc
负载均衡
后端
服务器
算法
大数据转型方案:首推数据湖!
数仓
技术应对关系型结构化数据游刃有余,但对于多元异构数据,却爱莫能助。最近行业大佬都在聊怎么部署数据湖,这波操作未来走向如何?数据湖技术能够实现全量数据的单一存储,通常存储原始格式的对象块或者文件。
zhisheng_blog
·
2023-12-05 02:12
大数据
人工智能
编程语言
java
数据分析
大数据开发:Hive on Spark设计原则及架构
在Spark越来越受到主流市场青睐的大背景下,Hive作为Hadoop生态当中的
数仓
组件工具,在于Spark生态的配合当中,开始有了HiveonSpark的思路,那么具体是怎么实现的呢?
成都加米谷大数据
·
2023-12-05 01:44
大数据的技术栈-逐步完善
c.MapReducesql引擎d.Impalasql引擎e.工具概观2.数据仓库知识a.Hive数据库1)HiveSql2)数据库结构b.Doris数据库3.混合处理框架SPARKa.Sparkb.集群架构4.
数仓
模型知识
刘文钊1
·
2023-12-04 20:12
大数据
51综合程序03-DS1302时钟
DS1302时钟芯片的工作原理1.芯片特点2.引脚说明3.寄存器地址4.读数据的时序图5.写数据的时序图二、综合实例LCD1602显示DS1302时钟芯片一、DS1302时钟芯片的工作原理1.芯片特点
实时计算
年
turbosqi
·
2023-12-04 20:41
嵌入式
单片机
嵌入式硬件
03
数仓
平台 Kafka
kafka概述定义Kafka是一个开源的分布式事件流平台(EventStreamingPlantform),主要用于大数据实时领域。本质上是一个分布式的基于发布/订阅模式的消息队列(MessageQueue)。消息队列在大数据场景中主要采用Kafka作为消息队列。传统消息队列主要应用场景包括:缓存/削峰、解耦和异步通信。消息队列的模式包含了2种,点对点订阅模式和发布/订阅模式。Kafka采用了发布
kk_io
·
2023-12-04 04:17
数据仓库
kafka
分布式
ng计算地址长度
需求:输入地址时候,会
实时计算
数组长度image.png超出长度提示超出了多少image.png方法calLength(address){ÏletallLen=address.line1.length;
简小咖
·
2023-12-03 13:57
hql面试题之上海某资深
数仓
开发工程师面试题-求不连续月份的月平均值
1.题目A,B两组产品的月平均值,月平均值是当月的前三个月值的一个平均值,注意月份是不连续的,如果当月的前面的月份不存在,则为0。如A组2023-04的月平均值为2023年1月的数据加2023-02月的数据的平均值,因为没有其他月份则需要再加一个0,再求平均值。要求:求出每个月的月平均值。‘A’,‘2023-01’,3030‘A’,‘2023-02’,5464‘A’,‘2023-04’,5467‘
江南正晓时
·
2023-12-03 12:56
hive
sql
激光跟踪仪在超大型工件空间测量中的应用,你了解多少?
它采用了先进的激光干涉测距和角度测量技术,基于球坐标法测量原理,通过发射激光并跟踪工件表面的反射光线,
实时计算
出工件的位置和形态参数,能够实现三维坐标的精密测量。
CHOTEST中图仪器
·
2023-12-03 10:16
大尺寸空间测量仪
3d
仪器仪表
激光跟踪仪
02
数仓
平台Zookeeper
概述ZooKeeper是一种分布式协调服务,用于管理大型主机集。在分布式环境中协调和管理服务是一个复杂的过程。ZooKeeper通过其简单的架构和API解决了这个问题。ZooKeeper允许开发人员专注于核心应用程序逻辑,而不必担心应用程序的分布式性质。Zookeeper工作机制Zookeeper从设计角度来理解,就是一个观察者模式设计的分布式服务管理框架,它负责存储和管理核心数据,接受观察者的注
kk_io
·
2023-12-03 09:52
数据仓库
zookeeper
分布式
云原生
AliExpress基于Flink的广告实时
数仓
建设
摘要:实时
数仓
以提供低延时数据指标为目的供业务实时决策,本文主要介绍基于Flink的广告实时
数仓
建设,主要包括以下内容:1.建设背景2.技术架构3.
数仓
架构4.实时OLAP5.实时保障6.未来规划建设背景广告是目前互联网流量变现的一种
王知无(import_bigdata)
·
2023-12-02 19:01
广告
大数据
编程语言
数据库
人工智能
亚马逊云科技re:Invent Peter DeSantis演讲,数据规模拓展无极限引领Serverless构建之路
Amazon全新发布RedshiftServerless:Al模型预测多维度
数仓
工作负载并自动调度和优化,高达10倍性价比提升。Amazon全新发布ElastiCacheServ
Zaker科技
·
2023-12-02 13:32
科技
serverless
云原生
【Spark
数仓
项目】需求八:MySQL的DataX全量导入和增量导入Hive
【Spark
数仓
项目】需求八:MySQL的DataX全量导入和增量导入Hive文章目录一、mysql全量导入hive[分区表]需求介绍:二、mysql增量导入hive1.增量导入的第一种实现方法2.另一种方法是时间字段
程序终结者
·
2023-12-02 10:22
spark
mysql
hive
2023.11.29 -hmzx电商平台建设项目 -核销主题阶段总结
目录1.准备源数据2.准备
数仓
工具进行源数据同步到ods层,本项目使用Datax3.使用Datax完成数据同步前建表时的方案选择3.1同步方式区别:3.2存储格式和压缩区别:4.在hive中创建表,共31
白白的wj
·
2023-12-02 09:53
数据仓库
大数据
hive
hadoop
数据库开发
etl
etl工程师
用 CloudCanal 快速验证阿里云 EMR for StarRocks 和 Doris
背景StarRocks和Doris是近两年来相当流行的、国产的、开源的实时
数仓
,不仅数据检索、分析能力出众,而且数据准备实时性好、准确度高、使用丝滑,可如同在线数据库般使用。
ClouGence
·
2023-12-02 08:47
CloudCanal
CloudDM
阿里云
云计算
直播电商数据仓库
直播电商数据仓库一.
数仓
及其维度什么是
数仓
数据仓库,简称
数仓
,(DataWarehouse)。
李昊哲小课
·
2023-12-01 21:31
数据分析
大数据
数据库
数据仓库
大数据
数据分析
数据可视化
数据库
数据库开发
finebi
尚硅谷大数据项目《在线教育之实时
数仓
》笔记008
视频地址:尚硅谷大数据项目《在线教育之实时
数仓
》_哔哩哔哩_bilibili目录第10章
数仓
开发之DWS层P066P067P068P069P070P071P072P073P074P075P076P077P078P079P080P081P082
upward337
·
2023-12-01 16:14
#
大数据数仓
大数据
实时数仓
hadoop
zookeeper
kafka
flink
maxwell
第13期:表统计信息的计算
对统计信息的计算分为非持久化统计信息(
实时计算
)与持久化统计信息。
爱可生开源社区
·
2023-12-01 16:46
2019-02-01
大数据技术的产生以及发展谷歌的三篇论文分布式文件系统GFS大数据分布式计算框架mapreduceNoSQL数据库系统BigTable大数据计算离线计算——批处理计算(MapReduce、Spark)
实时计算
奔跑的风2019
·
2023-12-01 04:34
1w字详解 ClickHouse漏斗模型实践方案(收藏)
作者:互联网大数据团队-WuYonggang日常工作中做为
数仓
开发工程师、数据分析师经常碰到漏斗分析模型,本文详细介绍漏斗模型的概念及基本原理,并阐述了其在平台内部的具体实现。
浪尖聊大数据-浪尖
·
2023-11-30 21:57
大数据
数据分析
java
python
数据库
Mysql 表结构 到 hive 表结构的转换 (DDL自动生成)
最近在做mysql入hive
数仓
的工作,由于业务表数量较大,单独写hiveDDL太过耗时,就找到了如下方法。
雾岛与鲸
·
2023-11-30 16:56
hive
hive
大数据学习-离线
数仓
项目实战笔记(上)
1.前置1.1.软件版本产品版本Hadoop2.9.2Hive2.3.7Flume1.9DataX3.0Airflow1.10Atlas1.2.0Griffin0.4.0Impalaimpala-2.3.0-cdh5.5.0MySQL5.71.2.软件安装分布情况服务器linux121linux122linux123Hadoop√namenode√√seconderynamenode,resour
ys4tnaf
·
2023-11-30 15:24
hadoop
大数据
数据仓库
hive
flume
01
数仓
平台 Hadoop介绍与安装
Hadoop概述Hadoop是
数仓
平台的核心组件。在Hadoop1.x时代,Hadoop中的MapReduce同时处理业务逻辑运算和资源调度,耦合性较大。在Hadoop2.x时代,增加了Yarn。
kk_io
·
2023-11-30 13:38
数据仓库
hadoop
大数据
分布式
数据仓库数据管理模型
数据仓库分为贴源层、数据仓库层、数据服务层,有人叫做
数仓
数据模型,或者叫"数据管理模型”。
zhulangfly
·
2023-11-30 13:52
数据仓库
大数据
深算院YashanDB整体亮相高交会开幕式
开幕式上,深算院重磅推介基于全自研内核的“1+3+3”YashanDB产品体系,即1个自主内核、共享集群数据库、实时
数仓
、空间数据库3大产品,以及迁移平台、运维平台、开发平台3大工具,由此形成具备完整能力的自主创新产品与企业级解决方案
YashanDB
·
2023-11-30 06:15
数据库
database
大数据
AntDB“超融合+流式实时
数仓
”——颠覆50年未变的数据库内核
流式处理引擎,颠覆50年未变的数据库内核流式处理的概念2001年9月11日,美国世贸大楼被袭击,美国国防部第一次将“主动预警”纳入国防的宏观战略规划。而IBM作为当时全球最大的IT公司,承担了大量基础支撑软件研发的任务。其中2009年正式发布的IBMInfoSphereStreams,就是全球最早真正意义上的商业化流数据处理引擎之一。典型的流处理框架,如ApacheStorm、SparkStrea
亚信安慧AntDB数据库
·
2023-11-30 03:01
数据库
antdb数据库
antdb
AntDB“超融合+流式实时
数仓
”——快速实现企业全链路实时化
AntDB-S流式数据库可以被应用于实时
数仓
、实时报表、实时告警、异步交易等业务场景,用户可以通过直接使用简单SQL创建复杂的流式数据处理业务逻辑,轻松替代ApacheS
亚信安慧AntDB数据库
·
2023-11-30 03:01
大数据
antdb数据库
antdb
数据库
AntDB“超融合+流式实时
数仓
”——打造分布式数据库新纪元
(一)前言据统计,在信息化时代的今天,人们一天所接触到的信息量,是古人一辈子所能接收到的信息量的总和。当今社会中除了信息量“多”以外,人们对信息处理的“效率”和“速度”的要求也越来越高。譬如,对于很多企业决策者来说,在当前的经济形势下需要尽一切可能降本增效。过去每周看看经营报表的习惯,现在慢慢转变为利用实时可视化的方式来随时分析企业当前的经营状况。数据库作为信息的核心载体,在过去的半个世纪中,基本
亚信安慧AntDB数据库
·
2023-11-30 03:57
数据库
antdb数据库
antdb
分布式
数据中台·实时开发计算平台
本人从实时产品平台角度,阐述作为产品经理对
实时计算
平台需要关注到的内容。什么是数据中台·
实时计算
平台?
实时计算
(实时开发)是为构建一套一站式、高性能实时大数据处理平台,广泛适用于流式数据处理场景。
数据先生
·
2023-11-30 00:33
数据仓库
大数据
职场和发展
数据库
数据挖掘
阿里云数据中台核心引擎
核心引擎MaxCompute阿里离线数据计算平台(离线
数仓
)原名ODPS,阿里巴巴自主研发的海量数据处理平台MaxCompute处理存储在TableStore的数据(不负责收集数据到TableStore
hsabrina
·
2023-11-30 00:30
工程架构
big
data
大数据
LTD251次升级 | 商机平台可筛选、浏览历史可查看 • 在线课程可秒杀购买 • 采购表单可
实时计算
价格与周期
1、新增商机类型筛选及历史浏览功能;2、 新增地址管理和物流公司管理功能;3、优化表单导出问题文件格式;4、 可定制
实时计算
价格的表单;5、 知识付费支持秒杀活动;01商机平台应用在上次升级中
LTD营销SaaS
·
2023-11-29 17:45
流量运营
用户运营
物联网数据的特点
;5.相对互联网应用,写多读少;6.用户关注的是一段时间的趋势,而不是某一特点时间点的值;7.数据是有保留期限的;8.数据的查询分析一定是基于时间段和地理区域的;9.除存储查询外,还往往需要各种统计和
实时计算
操作
laoge丶
·
2023-11-29 10:28
物联网
如何进行指标质量治理——指标系统(提质篇)
作者介绍@小风数据中台产品负责人;UBDC全域大数据峰会“灯塔人物”;擅长埋点模型、指标治理,
数仓
架构等;“数据人创作者联盟”成员。01指标质量治理概述指标质量治理主要分为两个部分:提质与增效。
一个数据人的自留地
·
2023-11-29 08:26
Spark Streaming基本概念
SparkStreaming是构建在Spark上的
实时计算
框架,它扩展了Spark处理大规模流式数据的能力。
晓之以理的喵~~
·
2023-11-29 07:36
Hadoop
Spark
大数据
spark
大数据
数据仓库
Databend 开源周报第 121 期
Databend是一款现代云
数仓
。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn。
Databend
·
2023-11-29 06:21
开源
数据库
细说数据仓库上篇
在谈
数仓
之前,先来看下面几个问题:
数仓
为什么要分层?
派可数据
·
2023-11-28 18:53
数据仓库
数据要素
商业智能
spark
大数据
分布式
商业智能BI
数据仓库
数据仓库建模下篇
在实际业务中,给了我们一堆数据,我们怎么拿这些数据进行
数仓
建设呢,
数仓
工具箱作者根据自身多年的实际业务经验,给我们总结了如下四步。
派可数据
·
2023-11-28 18:10
商业智能
数据要素
数据仓库
数据仓库
大数据
信息可视化
数据库
大数据开发:实时
数仓
架构层次设计
在大数据
实时计算
处理领域,数据仓库提供重要的支持,从传统的离线
数仓
到实时
数仓
,大数据带动了相应的市场需求,而从架构层次来说,实时
数仓
也有新的值得挖掘的技术点。
成都加米谷大数据
·
2023-11-28 16:52
ODPS SQL优化总结
本文结合作者多年的
数仓
开发经验,结合ODPS平台分享数据仓库中的SQL优化经验。背景数据仓库,是一个面向主题、集成的、随时间变化的、信息本身相对稳定的数据集合。
小二上酒8
·
2023-11-28 14:09
odps
sql
hive
java
开发语言
大数据和智能数据应用架构系列教程之:大数据与时间序列分析
本文将基于真实案例,从以下几个方面深入剖析大数据和时间序列分析相关的知识:数据产生背景介绍数据采集方式、处理方式及
实时计算
方式大数据分析中的数据特征、数据结构、数据挖掘、预测等技术细节
禅与计算机程序设计艺术
·
2023-11-28 00:23
AI实战
大数据AI人工智能
Python实战
大数据
人工智能
语言模型
Java
Python
架构设计
详解
数仓
中的数据分层:ODS、DWD、DWM、DWS、ADS
何为
数仓
DWDatawarehouse(可简写为DW或者DWH)数据仓库,是在数据库已经大量存在的情况下,它是一整套包括了etl、调度、建模在内的完整的理论体系。
禅与计算机程序设计艺术
·
2023-11-28 00:17
数仓
分层能减少重复计算,为啥能减少?如何减少?这篇文章包懂!
很多时候,看一些数据领域的文章,说到为什么做数据仓库、数据仓库要分层,我们经常会看到一些结论:因为有ABCD…等等理由,比如降低开发成本、减少重复计算等等好处然后,多数人就记住了ABCD。但是,每每被问起来,为什么,有什么案例,你是怎么理解的,就被问住,傻眼了。概念套概念,没意思,不如返璞归真,从生活案例重新理解起~01从统计班级人数开始本文将用生活化案例,结合粒度的概念,帮你理解常说的减少重复计
数据产品小lee
·
2023-11-27 12:42
大数据
数据仓库
数据建模
产品经理
【数据中台】开源项目(2)-Dbus数据总线
1背景企业中大量业务数据保存在各个业务系统数据库中,过去通常的同步数据的方法有很多种,比如:各个数据使用方在业务低峰期各种抽取所需数据(缺点是存在重复抽取而且数据不一致)由统一的
数仓
平台通过sqoop到各个系统中抽取数据
码农丁丁
·
2023-11-27 00:44
后端技术
#
大数据
开源
数据中台
ClickHouse替换MySQL作为
数仓
APP层
一、ClickHouse是什么?二、业务问题三、ClickHouse实践四、遇到的坑五、总结一、ClickHouse是什么?ClickHouse:是一个用于联机分析(OLAP)的列式数据库管理系统(DBMS)我们首先理清一些基础概念OLTP:是传统的关系型数据库,主要操作增删改查,强调事务一致性,比如银行系统、电商系统OLAP:是仓库型数据库,主要是读取数据,做复杂数据分析,侧重技术决策支持,提供
hzp666
·
2023-11-26 19:42
MySQL
PRD
数据库
mysql
ClickHouse
数据库
StarRocks与ClickHouse
2、开源
数仓
解决方案接下来
Yuan_CSDF
·
2023-11-26 19:11
数据库
OLAP
大数据
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他