E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
数仓(
大数据项目---电商
数仓
(三)
目录1.即席查询_Presto概述2.即席查询_Presto_Server的部署3.即席查询_Presto_Server启动4.即席查询_命令行客户端说明5.即席查询_LZO说明6.即席查询_Presto_web端口编辑7.即席查询_Presto使用注意事项/优化8.即席查询_Kylin简介9.即席查询_前置概念10.即席查询_Kylin架构11.即席查询_Hbase的一个安装12.即席查询_Ky
ASDWYang
·
2023-02-26 07:13
大数据
linux
JAVA
大数据
实时数据同步工具<Maxwell入门简介及原理解析、安装部署>
文章目录一、Maxwell的定义二、Maxwell的工作原理三、Maxwell的安装部署简述:对于离线
数仓
项目中将MySQL中的数据同步到大数据平台使用的工具是sqoop,而我们在大数据处理中并不是只有离线计算
徐象
·
2023-02-26 06:36
数据同步工具
大数据
实时数据
数据同步
mysql
实时
数仓
实践(一)之数据库实时增量同步工具-CDC(Change Data Capture)
数据库实时增量同步工具-CDC(ChangeDataCapture)Canal阿里巴巴B2B公司,因为业务的特性,卖家主要集中在国内,买家主要集中在国外,所以衍生出了杭州和美国异地机房的需求,从2010年开始,阿里系公司开始逐步的尝试基于数据库的日志解析,获取增量变更进行同步,由此衍生出了增量订阅&消费的业务。Canal是用java开发的基于数据库增量日志解析,提供增量数据订阅&消费的中间件。目前
NuOne_plus
·
2023-02-26 06:36
实时数仓实践
阿里云
数仓
实时同步任务binlog解析文档
背景:阿里云dataworks中有实时同步数据库binlog的任务配置,起源是业务数据库中数据被回滚了,所以借助
数仓
这边的同步任务数据进行解析和监控更新时间。
Hunter_Young
·
2023-02-26 06:35
大数据
阿里云
dataworks
实时同步
数仓
:浅谈银行业的
数仓
构建实践
文章目录简介一、银行
数仓
画像二、银行业
数仓
建设2.1数据总线2.2数据仓库ODM层2.3数据仓库SDM层2.4数据仓库FDM层2.5数据仓库ADM层2.6数据服务三、项目管理简介数据仓库,对从事IT行业的从业者来说并不是个陌生的名词
Freedom3568
·
2023-02-26 06:04
数据仓库
数据中台
数据仓库
数据挖掘
数仓
银行
实践
大数据项目之电商
数仓
、实时
数仓
同步数据、离线
数仓
同步数据、用户行为数据同步、日志消费Flume配置实操、日志消费Flume测试、日志消费Flume启停脚本
文章目录8.实时
数仓
同步数据9.离线
数仓
同步数据9.1用户行为数据同步9.1.1数据通道9.1.1.1用户行为数据通道9.1.2日志消费Flume配置概述9.1.2.1日志消费Flume关键配置9.1.3
Redamancy_06
·
2023-02-26 06:02
#
电商数仓
大数据
flume
kafka
数据仓库
hadoop
使用 Docker 搭建离线
数仓
环境
文章目录前言一、Docker安装1.1CentosDocker安装1.2UbuntuDocker安装【推荐】1.3MacOsDocker安装1.4WindowsDocker安装【不推荐】二、容器准备2.1拉取镜像2.2启动并创建容器2.3进入容器三、环境准备3.1安装必要软件3.2配置SSH免密登录3.3设置时区3.4关闭防火墙3.5时间同步、静态ip、主机映射四、MySQL安装4.1上传解压安装
Vicky_Tang
·
2023-02-25 07:18
docker
运维
大数据
数据仓库
Tapdata Connector 实用指南:实时
数仓
场景之数据实时同步至 ClickHouse
【前言】作为中国的“Fivetran/Airbyte”,Tapdata是一个以低延迟数据移动为核心优势构建的现代数据平台,内置60+数据连接器,拥有稳定的实时采集和传输能力、秒级响应的数据实时计算能力、稳定易用的数据实时服务能力,以及低代码可视化操作等。典型用例包括数据库到数据库的复制、将数据引入数据仓库或数据湖,以及通用ETL处理等。随着TapdataConnector的不断增长,我们最新推出《
·
2023-02-24 20:37
数据库
【离线
数仓
-5-数据仓库环境准备】
离线
数仓
-5-数据仓库环境准备离线
数仓
-5-数据仓库环境准备1.数据仓库运行环境1.Hive环境搭建1.Hive引擎2.HiveonSpark配置2.Yarn环境配置2.数据仓库开发环境3.模拟数据准备离线
数仓
Apache Minor Trend
·
2023-02-24 18:28
数据仓库
大数据
数据治理
数据仓库
大数据
大数据平台实时
数仓
从0到1搭建之 - 14 Maxwell & Canal 对比
大数据平台实时
数仓
从0到1搭建之-14Maxwell&Canal对比概述环境数据库配置安装配置启动命令输出结果HA监控web总结概述前两章分别写了maxwell和canal的安装使用,我本人其实是第一次听说这两个工具
这都不是事er
·
2023-02-24 12:17
实时数仓
kafka
big
data
docker
大数据平台实时
数仓
从0到1搭建之 - 12 Maxwell
大数据平台实时
数仓
从0到1搭建之-12Maxwell概述Maxwellquickstart修改MariaDB配置Maxwelldocker下载maxwell测试stdout:输出控制台kafka后续附客户端代码概述今天学习下
这都不是事er
·
2023-02-24 12:16
实时数仓
docker
mysql
mariadb
kafka
云音乐数据资产化建设的思考与实践
……“咱们的
数仓
建设得好不好?”,“
数仓
建设进度到哪儿了?模
·
2023-02-24 11:57
大数据数据库数据结构
数据治理如何做?火山引擎DataLeap帮助这款产品3个月降低计算成本20%
该产品随着用户体量和数据体量不断增长,
数仓
的任务量、数据量也不断攀升,运维难、成本贵、稳定性等问题在不断凸显。通过使用火山引擎DataLeap的数据治理能力,3个月时间将计算成本大幅缩减20%。
·
2023-02-23 16:20
大数据数据库
聊聊 HTAP 的前世今生
技术上,由于传统的
数仓
ETL链路长,延迟大,很难满足业务快速多变的诉求,业务场景的变化也掀起了一股HT
·
2023-02-23 15:17
云原生实时
数仓
SelectDB 首次产品发布会等你来约!
从结绳记事到竹木简牍,从书于纸墨到印刷成册;数据以千百种姿态承载着人类的文明贯穿历史的长河。时代在更迭,不变的是社会文明对于数据的沉淀和探索。在计算机的帮助下,人类处理信息的速度空前加快,经过指数级的增长,数据已经积累到了前所未有的量级,一轮基于“大数据”的产业革命重塑了个人、企业乃至社会发展的底层逻辑。数字化的征程一往无前,所有的组织都不约而同地迈上了业务数字化和数字业务化的探索之路。大家都在面
·
2023-02-22 10:07
数据库大数据云原生云服务
WARNING: Running pip as the ‘root‘ user can result in broken permissions and conflicting behaviour w
数仓
学习记录1、问题WARNING:Runningpipasthe'root'usercanresultinbrokenpermissionsandconflictingbehaviourwiththesystempackagemanager.Itisrecommendedtouseavirtualenvironmentinstead
祎祎_Yi
·
2023-02-21 13:23
pip
实时
数仓
Hologres新一代弹性计算组实例技术揭秘
作者:王奇(花名慧青)阿里云Hologres研发随着实时
数仓
在业务生产系统的普及,资源弹性、资源隔离等保障业务稳定性方面的技术需求开始变得越来越迫切。
·
2023-02-21 11:30
大数据实时计算
实时
数仓
Hologres 新一代弹性计算组实例技术揭秘
随着实时
数仓
在业务生产系统的普及,资源弹性、资源隔离等保障业务稳定性方面的技术需求开始变得越来越迫切。
·
2023-02-20 16:42
数据库云计算阿里云
Teradata退出中国背后:云
数仓
成为行业主流发展趋势
近日,数据仓库巨头Teradata(天睿公司)内部宣布退出在中国市场,引发业界广泛关注。作为数据仓库行业的明星企业,Teradata进入中国二十余年来,曾经一度占据中国数据仓库市场半壁江山。如今,随着Teradata的退出,中国大数据市场竞争格局也将产生新的变化。业内人士分析,云计算的快速兴起与蓬勃发展是Teradata走下“神坛”的一个重要转折点。云计算的去中心化架构,弹性存储与计算方式,高灵活
·
2023-02-20 14:36
数据库postgresql
Teradata退出中国,您可以相信中国数据库!
继Adobe、Tableau、Salesforce之后,2023年2月15日,
数仓
软件巨头Teradata宣布将逐步结束在中国的直接运营。
·
2023-02-20 14:34
数据治理体系化思考与实践
一、序言美团住宿数据治理团队通过多年
数仓
建设及数据治理的经验沉淀,并结合业务发展阶段对于数据治理的诉求,将治理的思路逐步从专项、表象、问题驱动的治理,转变为自动化、体系化的治理,并从标准化、数字化、系统化三个方向进行了落地与实践
000X000
·
2023-02-20 07:58
实战
数据分析
实时计算
big
data
数据挖掘
数据治理体系化思考与实践
关于
数仓
基础知识的超全概括!
周末和大家分享一些
数仓
基础知识的小集锦,希望能对你有些帮助~1、什么是数据仓库?权威定义:数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。
浪尖聊大数据-浪尖
·
2023-02-20 07:24
数据仓库
大数据
数据库
人工智能
java
业务数据治理体系化思考与实践
一、序言美团住宿数据治理团队通过多年
数仓
建设及数据治理的经验沉淀,
美团技术团队
·
2023-02-20 07:14
大数据
编程语言
机器学习
人工智能
数据分析
听闻Teradata退出中国,我想起了我经历过的一个
数仓
项目
昨天,Teradata撤出中国,我想起了我在20年前做的数据仓库项目。想当年Teradata是数据仓库的代名词啊,就如同现在搜索东西好多人说百度一下一样。可惜我没有用过Teradata。2002年,我基于SQLServer的数据仓库+商业智能做了一套所谓的决策支持系统。决策支持系统DSS,这样的名字在当年很流行。(1)20年前的数据来源和现在仍然差不多:不少来自Excel,那就ETL抽进来有些想要
david_lv
·
2023-02-19 20:28
数据仓库
数据库
Flink X Hologres构建企业级Streaming Warehouse
点击查看>>本篇内容主要分为四个部分:一、实时
数仓
分层的技术需求二、阿里云一站式实时
数仓
Hologres介绍三、FlinkxHologres:天作之合四、基于FlinkCatalog的StreamingWarehouse
aliyunhologres
·
2023-02-19 07:49
技术原理解读
flink
大数据
数据库
离线电商
数仓
3.0项目即席查询复盘笔记
离线电商
数仓
3.0项目即席查询复盘笔记kylin的简介与架构ApacheKylin是一个开源的分布式分析引擎,提供Hadoop/Spark之上的SQL查询接口及多维分析(OLAP)能力以支持超大规模数据
岁月的眸
·
2023-02-18 20:49
大数据
#
hive
kylin
核桃编程Delta Lake实时
数仓
应用实践
1.3架构改造前方案现有指标都是将Kafka/Mysql等的数据写入HDFS,使用Hive离线批处理,每10分钟执行一次,循环统计历史累计指标,再定时把数据同步到Mysql,提供给数据后台查询。如下图所示:image1.4遇到的问题随着计算的数据量越来越大,逐渐不能满足业务的更新频率要求。使用ApacheSqoop做全量数据同步,会对业务Mysql库/HDFS造成压力。使用ApacheSqoop做
fat32jin
·
2023-02-18 20:13
数仓
架构发展史
公众号:大数据技术派发展史时代的变迁,生死的轮回,历史长河滔滔,没有什么是永恒的,只有变化才是不变的,技术亦是如此,当你选择互联网的那一刻,你就相当于乘坐了一个滚滚向前的时代列车,开往未知的方向,不论什么样的技术架构只有放在当前的时代背景下,才是有意义的,人生亦是如此。时间就是一把尺子,它能衡量奋斗者前进的进程;时间就是一架天平,它能衡量奋斗者成果的重量;时间就是一架穿梭机,它能带我们遨游历史长河
大数据技术派
·
2023-02-18 00:30
数据库、数据仓库和数据湖
数据库和
数仓
的本质区别?
三半俊秀
·
2023-02-17 23:01
TeraData
数仓
数据库埋数
先复制一个原表createtableuco_8.testtable1231assaddle.yuanbiaowithnodata;编写存储过程Createproceduretestzss1()beginDECLAREIINTEGERDEFAULT0;DECLAREo_khbhCHAR(12);loop_table:LOOPSETI=I+1;SETo_khbh=cast(I+10000asVACHA
王者硕
·
2023-02-17 10:20
数据仓库
数仓
巨头在中国落幕,Teradata 退出国内市场!
2月15日,网传
数仓
巨头公司Teradata宣布将逐步结束在中国的直接运营,后续将进入中国公司关闭程序。其并未直接明确表明退出的原因,只是说此番决定是在「对中国当前和未来商业环境的慎重评估」后做出的。
CSDN资讯
·
2023-02-17 10:49
数据库
数据仓库
可路由计算引擎实现前置数据库
一方面,
数仓
是前端应用的数据后台,而前端应用不断增多,用户访问的并发数也不断增长。另一方面,
数仓
还要承担原始数据的批量离线处理,而批量任务不断增加,其数据量和计算量也在不断增大。
石臻臻的杂货铺
·
2023-02-16 23:56
SPL
数据库
数据仓库
Flink X Hologres 构建企业级 Streaming Warehouse
本篇内容主要分为四个部分:实时
数仓
分层的技术需求阿里云一站式实时
数仓
Hologres介绍FlinkxHologres:天作之合基于FlinkCatalog的StreamingWarehouse实践点击查看直播回放
·
2023-02-16 20:14
后端flink大数据实时计算
Flink CEP 在抖音电商的业务实践
摘要:本文整理自抖音电商实时
数仓
研发工程师张健,在FFA实时风控专场的分享。
·
2023-02-16 20:32
flink大数据实时计算后端
马斯克称计划今年底卸任推特CEO;腾讯回应微信将进军外卖服务;C++23 提上日程 | 极客头条
腾讯回应微信将进军外卖服务:只是内测一种接口能力《羊了个羊》营收破亿,主创团队已内测女性向新游戏传
数仓
巨头Teradata将退出中国,知情人士:消息属实科大讯飞:有信心实现ChatGPT类似的技术阶跃
极客日报
·
2023-02-16 20:58
快讯
极客日报
微信
c++23
如何写出高性能的 SQL Join: join 实现和最佳实践
Join是数据库和
数仓
中最常用的一个感念了。在关系型数据库的数据模型中,为了避免数据冗余存储,不同的数据往往放在不同的表中,分为事实表和维度表,这样做可以极大的节省数据存储空间。
·
2023-02-16 20:23
sql云计算数据库阿里云
文盘Rust -- rust 连接云上
数仓
starwift
作者:京东云贾世闻最近想看看rust如何集成clickhouse,又犯了好吃懒做的心理(不想自己建环境),刚好京东云发布了兼容ck的云原生
数仓
Starwfit,于是搞了个实例折腾一番。
·
2023-02-07 11:38
用户行为分析模型实践(三)——H5通用分析模型
ZhaoWei、TianFengbiao、LiXiong本文从提升用户行为分析效率角度出发,详细介绍了H5埋点方案规划,埋点数据采集流程,提供可借鉴的用户行为数据采集方案;且完整呈现了针对页面分析,留存分析的
数仓
模型规划方案
·
2023-02-07 10:44
大数据数据分析
美团点评 Flink 实时
数仓
经验分享
转载:原文地址实时
数仓
建设目的解决传统
数仓
的问题实时
数仓
是一个很容易让人产生混淆的概念。
秋慕云
·
2023-02-07 02:35
Flink系列 - 实时
数仓
之数据入HBase实战(八)
这个案例是建立在上一篇的基础之上,之所以做总结是因为网上很多都只是简单的调用API而已,根本找不到优化过后的sink自定义方法,显示的生产中我们不可能仅仅是像教程那样简单的能在HBase插入数据就行,性能对于生产系统是非常重要的。 接下来我们开搞啦。。。一、前期准备1.1引入相关依赖org.apache.flinkflink-hbase_2.111.10.1xyz.downgoonsnowf
小飞牛_666
·
2023-02-06 23:24
浅谈数据仓库(DW & BI)(六)
前一段时间简要描述了数据仓库的发展和一些
数仓
建模的方法论?
小杨_1858
·
2023-02-06 17:14
2019-10-13
10月11日,全市场估值水平:正常图片发自App指数估值表如下:图片发自App使用说明:1.参考A股全市场估值,控制A股整体仓位,参考指数估值调整指
数仓
位。
不在此山中白话投资
·
2023-02-06 17:56
Flink Table Store 典型应用场景
主要内容包括:介绍FlinkTableStore应用场景Demo后续挑战点击查看直播回放&演讲PPT一、介绍FlinkTableStore离线
数仓
和实时
数仓
是两个典型的
数仓
形态。
·
2023-02-06 11:59
flink大数据实时计算
企业的数据存储、处理与分析之道
12月30日,SelectDB携手阿里云共同举办云
数仓
专场沙龙,在线上沙龙中,来自SelectDB和阿里云的四位云计算领域专家,深入
数仓
的发展现状和未来趋势,结合企业级的真实场景落地案例,对技术和产品进行了详细的解读
阿里云云栖号
·
2023-02-06 10:33
云栖号技术分享
云计算
阿里云
Oracle
数仓
中判断时间连续性的几种SQL写法示例
零、需求介绍现有一张表数据如下:此表是一张镜像表,policyno列代表一个保单号,state列代表这个保单号在snapdate当天的最后一次状态(state每天可能会变很多次,镜像表只保留snapdate时间点凌晨的最后一次状态),snapdate代表当天做镜像的时间,现在有个需求,我们想取出来这个保单号连续保持某个状态的起止时间,例如:保单号sm1保持状态1的起止时间为202102012021
·
2023-02-06 03:04
基于 DataLakeAnalytics 的数据湖实践
随着软硬件各方面条件的成熟,数据湖(DataLake)已经越来越受到各大企业的青睐,与传统的
数仓
实践不一样的是,数据湖不需要专门的“入仓”的过程,数据在哪里,我们就从哪里读取数据进行分析。
xumingmingv
·
2023-02-06 02:12
数仓
架构的演变
随着互联网时代来临,数据量暴增,开始使用大数据工具来替代经典
数仓
中的传统工具。此时仅仅是工具的取代,架构上并没有根本的区别,可以把这个架构叫做离线大数据架构。
斯文遮阳
·
2023-02-05 14:44
Greenplum 数据库 之 表空间、数据库、模式及用户 的 创建与授权
由于刚接触Greenplum数据库,并且在网上相关的资料也不太多,都是这里找找那里找找,甚至跑官网去了英文文档了,然后慢慢拼接而成的,公司要用Greenplum做数据仓库,因此需要去搭建
数仓
的模型和用户的关联关系
小飞牛_666
·
2023-02-05 13:54
转行大数据开发应该怎么学习
转行进入大数据,首先需要了解的就是大数据是做什么,工作内容,然后就是找个完整的学习路线跟着去学习了,大数据的学习内容也是不少的~简单来说,分为6步,大数据开发入门,大数据核心基础,千亿级
数仓
技术,PB级内存计算
我想去吃ya
·
2023-02-05 03:04
大数据
学习
压力测试
开发语言
python
数仓
建模—指标体系
关注公众号:大数据技术派,回复资料,领取1024G资料。指标体系指标建设过程中遇到的问题指标建设方法论指标的构成如何设立指标体系评价指标体系指标管理场景落地总结指标体系提起指标这个词,每个人似乎都可以说出几个指标,像经常在工作中会听到的日活、月活、注册率、转化率、交易量等事实上指标就是用来量化事物的一个工具,帮助我们去将一些抽象的事件得出一个轮廓上的描述。例如我们可以从指标上判断一个产品的好坏,用
大数据技术派
·
2023-02-04 22:07
#
数据仓库
大数据
编程语言
python
机器学习
人工智能
上一页
33
34
35
36
37
38
39
40
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他