E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MaxCompute
Maxcompute
数据上云一致性比对
注:这里对数的场景就是指在阿里云平台使用dataworks等大数据开发工具集成业务系统数据库(oracle等)数据上云到
maxcompute
的场景,所以,示例的SQL也是针对
maxcompute
。
阿里云云栖号
·
2023-06-10 23:47
云栖号技术分享
数据库
java
oracle
大数据
云计算
Maxcompute
数据上云一致性比对
注:这里对数的场景就是指在阿里云平台使用dataworks等大数据开发工具集成业务系统数据库(oracle等)数据上云到
maxcompute
的场景,所以,示例的SQL也是针对
maxcompute
。
·
2023-06-07 11:29
大数据数据库
阿里数据仓库架构与模型设计
本文将分如下4个部分,介绍阿里巴巴DataWorks的数仓架构与模型设计方法:技术架构选型数仓分层数据模型层次调用规范01技术架构选型教程本身是以阿里云
MaxCompute
为例,实际上,流程和方法论是通用的
公众号:肉眼品世界
·
2023-04-17 21:37
数据仓库
架构
数据挖掘
大数据
数据库
MaxCompute
- ODPS重装上阵 第四弹 - CTE,VALUES,SEMIJOIN
摘要:
MaxCompute
(原ODPS)是阿里云自主研发的具有业界领先水平的分布式大数据处理平台,尤其在集团内部得到广泛应用,支撑了多个BU的核心业务。
阿里云云栖号
·
2023-04-17 08:16
数据
values
mytable
select
union
MaxCompute
- ODPS重装上阵 第六弹 - User Defined Type
功能简介
MaxCompute
中的UDT(UserDefinedType)功能支持在SQL中直接引用第三方语言的类或者对象,获取其数据内容或者调用其方法。
Ta oo
·
2023-04-17 08:46
DataX 快速入门
是被广泛使用的数据同步工具,由阿里巴巴集团使用Java和Python开发,实现了包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
珺王不早朝
·
2023-04-15 05:17
Python连接ODPS数据库
Python连接ODPS数据库以及数据读取主要内容主要内容很多情况下,数据分析师需要使用python连接数据库进行数据分析,本文内容为Python连接阿里云Dataworks下的
MaxCompute
(ODPS
进阶的雪宝
·
2023-04-14 01:50
python
python
Python—12.7、Odps操作
文档结构PyOdps简介odps操作基本操作项目空间表操作tunnel上传下载Sql执行DataFramePyOdps简介PyODPS是
MaxCompute
的PythonSDK,提供DataFrame框架和
蓝魔Y
·
2023-04-13 07:38
Python编程
odps
python
大数据之路读书笔记-04离线数据开发
面对海量的数据和复杂的计算,阿里巴巴的数据计算层包括两大体系:数据存储及计算平台(离线计算平
MaxCompute
实时计算平台StreamCompute、数据整合及管理体系(OneData)本章主要介绍MaxCompu
潘小磊
·
2023-04-11 11:41
大数据之路读书笔记
大数据
数据库
数据仓库
阿里云服务搭建离线数据仓库(一)
MaxCompute
:离线数据计算引擎,类似于spark、flink,只不过
MaxCompute
(简称:MC)是阿里云自己开发的计算引擎,目前MC服务已覆盖全球16个国家和地区,客
数据法师
·
2023-04-11 11:34
大数据
离线数仓
安利云服务
大数据
阿里云
DataWork
离线数仓
MaxCompute
MaxCompute
费用暴涨之新增SQL分区裁剪失败
现象:因业务需求新增了SQL任务,这SQL扫描的表为分区表,且SQL条件里表只指定了一个分区,按指定的分区来看数据量并不大,但是SQL的费用非常高。费用比预想的结果相差几倍甚至10倍以上。分析:我们先明确MaxComputeSQL后付费的计费公式:一条SQL执行的费用=扫描输入量️SQL复杂度️0.3(¥/GB)。变量主要是输入量和复杂度,但实际上复杂度最高也就为4,由复杂度引起的费用暴涨是比较罕
chikuai9995
·
2023-04-06 04:09
阿里云Big Data - dataworks和
MaxCompute
之间的关系与区别
dataworks和
MaxCompute
之间的关系与区别
MaxCompute
做数据存储和数据分析处理,Dataworks是集成了数据集成、数据开发调试、作业编排及运维、元数据管理、数据质量管理、数据API
天地不仁以万物为刍狗
·
2023-04-04 18:03
阿里云大数据
大数据
datahub数据源开发
maxcompute
(dataworks)
datahub数据源开发1,基础环境和从阿里官网获取对应的apidataworksopenapi文档在这里获取对应的projectdatabases和tables的api操作,注意这里需要的几个pip进行的安装包在datahub中安装1.1setup.py修改根据他的格式进行引入dataworks_common={"alibabacloud_dataworks-public20200518>=4.
玉雨钰瑜
·
2023-04-04 18:27
datahub
python
大数据
DataWorks系列(一): Dataworks下的
MaxCompute
(ODPS)的基本简介--经典六问
文章目录Dataworks下的
MaxCompute
(ODPS)基本简介(一):一:
MaxCompute
是什么?二:
MaxCompute
里面有什么?三:
MaxCompute
系统架构是什么?
NICEDAYSS
·
2023-04-04 18:25
阿里云
大数据
dataworks
maxcompute
阿里云
阿里云大数据平台DataWorks(原DataX)
核心功能数据集成离线/实时数据同步复杂网络环境下,对丰富异构类型数据源高效稳定的移动和同步能力数据开发对
MaxCompute
中的数据进行加工(SQL,UTF,Graph,MR)、分析与发掘(数据分析、数据挖掘
hsabrina
·
2023-04-04 14:39
工程架构
数据中台
云平台
big
data
大数据
云计算
数据分析
阿里云
阿里大数据-数据库总结:RDS ADS OTS
Maxcompute
(ODPS)
Maxcompute
(原odps)阿里云中的
Maxcompute
(原odps)其实就是hive,扮演数据仓库的角色,适合存储轨迹类历史数据,适合存储的数据量大,适合海量数据的处理,适合对数据进行离线分析
hsabrina
·
2023-04-04 06:37
云平台
数据中台
大数据
odps
阿里云
DataX 数据源同步
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
远方有海,小样不乖
·
2023-04-03 04:40
datax
大数据
阿里云框架大数据
框架总览:DataHub数据总线类比kafka与各种服务接口
MaxCompute
大数据计算框架类比Hadoop+hive+调度器DataWorks可视化
MaxCompute
的开发管理平台RDS关系型数据库类比
zhzsdiligence
·
2023-03-31 18:00
DataX 简介及架构原理
开发的一个异构数据源离线同步工具异构数据源:不同存储结构的数据源致力于实现包括关系型数据库MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
温岚万叶
·
2023-03-30 08:53
ETL
工具
架构
big
data
DataX
数据仓库
数仓(三)简析阿里、美团、网易、恒丰银行、马蜂窝5家数仓分层架构
这篇我们简要分析一下以下5家公司的数仓分层架构模型:1、马蜂窝数仓分层架构2、阿里云
MaxCompute
配合DataWorks数仓架构分层架构3、美团点评基于Flink实时数仓分层架构4、网易严选基于Flink
浪尖聊大数据-浪尖
·
2023-03-30 02:09
数据仓库
大数据
数据分析
java
人工智能
【云计算】阿里云爬坑记录-ORDER BY must be used with a LIMIT clause
00.背景在使用Tableau连接
MaxCompute
的时候,经常会出现这样的报错,现在记录一下我的处理流程01.发现问题打算用tableau分析一下site_name这个字段的分布情况,首先想把site_name
mafumafu2018
·
2023-03-22 11:58
云计算
云计算
阿里云
大数据-玩转数据-
MaxCompute
SQL
您可以自行在
MaxCompute
项目上创建表并上传数据。数据导入请参见概述。下载emp表数据文件和dept表数据文件。创建emp表。
人猿宇宙
·
2023-03-22 11:55
阿里云
sql
数据仓库
etl工程师
数据库开发
修改linux系统时间-ODPS-0410031-解决方案
写在前面近期较忙,,,仅参考记录问题解决方案问题描述
MaxCompute
客户端配置因本地时间不对导致超时FAILED:ODPS-0410031:Authenticationrequestexpired-theexpiretimeintervalexceedsthemaxlimitation
kngines
·
2023-03-22 11:49
Jupyter
Notebook
阿里系平台
linux
date
ODPS-0410031
如何用DataX自定义KuduWriter插件
DataXDataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
山间浓雾有路灯
·
2023-03-13 01:56
阿里云
maxcompute
SQL代码编码原则与规范
文章目录编码原则SQL编码规范代码样例原文链接本文向您介绍SQL编码的基本原则和详细的编码规范。编码原则SQL代码的编码原则如下:代码功能完善,健壮。代码行清晰、整齐,具有一定的可观赏性。代码编写要充分考虑执行速度最优的原则。代码行整体层次分明、结构化强。代码中应有必要的注释以增强代码的可读性。规范要求非强制性约束代码开发人员的代码编写行为,在实际应用中在不违反常规要求的前提下允许存在可理解的偏差
半路出家的coder
·
2023-02-19 20:28
数据仓库
sql
记一个
MaxCompute
最佳实践-使用虚拟节点
问题描述故事是这样的,我们使用的是阿里云的
MaxCompute
作为离线平台,我们的数据同步机制是这样的,同步方式由于种种原因吧,我们的同步的数据其实是备库数据,备库的数据是业务系统从库的数据,环节一多就容易出问题
橘猫吃不胖
·
2023-02-05 00:24
ODPS 数据全量/增量同步方案
随着业务量增加,原采用的mysql对大量业务数据的处理效率降低,公司采购的ODPS(
MaxCompute
)阿里数据处理平台,进行数据的处理。
梦幻通灵
·
2023-02-01 07:56
数据处理
后端开发
odps
大数据
big
data
Hologres揭秘:高性能原生加速
MaxCompute
核心原理
Hologres(中文名交互式分析)是阿里云自研的一站式实时数仓,这个云原生系统融合了实时服务和分析大数据的场景,全面兼容PostgreSQL协议并与大数据生态无缝打通,能用同一套数据架构同时支持实时写入实时查询以及实时离线联邦分析。它的出现简化了业务的架构,与此同时为业务提供实时决策的能力,让大数据发挥出更大的商业价值。从阿里集团诞生到云上商业化,随着业务的发展和技术的演进,Hologres也在
阿里云Hologres
·
2023-01-30 15:05
使用datax的RDBMSReader抽取hive表
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
空尘AI
·
2023-01-30 02:08
DataX快速入门
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
微毂
·
2023-01-26 05:21
大数据
大数据
Datax入门使用
DataX是阿里巴巴集团内被广泛使用的离线数据同步工具/平台,实现包括MySQL、Oracle、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
人在旅途ぃ
·
2023-01-26 05:43
etl
DataX使用入门
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
mynameisjinxiaokai
·
2023-01-26 05:23
java
BD
java
datax
关于SQL表中drop table和delete table的区别
问题:使用阿里云的
maxcompute
产品发现有中间表的产生,需要删除。
·
2023-01-23 00:23
阿里云大数据工程师ACP认证例题
中,常量定义IOoBD表示的含义是:(A) A.数值为100的DECIMAL B.数值为100的Bigint C.数值为100的String D.数值为100的Double2.阿里云
MaxCompute
myqijin
·
2023-01-16 11:14
大数据
大数据
揭秘阿里云EB级大数据计算引擎
MaxCompute
日前,全球权威咨询与服务机构Forrester发布了《TheForresterWaveTM:CloudDataWarehouse,Q42018》报告。这是ForresterWave首次发布关于云数仓解决方案(CloudDataWarehouse,简称CDW)的测评。报告对云数仓的当前产品功能、产品路线和发展策略、市场表现等几个方面进行全面的评估,在产品能力排行榜中,阿里云力压微软排行第7。Forr
阿里云云栖号
·
2023-01-14 16:44
分布式计算
分布式存储
MaxCompute
阿里云ACA大数据助理工程师认证学习笔记和题
1某大型企业计划使用
MaxCompute
对本公司的数据进行加工和分析,预计该项目会有上万个表、数干个本题分信任务,同时有近4人的团队负责该项目的建设和运维。
zgycsmb
·
2023-01-14 16:14
阿里云
big
data
云计算
基于阿里云
MaxCompute
构建企业云数据仓库CDW
在本文中阿里云资深产品专家云郎分享了基于阿里云
MaxCompute
构建企业云数据仓库CDW的最佳实践建议。本文内容根据演讲视频以及PPT整理而成。
阿里云云栖号
·
2023-01-14 16:13
我是程序员
基于阿里云
MaxCompute
构建企业云数据仓库CDW的最佳实践建议
在本文中阿里云资深产品专家云郎分享了基于阿里云
MaxCompute
构建企业云数据仓库CDW的最佳实践建议。本文内容根据演讲视频以及PPT整理而成。
阿里云技术
·
2023-01-14 16:13
大数据
数据仓库
MaxCompute
阿里云
MaxCompute
被Forrester评为全球云端数据仓库领导者
2019独角兽企业重金招聘Python工程师标准>>>摘要:参考消息网3月19日报道日前,全球权威调研机构佛瑞斯特研究公司(Forrester)发布《2018年一季度云端数据仓库》报告。报告对大数据服务商的主要功能、区域表现、细分市场和典型客户等进行了全面评估,最终AWS、阿里云、谷歌、微软四大巨头杀入全球一线阵营。参考消息网3月19日报道日前,全球权威调研机构佛瑞斯特研究公司(Forrester
weixin_33753845
·
2023-01-14 16:40
大数据
python
人工智能
操作系统顶级会议SOSP 阿里云
MaxCompute
开启NewSQL时代
近日,第26届操作系统原理大会(SOSP)在上海举行,来自亚洲、欧洲、北美等地区的高校、学术机构和众多科技企业研究人员齐聚一堂。阿里巴巴受邀参加此次会议,除在展区展示系统软件技术的同时,阿里集团副总裁周靖人在BOF环节向参会人员介绍了阿里在数据库、计算、机器学习、网络等领域的多项重点技术。SOSP和另一个计算机系统领域会议OSDI同被誉为操作系统原理领域的奥斯卡,拥有极高的学术地位,参会人员在学术
weixin_33877885
·
2023-01-14 16:40
操作系统
大数据
人工智能
阿里云 -
MaxCompute
研究
一、官方介绍
MaxCompute
是适用于数据分析场景的企业级SaaS(SoftwareasaService)模式云数据仓库,提供离线和流式数据的接入,支持大规模数据计算及查询加速能力。
维克先生
·
2023-01-14 16:32
数据库
数据仓库
阿里云
odps
大数据
Hologres助力AliExpress双11实时数仓升级
概要:刚刚结束的2020天猫双11中,
MaxCompute
交互式分析(Hologres)+实时计算Flink搭建的云原生实时数仓首次在核心数据场景落地,为大数据平台创下一项新纪录。
阿里开发者
·
2023-01-08 10:39
存储
SQL
运维
分布式计算
druid
Cloud
Native
BI
双11
MaxCompute
流计算
windows上datax的使用记录
DataX实现了包括MySQL、Oracle、OceanBase、SqlServer、Postgre、HDFS、Hive、ADS、HBase、TableStore(OTS)、
MaxCompute
(ODPS
AnalogElectronic
·
2023-01-07 09:46
python数据人工智能
windows
数仓构建-架构与模型设计
MaxCompute
作为整个大数据开发过程中的离线计算引擎。DataWorks则包括数据开发、数据质量、数据安全、数据管理等在内的一系列功能。
胜利的曙光
·
2023-01-06 01:24
数据仓库
阿里云
架构
数据仓库
big
data
invalid python sdk_Python SDK
Endpoint的配置请参见
MaxCompute
入口对象参数位置填写错误。请
weixin_39778582
·
2023-01-03 11:08
invalid
python
sdk
阿里云DataWorks学习——数仓架构设计
本教程中使用阿里云大数据产品
MaxCompute
配合DataWorks,完成整体的数据建模和研发流程。完整的技术架构图如下图所示。其中,DataWorks的数据集成负责完成数据的采集和基本的ETL。
zhisheng_blog
·
2022-12-31 16:36
数据仓库
大数据
dbcp
数据分析
odbc
使用 DataWorks 将 PolarDB-X 中的数据同步到
MaxCompute
MaxCompute
是适用于数据分析场景的云数据仓库,适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。
·
2022-12-27 18:01
数据库数据库开发云计算阿里云
使用 DataWorks 将 PolarDB-X 中的数据同步到
MaxCompute
MaxCompute
是适用于数据分析场景的云数据仓库,适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。
·
2022-12-27 17:29
数据库数据库开发云计算阿里云
MySQL
MaxCompute
与AnalyticDB实现数据处理与转换过程详解
目录1、行转列函数2、判空函数3、时间函数4、建表语句1、行转列函数odps中行转列函数wm_concat,将列信息转成行显示,可指定分隔符。语法格式wm_concat(separator,string),其中separator为分隔符,支持字符串去重,即distinct.selectwm_concat('|',sku_id)fromt_business_order_odpswherecreate
·
2022-12-27 00:27
数据管理篇之存储和成本管理
解决方案目前
MaxCompute
中提供了archive压缩方法,它采用了具有更高压缩比的压缩算法,可以将数据保存为RAIDfile的形式,数据不再简单地保存为3份,而是使用盘古RAIDf
道理你都懂
·
2022-12-25 03:36
大数据之路书籍阅读
大数据
数据库
java
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他