大数据计算第11页

flink总结

为什么用flink目前我们我们熟知的大数据计算引擎有mapreduce、spark、storm等等，那为什么还要有flink呢？

樱花庄青山七海·2020-09-11 05:06

Spark性能优化-数据倾斜调优

###数据倾斜调优####调优概述有的时候，我们可能会遇到大数据计算中一个最棘手的问题——数据倾斜，此时Spark作业的性能会比期望差很多。

ccddsdsdfsdf·2020-09-11 01:23

AI框架大牛贾扬清加盟，任职阿里巴巴技术VP

阿里巴巴宣布，贾扬清正式加盟，担任技术副总裁岗位，领导大数据计算平台的研发工作。贾扬清，本科和硕士毕业于清华大学，在美国加州大学伯克利分校计算机科学博士学位。

weixin_33971977·2020-09-10 19:45

确认！贾扬清下一站，阿里硅谷研究院任VP

源/雷锋网今日消息，原Facebook华人科学家贾扬清已正式加入阿里巴巴，担任技术副总裁岗位，领导大数据计算平台的研发工作。

机器学习算法与Python学习-公众号·2020-09-10 16:05

确认！贾扬清加盟阿里，任技术副总裁

阿里巴巴达摩院官方认证账号在知乎上宣布，贾扬清已正式加入阿里巴巴，担任技术副总裁岗位，领导大数据计算平台的研发工作。与此同时，贾扬清在领英上的履历也已经更新。

AI科技大本营·2020-09-10 10:38

[转]高压缩空间占用的 Hyper LogLog 算法

大数据计算：如何仅用1.5KB内存为十亿对象计数-HyperLogLog算法BigDataCounting:HowToCountABillionDistinctObjectsUsingOnly1.5KThisisaguestpostbyMattAbrams

黑夜路人·2020-08-25 16:28

MaxCompute管家详解--管家助力，轻松玩转MaxCompute

一、背景速览MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案，使用户可以经济并高效的分析处理海量数据。

阿里云云栖号·2020-08-24 20:11

MaxCompute介绍

spm=a2c4e.11153940.blogcont78108.17.46c53af60mplZf一什么是MaxCompute大数据计算服务（MaxCompute，原名ODPSopendataprocessingservice

有石为玉·2020-08-24 20:04

MaxCompute基础与MaxCompute_SQL优化

总论：大数据计算服务(MaxCompute，原名ODPS)是一种快速、完全托管的TB/PB级数据仓库解决方案。

chengli1824·2020-08-24 19:43

【大数据】MaxCompute概述

什么是MaxCompute大数据计算服务（MaxCompute，原名ODPS）是一种快速、完全托管的GB/TB/PB级数据仓库解决方案。

binggetong·2020-08-24 19:03

阿里云大数据计算服务 - MaxCompute (原名 ODPS)

MaxCompute是阿里EB级计算平台，经过十年磨砺，它成为阿里巴巴集团数据中台的计算核心和阿里云大数据的基础服务。去年MaxCompute做了哪些工作，这些工作背后的原因是什么？大数据市场进入普惠+红海的新阶段，如何与生态发展共赢？人工智能进入井喷阶段，如何支持与借力？本文从过去一年的总结，核心技术概览，以及每条技术线路未来展望等几个方面做一个概述。BigData概念在上世纪90年代被提出，随

weixin_30550081·2020-08-24 18:02

官方剧透：1.11 发版前我们偷看了 Flink 中文社区发起人的聊天记录

作为备受瞩目的新一代开源大数据计算引擎，Flink无疑已成为Apache基金会和GitHub最为活跃的项目之一。

ApacheFlink·2020-08-24 17:38

Scala语言概述

Spark—新一代内存级大数据计算框架，是大数据的重要内容。Spark就是使用Scala编写的。因此为了更好的学习Spark,需要掌握Scala这门语言。

jp_666·2020-08-24 14:53

Hbase 配置多master节点

环境描述正常运行一套hadoop-3.0.0集群，hbase配置，一个Hmaster，两个Hregionserver；运行大数据计算时候，hbase的Hmaster容易因为内存资源问题自动退出；需要配置多个

IT-冰河·2020-08-24 13:20

使用MaxCompute进行数据质量核查

数据质量顾名思义就是数据的质量数据质量是数据分析结论有效性和准确性的基础，也是最重要的前提和保障数据质量是数据分析应用的基础，为了获得可靠的数据，企业必须密切关注数据质量，数据质量将是直接影响系统应用成功的关键大数据计算服务

xmvip01·2020-08-24 01:52

阿里云大数据计算服务MaxCompute使用教程

阿里云大学：阿里云大数据计算服务MaxCompute使用教程MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案，使您可以经济并高效的分析处理海量数据。

阿里云大学百科·2020-08-23 21:04

2018-08-05

Spark比拼Flink：下一代大数据计算引擎之争，谁主沉浮？作为面试官，我是怎么快速判断程序员能力的？

baitu·2020-08-23 20:54

异构数据库结构与数据同步工具dbswitch

是一种基于PostgreSQL的分布式数据库，其采用shared-nothing架构，其架构专门用于管理大规模分析数据仓库，Greenplum主要定位在OLAP领域，利用GreenplumMPP数据库做大数据计算或分析平台非常适合

inrgihc·2020-08-23 17:06

Springboot自定义Kafka序列化与Flink自定义kafka反序列化

而其中Flink又是目前比较流行的大数据计算框架，相比其它大数据计算框架拥有更多的优势。Flink+Kafka的流式计算组合中，Kafka的默认序列化与反序列化都是采用的String，也就是说，Ka

wFitting·2020-08-23 09:01

Spark Shuffle实现

ApacheSpark探秘：SparkShuffle实现http://dongxicheng.org/framework-on-yarn/apache-spark-shuffle-details/对于大数据计算框架而言

weixin_30719711·2020-08-23 03:39

vue动态绑定背景图片

onlineShopping",data(){return{goalList:[{id:1,title:'行业数据透视',text:'汇聚用户购物能力、日常行为和区域经济等数据，进行数据处理分析，实现大数据计算

AIU哎呀·2020-08-23 00:39

阿里云大数据计算服务MaxCompute使用教程

关于阿里云大数据计算服务MaxCompute的详细内容：阿里云大数据计算服务MaxCompute使用教程（MaxCompute（原ODPS）是一项大数据计算服务，它能提供快速、完全托管的PB级数据仓库解决方案

阿里云大学百科·2020-08-23 00:10

解密背后的大数据计算平台架构

简介：小红书作为生活分享类社区，目前有8500万用户，年同比增长为300%，大约每天有30亿条笔记在发现首页进行展示。推荐是小红书非常核心且重要的场景之一，本文主要分享在推荐业务场景中小红书的实时计算应用。作者：郭一整理：董黎明本文整理自2019阿里云峰会·上海开发者大会开源大数据专场中小红书实时推荐团队负责人郭一先生现场分享。小红书作为生活分享类社区，目前有8500万用户，年同比增长为300%，

zxfBdd·2020-08-22 18:35

中国HBase技术社区第三届 MeetUp 杭州站 PPT资料下载

开源社区爱好者，热衷于分布式爬虫，分布式数据库，大数据计算等技术。内容概要：为什么引入HBase，HBase在风控体系中的位置；HBase+Phoenix使用过程中碰到的问题(可用性

ad4d39659223·2020-08-22 16:55

大数据实践解析（下）：Spark的读写流程分析

spark是一种基于内存的快速、通用、可扩展的大数据计算引擎，适用于新时代的数据处理场景。

华为云开发者社区·2020-08-22 15:38

Spark中的矩阵乘法源码分析

前言：矩阵乘法在数据挖掘/机器学习中是常用的计算步骤，并且在大数据计算中，shuffle过程是不可避免的，矩阵乘法的不同计算方式shuffle的数据量都不相同。

拱头·2020-08-22 15:45

MaxCompute客户端在windows命令行下查询中文乱码怎么办？

MaxCompute客户端工具是阿里云大数据计算服务MaxCompue产品官方客户端工具，通过客户端工具可以连接MaxCompute项目，完成包括数据管理、数据上下传、作业执行、用户及授权管理等各项操作

阿里云云栖号·2020-08-22 14:13

代码快速“检”“修”不是梦，阿里云MaxCompute Studio 2.9.0 新版本发布

近日，阿里云大数据计算服务MaxCompute动作频频，在美国东部1（弗吉尼亚）节点开服售卖，用户可在国际站、中文站、日本站购买美东节点资源，在控制台按需求开通project。

猫耳呀·2020-08-21 11:51

MOOC网站日志分析

MOOC网站日志分析认证可以帮助学员掌握如何收集用户访问日志，如何对访问日志进行分析，如何利用大数据计算服务对数据进行处理，如何以图表化的形式展示分析后的数据。

xmvip01·2020-08-21 08:17

官方剧透：1.11 发版前我们偷看了 Flink 中文社区发起人的聊天记录

作为备受瞩目的新一代开源大数据计算引擎，Flink无疑已成为Apache基金会和GitHub最为活跃的项目之一。

Ververica·2020-08-21 06:48

Flink 初探：为什么选择 Flink（flink/storm/spark对比浅析）

本文主要记录一些关于Flink与storm,spark的区别,优势,劣势,以及为什么这么多公司都转向Flink.WhatIsFlink一个通俗易懂的概念:ApacheFlink是近年来越来越流行的一款开源大数据计算引擎

TinlokLee·2020-08-21 05:35

从部署和运维说说DLI（1）

DLI是支持多模引擎的Serverless大数据计算服务，其很好的实现了Serverless的特性：1.弱化了存储和计算之间的联系；2.代码的执行不再需要手动分配资源；3.按使用量计费。

华为云开发者社区·2020-08-21 04:10

运营商大数据能做什么？

大数据的主要作用是帮助企业通过数据的广泛采集，和信息的收集，通过大数据计算，帮助企业做一些决策类或者一些营销导向或者底层服务等。大数据分为很多种！运营商大数据便是其中的一种。

王柄富·2020-08-21 04:31

看DLI服务4核心如何提升云服务自动化运维

DLI是支持多模引擎的Serverless大数据计算服务，免运维也是其作为Serverless云服务面向客户时的一个重要的特性。那么对于服务本身我们是如何实现整个服务的运维呢？

华为云开发者社区·2020-08-21 04:30

从部署和运维说说DLI（1）

DLI是支持多模引擎的Serverless大数据计算服务，其很好的实现了Serverless的特性：1.弱化了存储和计算之间的联系；2.代码的执行不再需要手动分配资源；3.按使用量计费。

华为云开发者社区·2020-08-21 02:52

阿里巴巴飞天大数据架构体系与Hadoop生态系统

Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统，主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算，充分利用集群的威力进行高速运算和存储。

阿里云云栖号·2020-08-20 22:19

[转] Apache Kylin在百度地图的实践

前言百度地图开放平台业务部数据智能组主要负责百度地图内部相关业务的大数据计算分析，处理日常百亿级规模数据，为不同业务提供单条SQL毫秒级响应的OLAP多维分析查询服务。

blair·2020-08-20 19:32

小区乐介绍

小区乐的使命就是解决这三个问题图片发自App项目背景1、社区里的生意图片发自App（1）据高德地图大数据计算，截至2015年，统计出全国共30万个小区，而这个数字在城镇化发展的前提下仍在不断扩大，这也意味着社区里的这种邻里生意市场前景广阔

斑马会员全球联盟·2020-08-20 18:23

Ubuntu安装机器学习常用环境(N卡驱动+Cuda+Cudnn)

零之前言很多基于机器学习的都要跑CUDA，不管是视觉计算还是大数据计算，很多都要基于这个环境。所以就记录以下这一系列套件的安装。

康娜喵·2020-08-20 18:43

运营商大数据能做什么？

大数据的主要作用是帮助企业通过数据的广泛采集，和信息的收集，通过大数据计算，帮助企业做一些决策类或者一些营销导向或者底层服务等。大数据分为很多种！运营商大数据便是其中的一种。

王柄富·2020-08-20 17:27

运营商大数据能做什么？

大数据的主要作用是帮助企业通过数据的广泛采集，和信息的收集，通过大数据计算，帮助企业做一些决策类或者一些营销导向或者底层服务等。大数据分为很多种！运营商大数据便是其中的一种。

王柄富·2020-08-20 17:27

超英文邮件50%！Flink 中文邮件列表必须有姓名

作为备受瞩目的新一代开源大数据计算引擎，Flink已成为Apache基金会和GitHub最为活跃的顶级项目之一。

ApacheFlink·2020-08-20 17:12

超英文邮件50%！Flink 中文邮件列表必须有姓名

作为备受瞩目的新一代开源大数据计算引擎，Flink已成为Apache基金会和GitHub最为活跃的顶级项目之一。

ApacheFlink·2020-08-20 17:12

阿里巴巴飞天大数据架构体系与Hadoop生态系统

Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统，主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算，充分利用集群的威力进行高速运算和存储。

阿里云云栖号·2020-08-20 16:07

阿里巴巴飞天大数据架构体系与Hadoop生态系统

Hadoop是一个开源、高可靠、可扩展的分布式大数据计算框架系统，主要用来解决海量数据的存储、分析、分布式资源调度等。Hadoop最大的优点就是能够提供并行计算，充分利用集群的威力进行高速运算和存储。

阿里云云栖号·2020-08-20 16:07

[转] Apache Kylin在百度地图的实践

前言百度地图开放平台业务部数据智能组主要负责百度地图内部相关业务的大数据计算分析，处理日常百亿级规模数据，为不同业务提供单条SQL毫秒级响应的OLAP多维分析查询服务。

blair·2020-08-20 16:08

[转] Apache Kylin在百度地图的实践

前言百度地图开放平台业务部数据智能组主要负责百度地图内部相关业务的大数据计算分析，处理日常百亿级规模数据，为不同业务提供单条SQL毫秒级响应的OLAP多维分析查询服务。

blair·2020-08-20 16:08

润乾集算器与帆软报表应用集成（api）

集算器作为一种大数据计算工具，不仅在润乾产品体系中能发挥它的巨大作用，在其他绝大部分数据处理、数据计算领域的项目、产品中，也都有他助力计算的身影。

cainiao_M·2020-08-20 15:22

MOOC网站日志分析

MOOC网站日志分析认证可以帮助学员掌握如何收集用户访问日志，如何对访问日志进行分析，如何利用大数据计算服务对数据进行处理，如何以图表化的形式展示分析后的数据。

xmvip01·2020-08-19 20:45

深入了解大数据计算模式

1.批处理计算批处理计算主要解决针对大规模数据的批量处理，也是我们日常数据分析工作中非常常见的一类数据处理需求。MapReduce是最具有代表性和影响力的大数据批处理技术，可以并行执行大规模数据处理任务，用于大规模数据集（大于1TB）的并行运算。MapReduce极大地方便了分布式编程工作，它将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数——Map和Reduce上，编程人员在不会

我是一名程序猿·2020-08-19 08:11

推荐频道

大数据计算

flink总结

Spark性能优化-数据倾斜调优

AI框架大牛贾扬清加盟，任职阿里巴巴技术VP

确认！贾扬清下一站，阿里硅谷研究院任VP

确认！贾扬清加盟阿里，任技术副总裁

[转]高压缩空间占用的 Hyper LogLog 算法

MaxCompute管家详解--管家助力，轻松玩转MaxCompute

MaxCompute介绍

MaxCompute基础与MaxCompute_SQL优化

【大数据】MaxCompute概述

阿里云大数据计算服务 - MaxCompute (原名 ODPS)

官方剧透：1.11 发版前我们偷看了 Flink 中文社区发起人的聊天记录

Scala语言概述

Hbase 配置多master节点

使用MaxCompute进行数据质量核查

阿里云大数据计算服务MaxCompute使用教程

2018-08-05

异构数据库结构与数据同步工具dbswitch

Springboot自定义Kafka序列化与Flink自定义kafka反序列化

Spark Shuffle实现

vue动态绑定背景图片

阿里云大数据计算服务MaxCompute使用教程

解密背后的大数据计算平台架构

中国HBase技术社区第三届 MeetUp 杭州站 PPT资料下载

大数据实践解析（下）：Spark的读写流程分析

Spark中的矩阵乘法源码分析

MaxCompute客户端在windows命令行下查询中文乱码怎么办？

代码快速“检”“修”不是梦，阿里云MaxCompute Studio 2.9.0 新版本发布

MOOC网站日志分析

官方剧透：1.11 发版前我们偷看了 Flink 中文社区发起人的聊天记录

Flink 初探：为什么选择 Flink（flink/storm/spark对比浅析）

从部署和运维说说DLI（1）

运营商大数据能做什么？

看DLI服务4核心如何提升云服务自动化运维

从部署和运维说说DLI（1）

阿里巴巴飞天大数据架构体系与Hadoop生态系统

[转] Apache Kylin在百度地图的实践

小区乐介绍

Ubuntu安装机器学习常用环境(N卡驱动+Cuda+Cudnn)

运营商大数据能做什么？

运营商大数据能做什么？

超英文邮件50%！Flink 中文邮件列表必须有姓名

超英文邮件50%！Flink 中文邮件列表必须有姓名

阿里巴巴飞天大数据架构体系与Hadoop生态系统

阿里巴巴飞天大数据架构体系与Hadoop生态系统

[转] Apache Kylin在百度地图的实践

[转] Apache Kylin在百度地图的实践

润乾集算器与帆软报表应用集成（api）

MOOC网站日志分析

深入了解大数据计算模式