MongoBD大数据处理第32页

GPS网络时间服务器让您拥有不一样的网络系统

GPS网络时间服务器让您拥有不一样的网络系统GPS网络时间服务器让您拥有不一样的网络系统京准电子科技官微——ahjzsz时间同步技术必定将是整个大数据处理系统的重要支撑和保障。

GPS时钟服务器,NTP时间服务器,时间同步服务器15901092122岳峰·2020-08-21 10:00

2.0Spark编程模型

同时，Spark依靠Scala强大的函数式编程Actor通信模式、闭包、容器、泛型，并借助统一资源调度框架，成为一个简洁、高效、强大的分布式大数据处理框架。Spark在运算

Albert陈凯·2020-08-21 07:22

hadoop学习之hadoop优缺点

适合大数据处理

kerl-fashion·2020-08-21 07:21

第一章-Flink介绍-《Fink原理、实战与性能优化》读书笔记

随着雅虎对hadoop的开源，越来越多的大数据处理技术开始涌入人们的视线，例如目前比较流行的大数据处理引擎ApacheSpark,基本上已经取代了MapReduce成为当

weixin_30776545·2020-08-21 06:51

聪明的代码

code1词法分析：领域为n的所有频度计数在《数据算法Hadoop/Spark大数据处理技巧》一书中的第五章的反转排序中有一段映射器的代码能够得到领域为2的所有频度计数，代码量不大，但是思路让人敬佩。

jimmysenior·2020-08-21 06:17

大数据框架--hadoop、spark、storm、flink、Samza介绍

Hadoop、Spark、Storm、Flink是比较常用的分布式计算系统1）仅批处理框架：Hadoop常用于离线的复杂的大数据处理。

戰士·2020-08-21 04:25

Hadoop中的YARN

MRv1是目前使用的标准的大数据处理系统。但是，这种架构存在不

小鸟123·2020-08-21 04:22

Inflation 引起的 MetaSpace Full GC 问题排查｜蚂蚁集团实例分析

蚂蚁集团的智能监控平台深度利用了Spark的能力进行多维度数据聚合，Spark由于其高效、易用、分布式的能力在大数据处理中十分受欢迎。

SOFAStack·2020-08-21 03:39

Spark如何与深度学习框架协作，处理非结构化数据

随着大数据和AI业务的不断融合，大数据分析和处理过程中，通过深度学习技术对非结构化数据（如图片、音频、文本）进行大数据处理的业务场景越来越多。

华为云开发者社区·2020-08-21 02:00

flink入门实例-Windows下本地模式跑SocketWordCount

一般情况下，开发大数据处理程序，我们希望能够在本地编写代码并调试通过，能够在本地进行数据测试，然后在生产环境去跑“大”数据。

weixin_30508309·2020-08-21 02:50

从Storm到Flink：大数据处理的开源系统及编程模型（文末福利）

本文节选自CCF大数据教材系列丛书之《大数据处理》，本书由华中科技大学金海教授主编，包括大数据处理基础技术、大数据处理编程与典型应用处理、大数据处理系统与优化三个方面。

AI科技大本营·2020-08-21 02:37

URL任意跳转漏洞

猜测原理是通过大数据处理

你在教我打CTF啊·2020-08-21 01:03

第九弹 - 脚本模式与参数视图

MaxCompute（原ODPS）是阿里云自主研发的具有业界领先水平的分布式大数据处理平台,尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。

阿里云云栖号·2020-08-21 00:03

第九弹 - 脚本模式与参数视图

MaxCompute（原ODPS）是阿里云自主研发的具有业界领先水平的分布式大数据处理平台,尤其在集团内部得到广泛应用，支撑了多个BU的核心业务。

阿里云云栖号·2020-08-21 00:03

大数据处理算法--Bloom Filter

一、布隆过滤器（BloomFilter）的定义布隆过滤器可以用来检测数据是否存在于一个集合中。它是hash的扩展，底层就是一个位数组，每一个bit位可以表示一个数字，所以布隆过滤器是基于位图来实现的。二、布隆过滤器的原理1、插入数据在位图中，每一个bit对应一个数字，出现一个数字就可以在相应的位上置1。但是布隆过滤器不一样，它要处理的不仅仅是整型还有其他如string类型的数据，因此，当大量的st

db199410·2020-08-20 23:29

大数据学习路线

一、大数据处理流程上图是一个简化的大数据处理流程图，大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。

黑白影·2020-08-20 22:08

大数据学习路线

一、大数据处理流程上图是一个简化的大数据处理流程图，大数据处理的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。

黑白影·2020-08-20 22:08

大数据采集、清洗、处理：使用MapReduce进行离线数据分析完整案例

1大数据处理的常用方法大数据处理目前比较流行的是两种方法，一种是离线处理，一种是在线处理，基本处理架构如下：在互联网应用中，不管是哪一种处理方式，其基本的数据来源都是日志数据，例如对于web应用来说，则可能是用户的访问日志

yoku酱·2020-08-20 21:47

通用大数据架构为什么不适合处理物联网数据？

除使用大家所熟悉的Hadoop组件如HDFS，MapReduce,HBase,Hive外，通用的大数据处理平台往往还使用Kafka或其他消息队列工具，Redis或其他缓存软件，Flink或其他实时流式数据处理软件

涛思数据·2020-08-20 21:20

关于大数据产品研发初步规划V1.2_文档

大数据产品整体框架设计大数据产品整体框架之软件建设主要分为四部分内容：1、ETL，负责各数据库间数据有序流动；2、资源统一管理平台，负责多个数据库的资源管理，包含元数据管理等；3、分布式文件系统，负责非结构化数据，如图片、文档、音视频等文件存储与访问；4、大数据处理平台

卿卿老祖·2020-08-20 21:59

斗象科技NTA全流量大数据架构 VS 传统单机设备，底层差别到底在哪？

Gartner对NTA定义：以网络流量为基础，应用人工智能、大数据处理等先进

斗象科技·2020-08-20 21:04

Impala：新一代开源大数据分析引擎

文/耿益锋陈冠诚Impala项目主页在：https://github.com/cloudera/impala大数据处理是云计算中非常重要的问题，自Google公司提出MapReduce分布式处理框架以来

思否编辑部·2020-08-20 19:39

Impala：新一代开源大数据分析引擎

文/耿益锋陈冠诚Impala项目主页在：https://github.com/cloudera/impala大数据处理是云计算中非常重要的问题，自Google公司提出MapReduce分布式处理框架以来

思否编辑部·2020-08-20 19:39

Spark搭建及第一个Spark程序

Spark简介spark:一个基于内存的，分布式的大数据处理框架（计算引擎）官网：http://spark.apache.org/中文官网：http://spark.apachecn.org/docs/

权飞虎·2020-08-20 18:22

第一篇|Spark概览

经过10年的发展，Spark成为了炙手可热的大数据处理平台，目前最新的版本是Spar

西贝木土·2020-08-20 17:27

第一篇|Spark概览

经过10年的发展，Spark成为了炙手可热的大数据处理平台，目前最新的版本是Spar

西贝木土·2020-08-20 17:27

万字详解TDengine 2.0整体架构设计思路

大数据处理系统就是要将各种采集的

涛思数据·2020-08-20 17:50

万字详解TDengine 2.0整体架构设计思路

大数据处理系统就是要将各种采集的

涛思数据·2020-08-20 17:50

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

质量可能不够，数量一定管够高容错性：一个节点任务失败，能自动转移到其他空闲节点适合大数据处理：得益

Chord_Gll·2020-08-20 17:37

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

质量可能不够，数量一定管够高容错性：一个节点任务失败，能自动转移到其他空闲节点适合大数据处理：得益

Chord_Gll·2020-08-20 17:37

通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例

而Serverless的出现，为MapReduce进行大数据处理又提供了一个新的部署方案，Serverless与MapReduce究竟如何结合呢？本文将通过一个简单的教程，指导大家快

Serverless·2020-08-20 17:09

通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例

而Serverless的出现，为MapReduce进行大数据处理又提供了一个新的部署方案，Serverless与MapReduce究竟如何结合呢？本文将通过一个简单的教程，指导大家快

Serverless·2020-08-20 17:09

通用大数据架构为什么不适合处理物联网数据？

除使用大家所熟悉的Hadoop组件如HDFS，MapReduce,HBase,Hive外，通用的大数据处理平台往往还使用Kafka或其他消息队列工具，Redis或其他缓存软件，Flink或其他实时流式数据处理软件

涛思数据·2020-08-20 16:29

通用大数据架构为什么不适合处理物联网数据？

除使用大家所熟悉的Hadoop组件如HDFS，MapReduce,HBase,Hive外，通用的大数据处理平台往往还使用Kafka或其他消息队列工具，Redis或其他缓存软件，Flink或其他实时流式数据处理软件

涛思数据·2020-08-20 16:29

快速掌握阿里云 E-MapReduce

阿里云ElasticMapReduce（E-MapReduce）是一种大数据处理的系统解决方案。

xmvip01·2020-08-20 12:24

及时更新知识和技能

当今信息及技术的变化速度很快，若不注意知识和技能的更新，那么可能过不了几年工作的效率和思路就赶不上变化了，十年前我们还在用EXCEL一个个处理数据的时候，高手已经在用VBA处理了，当下我们还在用电子表格进行大数据处理和分析的时候

刘志民_64be·2020-08-20 11:02

Scala和Java的语法差异(转)

目前spark、kafaka等流行的大数据处理的软件都是由scala编写。1语法差异罗列下面介绍一些scala语言和java语言差异点,通过简单罗列的方式

生活的探路者·2020-08-20 10:10

Python学习资料汇总

我了解到，很多文章关于这个问题的回答是“教育部正式将人工智能、物联网、大数据处理正式划入高中新课标”、“Python纳入浙江高考”、“Python纳入山东小学教材”等。

Y木木老师Y·2020-08-20 10:51

专家级程序员技术栈

了解其他编程语言如Java、Python、Go、Rust、C等了解计算机硬件和Linux操作系统理解计算机网络（TCP/IP/Https协议、路由、交换等）掌握常见AI模型精通并行和并发编程精通至少一种大数据处理框架

xiaoxiao落木·2020-08-20 06:18

Jupyter结合pyechart安装的跳坑小指南（结合自己遇到的问题给大家节省些许时间）

写在前面这个学期，选修了一门机器学习与大数据处理，所使用的工具是JupyterNotebooks.前一次的作业要求把分析出来的数据可视化，对于这个大家的第一反应大概会是用matplotlib。

西门吹贾·2020-08-20 01:42

基于OGG Datahub插件将Oracle数据同步上云

一、背景介绍随着数据规模的不断扩大，传统的RDBMS难以满足OLAP的需求，本文将介绍如何将Oracle的数据实时同步到阿里云的大数据处理平台当中，并利用大数据工具对数据进行分析。

阿里云云栖号·2020-08-20 01:20

python文件名排序：“字符串+数字”形式的文件名称排序脚本

当我们使用os.listdir(rootDir)获得该文件夹下所有文件名称后，会发现其是乱序的，而在大数据处理过程中，我们往往希望可以按照顺序将样本输入进我们的系统。

奔跑的Yancy·2020-08-20 00:23

大数据方面核心技术

首先给出一个通用化的大数据处理框架，主要分为下面几个方面：数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。

yoku酱·2020-08-19 22:17

dbutils 的使用，事务处理，操作多表

dbutils的使用，事务处理，多表操作，oracle大数据处理作者：吕鹏时间：2011-08-08首先还是简单的回顾一下昨天我们讲的什么，我们昨天讲了数据库连接池，为防止频繁访问数据库而建立的连接池的实现有两种一个是自定义连接池

南北雪树·2020-08-19 20:23

比较两个大文本文件的差异并输出增量和减量

要求不能使用Spark或Hadoop这样的大数据处理框架。思路：首先使用外排序算法对A,B分别按字典序排序，输出a.sorted和b.sorted两个文件，然后再遵循以

司青·2020-08-19 20:19

送书【新书】 |《python数据科学实战》

本周我们送出的是《python数据科学实战》（文末查看送书规则）编辑推荐狗熊会（数据产业高端智库）官方出品：源于实践、终于实战的Python数据分析与大数据处理精进指南！

敲代码的灰太狼·2020-08-19 20:17

大数据处理和软件开发第一步：VMware下安装CentOS 8 Linux操作系统

说明如果手里有淘汰下来的电脑，可以直接将CentOS8Linux操作系统装在物理电脑上。直接看下面的CentOS8Linux系统安装部分，不用看VMware安装的相关内容。如果手里只有一台电脑，那么只能通过安装虚拟机来安装CentOS8Linux。虚拟机软件有好多种，本文将以WMware为例来进行安装讲解。为什么选择CentOS8Linux而不是别的Linux发行版？因为CentOS8Linux是

9Tristone·2020-08-19 17:40

Hadoop-->HDFS原理总结

HadoopDistributedFileSystemHDFS概述HDFS优点：高容错性数据自动保存多个副本（不同的副本放在不同的节点上）副本丢失后,自动恢复适合批处理移动计算而非数据数据位置暴露给计算框架适合大数据处理

村头陶员外·2020-08-19 08:22

Hadoop技术(一)分布式文件系统HDFS

分布式文件系统HDFS第一章统一思维单机大数据处理实现以及问题问题引入现在收集到的想法问题升级第二章Hadoop一Hadoop简介HDFS优点HDFS缺点二Hadoop分布式文件系统HDFS相关介绍HDFS

时间静止不是简史·2020-08-19 06:07

大数据分析师·人才培养·高薪起航

动辄达到数百TB甚至数十至数百PB规模的行业/企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力，因此，寻求有效的大数据处理技术、方法和手段已经成为现实世界的迫切需求。

CDA·数据分析师·2020-08-19 06:13

推荐频道

MongoBD大数据处理

GPS网络时间服务器让您拥有不一样的网络系统

2.0Spark编程模型

hadoop学习之hadoop优缺点

第一章-Flink介绍-《Fink原理、实战与性能优化》读书笔记

聪明的代码

大数据框架--hadoop、spark、storm、flink、Samza介绍

Hadoop中的YARN

Inflation 引起的 MetaSpace Full GC 问题排查｜蚂蚁集团实例分析

Spark如何与深度学习框架协作，处理非结构化数据

flink入门实例-Windows下本地模式跑SocketWordCount

从Storm到Flink：大数据处理的开源系统及编程模型（文末福利）

URL任意跳转漏洞

第九弹 - 脚本模式与参数视图

第九弹 - 脚本模式与参数视图

大数据处理算法--Bloom Filter

大数据学习路线

大数据学习路线

大数据采集、清洗、处理：使用MapReduce进行离线数据分析完整案例

通用大数据架构为什么不适合处理物联网数据？

关于大数据产品研发初步规划V1.2_文档

斗象科技NTA全流量大数据架构 VS 传统单机设备，底层差别到底在哪？

Impala：新一代开源大数据分析引擎

Impala：新一代开源大数据分析引擎

Spark搭建及第一个Spark程序

第一篇|Spark概览

第一篇|Spark概览

万字详解TDengine 2.0整体架构设计思路

万字详解TDengine 2.0整体架构设计思路

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

Hadoop学习笔记二：MapReduce的IO类型 && 文件切片

通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例

通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例

通用大数据架构为什么不适合处理物联网数据？

通用大数据架构为什么不适合处理物联网数据？

快速掌握阿里云 E-MapReduce

及时更新知识和技能

Scala和Java的语法差异(转)

Python学习资料汇总

专家级程序员技术栈

Jupyter结合pyechart安装的跳坑小指南（结合自己遇到的问题给大家节省些许时间）

基于OGG Datahub插件将Oracle数据同步上云

python文件名排序：“字符串+数字”形式的文件名称排序脚本

大数据方面核心技术

dbutils 的使用，事务处理，操作多表

比较两个大文本文件的差异并输出增量和减量

送书【新书】 |《python数据科学实战》

大数据处理和软件开发第一步：VMware下安装CentOS 8 Linux操作系统

Hadoop-->HDFS原理总结

Hadoop技术(一)分布式文件系统HDFS

大数据分析师·人才培养·高薪起航