E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MongoBD大数据处理
GPS网络时间服务器让您拥有不一样的网络系统
GPS网络时间服务器让您拥有不一样的网络系统GPS网络时间服务器让您拥有不一样的网络系统京准电子科技官微——ahjzsz时间同步技术必定将是整个
大数据处理
系统的重要支撑和保障。
GPS时钟服务器,NTP时间服务器,时间同步服务器15901092122岳峰
·
2020-08-21 10:00
2.0Spark编程模型
同时,Spark依靠Scala强大的函数式编程Actor通信模式、闭包、容器、泛型,并借助统一资源调度框架,成为一个简洁、高效、强大的分布式
大数据处理
框架。Spark在运算
Albert陈凯
·
2020-08-21 07:22
hadoop学习之hadoop优缺点
适合
大数据处理
kerl-fashion
·
2020-08-21 07:21
第一章-Flink介绍-《Fink原理、实战与性能优化》读书笔记
随着雅虎对hadoop的开源,越来越多的
大数据处理
技术开始涌入人们的视线,例如目前比较流行的
大数据处理
引擎ApacheSpark,基本上已经取代了MapReduce成为当
weixin_30776545
·
2020-08-21 06:51
聪明的代码
code1词法分析:领域为n的所有频度计数在《数据算法Hadoop/Spark
大数据处理
技巧》一书中的第五章的反转排序中有一段映射器的代码能够得到领域为2的所有频度计数,代码量不大,但是思路让人敬佩。
jimmysenior
·
2020-08-21 06:17
Hadoop
java
大数据框架--hadoop、spark、storm、flink、Samza介绍
Hadoop、Spark、Storm、Flink是比较常用的分布式计算系统1)仅批处理框架:Hadoop常用于离线的复杂的
大数据处理
。
戰士
·
2020-08-21 04:25
基础知识
Hadoop中的YARN
MRv1是目前使用的标准的
大数据处理
系统。但是,这种架构存在不
小鸟123
·
2020-08-21 04:22
Hadoop
Inflation 引起的 MetaSpace Full GC 问题排查|蚂蚁集团实例分析
蚂蚁集团的智能监控平台深度利用了Spark的能力进行多维度数据聚合,Spark由于其高效、易用、分布式的能力在
大数据处理
中十分受欢迎。
SOFAStack
·
2020-08-21 03:39
监控
service-mesh
分布式
Spark如何与深度学习框架协作,处理非结构化数据
随着大数据和AI业务的不断融合,大数据分析和处理过程中,通过深度学习技术对非结构化数据(如图片、音频、文本)进行
大数据处理
的业务场景越来越多。
华为云开发者社区
·
2020-08-21 02:00
深度学习
大数据
人工智能
spark
模型
flink入门实例-Windows下本地模式跑SocketWordCount
一般情况下,开发
大数据处理
程序,我们希望能够在本地编写代码并调试通过,能够在本地进行数据测试,然后在生产环境去跑“大”数据。
weixin_30508309
·
2020-08-21 02:50
大数据
java
操作系统
从Storm到Flink:
大数据处理
的开源系统及编程模型(文末福利)
本文节选自CCF大数据教材系列丛书之《
大数据处理
》,本书由华中科技大学金海教授主编,包括
大数据处理
基础技术、
大数据处理
编程与典型应用处理、
大数据处理
系统与优化三个方面。
AI科技大本营
·
2020-08-21 02:37
URL任意跳转漏洞
猜测原理是通过
大数据处理
你在教我打CTF啊
·
2020-08-21 01:03
渗透测试小记录
第九弹 - 脚本模式与参数视图
MaxCompute(原ODPS)是阿里云自主研发的具有业界领先水平的分布式
大数据处理
平台,尤其在集团内部得到广泛应用,支撑了多个BU的核心业务。
阿里云云栖号
·
2020-08-21 00:03
脚本
第九弹 - 脚本模式与参数视图
MaxCompute(原ODPS)是阿里云自主研发的具有业界领先水平的分布式
大数据处理
平台,尤其在集团内部得到广泛应用,支撑了多个BU的核心业务。
阿里云云栖号
·
2020-08-21 00:03
脚本
大数据处理
算法--Bloom Filter
一、布隆过滤器(BloomFilter)的定义布隆过滤器可以用来检测数据是否存在于一个集合中。它是hash的扩展,底层就是一个位数组,每一个bit位可以表示一个数字,所以布隆过滤器是基于位图来实现的。二、布隆过滤器的原理1、插入数据在位图中,每一个bit对应一个数字,出现一个数字就可以在相应的位上置1。但是布隆过滤器不一样,它要处理的不仅仅是整型还有其他如string类型的数据,因此,当大量的st
db199410
·
2020-08-20 23:29
数据结构
大数据学习路线
一、
大数据处理
流程上图是一个简化的
大数据处理
流程图,
大数据处理
的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。
黑白影
·
2020-08-20 22:08
hadoop
spark
storm
zookeeper
kafka
大数据学习路线
一、
大数据处理
流程上图是一个简化的
大数据处理
流程图,
大数据处理
的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。
黑白影
·
2020-08-20 22:08
hadoop
spark
storm
zookeeper
kafka
大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例
1
大数据处理
的常用方法
大数据处理
目前比较流行的是两种方法,一种是离线处理,一种是在线处理,基本处理架构如下:在互联网应用中,不管是哪一种处理方式,其基本的数据来源都是日志数据,例如对于web应用来说,则可能是用户的访问日志
yoku酱
·
2020-08-20 21:47
通用大数据架构为什么不适合处理物联网数据?
除使用大家所熟悉的Hadoop组件如HDFS,MapReduce,HBase,Hive外,通用的
大数据处理
平台往往还使用Kafka或其他消息队列工具,Redis或其他缓存软件,Flink或其他实时流式数据处理软件
涛思数据
·
2020-08-20 21:20
大数据
时间序列数据存储
物联网
tdengine
涛思数据
关于大数据产品研发初步规划V1.2_文档
大数据产品整体框架设计大数据产品整体框架之软件建设主要分为四部分内容:1、ETL,负责各数据库间数据有序流动;2、资源统一管理平台,负责多个数据库的资源管理,包含元数据管理等;3、分布式文件系统,负责非结构化数据,如图片、文档、音视频等文件存储与访问;4、
大数据处理
平台
卿卿老祖
·
2020-08-20 21:59
斗象科技NTA全流量大数据架构 VS 传统单机设备,底层差别到底在哪?
Gartner对NTA定义:以网络流量为基础,应用人工智能、
大数据处理
等先进
斗象科技
·
2020-08-20 21:04
Impala:新一代开源大数据分析引擎
文/耿益锋陈冠诚Impala项目主页在:https://github.com/cloudera/impala
大数据处理
是云计算中非常重要的问题,自Google公司提出MapReduce分布式处理框架以来
思否编辑部
·
2020-08-20 19:39
大数据
hadoop
mapreduce
impala
开源项目介绍
Impala:新一代开源大数据分析引擎
文/耿益锋陈冠诚Impala项目主页在:https://github.com/cloudera/impala
大数据处理
是云计算中非常重要的问题,自Google公司提出MapReduce分布式处理框架以来
思否编辑部
·
2020-08-20 19:39
大数据
hadoop
mapreduce
impala
开源项目介绍
Spark搭建及第一个Spark程序
Spark简介spark:一个基于内存的,分布式的
大数据处理
框架(计算引擎)官网:http://spark.apache.org/中文官网:http://spark.apachecn.org/docs/
权飞虎
·
2020-08-20 18:22
大数据
Spark
第一篇|Spark概览
经过10年的发展,Spark成为了炙手可热的
大数据处理
平台,目前最新的版本是Spar
西贝木土
·
2020-08-20 17:27
spark
第一篇|Spark概览
经过10年的发展,Spark成为了炙手可热的
大数据处理
平台,目前最新的版本是Spar
西贝木土
·
2020-08-20 17:27
spark
万字详解TDengine 2.0整体架构设计思路
大数据处理
系统就是要将各种采集的
涛思数据
·
2020-08-20 17:50
tdengine
大数据
物联网
涛思数据
实时计算
万字详解TDengine 2.0整体架构设计思路
大数据处理
系统就是要将各种采集的
涛思数据
·
2020-08-20 17:50
tdengine
大数据
物联网
涛思数据
实时计算
Hadoop学习笔记二:MapReduce的IO类型 && 文件切片
质量可能不够,数量一定管够高容错性:一个节点任务失败,能自动转移到其他空闲节点适合
大数据处理
:得益
Chord_Gll
·
2020-08-20 17:37
mapreduce
hadoop
Hadoop学习笔记二:MapReduce的IO类型 && 文件切片
质量可能不够,数量一定管够高容错性:一个节点任务失败,能自动转移到其他空闲节点适合
大数据处理
:得益
Chord_Gll
·
2020-08-20 17:37
mapreduce
hadoop
通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例
而Serverless的出现,为MapReduce进行
大数据处理
又提供了一个新的部署方案,Serverless与MapReduce究竟如何结合呢?本文将通过一个简单的教程,指导大家快
Serverless
·
2020-08-20 17:09
腾讯云
serverless
通过腾讯云 Serverless Regsitry 快速开发与部署一个 WordCount 实例
而Serverless的出现,为MapReduce进行
大数据处理
又提供了一个新的部署方案,Serverless与MapReduce究竟如何结合呢?本文将通过一个简单的教程,指导大家快
Serverless
·
2020-08-20 17:09
腾讯云
serverless
通用大数据架构为什么不适合处理物联网数据?
除使用大家所熟悉的Hadoop组件如HDFS,MapReduce,HBase,Hive外,通用的
大数据处理
平台往往还使用Kafka或其他消息队列工具,Redis或其他缓存软件,Flink或其他实时流式数据处理软件
涛思数据
·
2020-08-20 16:29
大数据
时间序列数据存储
物联网
tdengine
涛思数据
通用大数据架构为什么不适合处理物联网数据?
除使用大家所熟悉的Hadoop组件如HDFS,MapReduce,HBase,Hive外,通用的
大数据处理
平台往往还使用Kafka或其他消息队列工具,Redis或其他缓存软件,Flink或其他实时流式数据处理软件
涛思数据
·
2020-08-20 16:29
大数据
时间序列数据存储
物联网
tdengine
涛思数据
快速掌握阿里云 E-MapReduce
阿里云ElasticMapReduce(E-MapReduce)是一种
大数据处理
的系统解决方案。
xmvip01
·
2020-08-20 12:24
及时更新知识和技能
当今信息及技术的变化速度很快,若不注意知识和技能的更新,那么可能过不了几年工作的效率和思路就赶不上变化了,十年前我们还在用EXCEL一个个处理数据的时候,高手已经在用VBA处理了,当下我们还在用电子表格进行
大数据处理
和分析的时候
刘志民_64be
·
2020-08-20 11:02
Scala和Java的语法差异(转)
目前spark、kafaka等流行的
大数据处理
的软件都是由scala编写。1语法差异罗列下面介绍一些scala语言和java语言差异点,通过简单罗列的方式
生活的探路者
·
2020-08-20 10:10
Python学习资料汇总
我了解到,很多文章关于这个问题的回答是“教育部正式将人工智能、物联网、
大数据处理
正式划入高中新课标”、“Python纳入浙江高考”、“Python纳入山东小学教材”等。
Y木木老师Y
·
2020-08-20 10:51
python
java
编程语言
专家级程序员技术栈
了解其他编程语言如Java、Python、Go、Rust、C等了解计算机硬件和Linux操作系统理解计算机网络(TCP/IP/Https协议、路由、交换等)掌握常见AI模型精通并行和并发编程精通至少一种
大数据处理
框架
xiaoxiao落木
·
2020-08-20 06:18
软件工程与技术
Jupyter结合pyechart安装的跳坑小指南(结合自己遇到的问题给大家节省些许时间)
写在前面这个学期,选修了一门机器学习与
大数据处理
,所使用的工具是JupyterNotebooks.前一次的作业要求把分析出来的数据可视化,对于这个大家的第一反应大概会是用matplotlib。
西门吹贾
·
2020-08-20 01:42
奇奇怪怪小技巧
基于OGG Datahub插件将Oracle数据同步上云
一、背景介绍随着数据规模的不断扩大,传统的RDBMS难以满足OLAP的需求,本文将介绍如何将Oracle的数据实时同步到阿里云的
大数据处理
平台当中,并利用大数据工具对数据进行分析。
阿里云云栖号
·
2020-08-20 01:20
python文件名排序:“字符串+数字”形式的文件名称排序脚本
当我们使用os.listdir(rootDir)获得该文件夹下所有文件名称后,会发现其是乱序的,而在
大数据处理
过程中,我们往往希望可以按照顺序将样本输入进我们的系统。
奔跑的Yancy
·
2020-08-20 00:23
Python
大数据方面核心技术
首先给出一个通用化的
大数据处理
框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。
yoku酱
·
2020-08-19 22:17
dbutils 的使用,事务处理,操作多表
dbutils的使用,事务处理,多表操作,oracle
大数据处理
作者:吕鹏时间:2011-08-08首先还是简单的回顾一下昨天我们讲的什么,我们昨天讲了数据库连接池,为防止频繁访问数据库而建立的连接池的实现有两种一个是自定义连接池
南北雪树
·
2020-08-19 20:23
Oracle&MySQL
比较两个大文本文件的差异并输出增量和减量
要求不能使用Spark或Hadoop这样的
大数据处理
框架。思路:首先使用外排序算法对A,B分别按字典序排序,输出a.sorted和b.sorted两个文件,然后再遵循以
司青
·
2020-08-19 20:19
Java
算法
送书【新书】 |《python数据科学实战》
本周我们送出的是《python数据科学实战》(文末查看送书规则)编辑推荐狗熊会(数据产业高端智库)官方出品:源于实践、终于实战的Python数据分析与
大数据处理
精进指南!
敲代码的灰太狼
·
2020-08-19 20:17
python
数据分析
数据挖掘
人工智能
编程语言
大数据处理
和软件开发第一步:VMware下安装CentOS 8 Linux操作系统
说明如果手里有淘汰下来的电脑,可以直接将CentOS8Linux操作系统装在物理电脑上。直接看下面的CentOS8Linux系统安装部分,不用看VMware安装的相关内容。如果手里只有一台电脑,那么只能通过安装虚拟机来安装CentOS8Linux。虚拟机软件有好多种,本文将以WMware为例来进行安装讲解。为什么选择CentOS8Linux而不是别的Linux发行版?因为CentOS8Linux是
9Tristone
·
2020-08-19 17:40
CentOS
Hadoop-->HDFS原理总结
HadoopDistributedFileSystemHDFS概述HDFS优点:高容错性数据自动保存多个副本(不同的副本放在不同的节点上)副本丢失后,自动恢复适合批处理移动计算而非数据数据位置暴露给计算框架适合
大数据处理
村头陶员外
·
2020-08-19 08:22
hadoop
Hadoop技术(一)分布式文件系统HDFS
分布式文件系统HDFS第一章统一思维单机
大数据处理
实现以及问题问题引入现在收集到的想法问题升级第二章Hadoop一Hadoop简介HDFS优点HDFS缺点二Hadoop分布式文件系统HDFS相关介绍HDFS
时间静止不是简史
·
2020-08-19 06:07
大数据学习
JAVA小窝(笔记)
大数据分析师·人才培养·高薪起航
动辄达到数百TB甚至数十至数百PB规模的行业/企业大数据已远远超出了现有传统的计算技术和信息系统的处理能力,因此,寻求有效的
大数据处理
技术、方法和手段已经成为现实世界的迫切需求。
CDA·数据分析师
·
2020-08-19 06:13
数据分析师
大数据
大数据分析师
上一页
28
29
30
31
32
33
34
35
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他