E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MongoBD大数据处理
大数据测试要点总结
一.非功能性测试由于大数据面向具体行业的应用,除了功能性测试,在整个
大数据处理
框架下需要进行非功能性测试,以下几种:a.性能测试性能是评估一个大数据分析系统的最为关键的维度,大数据系统性能主要包括吞吐量
weixin_48048408
·
2020-09-16 17:11
吐血整理:盘点19种
大数据处理
的典型工具
导读:本文讨论
大数据处理
的生命周期和典型工具。
hzbooks
·
2020-09-16 15:50
队列
分布式
大数据
编程语言
hadoop
Spark
大数据处理
框架入门-包括生态系统、运行流程以及部署方式
Spark
大数据处理
框架简介ApacheSpark是专为大规模数据处理而设计的快速通用的计算引擎。
我愿痴狂
·
2020-09-16 12:09
大数据组件架构
Spark架构
面向大数据框架的测评
1.概述
大数据处理
流程一般如下:使用相关工具对分布广泛的非结构化的数据源进行抽取和集成,采用合适的标准对结果进行统一存储,利用数据分析的相关技术分析存储的数据,从所存储的数据中选择有用的内容并通过恰
ah4526
·
2020-09-16 12:24
大数据
Flink vs Spark
https://zhuanlan.zhihu.com/p/68206953ApacheFlink是新一代通用
大数据处理
引擎,旨在统一不同的数据负载。听起来像ApacheSpark吗?是的。
曹雪朋
·
2020-09-16 12:44
Flink
大数据知识点—spark概念,核心架构,运行流程
概念Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据)的
大数据处理
的需求。
BAO7988
·
2020-09-16 10:45
大数据
大数据
spark
Spark 内部剖析
Spark已经成为
大数据处理
中的必备技术,经过多年的发展它再也不是新技术,那么只是掌握开发中的API远远不能满足要求,本场Chat就是带领你迈向Spark更深层次的领域--内核解析。
蔚1
·
2020-09-16 10:45
运维
内存管理
netty
大数据系统学习笔记
大数据难点:1.数据类型多(variety)2.要求及时响应(velocity)3.数据的不确定性(veracity)大数据时代处理数据的理念:1.要全体不要抽样2.要效率不要绝对精确3.要相关不要因果
大数据处理
形
he_world
·
2020-09-16 09:35
大数据
数据
velocity
时代
class
java实现朴素贝叶斯分类算法
大数据处理
中最常用就是对数据进行分类,统计,关联分析等。这篇博客介绍下朴素贝叶斯分类算法在数据分类中的一个应用,举一个例子并使用java对其进行实现,借此也巩固下我所学的知识。
showCar
·
2020-09-16 08:35
Linux下Hadoop集群的搭建(1)—重新编译Hadoop
随着互联网大数据的兴起,Hadoop这个专门用于
大数据处理
的框架也越来越被人重视起来,可以说Hadoop这个框架是现阶段进行
大数据处理
的标配,作为一个冲锋于互联网的先锋军,学习一下Hadoop这个框架都是有必要的
高寒竹林
·
2020-09-16 05:22
Hadoop
Linux服务器
Haddop
Linux
Maven
大数据
hadoop集群
【
大数据处理
架构】SparkR
一、从R说起R是用于统计分析、绘图的语言和操作环境。R是属于GNU系统的一个自由、免费、源代码开放的软件,它是一个广泛应用于统计计算和统计制图的优秀编程语言。优点:开源,有许多工具包,可塑性强。例子:quantmond用于股票分析>install.packages('quantmod')#安装quantmod包>require(quantmod)#引用quantmod包>getSymbols("G
tintinsnowy
·
2020-09-16 04:00
大数据
大数据集群之HDFS的简单使用(使用HDFS 简单实现云盘系统)
HDFS作为Hadoop的文件系统,具有以下特点:高容错流式文件访问适合
大数据处理
适合批处理高容错率可以使它构建在廉洁的机器上当然也有缺点:不擅长低延迟和高吞吐率的数据访问小文件存储并发写入和高频率修改参照
bay_bai
·
2020-09-16 02:36
java
大数据
java
hadoop
hdfs
大数据
分治算法:谈一谈大规模计算框架MapReduce中的分治思想
分治算法:谈一谈大规模计算框架MapReduce中的分治思想MapReduce是Google
大数据处理
的三驾马车之一,另外两个是GFS和Bigtable理解分治算法:将原问题划分成n个规模较小,并且结构与原问题相似的子问题
ywangjiyl
·
2020-09-16 01:45
数据结构与算法
跟宝宝一起学习
【数据结构与算法】->算法->分治算法->MapReduce的基本思想
分治算法Ⅰ前言Ⅱ分治算法的理解Ⅲ分治算法的应用Ⅳ分治思想在海量数据处理中的应用ⅤMapReduce的基本思想Ⅰ前言MapReduce是Google
大数据处理
的三驾马车之一,另外两个是GFS和Bigtable
山河罔顾
·
2020-09-16 01:29
数据结构与算法
数据结构
算法
MapReduce
分治思想
归并排序
Hadoop之Hdfs基本知识
HDFS的特点超大文件:
大数据处理
:GB、TB、甚至PB级数据、百万规模以上的
hengliwuyou
·
2020-09-15 16:12
Hadoop
Hadoop和传统
大数据处理
方式的差别 分类: 杂文 ...
Hadoop和传统
大数据处理
方式的差别本文摘自:Markboo新浪博客说道Hadoop,就要先讲到大数据。上个世纪,好远。。。九十年代后,开始,数据开始大量的产生,总之到了快没法弄的程度了。
dengxundong1074
·
2020-09-15 16:36
人工智能
数据库
大数据
Apache Spark处理大数据入门,看这一篇就够了
作者SriniPenchikala,译者丛一什么是SparkApacheSpark是一个围绕速度、易用性和复杂分析构建的
大数据处理
框架。
零如雨
·
2020-09-15 15:55
大数据
大数据:随机生成10万个整数找出出现次数前一百的数
实现
大数据处理
的基本方法是分治法+heapsort/***@100000个整形数据,范围在0~32768*1.输出最大*2.输出次数前100的数*/#include#include#include#includetypedefstruct
朱里安
·
2020-09-15 13:14
数据处理
Apache Spark入门级摘要
ApacheSpark是一个围绕速度、易用性和复杂分析构建的
大数据处理
框架,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的流数据
奋起直追CDS
·
2020-09-15 13:53
大数据
太多选择——如何挑选合适的大数据或Hadoop平台?
你有多种选择来安装Hadoop的一个版本并实现
大数据处理
。本文讨论了
xiyf2046
·
2020-09-15 13:51
hadoop
三大运营商大数据有什么用
大数据时代,实现精准营销并非无规律可循,大数据精准营销依托中国联通、电信、移动三大运营商的海量用户数据以及强
大数据处理
能力,通过对数据的深入挖掘、行业的深度研究、为各类企业客户建立起精准的用户画像,提供触达通道
LBT85785
·
2020-09-15 06:35
大数据
大数据
视频教程-新版SpringBoot2.3+Spring5.X+Mybatis3.X+IDEA+全栈综合项目实战-Java
全栈综合项目实战7年的开发架构经验,曾就职于国内一线互联网公司,开发工程师,现在是某创业公司技术负责人,擅长语言有node/java/python,专注于服务端研发,人工智能相关领域,熟悉分布式高可用系统的架构,
大数据处理
weixin_34847060
·
2020-09-15 06:13
大数据介绍
目录1、大数据概览1.1大数据概览——大数据定义1.2大数据概览——大数据来源1.3大数据概览——大数据的数据类型2、
大数据处理
及意义3、大数据应用场景4、小结1、大数据概览1.1大数据概览——大数据定义大数据常用定义
远方与你
·
2020-09-15 05:16
大数据
新手小白大数据学习路线规划
上图是一个简化的
大数据处理
流程图,
大数据处理
的主要流程包括数据收集、数据存储、数据处理、数据应用等主要环节。
juan333
·
2020-09-15 02:33
程序员
Hadoop(一)大数据急速入门(一看就会)
大数据的4V特点Volume(大量),
大数据处理
的数据是TB,PB,EB
我是余傲:)
·
2020-09-15 01:22
hadoop
大数据
hadoop
mapreduce
hdfs
红象云腾Redoop Enterprise CRH V5.0的五大过人之处
Hadoop,这个由Apache基金会所开发的分布式系统基础架构近些年来得益于其自身在数据提取、变形和加载(ETL)方面上的天然优势,得以在
大数据处理
应用中得到广泛的应用,但Hadoop毕竟是成长于国外的环境和土壤中
科技峰行者
·
2020-09-15 01:05
《MongoDB
大数据处理
权威指南(第2版)》之MongoDB入门
想象一下这样的世界:数据库使用是如此的简单,以至于你忘记了正在使用它。再想象一下这样的世界:不需要任何复杂配置或设置,数据库仍然能够快速运行,并且具有良好的扩展性。想一下,如何可以只关注gg于手上的任务,完成它,并可以按时下班。这听起来有点神奇,但是MongoDB承诺帮助你完成所有这些事情(甚至更多)。MongoDB(源自单词humongous)是一种相对较新的数据库,它没有表、模式、SQL或行的
清图
·
2020-09-15 01:19
数据库
python之panda模块理解与学习。
转载自品略图书馆http://www.pinlue.com/article/2019/03/2601/068413323231.htmlPandas是Python的一个
大数据处理
模块。
銨靜菂等芐紶
·
2020-09-14 21:43
Python
python
panda
Spark之UDAF
故而,对于一个
大数据处理
平台而言,倘
hankl1990
·
2020-09-14 21:30
给定a和n,计算a+aa+aaa+a...a(n个a)的和(
大数据处理
)
题目描述:给定a和n,计算a+aa+aaa+a...a(n个a)的和。输入:测试数据有多组,输入a,n(1#includeusingnamespacestd;intmain(){inta,n;intsum=0;vectorv;vectortemp;vector::iteratorit;inthight=0;//存储进位while(cin>>a>>n){v.clear();temp.clear();
iteye_3619
·
2020-09-14 19:15
spark实现wordCount(scala、python)
本文环境spark1.6scala2.1.6,python2.7Spark是大家非常熟悉的
大数据处理
框架,虽然在公司已经使用了很久,但是没有深入的了解过Spark的底层代码原理,大家都清楚,Spark是由
Victor_Monkey
·
2020-09-14 18:06
大数据
spark
Kafka 入门介绍
鉴于Kafka在如今
大数据处理
领域的重要地位,还是写一篇文章来简单介绍一下kafka吧。本文只谈基础概念,也算是个小界,大神请绕道。
Rocky-Yang
·
2020-09-14 17:07
实时大数据处理
kafka
大数据
Storm 入门的Demo教程
Storm介绍Storm是Twitter开源的分布式实时
大数据处理
框架,最早开源于github,从0.9.1版本之后,归于Apache社区,被业界称为实时版Hadoop。
weixin_34116110
·
2020-09-14 16:07
用于
大数据处理
的高性能计算的4个实现步骤
在大数据领域,并非每家公司都需要高性能计算(HPC),但几乎所有使用大数据的企业都采用了Hadoop式分析计算。HPC和Hadoop之间的区别很难区分,因为可以在高性能计算(HPC)设备上运行Hadoop分析作业,但反之亦然。HPC和Hadoop分析都使用并行数据处理,但在Hadoop和分析环境中,数据存储在硬件上,并分布在该硬件的多个节点上。在高性能计算(HPC)中,数据文件的大小要大得多,数据
haboop
·
2020-09-14 14:51
大数据书籍
大数据经验
大数据技术
大数据资讯
大数据应用
大数据人生
大数据教程
一个脚本搞定文件合并去重,
大数据处理
,可以合并几个G以上的文件
问题:先讲下需求,有若干个文本文件(txt或者csv文件等),每行代表一条数据,现在希望能合并成1个文本文件,且需要去除重复行。分析:一向奉行简单原则,如无必要,绝不复杂。如果数据量不大,那么如下两条命令就可以搞定合并:cata.txt>>new.txtcatb.txt>>new.txt……去重:catnew.txt|sort|uniq>outfile.txt搞定,收工。但是,但是,如果文本文件非
陈 超
·
2020-09-14 13:31
编程语言
文件去重合并
大数据处理
文件去重
33-Storm学习-史上最通俗易懂Storm教程:大白话介绍Storm
ApacheStorm是一个分布式实时
大数据处理
系统。Storm设计用于在容错和水平可扩展方法中处理大量数据。Storm是一个分布式的,可靠的,容错的数据流处理系统。
luu_一只程序猿
·
2020-09-14 12:42
#
#
Storm实时性大数据处理
干货 | 广告系统架构解密
从技术角度来说,广告业务涉及到AI算法、
大数据处理
、检索引擎、高性能和高可用的工程架构等多个方向,同样有着不错的技术吸引力。我从去年开始接触广告业务,到现在差不多一年时间了。
趣任务-专注任务管理
·
2020-09-14 10:34
好文共享
hadoop
spark
项目架构
广告
redis
通向架构师的道路(第二十七天)IBM网格计算与企业批处理任务架构
这些批处理经常会涉及到一些
大数据处理
,同时处理一批增、删、改、查等SQL,往往涉及到好几张表,这边取点数据那边写点数据,运行一些存储过程等。
iteye_11790
·
2020-09-14 05:44
在云上搭建大规模实时数据流处理系统
一、实时
大数据处理
利器——Storm和Kafka大数据时代,随
weixin_34267123
·
2020-09-14 05:14
Java web(JDBC)
大数据处理
[BLOB数据,CLOB数据]
大数据处理
处理CLOB数据在实际开发中,CLOB用于储存文本的大数据,但是,对于MySQL来说,大数据文本的储存方式是用TEXT类型表示,案例如下:importjava.io.
啊~小 l i
·
2020-09-14 01:07
MySQL
数据库
mysql
jdbc
sql
java
辅助系统----日志采集框架Flume
前言在一个完整的离线
大数据处理
系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架
魔法 • 革
·
2020-09-13 22:54
人工智能的技术成熟度做到了哪种地步?
1.人工智能中涉及到的技术在人工智能的发展中,
大数据处理
、深度学习和GPU计算三个方面的技术起到了关键的推动作用
CDA·数据分析师
·
2020-09-13 20:26
云计算、PaaS开发、企业云平台搭建
传统模式(单机纵向扩展):CPU、内存、硬盘云计算特点:通过增加节点来扩展自下而上管理模式(自治、自动化)适合自动化
大数据处理
虚拟化动态迁移云计算思想:解耦:打破串行执行,变成一环节一环节(异步)简单的极致
Virgil_Ye
·
2020-09-13 20:12
产品需求与设计
一个demo快速入门Storm
简单地说:storm是一个分布式实时
大数据处理
系统,主要用于做实时流式计算。
我的兔子丢了
·
2020-09-13 20:38
大数据
后端开发
Flume+Kafka+Storm+Redis构建大数据实时处理系统:实时统计网站PV、UV+展示
[TOC]1
大数据处理
的常用方法前面在我的另一篇文章中《大数据采集、清洗、处理:使用MapReduce进行离线数据分析完整案例》中已经有提及到,这里依然给出下面的图示:前面给出的那篇文章是基于MapReduce
weixin_34406796
·
2020-09-13 20:26
CDH6.0.0详细安装教程及所遇到的问题
ClouderaManager则是为了便于在集群中进行Hadoop等
大数据处理
相关的服务安装和监控管理的组件,对集群中主
weixin_34378767
·
2020-09-13 20:55
storm + kafka + zookeeper
Storm是Twitter开源的分布式实时
大数据处理
框架,Storm是流示数据处理,是不均匀的,通过kafka+zookeeper将消息处理后均匀返回给Stormkafka是一个分布式的,分区的消息(官方称之为
版式浮夸
·
2020-09-13 19:46
Flume+Kafka+Flink+Redis构建大数据实时处理系统:实时统计网站PV、UV展示
1.
大数据处理
的常用方法
大数据处理
目前比较流行的是两种方法,一种是离线处理,一种是在线处理,基本处理架构如下:在互联网应用中,不管是哪一种处理方式,其基本的数据来源都是日志数据,例如对于web应用来说,
weixin_33670713
·
2020-09-13 18:39
Cloudera Manager CDH 5.12
大数据处理
平台部署指南
ClouderaManagerCDH5.12部署指南官方共给出了3中安装方式。第一种方法必须要求所有机器都能连网,由于各种网络超时错误,基本没法用。第二种方法使用CM的在线yum源,在线下载很多包,同样是超时严重。第三种方法是全离线方式,实际情况是也只能用这个。1、ClouderaManager的部署条件CDH不支持在容器中部署。支持OracleJDK7,目前可使用的最新版本为1.7u80,C5.
运维个西瓜
·
2020-09-13 18:34
大数据处理
框架之:Storm + Kafka + zookeeper 集群
Stormkafkazookeeper集群我们知道storm的作用主要是进行流式计算,对于源源不断的均匀数据流流入处理是非常有效的,而现实生活中大部分场景并不是均匀的数据流,而是时而多时而少的数据流入,这种情况下显然用批量处理是不合适的,如果使用storm做实时计算的话可能因为数据拥堵而导致服务器挂掉,应对这种情况,使用kafka作为消息队列是非常合适的选择,kafka可以将不均匀的数据转换成均匀
李大瑞瑞儿
·
2020-09-13 17:19
大数据实时分析
实时查询
Storm实时分析处理
kafka集群
上一页
25
26
27
28
29
30
31
32
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他