E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MongoBD大数据处理
研究生才开始学习数据挖掘来得及吗?
打好基础(算法设计与分析;数学:概率论;数据挖掘基础)学习机器学习十大经典算法(原理,实现,思考),推荐斯坦福的公开课学点相关学科(统计学)确定一个研究方向,多看论文看一点
大数据处理
的基础知识多参加数据挖掘方面的比赛
小科的IT
·
2020-07-04 00:53
职业感想
零基础如何快速学好大数据?
那
大数据处理
技术怎么学习呢?首先我们要学习Java语言和Linux操作系统,这两个是学习大数据的基础,学习的顺序不分前后。Java:大家都知道Java的方向有JavaSE、Ja
qq_27513477
·
2020-07-02 17:28
大数据
大数据
java
Apache Flink 简介和编程模型
ApacheFlink是一个同时支持分布式数据流处理和数据批处理的
大数据处理
系统。
MasterT-J
·
2020-07-02 16:18
实时流处理
Flink框架
第三代
大数据处理
方案Flink
被人们称为第三代
大数据处理
方案。该计算框架和Spark设计理念出发点恰好相反。
鹏飞九万里
·
2020-07-02 14:10
第一章初识hadoop
——gracehopper数据
大数据处理
和分析要解决的第一个问题是硬盘存储失败。第二个问题是大多数的分析任务应该能够通过某种途径集合成数据。从一个硬盘读出来的数据,可能需要和其它99个硬盘的数据集成。
maixia24
·
2020-07-02 11:03
Hadoop权威指南第二版翻译
python 字典处理的一些坑
问题背景:这两天用python做
大数据处理
,抽取每个文本单词,进行统计排序。数据大概有2000万个,利用python多进程处理。数据同步用的python多进程通信中比较常使用的ManagerDict。
GThyton
·
2020-07-02 11:09
从第一行代码到20万行开源,我已经走过了三年
我得意地告诉参会的朋友们,我不想做天使投资人,而是要重出江湖,亲自操刀,写一个巨牛的专门针对物联网场景的
大数据处理
引擎,希望今后世界上90%的数据都用我陶建
陶建辉(Jeff)
·
2020-07-02 06:27
大数据入门到精通学习宝典
大数据处理
技术怎么学习呢?在做大数据开发之前,因为Hadoop是高层次的语言开发,需要懂得Java或者Python,很快的就能上手。其实大数据并不是一种概念,而是一种方法论。
小迪和夫人
·
2020-07-02 05:00
大数据
用Apache Spark进行
大数据处理
from:http://www.infoq.com/cn/articles/apache-spark-sqlSparkSQL,作为ApacheSpark大数据框架的一部分,主要用于结构化数据处理和对Spark数据执行类SQL的查询。通过SparkSQL,可以针对不同格式的数据执行ETL操作(如JSON,Parquet,数据库)然后完成特定的查询操作。在这一文章系列的第二篇中,我们将讨论SparkS
iteye_13851
·
2020-07-02 04:30
Spark篇
[Flink课程]---- 1.2 Flink 和 Spark 的对比
introduction-to-flink-for-spark-developers-flink-vs-spark/面向Spark开发人员的ApacheFlink简介:FlinkvsSpark世界还需要另一个
大数据处理
系统吗
highfei2011
·
2020-07-02 02:44
Spark
Flink
一共81个,开源
大数据处理
工具汇总
原文出处:36大数据:一共81个,开源
大数据处理
工具汇总(上)36大数据:一共81个,开源
大数据处理
工具汇总(下),包括日志收集系统/集群管理/RPC等第一部分查询引擎一、Phoenix贡献者::Salesforce
小虾米有鲨鱼梦
·
2020-07-02 00:08
hadoop
ubuntu14.04 安装JDK1.8
在我看来,java特别适合做大型软件(web服务,
大数据处理
等),而C++特别适合系统级开发(操作系统级别,游戏,图像处理等),这里并非想挑起语言圣战,只是表
光速跑者21
·
2020-07-02 00:52
linux
java
Flink分析使用之十底层RPC的实现
一、介绍Flink是分布式
大数据处理
框架,那么网络通信就离不开了,从目前来看,几乎所有的开源的大型软件,尤其是Java的,基本已经不再倾向于自己写底层网络通信,毕竟有很多可以使用的Rpc网络通信框架可以来完善使用
fpcc
·
2020-07-02 00:34
大数据
flink
征信
大数据处理
和征信大数据挖掘分析技术的介绍
征信数据的形成渠道多样,并且数据种类和数据结构也非常复杂。从征信数据的渠道来源来说,有来自政府的公开信息,也有从市场采集的信息;从征信数据的数据种类来说,有金融交易数据、市场交易数据,也有不少社交行为数据;从征信数据的数据结构来说,有结构化的数据,如数据库里的行数据,也有非结构化的数据,如视频、图像、文本等。1.征信大数据的数据加工过程总体来说,征信行业大数据应用实施的演变过程可以分为四个阶段:第
duozhishidai
·
2020-07-01 23:32
大数据
Python网络爬虫与信息提取
课程内容是进入
大数据处理
、数据挖掘、以数据为中心人工智能领域的必备实践基础。“Python网络爬虫与数据分析”课程由“Python网络爬虫与信息提
di_pingxian
·
2020-07-01 22:19
读秒分析报告一
其次,读秒同时也指“读秒”产品背后的公司(于2016年6月2日成立),是一家智能信贷服务方案提供商,读秒依托PINTEC集团的
大数据处理
和金融科技的研发能力,为各类型合作伙伴提供一整套的全流程的智能信贷解决方案
可飞
·
2020-07-01 21:17
一文读懂大数据:Hadoop,大数据技术及相关应用
主要内容·1来自Wikibon社区的大数据宣言·2数据处理与分析:传统方式·3大数据性质的变化·4
大数据处理
和分析的新方法4.1Hadoop4.2NoSQL4.3大规模并行分析数据库·5大数据方法的互补
beyound507
·
2020-07-01 18:32
读书笔记之大数据计算模式
大数据计算模式:根据大数据的不同特征和计算特征,从多样性的大数据计算问题和需求中提炼并建立的各种高层抽象或模型,传统的并行计算方法主要从体系结构和编程语言层面定义了一些较为底层的并行计算抽象和模型,但由于
大数据处理
问题具有很多高层的数据特征和计算特征
阿默mini
·
2020-07-01 17:00
#
大数据技术及应用教程
大数据
hadoop
大数据处理
平台与案例
整个
大数据处理
技术的核心基础hadoop、mapreduce、nosql系统,而这三个系统是建立在谷歌提出的大表、分
adnb34g
·
2020-07-01 16:39
hadoop
Flink on yarn应用部署
传统的
大数据处理
架构已经无法满足当前企业的发展,这个时候流式架构的出现,让企业的数据能够在较短的时间内处理快速响应迭代,满足企业各种场景下的不同需求。Flin
MrZhangBaby
·
2020-07-01 11:35
大数据
Flink
大数据基础文献综述
前者介绍了大数据的产生、分析了大数据的处理流程,并提出了大数据所面临的若干挑战,而后者介绍了大数据的基本概念,阐述其同传统数据库的区别,对
大数据处理
框架进行了详细解析,并展开介绍了大数据时代不可或缺的云计算技术
H114754726
·
2020-07-01 09:27
(转发)
大数据处理
架构系列三:原来如此简单,HADOOP原理解读
备注:转发地址https://baijiahao.baidu.com/s?id=1622979386736660543&wfr=spider&for=pc写在前面的话:不要被技术吓到哦,本文尽量写的白话,致力为从事大数据的运营、咨询规划、需求以及想学习大数据的入门者提供知识分享@……@首先阐述两个事实,然后再针对事实来引出问题的解决方案,以更好的帮助我们来理解Hadoop处理架构:1、数据现状:2
大佛拈花
·
2020-07-01 09:01
实时计算在贝壳的实践
**摘要:**ApacheFlink是一个分布式
大数据处理
引擎,可对有限数据流和无限数据流进行有状态计算。
Ververica
·
2020-07-01 06:49
Flink
实时计算
大数据
流量劫持技术2
运用
大数据处理
的相关技术,提供对较长时间跨度的海量网络流量数据进行挖掘分析的能力;结合机器学习、规则检测、沙箱检测、情报分析等多种威胁检测手段,依据攻击链模型对威胁行为进行关联,构建出一套较为完善的APT
weixin_34015336
·
2020-07-01 05:01
Apache Flink在滴滴的应用与实践
分享嘉宾:梁李印滴滴出行高级技术专家编辑整理:张策内容来源:FlinkForwardASIA出品平台:DataFunTalk导读:ApacheFlink是一个分布式
大数据处理
引擎,可对有限数据流和无限数据流进行有状态计算
过往记忆
·
2020-07-01 05:09
一共81个,开源
大数据处理
工具汇总(下),包括日志收集系统/集群管理/RPC等
http://www.36dsj.com/archives/25042一共81个,开源
大数据处理
工具汇总(下),包括日志收集系统/集群管理/RPC等诺蓝2015-03-129:40:22大数据工具评论(
me_lawrence
·
2020-07-01 03:49
big
data
大数据处理
入门概念解析
今天我们就从大数据在职培训的角度,来分享一些
大数据处理
入门概念。
huifeideyugo123
·
2020-07-01 02:03
Google后Hadoop时代的新“三驾马车”——Caffeine、Pregel、Dremel整理
MikeOlson是Hadoop运动背后的主要推动者,但这还远远不够,目前Google内部使用的大数据软件Dremel使
大数据处理
起来更加智能。
zzhays
·
2020-06-30 21:18
架构设计
小猪的Python学习之旅 —— 17.Python数据分析:我主良缘交友了解下
引言:本节应该是Python数据分析入门的最后一节了,数据分析的水可是深的很:
大数据处理
,机器学习,深度学习,NLP等,
coder-pig
·
2020-06-30 19:43
Python
小猪的Python学习之旅
flume 1.8 详解
flume的安装部署flume的企业案例三、目标掌握flume的应用场景掌握flume中常用的source、channel、sink使用掌握flume的企业案例四、知识要点1.Flume是什么在一个完整的离线
大数据处理
系统中
cherish-zp
·
2020-06-30 19:20
flume
大数据
O'Reilly精品图书推荐:数据算法:Hadoop/Spark
大数据处理
技巧
书名:数据算法:Hadoop/Spark
大数据处理
技巧作者:MahmoudParsian著译者:苏金国杨健康等译国内出版社:中国电力出版社出版时间:2016年10月页数:696书号:978-7-5123
OReillyData
·
2020-06-30 18:06
用Apache Spark进行
大数据处理
-第一部分:入门介绍
什么是SparkApacheSpark是一个围绕速度、易用性和复杂分析构建的
大数据处理
框架。最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一。
zkf541076398
·
2020-06-30 18:03
Spark
盘点:
大数据处理
必备的十大工具
摘要:随着互联网的愈来愈开放,电子商务平台和社交网络的盛行,导致数据在日益增长,给企业管理大量的数据带来了挑战的同时也带来了一些机遇。随着互联网的愈来愈开放,电子商务平台和社交网络的盛行,导致数据在日益增长,给企业管理大量的数据带来了挑战的同时也带来了一些机遇。下面是用于信息化管理的大数据工具列表:1.ApacheHive:Hive是一个建立在Hadoop上的开源数据仓库基础设施,通过Hive可以
zjxiaolu
·
2020-06-30 18:43
机器学习与数据挖掘
大数据测试学习笔记之hadoop家族
前言在进行大数据测试之前,我们必须了解下
大数据处理
的的相关技术体系,今天主要学习和了解了hadoop家族,这里记录下来分享给大家。
zhusongziye
·
2020-06-30 17:48
大数据和人工智能
开发人员学Linux(14):CentOS7安装配置大数据平台Hadoop2.9.0
当然Hadoop不代表大数据,而是
大数据处理
领域的一个比较有名的开源框架而已,通常说的大数据包含了大数据的存放、大数据的分析处理及大数据的查询展示,本篇提到的Hadoop只不过是在其中的大数据的分析处理环节起作用
周公
·
2020-06-30 16:31
Linux&Open
Source
开发人员学Linux
CentOS
mapreduce
hadoop
云计算
jdk
大数据与云计算相辅相成
在这种情况下,云计算所具备的弹性伸缩和动态调配、资源的虚拟化和系统的透明性、支持多租户、支持按量计费或按需使用,以及绿色节能等基本要素正好契合了新型
大数据处理
技术的需求;而以云计算为典型代表的新一代计算模式
强豪建设
·
2020-06-30 16:16
大数据与云计算相辅相成
Hadoop基础学习
4,
大数据处理
的容错性1)存储容错:RAID冗余磁盘阵列2)计算任务容错:失效节点检测,计算任务迁移,数据定位与获取。
zhanggh900921
·
2020-06-30 13:05
GeoMesa介绍
GeoMesa是由locationtech开源的一套地理
大数据处理
工具套件。其可在分布式计算系统上进行大规模的地理空间查询和分析。
barrycug
·
2020-06-30 12:58
mapreduce 单词统计 案例
mapreduce单词统计案例一、HadoopMapReduce构思体现在如下的三个方面:1.如何对付
大数据处理
:分而治之2.构建抽象模型:Map和ReduceMap:对一组数据元素进行某种重复式的处理
zengxianglei
·
2020-06-30 12:49
大数据
未来从现实走向虚拟
只能转入虚拟世界工作.2.技术已经实现现实与虚拟联通,互联网改变生活不是空谈;2.随着科技的进步,越来越多的劳动力和就业机会将转移到网络虚拟世界,人类只有学会利用虚拟世界,才有事可做,劳有所得,才能活下去;3.
大数据处理
技术正在不断发展成熟
红地龙
·
2020-06-30 12:01
心得
设计
预言
Strom、SparkStreaming以及Flink三种流式框架了解
Storm:Storm是Twitter开源的分布式实时
大数据处理
框架,擅长处理海量数据,适用于数据实时处理而非批处理。
淡定一生2333
·
2020-06-30 12:38
Flink
大数据处理
的五大关键技术及其应用
数据处理是对纷繁复杂的海量数据价值的提炼,而其中最有价值的地方在于预测性分析,即可以通过数据可视化、统计模式识别、数据描述等数据挖掘形式帮助数据科学家更好的理解数据,根据数据挖掘的结果得出预测性决策。其中主要工作环节包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。一、大数据采集技术数据是指通过RFID射频数
阿里十年程序员生活
·
2020-06-30 11:35
大数据
程序员
编程语言
hadoop
大数据与云计算、物联网三者的区别和关联
在
大数据处理
的需求下,出现了许多优秀的云计算平台,例如Apache开源的Hadoop、Google的MapReduce、微软的Dryad等。在处理格式多样的大数据时
阿里十年程序员生活
·
2020-06-30 11:35
大数据
编程语言
hadoop
程序员
大数据处理
技术的总结与分析
在我们实际生活中,事务型数据处理需求非常常见,例如:淘宝网站交易系统、12306网站火车票交易系统、超市POS系统等都属于事务型数据处理系统。一数据分析处理需求分类1事务型处理在我们实际生活中,事务型数据处理需求非常常见,例如:淘宝网站交易系统、12306网站火车票交易系统、超市POS系统等都属于事务型数据处理系统。这类系统数据处理特点包括以下几点:一是事务处理型操作都是细粒度操作,每次事务处理涉
阿里十年程序员生活
·
2020-06-30 11:04
大数据
编程语言
hadoop
程序员
什么是大数据开发?
大数据开发其实分两种,第一类是编写一些Hadoop、Spark的应用程序,第二类是对
大数据处理
系统本身进行开发。第一类工作感觉更适用于dataanalyst这种职位吧,而
非科班大数据工程师
·
2020-06-30 10:27
大数据
Python
大数据处理
代码性能优化
在做
大数据处理
时,可能会涉及到大矩阵运算和并行计算,python原生对这些支持的不是太好,必须要进行优化。
ybdesire
·
2020-06-30 06:24
Python
Machine
Learning
Hadoop的安装与使用
大数据技术原理与应用第二章
大数据处理
架构Hadoop学习指南一、Ubuntu18.04双系统安装1.下载Ubuntu18.042.把U盘格式化为ntfs格式再制作启动盘,否则“安装程序向硬盘复制文件时遇到错误
CongYao666
·
2020-06-30 06:14
数据分析
Python读写Excel文件的三种模块与方式,你都知道吗?
最近在做一些
大数据处理
和分析,本来想着直接用Excel来处理。但后面发现做了很多的重复的数据,感觉没什么意义,还浪费了大把时间跟精力,于是就想着写个小工具帮着处理。
程序员离一
·
2020-06-30 06:26
python
走进大数据 | 深入理解Apache Flink核心技术
ApacheFlink(下简称Flink)项目是
大数据处理
领域最近冉冉升起的一颗新星,其不同于其他大数据项目的诸多特性吸引了越来越多人的关注。
此id已存在
·
2020-06-30 05:56
框架
使用
大数据
技术分享
学习
实时处理
Flink
Apache
基于kylin大数据多维分析功能整合
面对MOLAP,
大数据处理
业界给出来一个比较合适、新兴的
yangbomy
·
2020-06-30 05:17
上一页
39
40
41
42
43
44
45
46
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他