E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
MongoBD大数据处理
Python学习笔记(1)——Python简介以及开发环境的搭建
4.Python的应用:(1)web开发(2)
大数据处理
Pyt
岳野
·
2020-07-08 18:12
学习笔记
Lan分享的策略研发岗
职位要求:1、优秀的代码能力,掌握常用编程语言和算法;2、对推荐系统、机器学习和
大数据处理
感兴趣,熟悉其中一项或者多项;3、2年以上工
TonyLan
·
2020-07-08 18:48
大数据处理
的一些总结和应用(有关舆情监控)
说到
大数据处理
可能大家都不会陌生,这是近年来非常火热的话题,各行各业都想借助大数据为自己助力,有了这个工具,就好像在飞机上看农田一般清晰,一目了然,也也就是业内人士常说的大数据提供了一个------上帝视角大数据的概念
weixin_34198762
·
2020-07-08 17:24
java面试-垃圾回收器谈谈你的理解
2、并行垃圾回收器(Parallel)多个垃圾收集线程并行工作,此时用户线程是暂停的,用于科学计算、
大数据处理
等弱交互场景。3、并发
weixin_30532837
·
2020-07-08 13:33
经典算法题:
大数据处理
常见算法题
第一部分、十道海量数据处理1、海量日志数据,提取出某日访问百度次数最多的那个IP。此题,在我之前的一篇文章算法里头有所提到,当时给出的方案是:IP的数目还是有限的,最多2^32个,所以可以考虑使用hash将ip直接存入内存,然后进行统计。再详细介绍下此方案:首先是这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中。注意到IP是32位的,最多有个2^32个IP。同样可以采用映射的方法
苍痕
·
2020-07-08 12:57
经典算法题
DFSClient技术内幕 (DFSClient介绍以及其初始化)
注:hadoop版本0.20.2,有童鞋表示看代码头晕,所以本文采用纯文字描述,哥还特意为你们把字体调调颜色噢^o^大家都知道,hadoop是最优秀的
大数据处理
框架之一,而本文研究的DFSClient是
天然呆的技术博客
·
2020-07-08 10:24
hadoop技术内幕
线上安装mongoDB
注意:如果你使用sudoyuminstall-ymongodb-org命令能直接安装
mongoBD
,则可以不继续阅读本文本文所用到的环境:服务器OS:CentOS6.8X64本机:MacOS本文所安装的
xexiaoyi
·
2020-07-08 09:22
腾讯大数据之新一代资源管理与调度平台
数据平台部的TDW,是腾讯自主研发,支持百PB级的数据存储和计算,提供海量、高效、稳定的大数据平台支撑和决策支持,成为腾讯
大数据处理
的核心平台。
Daemon_1994
·
2020-07-08 09:50
server
design
云计算课程详解
——2013年6月传智播客推出了7天的云计算之
大数据处理
hadoop课程,经过2年的深入研究及打磨,2015年5月传智播客正式向外推出云计算高薪就业课程。
有种生活叫慢节奏
·
2020-07-08 09:27
Hadoop
Apache Flink现在在
大数据处理
方面
我们是否还需要另外一个新的数据处理引擎?当我第一次听到flink的时候这是我是非常怀疑的。在大数据领域,现在已经不缺少数据处理框架了,但是没有一个框架能够完全满足不同的处理需求。自从Apachespark出现后,貌似已经成为当今把大部分的问题解决得最好的框架了,所以我对另外一款解决类似问题的框架持有很强烈的怀疑态度。不过因为好奇,我花费了数个星期在尝试了解flink。一开始仔细看了flink的几个
tao_wei162
·
2020-07-08 07:31
大数据学习必须掌握的五大核心技术有哪些?
首先给出一个通用化的
大数据处理
框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。
yoku酱
·
2020-07-08 05:45
黑马头条推荐系统
方向应用项目目标熟练账务推荐系统的实时推荐业务流熟练账务推荐系统lambda分布式计算工具、存储工具使用熟练账务黑马推荐离线计算、在线实时计算解决方案技术架构使用lambda大数据实时和离线计算整体框架大数据Lambda架构Lambda架构是实时
大数据处理
框架将离线计算和实
小猪Piglet
·
2020-07-08 04:17
Hadoop基础与电商行为日志分析 新手入门大数据
第1章大数据概述本章将从故事说起,让大家明白大数据是与我们的生活息息相关的,并不是遥不可及的,还会介绍大数据的特性,以及大数据对我们带来的技术变革,
大数据处理
过程中涉及到的技术以及大数据典型应用。
qq_38454023
·
2020-07-08 00:13
IT干货||大数据关键技术分析
大数据处理
关键技术一般包括:大数据采集、大数据预处理、大数据存储及管理、大数据分析及挖掘、大数据展现和应用(大数据检索、大数据可视化、大数据应用、大数据安全等)。
IT奶爸
·
2020-07-07 23:39
2015十大CMS系统介绍
CSS的模式使的网页更符合标准.评价:这是一套令人爱憎分明的系统,首先它是国内一款开源的系统,2.x的时候功能都已经另它的fans为之疯狂,非常灵活的定制,强大的功能,简洁的操作,但2.x的瓶颈问题:
大数据处理
Page-hy
·
2020-07-07 21:11
cms
网站制作
网站设计
建站系统
网站建设
Spark强大的函数扩展功能
故而,对于一个
大数据处理
平台而言,倘若不能支持函数的扩展,确乎是不可想象的。Spark首先是一个开源框架,当我们发现一些函数具有通用的性质,自然可以考
_张逸_
·
2020-07-07 17:05
智慧城市
智慧城市方案设计初期就能深度整合涉及到的上下游,从上游的服务商供应商,监控摄像头、
大数据处理
平台、各类型大屏厂商、音视频会议终端、网络服务商、云计算云存储服务商等等,再到下游的终端用户、公共交通运输、安防监控天网工程
datamining2005
·
2020-07-07 06:48
产业互联网(2B)
大数据存取的选择:行存储还是列存储?
在已知的几种
大数据处理
软件中,Hadoop的HBase采用列存储,Mongo
程江玉
·
2020-07-07 06:27
30000
看了
大数据处理
,我也希望构建一个数据平台跑跑数据看看结果。学了Linux性能优化,能不能有个集群让我耍耍,各种参数跑一边试试……学完之后,唯有动手实践,东西才能成为自己的。
MacTalk
·
2020-07-07 00:00
大数据方面核心技术有哪些?新人必读
首先给出一个通用化的
大数据处理
框架,主要分为下面几个方面:数据采集与预处理、数据存储、数据清洗、数据查询分析和数据可视化。
大数据交流
·
2020-07-06 22:16
Python 抓取欧洲足球联赛数据进行大数据分析
摘要:背景WebScraping在大数据时代,一切都要用数据来说话,
大数据处理
的过程一般需要经过以下的几个步骤数据的采集和获取数据的清洗,抽取,变形和装载数据的分析,探索和预测数据的展现其中首先要做的就是获取数据
乱蓬头199302
·
2020-07-06 18:29
程序员的进阶OCM
作为一名程序员发展的道路是从前段或者后台向云计算
大数据处理
数据库开发方面转的.银行系统的集中心试的数据处理才能体现一个人的价值.OracleCertifiedMaster(OCM)大师认证资质是Oracle
幻影道哥
·
2020-07-06 17:51
#学习笔记#章二-
大数据处理
架构hadoop-中国MOOC厦大
1.hadoop简介:1.1.hadoop背景与简介开源运行在linux上且用JAVA编写,有良好的跨平台特性。应用可以用多种语言编写。可运行在低端机上,构成集群。1.2.Hadoop应用现状application.png1.3.YARN资源调度,可以用在hadoop,storm,spark上面。1.4.怎么选择合适版本?version.png学生选一个难装的版本,完全是因为我们穷啊,哈哈哈哈哈哈
LeeMin_Z
·
2020-07-06 15:44
Spark 两种方法计算分组取Top N
Spark分组取TopN运算
大数据处理
中,对数据分组后,取TopN是非常常见的运算。下面我们以一个例子来展示spark如何进行分组取Top的运算。
MyStitch
·
2020-07-06 15:00
python常用模块Matplotlib:
大数据处理
之数据可视化绘图
转载自品略图书馆http://www.pinlue.com/article/2020/03/0118/109961853318.html说到数据分析,Python完全能够胜任这方面的工作。Python究竟如何在数据分析领域做到游刃有余?因为它有“四板斧”,分别是Matplotlib、NumPy、SciPy/Pandas。Matplotlib是画图工具,NumPy是矩阵运算库,SciPy是数学运算工
銨靜菂等芐紶
·
2020-07-06 10:37
Python
Storm运行流程的理解
Hadoop进入21世纪,随着社会的快速发展,人类活动产生的数据急速膨胀,同时大量累积的数据最为一项资源受到普遍关注,对大量数据的处理与分析显得很重要,而Hadoop是
大数据处理
领域的佼佼者。
xia0leiXu
·
2020-07-06 09:55
Storm集群的运转流程
大数据技术原理与应用之【
大数据处理
架构Hadoop】习题
1.试述hadoop和谷歌的mapreduce、gfs等技术之间的关系答:Hadoop的核心是分布式文件系统HDFS和MapReduce,HDFS是谷歌文件系统GFS的开源实现,MapReduces是针对谷歌MapReduce的开源实现。2.试述Hadoop具有哪些特性。答:高可靠性,高效性,高可扩展性,高容错性,成本低,运行在Linux平台,支持多种编程语言3.试述Hadoop在各个领域的应用情
Alice菌
·
2020-07-06 05:17
大数据
大数据处理
框架 Hadoop 简介,安装与使用教程——《大数据技术原理与应用》课程学习总结
第二章2.1概述2.1.1Hadoop简介Hadoop是基于Java语言开发的,具有很好的跨平台特性,并且可以部署在廉价地计算机集群中。Hadoop的核心是分布式文件系统(HDFS)和MapReduce。HDFS是针对谷歌文件系统(GFS)的开源实现,是面向普通硬件环境的分布式文件系统,具有较高的读写速度、很好的容错性和可很伸缩性,支持大规模数据的分布式存储,其荣誉数据存储的方法很好地保证了数据的
who is bug
·
2020-07-06 05:22
大数据技术原理与应用
大数据学习笔记 第二章
大数据处理
架构Hadoop
Hadoop简介Hadoop是Apache软件基金会旗下的开源平台可支持多种编程语言——跨平台Hadoop两大核心——HDFS+MapReduce集群分布式处理大型公司都在用。Hadoop具有可靠性Hadoop具有高效性Hadoop具有很好的可扩展性Hadoop具有高容错性Hadoop具有成本低Hadoop的不同版本ApacheHadoopHadoop1.0HDFS与MapReduceHadoop
数据汪东哥
·
2020-07-06 03:12
数据算法 Hadoop/Spark
大数据处理
---第十六章
本章为查找图中的所有三角形查找三角形的算法的思想绘图1.png本章实现方式1.基于MapReduce实现2.基于spark来实现3.基于传统Scala来实现++基于传统MapReduce来实现++1.MapReduce实现的过程image2.MapReduce的实现类image3.Map端代码实现publicclassGraphEdgeMapperextendsMapper{LongWritabl
冷梦颜情
·
2020-07-06 03:09
边缘计算入门与实战
其实如果说云计算是集中式
大数据处理
,边缘计算则可以理解为边缘式
大数据处理
。但不同的是,只是这一次,数据
阿里云小百科
·
2020-07-06 02:20
Xilinx Zynq-7000嵌入式系统设计与实现 学习教程(1)
学习资料下载地址:http://www.edawiki.com开篇体会;Xilinx的ZYNQ系列FPGA是二种看上去对立面的思想的融合,ARM处理器的串行执行+FPGA的并行执行,着力于解决
大数据处理
weixin_34224941
·
2020-07-06 00:38
如何使用Greenplum提高PB级数据处理能力
在
大数据处理
方面,不同技术栈所具备的性能也有所不同。如何快速有效地处理这些体量庞大的数据,令不少开发者为之苦恼。
个推
·
2020-07-05 23:43
greenplum
数据处理
流式
大数据处理
的三种框架:Storm,Spark和Samza
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。ApacheStorm在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(masternode)分发代码,将任务分配给工作节点(workernode)执行。一个拓扑中包括spout和bol
weixin_33806509
·
2020-07-05 23:11
扩展Spark Catalyst,打造自定义的Spark SQL引擎
ApacheSpark是
大数据处理
领域最常用的计算引擎之一,被应用在各种各样的场景中,除了易用的API,稳定高效的处理引擎,可扩展性也是Spark能够得到广泛应用的一个重要原因。
weixin_33744854
·
2020-07-05 22:16
探索Greenplum的实践,了解新一代
大数据处理
利器
前言:近年来,互联网的快速发展积累了海量大数据,而在这些大数据的处理上,不同技术栈所具备的性能也有所不同,如何快速有效地处理这些庞大的数据仓,成为很多运营者为之苦恼的问题!随着Greenplum的异军突起,以往大数据仓库所面临的很多问题都得到了有效解决,Greenplum也成为新一代海量数据处理典型代表。本文结合个推数据研发工程师李树桓在大数据领域的实践,对处理庞大的数据量时,如何选择有效的技术栈
weixin_33691700
·
2020-07-05 22:02
视频教程-Python数据分析案例实战 视频课程-Python
从事多年JAVAEE、
大数据处理
方向的研发,设计和管理工作,擅长分布式开发和实时计算。对Hadoop、Storm、Spark等大数据领域技术框架有一定的实践经验。
weixin_33412540
·
2020-07-05 22:15
视频教程-Python数据可视化 pyecharts实战-Python
从事多年JAVAEE、
大数据处理
方向的研发,设计和管理工作,擅长分布式开发和实时计算。对Hadoop、Storm、Spark等大数据领域技术框架有一定的实践经验。
weixin_33056227
·
2020-07-05 22:14
PHP的高并发和
大数据处理
收集前人的经验。加速学习,解决工作中的难题。一、代码优化(包括sql语句的优化),合理的使用索引,避免整表查询。二、日常海量数据处理我用文件缓存,文件缓存分两种,第一种是最常见的生成html静太文件,除非数据有变动不然是不会查询数据库,其次.html文件更容易被搜索引擎收录,生成静太缓存也是有讲究的,最好是把生成的文件分布一下,别把生成的几百万个文件都放在一个目录里。第二种是对于使用高频率的数据生
weixin_30773135
·
2020-07-05 21:37
世纪云平台打造无人值守一站式智能化酒店
世纪云平台是世纪晟科技通过自主研发的人脸识别及生物形体检测算法为供应商支撑,以分布式数据管理理念为建设框架,以PAAS服务为核心,以人工智慧大脑为未来发展目标而打造的一款基于大数据云计算处理及数据精准分析的
大数据处理
平台
Computer丶小捷
·
2020-07-05 21:36
边缘计算:万物互联时代新型计算模型
背景目前,
大数据处理
已经从以云计算为中心的集中式处理时代(把2005-2015年称之为集中式
大数据处理
时代)正在跨入以万物互联为核心的边缘计算时代(称之为边缘式
大数据处理
时代)。
weixin_30449239
·
2020-07-05 20:14
Hadoop专业解决方案之构建Hadoop企业级应用
传统方式的应用构建是基于数据存储在不支持
大数据处理
的基础之上。
weixin_30292843
·
2020-07-05 20:22
视频教程-19全新mysql教程零基础入门实战精讲mysql视频DBA数据库视频教程SQL教程-MySQL...
教程7年的开发架构经验,曾就职于国内一线互联网公司,开发工程师,现在是某创业公司技术负责人,擅长语言有node/java/python,专注于服务端研发,人工智能相关领域,熟悉分布式高可用系统的架构,
大数据处理
weixin_27866807
·
2020-07-05 20:08
【结构化思考】边缘计算架构 3D模型参考
彼得莱文随着数据量的继续增加以及数据处理多样化的要求,基于云端的
大数据处理
面临诸多挑战。以当下火热的自动驾驶汽车为例,从产品形态上看,自动驾驶汽车更像是一个「移动数据中心」。
东海陈光剑
·
2020-07-05 19:20
Spark 问题汇总
在大数据领域,spark是一个比较受欢迎的
大数据处理
平台,但是由于数据量过大等一系列问题,造成任务执行不成功,现在总结个人在工程实践中遇到的一些个奇葩问题.1.数据倾斜问题现象:1.可能会报资源不足,内存溢出
算法小白_gyl
·
2020-07-05 18:29
计算机
云计算
Spark
数据处理
OLAP引擎这么多,为什么苏宁选择用Druid?
51CTO传媒2018-12-2111:24:12【51CTO.com原创稿件】随着公司业务增长迅速,数据量越来越大,数据的种类也越来越丰富,分析人员对数据处理的响应延时要求也越来越高,传统的
大数据处理
工具已经无法满足业务的需求
师太,老衲把持不住了
·
2020-07-05 16:23
日志采集框架Flume
在一个完整的
大数据处理
系统中,除了hdfs+mapreduce+hive组成分析系统的核心之外,还需要数据采集、结果数据导出、任务调度等不可或缺的辅助系统,而这些辅助工具在hadoop生态体系中都有便捷的开源框架
缘定三石
·
2020-07-05 14:11
Flume实战
物联网、车联网、工业互联网大数据平台,为什么推荐使用TDengine?
这些软件较好的解决了通用大数据问题,但是物联网、车联网、工业互联网等场景的数据有其独特性,如果充分利用这些独特之处,可以推出一个专有的物联网
大数据处理
平台,数
涛思数据
·
2020-07-05 14:17
初识 Flink
目前比较流行的
大数据处理
引擎ApacheSpark,基本上已经取代了MapReduce成为当前
大数据处理
的标准。
花未全开*月未圆
·
2020-07-05 13:00
细数云计算产品和技术-Salesforce
云计算的使用场景有很多,例如:IDC云,企业云,云存储系统,虚拟桌面云,开发测试云,
大数据处理
云,协作云,游戏云。不同场景使用的核心技术略有不同。
风中的大苹果Martecher
·
2020-07-05 11:39
上一页
37
38
39
40
41
42
43
44
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他