E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
mapreduce运行日志
canopy算法流程_python实现Canopy算法
Canopy聚类序前两个月在做项目突然发现Canopy算法发现网上直接用python实现的不多,因为Mahout已经包含了这个算法,需要使用的时候仅需要执行Mahout几条命令即可,并且多数和
MapReduce
weixin_39765840
·
2023-01-23 07:37
canopy算法流程
一些场景题
一些硬核实操题从一百万条搜索记录中,寻找出现次数最多的10条这种问题核心感觉还是一个分治的思想,也就是一个
mapReduce
的思想。
70pice
·
2023-01-22 23:34
学习
java
大数据 - 大数据开发技术课程总结(未完)
1.课程介绍大数据开发课程主要从了解大数据概念、特征开始,再介绍大数据Java开发和Hadoop的环境配置,较为全面地讲解了HDFS分布式存储,
MapReduce
分布式计算框架,Spark平台开发和Scala
陈杉菜
·
2023-01-22 19:40
#
大数据开发
大数据
spark
hadoop
MapReduce
编程模型:用
MapReduce
进行大数据分析
说明:通过本文对
MapReduce
编程模型循序渐进的说明,你可以对
MapReduce
工作机制有一个总体上的很好的把握,是来自IBMdeveloperWorks的一篇非常好的文章(转载)!
diaoqi5743
·
2023-01-20 14:14
大数据
java
数据结构与算法
错误: 找不到或无法加载主类 org.apache.hadoop.
mapreduce
.v2.app.MRAppMaster
目录报错信息:说明:报错截图:解决步骤1.输出路径信息(运行代码)2.复制上面输出的路径,添加到hadoop下面的yarn-site.xml里面3.每个节点都要添加相应的信息(完成后重启集群)4.继续运行jar包5.验证结果报错信息:Containerexitedwithanon-zeroexitcode1.Errorfile:prelaunch.err.错误:找不到或无法加载主类org.apac
qq_58392257
·
2023-01-20 13:11
hadoop
mapreduce
apache
hdfs
大数据
Spark 在 KaiwuDB 中的应用与实践
走进Spark1、Spark介绍(1)Spark是用于大规模数据处理的统一分析引擎;(2)运行速度快:Spark使用先进的DAG执行引擎,以支持循环数据流与内存计算,基于内存的执行速度可比Haddop
MapReduce
·
2023-01-19 15:33
spark数据库
大数据系统——Hive-A Warehousing Solution Over a Map-Reduce Framework论文分享
Hadoop上可以运行
MapReduce
,但是
mapreduce
编程模型的级别非常低,难以维护和重用。Hive是一种基于Hadoop构建的开源数据仓库解决方案。Hive支持类似SQL的声明性语言查询
应该叫什么名字
·
2023-01-17 15:31
数据仓库
sql
大数据
hive
大数据工具——Hive(基础)
本质Hive的本质是将HQL转换成
MapReduce
任务,完成整个数据的分析查询,减少编写
MapReduce
的复杂度。二、Hive的优缺点优点1.学习成本低:提
NoMissU
·
2023-01-17 15:31
大数据
hadoop
hive
数据库
mysql
MapReduce
编程
一、
MapReduce
编程规范
MapReduce
的开发一共又八个步骤,其中Map阶段分为2个步骤,Shuffle阶段4个步骤,Reduce阶段分为2个步骤。
HeiSeXingYe
·
2023-01-17 09:22
hadoop
mapreduce
大数据
【pyqt5】实时显示程序
运行日志
输出,不用多线程
实时的运行结果输出:#用button指向此函数defprintABCD(self):a='*'foriinrange(1,10000):text='第'+str(i)+'次输入内容'+a*i+'\n'self.labelruning.append(text)#labelruning可以是文本部件或标签部件QApplication.processEvents()#实时刷新界面time.sleep(0
不要叫我地扒哥
·
2023-01-16 16:30
python
tensorflow
pytorch
caffe
MapReduce
迭代计算之网页评价PageRank案例
学习这个案例的目的:掌握mr程序是可以进行迭代计算的,但是要给它一个停下来的标准。PageRank是什么PageRank(网页排名)是Google提出的算法,用于衡量特定网页相对于搜索引擎索引中的其他网页而言的重要程度,是Google对网页重要性、价值的评估。是Google创始人拉里·佩奇和谢尔盖·布林于1997年创造的。PageRank实现了将链接价值概念作为排名因素。http://pr.chi
「已注销」
·
2023-01-16 15:19
MapReduce
初识Hadoop架构
初识hadoopGoogle的“三驾马车“HDFSYARN
MapReduce
持续更新…………Google的“三驾马车“GFS即TheGoogleFileSystem,描述了一个分布式文件系统的设计思路。
阿楷不当程序员
·
2023-01-16 10:47
笔记
hadoop
hdfs
hbase
大数据
mapreduce
Google
MapReduce
中文版阅读心得之什么是
mapreduce
1.
mapreduce
主要应用在什么地方
mapreduce
是谷歌给出的使用分布式计算机计算超大规模数据集的一种解决方案,是一种编程模型。
时代新人0-0
·
2023-01-14 10:49
论文阅读总结
分布式
mapreduce
大数据学习笔记(一):Hadoop笔记2
提示:有一些是参考了他人的总结,第二份笔记主要是对HDFS进行一个总结,后续将对
mapreduce
及其他环节进行详细的介绍和总结,整个大数据的路线将以python为主,有错误的地方欢迎批评指正。
WeXn
·
2023-01-14 08:38
大数据
hadoop
大数据
学习
python
HiveSQL原理和优化详解
HiveSQL编译成
MapReduce
过程编译SQL的任务是在上节中介绍的COMPILER(编译器组件)中完成的。
000X000
·
2023-01-13 15:19
数据仓库
大数据
HIVE
HiveSQL原理和优化详解
Hive
HiveSQL
一步步教你Hadoop多节点集群安装配置
以Hadoop分布式文件系统HDFS(HadoopDistributedFilesystem)和
MapReduce
(Google
MapReduce
的开源实现)为核心的Hadoop为用户
langwuzhe
·
2023-01-13 09:04
hadoop
hadoop
大数据核心框架Hadoop
Hadoop两大核心框架HDFS与
MapReduce
的原理、发展情况、常见操作与行业应用Hadoop简介1、什么是Hadoop?
爱吃香菜的斌斌
·
2023-01-12 21:36
大数据
hadoop
大数据---Hadoop集群搭建学习(干货)
文章目录Hadoop集群搭建学习1Hadoop发展史2Hadoop三大发行版本3Hadoop的优势(4高)4Hadoop组成(面试重点)5HDFS架构概述6
MapReduce
架构概述7大数据技术生态体系
yidianyidei
·
2023-01-12 21:06
分布式
大数据
hadoop
大数据 hadoop
旗下的一套开源软件平台2.HADOOP提供的功能:利用服务器集群,根据用户的自定义业务逻辑,对海量数据进行分布式处理3.HADOOP的核心组件有A.HDFS(分布式文件系统)B.YARN(运算资源调度系统)C.
MAPREDUCE
DHRJFH
·
2023-01-12 21:33
大数据
hadoop
【大数据hadoop】基于centos7搭建haoop与hive
这些SQL语句最终会翻译成
MapReduce
程序执行。Hive
逆风飞翔的小叔
·
2023-01-12 21:03
大数据
运维工具
hive
centos7搭建hadoop
centos搭建hadoop3
centos7搭建hive
centos7搭建hive3
阿里云搭建hadoop3
03 Hive概述
Hive本质:将HQL转化成
MapReduce
程序Hive处理的数据存储在HDFSHive分析数据底层的
长不大的大灰狼
·
2023-01-12 12:29
大数据
hive
hadoop
大数据
02 Hadoop概述
Hadoop概述1、Hadoop是什么2、Hadoop版本3、HDFS、YARN、
MapReduce
(1)HDFS(2)YARN(3)
MapReduce
(3)Hadoop模块之间的关系1、Hadoop是什么是一个由
长不大的大灰狼
·
2023-01-12 11:59
大数据
hadoop
大数据
hive
尚硅谷 SparkSQL 3.0
概述SparkSQL是Spark用于处理结构化数据的一个模块这里的机构化数据就是值类似数据库的二维数据表1.2HiveandSparkSQLSparkSQL的前身是Shark,给熟悉后端开发但又不理解
MapReduce
紫金小飞侠
·
2023-01-12 10:16
#
Spark
大数据技术之SparkSQL介绍
我们已经学习了Hive,它是将HiveSQL转换成
MapReduce
然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于
MapReduce
这种计算模型执行效率比较慢。
尚硅谷铁粉
·
2023-01-12 10:46
大数据
hadoop
hive
大数据技术之SparkSQL(一)-spark sql 的介绍,特点,Data Frame,DataSet的介绍
我们已经学习了Hive,它是将HiveSQL转换成
MapReduce
然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于
MapReduce
这种计算模型执行效率比较慢。所有Sp
2401号行者
·
2023-01-12 10:44
spark
大数据
大数据技术之SparkSql
1.2HiveandSparkSQLSparkSQL的前身是Shark,给熟悉RDBMS但又不理解
MapReduce
的技术人员提供快速上手的工具。
大数据翻身
·
2023-01-12 10:12
spark
big
data
scala
sql
大数据技术之SparkSQL(一)概述
我们已经学习了Hive,它是将HiveSQL转换成
MapReduce
然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于
MapReduce
这种计算模型执行效率比较慢。
BAO7988
·
2023-01-12 10:04
大数据
大数据
spark
大数据技术之SparkSQL(超级详细)
它是将HiveSQL转换成
MapReduce
然后提交到集群上执行,大大简化了编写MapReduc的程序的复杂性,由于
MapReduce
这种计算模型执行效率比较慢。所以SparkSQL的应运而生,
星川皆无恙
·
2023-01-12 10:03
大数据
Hadoop
spark
大数据
hive
spark
hadoop
Flink
2006年2月诞生的Hadoop中的
MapReduce
,2014年9月份诞生的Storm以及2014年2月诞生的Spark都有着各自专注的应用场景。
祈人之忧
·
2023-01-12 10:45
BigData
sql
hadoop
database
flink
scala
【第98期】终于有人把Flink设计理念与基本架构讲明白了
导读:本文从设计理念的角度将Flink与主流计算引擎Hadoop
MapReduce
和Spark进行对比,并从宏观上介绍Flink的基本架构。
hzbooks
·
2023-01-12 10:12
分布式
大数据
编程语言
hadoop
数据库
【机器学习】分布式机器学习原理及实战(Pyspark)
自2003年Google公布了3篇大数据奠基性论文,为大数据存储及分布式处理的核心问题提供了思路:非结构化文件分布式存储(GFS)、分布式计算(
MapReduce
)及结构化数据存储(BigT
风度78
·
2023-01-11 19:15
人工智能
机器学习
深度学习
大数据
编程语言
HBase学习笔记
HDFS来源Google的GFS
MapReduce
来源Google的
MapReduce
HBase来源Go
LvJinYang
·
2023-01-11 15:12
大数据
HBase
ANSYS APDL学习(4):ANSYS 基本介绍
来源笔记Ansys数据库命令Lockfile:Errorfile:OutputfileResultsfile保存ansys的文件和结果Archivingmodels档案模型重新
运行日志
文件rerunninglogfiles
娱乐至上2091
·
2023-01-11 15:04
ANSYS
学习
Hadoop基准测试
测试读写性能#-write写入#-nrFiles指定写入到文件数#-fileSize10MB指定写入到文件大小hadoopjar/export/server/hadoop-3.1.4/share/hadoop/
mapreduce
识途老码
·
2023-01-11 11:22
Hadoop
hadoop
大数据
mapreduce
Hadoop初体验
Hadoop初体验HDFS初体验shell命令操作WebUI页面操作思考Hadoop
MapReduce
+YARN初体验计算圆周率Pi的值--官方示例词频统计--官方示例通过webui查看运行结果HDFS
识途老码
·
2023-01-11 11:21
Hadoop
hadoop
大数据
mapreduce
hdfs
【转载】sqoop导入导出到mysql,hbase,hive,hdfs系统,多表关联倒出例子
Sqoop中一大亮点是可以通过Hadoop的
mapreduce
把数据从关系型数据库中导
CSDN_Shaw
·
2023-01-11 08:02
MySQL那些事儿
hive
mysql
hdfs
使用
MapReduce
求出各年销售笔数、各年销售总额
1)将上面的数据文件上传到hdfshdfsdfs-putsales.csv/input/2)采用Eclipse/IDEA创建一个Maven工程,同时修改pom.xml文件,增加dependencies,/dependencies、build,/build节点,内容如下:org.apache.hadoophadoop-common2.7.7org.apache.hadoophadoop-hdfs2.
FR52
·
2023-01-10 11:55
java
大数据
mapreduce
hadoop
hdfs
东北大学2023分布式操作系统实验
2.Hadoop简介2.1Hadoop项目基础结构在其核心,Hadoop主要有两个层次,即:加工/计算层(
MapReduce
)存储层(Hadoop分布式文件系统)除了上面提到的两个核心组件,Hadoop
加油呀,哒哒哒
·
2023-01-10 10:48
分布式操作系统
分布式
hadoop
hdfs
Tensorflow之TFRecord的原理和使用心得
Hive作为构建在HDFS上的一个数据仓库,它本质上可以看作是一个翻译器,可以将HiveSQL语句翻译成
MapReduce
程序或Spark程序,因此模型需要的数据例如csv/libsvm文件都会保存成Hive
程序员对白
·
2023-01-10 08:47
程序人生
人生经验
面试
职场和发展
java
Mapreduce
生成Hfile文件,加载到hbase问题汇总
Hfile在hbase表中的底层数据形式:默认default下面1、Can'tgetmasteraddressfromZooKeeper;znodedata==nullhbase(main):001:0>listTABLEERROR:Can'tgetmasteraddressfromZooKeeper;znodedata==nullHereissomehelpforthiscommand:List
鲲鹏小飞猪
·
2023-01-08 10:20
Hadoop生态
java工具使用
武汉理工大学 大数据架构与模式期末复习
代码算法部分没有列出,重点大概为网络爬虫,跳表布隆过滤器和
MapReduce
的算法,稍微上网查查就能找到代码,不
安_荼生
·
2023-01-08 10:46
big
data
hdfs
mapreduce
大数据之Hadoop企业级生产调优手册(下)
面试“获取更多惊喜《大数据之Hadoop企业级生产调优手册(上)》5HDFS—存储优化5.1纠删码5.2异构存储(冷热数据分离)6HDFS—故障排除6.1集群安全模式6.2慢磁盘监控6.3小文件归档7
MapReduce
王知无(import_bigdata)
·
2023-01-08 07:27
大数据
分布式
hadoop
spark
java
大数据面试通关手册|Spark面试题(一)
Spark通常来说,Spark与
MapReduce
相比,Spark运行效率更高。请说明效率更高来源于Spark内置的哪些机制?hadoop和spark使用场景?spark如
王知无(import_bigdata)
·
2023-01-07 15:08
大数据面试通关手册
大数据
大数据面试通关手册|Hadoop面试系列之优化
1、
MapReduce
跑得慢的原因?
Mapreduce
程序效率的瓶颈在于两点:1)计算机性能CPU、内存、磁盘健康、网络2)I/O操作优化(1)数据倾斜(2)map和red
王知无(import_bigdata)
·
2023-01-07 15:38
大数据面试通关手册
大数据
大数据面试通关手册|Hadoop系列之
MapReduce
⭐⭐欢迎关注博客主页:https://blog.csdn.net/u013411339⭐⭐欢迎点赞收藏⭐留言,欢迎留言交流!⭐⭐本文由【王知无】原创,首发于CSDN博客!⭐⭐本文首发CSDN论坛,未经过官方和本人允许,严禁转载!1、谈谈Hadoop序列化和反序列化及自定义bean对象实现序列化?1)序列化和反序列化(1)序列化就是把内存中的对象,转换成字节序列(或其他数据传输协议)以便于存储(持久
王知无(import_bigdata)
·
2023-01-07 15:07
大数据面试通关手册
大数据
面试
python大数据hadoop_Python+Spark 2.0+Hadoop 机器学习与大数据实战pdf,9787302490739下载
编辑推荐1.Hadoop集群安装与分散式运算和存储介绍通过实机操作,学会如何安装VirtualBox、UbuntuLinux、Hadoop单机与多台机器集群安装,并学会使用HDFS分散式存储与
MapReduce
weixin_39862382
·
2023-01-07 14:42
python大数据hadoop
大数据学习笔记之Spark:Spark基础解析
Google就是处理大数据的,网页和网页之间有很多的关联关系,为了处理排序啊这些算法,所以Google就发明了,Google就发布了三个论文,基于这三个论文的开源,实现了Hadoop、Hdfs、
MapReduce
BAO7988
·
2023-01-07 14:32
大数据
大数据
大数据开发
大数据入门
spark
大数据分析
漏洞复现----50、Couchdb 垂直权限绕过漏洞(CVE-2017-12635)
它使用JSON存储数据,使用
MapReduce
作为其查询语言的JavaScript,以及作为API的HTTP。Erlang的JSON解析工具:Jiffy
七天啊
·
2023-01-07 07:24
渗透测试
#
漏洞复现
Couchdb
垂直权限绕过
CVE-2017-12635
在hadoop集群上编写
mapreduce
程序_Hadoop集群安装系列------伪分布式安装(根据官方文档编写)...
1.预备简单理解hdfs的原理hdfs的作用2.开始搭建2.1设置配置信息修改hadoop-env.sh文件将hadoop-env.sh文件中的#Thejavaimplementationtouse.下修改成:exportJAVA_HOME=${JAVA_HOME}exportJAVA_HOME=/root/bigdata/jdk修改core-site.xml文件#etc/hadoop/core-
weixin_39595537
·
2023-01-06 19:38
org.apache.hadoop.yarn.api.records.LocalResource.setShouldBeUploadedToSharedCache(Z)V
在运行Hbase和
Mapreduce
结合案例时,出现Exceptioninthread“main”java.lang.AbstractMethodError:org.apache.hadoop.yarn.api.records.LocalResource.setShouldBeUploadedToSharedCache
THIS_GIRL
·
2023-01-06 15:25
mapreduce
hbase
上一页
58
59
60
61
62
63
64
65
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他