E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop分片
在多台阿里云服务器上部署
Hadoop
分布式系统及WordCount实验
一、实现master与slave之间无密码连接分别在master及slave上生成rsa密钥:mkdir~/.sshcd~/.sshssh-keygen-t-rsa一路回车(选择默认设置),此时,ssh文件夹中生成了id_rsa.pub和id_rsa两个,然后使用scp命令将公钥(id_rsa.pub)分别拷到对方机器中scpid_rsa.pubh1@对方机器IP:~/.ssh/authorize
Clearlove灬Star
·
2024-02-07 05:01
大数据
阿里云
Hadoop
分布式
Wordcount
合肥工业大学2022大数据技术实验二
实验序号及名称:实验二在
Hadoop
平台上部署WordCount程序实验时间∶2022年5月14日预习内容一、实验目的和要求∶在
Hadoop
平台上部署WordCount程序。
一头骇人鲸
·
2024-02-07 05:00
大数据技术
大数据
hadoop
java
hadoop
wordcount代码分析
输入输出文件异常类importjava.util.Iterator;Iterator是迭代器类importjava.util.StringTokenizer;用来对字符串进行切importorg.apache.
hadoop
.fs.Path
姹紫_嫣红
·
2024-02-07 05:57
大数据hadoop
Java
【实验2】在
Hadoop
平台上部署WordCount程序
HDFS6.分布式文件系统HDFS上的编程实践6.1安装Eclipse6.2创建Eclipse工程6.3编写一个Java应用程序检测HDFS中是否存在一个文件7.Eclipse上的HDFS操作7.1安装
Hadoop
-Eclipse
-借我杀死庸碌的情怀-
·
2024-02-07 05:27
hadoop
npm
大数据
centos
分布式
如何将日志文件和二进制文件快速导入HDFS?
日志数据在应用程序中一直很常见,
Hadoop
能够处理生产系统生成的大量日志数据,比如网络设备、操作系统、Web服务器和应用程序的日志数据。
weixin_34159110
·
2024-02-07 05:36
大数据
数据库
python
数据仓库-Hive基础(二)Hive 的基本概念
什么是HiveHive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
做个合格的大厂程序员
·
2024-02-07 03:42
Spark Chapter 8 Spark SQL
DB2,SQLServer在大数据平台上实现大数据计算:Hive/SparkSQL/SparkCore直接使用SQL语句进行大数据分析hive的问题:底层MR,2.x之后可以用spark应用场景SQLon
Hadoop
深海suke
·
2024-02-07 01:34
Hadoop
集群(第10期副刊)_常用MySQL数据库命令
1、系统管理1.1连接MySQL格式:mysql-h主机地址-u用户名-p用户密码举例:例1:连接到本机上的MySQL。首先在打开DOS窗口,然后进入目录mysqlbin,再键入命令"mysql–uroot–p",回车后提示你输密码,如果刚安装好MySQL,超级用户"root"是没有密码的,故直接回车即可进入到MySQL中了,MySQL的提示符是:mysql>。例2:连接到远程主机上的MYSQL。
阿布2
·
2024-02-07 00:08
Hadoop学习之道
hadoop集群
hadoop
mapreduce
集群
数据挖掘
2024-02-06(Sqoop)
1.SqoopApacheSqoop是
Hadoop
生态体系和RDBMS(关系型数据库)体系之间传递数据的一种工具。Sqoop工作机制是将导入或者导出命令翻译成MapReduce程序来实现。
陈xr
·
2024-02-06 23:29
随记日志
sqoop
大数据
java推荐算法_基于内容的推荐算法实现
javapackagecom.oracle.moviecf;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.
hadoop
.conf.Configuration
RED韵
·
2024-02-06 19:54
java推荐算法
文件
分片
上传
当遇到文件太大、网络不好等情况时,如果发生连接中断、挂掉,那整个文件就白传,需要重头再传,这是非常不人性化的用户体验。所以我们可以根据网络情况将文件分成小碎片,最后在服务端将碎片合并,以降低网络传输中断带来的风险。使用worker开启更多线程,优化上传速度index.jsconstfileDom=document.querySelector('input')//设置文件分块大小constCHUNK
AwyaW1217
·
2024-02-06 19:08
前端
javascript
开发语言
ShardingSphere-Proxy5搭建使用
ShardingSphere-Proxy5搭建使用ApacheShardingSphere下的一个产品,定位为透明化的数据库代理端,与mycat类似,所有的
分片
都由其完成。
Echo_bf84
·
2024-02-06 18:22
Spark简介
Spark作为第二代大数据处理工具,跟
hadoop
对比,它是基于内存的,所以在迭代计算方便速度有了很大提升。我用到的主要是SparkCore,SparkSQL,SparkStreaming。
麦克阿瑟99
·
2024-02-06 18:07
Python-列表操作
微信公众号-IT赶路人,关注我,了解更多IT相关信息~~image列表作为Python的基础容器,同时也提供了丰富的访问方法,包括
分片
,乘法,成员资格内建函数等。
分片
分片
是访问某个范围内的元素。
IT赶路人
·
2024-02-06 17:04
图片传输到ipfs节点然后将生成的ipfs访问链接存到区块链
在区块链上直接存储图片不仅时间很长,而且需要进行
分片
和拼接,比较麻烦,我们直接使用ipfs存储图片流程描述:首先在本地搭建ipfs节点,使用go-ipfs版本进行搭建,搭建完之后,使用ipfsdaemon
不想当程序员的STAN
·
2024-02-06 16:07
区块链
web
以太坊
智能合约
去中心化
致IT领域那些忽悠过的概念
这里我要说的是:1:
Hadoop
是大数据解决方案之一,是个代名词,但是不是全部。2:除了少数公司,绝大多数(99.99%)的公
薛晓刚
·
2024-02-06 15:08
数据库
redis:七、集群方案(主从复制、哨兵模式、
分片
集群)和面试模板
redis集群方案在Redis中提供的集群方案总共有三种(一般一个redis节点不超过10G内存)主从复制哨兵模式
分片
集群主从复制(主从数据同步)replid和offsetReplicationId:简称
鸡鸭扣
·
2024-02-06 15:26
redis
redis
面试
java
缓存
Hbase 数据迁移
Hbase数据迁移可选方案对比l已验证方案操作说明:nExport&importu导出命令及示例hbaseorg.apache.
hadoop
.hbase.mapreduce.Export“表名”文件路径导出至本地文件系统
运维那些事儿
·
2024-02-06 14:44
hbase
hbase
hadoop
大数据
ES 增删改查 批量操作
elk101.oldboyedu.com:9200/python-4{"settings":{"index":{"number_of_replicas":1,#副本"number_of_shards":5#
分片
运维那些事儿
·
2024-02-06 14:43
ELK
elasticsearch
python
http
flink学习记录
flink-conf.yaml配置文件:jobmanager.rpc.address:
hadoop
1jobmanager.rpc.port:6123jobmanager.heap.size:512mtaskmanager.heap.size
戏 剧
·
2024-02-06 14:34
flink
Hadoop
命令手册
翻译:http://
hadoop
.apache.org/docs/stable/
hadoop
-project-dist/
hadoop
-common/CommandsManual.html版本:2.9.0
金刚_30bf
·
2024-02-06 13:29
大文件传输解决方案:
分片
上传 / 下载限速
我在项目中遇到过4G左右的文件同时100多台机器下载,此时如果用post上传和下载想一下都不可能,但百度查的话都是说调整php.ini的post的限制,但这是一个可笑的解决方法,由此就需要用另一种解决方法–
分片
上传和下载限速在此带大家用
请叫我菜鸟猿
·
2024-02-06 11:50
php
MongoDB聚合:$listSampledQueries
analyzeShardKey命令使用采样查询来计算
分片
密钥的读写分布指标。
原子星
·
2024-02-06 10:42
mongodb
mongodb
数据库
热数据存储在HDFS,冷备数据存储于对象存储中
改方案均采用同一套
Hadoop
架构,使用hive均可以读取到,在降低成本的同时提高数据的利用率。2.准备条件c
tuoluzhe8521
·
2024-02-06 10:11
云原生
hdfs
hadoop
大数据
cos
对象存储
决胜大数据时代:
Hadoop
&Yarn&Spark企业级最佳实践(8天完整版脱产式培训版本)...
Hadoop
、Yarn、Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课。
weixin_30273931
·
2024-02-06 09:08
java
人工智能
移动开发
es 读流程源码解析
本文源码基于es6.8.0版本search分为两部分,query+fetch节点角色划分协调节点负责接收请求,然后构造查询分发给其他的数据节点,然后从各个
分片
上获取数据。
水的精神
·
2024-02-06 08:11
elasticsearch源码
es源码解析
es读流程
(五)elasticsearch 源码之查询流程分析
.概述上文我们讨论了es(elasticsearch,下同)索引流程,本文讨论es查询流程,以下是基本流程图2.查询流程为了方便调试代码,笔者在电脑上启动了了两个节点,创建了一个索引如下,该索引有两个
分片
大叶子不小
·
2024-02-06 08:33
elasticsearch
jenkins
大数据
linux安装
hadoop
详细步骤(伪分布式)
今天重装了下
hadoop
,特在此记录下!
红烧柯基
·
2024-02-06 08:28
linux
hadoop
linux
Redis核心技术与实战【学习笔记】 - 24.Redis 数据
分片
方案选择:Codis 和 Redis Cluster
简述Redis的切片集群使用多个实例保存数据,能很好的应对大数据量的场景。在《4.Redis切片集群》中,介绍了Redis官方提供的切片集群方法RedisCluster。本章,再来学习下,在RedisCluster方案正式发布前,业界广泛使用的Codis。1.Codis的整体架构和基本流程Codis集群中包含了4类关键组件。codisserver:这是进行了二次开发的Redis实例,其中增加了额外
陈建111
·
2024-02-06 08:43
Redis核心技术学习
redis
Redis
数据分片方案
Codis
Redis
Cluster
ElasticJob 3.0 带你快速入门
答:定时任务框架;优势:支持分布式部署;不同节点上执行的是不一样的任务(代码是同一套);对于一个大任务,可以用
分片
策略,让他
@lihewei
·
2024-02-06 07:00
java
elastic-job
Hadoop
-Yarn-启动篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、脚本部分1、start-yarn.sh如果我们想单独启动
隔着天花板看星星
·
2024-02-06 07:16
hadoop
大数据
分布式
Elasticsearch存储目录结构深入详解
我们将查看节点,索引和
分片
级文件,并简要说明其内容,以便了解Elasticsearch写入磁盘的数据。
aa1215018028
·
2024-02-06 07:52
数据库
时序
Elasticsearch
目录结构
想学大数据?先看完这几本书再说
除了这些技术领域,还有一些特定的技术和语言需要你继续研究:
Hadoop
,Spark,Python,和R等等,还有无数实现自动化的工具等等,这些工具几乎每天都会用到,这就需要你不断的学习。
yoku酱
·
2024-02-06 06:55
OpenStack-Swift
分片
存储
1.规划节点IP主机名节点192.168.100.10controllerOpenStack控制节点192.168.100.20computeOpenStack计算节点2.环境准备使用OpenStack平台的两台节点,自行使用脚本安装Swift对象存储服务。然后使用这两台进行实验。节点规划表中的IP地址为作者的IP地址,在进行实操案例的时候,按照自己的环境规划网络与IP地址。3.案例实施3.1Sw
曹博Blog
·
2024-02-06 06:55
Linux
openstack
swift
ssh
MongoDB
分片
集群搭建
----前言mongodb
分片
一般用得比较少,需要较多的服务器,还有三种的角色一般把mongodb的副本集应用得好就足够用了,可搭建多套mongodb复本集mongodb
分片
技术mongodb副本集可以解决数据备份
ZzzkiYoumi
·
2024-02-06 06:21
MongoDB
mongodb
数据库
dba
MongoDB的
分片
集群(二) :mongodb4.x
分片
集群离线搭建&开启安全认证
相关文章:MongoDB的
分片
集群(一):基础知识在《MongoDB的
分片
集群(一):基础知识》中梳理了
分片
集群的基础知识,本文则记录
分片
集群的离线搭建,并开启集群的安全认证的过程。
SRE成长记
·
2024-02-06 06:45
数据库
mongodb
数据库
分片集群
数据库集群
数据库安全
CentOS 8 安装配置
Hadoop
3.3.6 伪分布式安装方式(适用于开发和调试)
1.配置服务器ssh免密登录,否则后面启动会报错:尝试通过SSH连接到主机出现认证错误的提示配置服务器ssh免密登录:1.生成SSH密钥对(如果尚未生成):执行下面的命令生成密钥对,一直回车即可ssh-keygen-trsa出现下面的提示说明生成成功了:2.第二步,将公钥添加到~/.ssh/authorized_keys文件:cat~/.ssh/id_rsa.pub>>~/.ssh/authori
鱼大虾
·
2024-02-06 05:39
centos
linux
运维
HDFS入门基础
HDFS命令基础语法:【
hadoop
fs具体命令、hdfsdfs具体命令】两个是完全相同的。显示文件列表#hdfsdfs-lsURL创建目录#hdfsdfs-mkdir[-p]URL使用-p参数可以
nucty
·
2024-02-06 05:33
大数据
hdfs
hadoop
大数据
电商推荐系统
一、获取用户对商品的偏好值代码实现packagezb.grms;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.conf.Configured
nucty
·
2024-02-06 05:31
大数据
mapreduce
hadoop
Apache
Hadoop
Apache
Hadoop
_狭义上说,
Hadoop
指Apache一款java语言开发的开源框架,它的核心组件有:HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
VincentLeon
·
2024-02-06 05:28
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装1简介Ambari跟
Hadoop
等开源软件一样,也是ApacheSoftwareFoundation中的一个项目,并且是顶级项目。
WaiSaa
·
2024-02-06 02:53
关于Spark/
Hadoop
中Master/Slave IP不正确的问题
在配置SparkStandAloneMode的时候,我遇到了Slave无法向正确的MasterIP发送数据的问题。通常这类问题都来源于没有正确配置./conf/spark_env.sh文件,只要在这个文件里定义好了SPARK_LOCAL_IP和SPARK_MASTER_HOST,就可以解决这个问题。而我设置了configure文件之后问题依然存在。原因在于MasterNode上有多个网卡,每个网卡
ecce
·
2024-02-06 02:37
Docker安装部署ELK (Elasticsearch+Kibana+Logstash+Filebeat)
Elasticsearch是个开源分布式搜索引擎,它的特点有:分布式,零配置,自动发现,索引自动
分片
,索引副本机制,restful风格接口,多数据源,自动搜索负载等。
zhanglb12
·
2024-02-06 02:57
hbase基本命令
1、进入hbase的shellhbase提供了一个shell的终端给用户交互[root@
hadoop
3conf]#hbaseshell退出使用quit或者ctrl+c需要关闭
hadoop
的安全模式不然进行一些操作
小月半会飞
·
2024-02-06 01:52
shell中正则表达式
[atguigu@
hadoop
101shells]$cat/etc/passwd|grepatguigu1.常用特殊字符^$.*[]\^:匹配一行的开头$:匹配一行的结束.
看山不是山a
·
2024-02-05 23:07
Linux
正则表达式
linux
运维
大数据之 ZooKeeper原理及其在
Hadoop
和HBase中的应用
链接:https://blog.csdn.net/zhang123456456/article/details/78008626ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeep
yangfhit
·
2024-02-05 20:29
ES
Shards:代表索引
分片
,es可以把一个完整的索引分成多个
分片
,这样的好处是可以把一个大的索引拆
moonhatred
·
2024-02-05 18:42
Hadoop
Start(1) ——Google与
Hadoop
的前世今生
参考文档:《
Hadoop
权威指南(第4版)》网址:http://
hadoop
.apache.org/[1]HDFS:
Hadoop
DistributionFileSystem
Hadoop
分布式文件系统[2
bclz
·
2024-02-05 18:41
cluster.routing.allocation.enable与cluster.routing.rebalance.enable 区别
和cluster.routing.rebalance.enable参数是有区别的:cluster.routing.allocation.enable设置成none,主要是影响集群中新创建的索引无法进行
分片
分配
bigdata张凯翔
·
2024-02-05 17:00
es搭建集群模式时出现master not discovered or elected yet, an election requires two nodes with ids [xxx,xxx]问题
节点异常情况大概率是因为第一次启动es集群模式时报错了,只需删除es安装目录中的data目录,然后kill掉es进程,重新启动就好了data目录是Elasticsearch节点的核心数据存储区域,它包含了索引、
分片
和相关的
-00
·
2024-02-05 17:03
elasticsearch
大数据
搜索引擎
上一页
6
7
8
9
10
11
12
13
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他