E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop大数据分析
Hadoop
3完全分布式搭建
一、第一台的操作搭建修改主机名使用hostnamectlset-hostname修改当前主机名关闭防火墙和SELlinux1,使用systemctlstopfirewalldsystemctldisablefirewalld关闭防火墙2,使用vim/etc/selinux/config修改为SELINUX=disabled使用NAT模式配置静态IP1,修改网络配置vim/etc/sysconfig
三木一立
·
2024-01-21 05:54
大数据
分布式
php
开发语言
Linux 部署
Hadoop
伪分布式集群教程
首先:我们需要下载一些关于
Hadoop
伪分布式集群需要的工具与tar包链接:https://pan.baidu.com/s/1oUw1jDCxfghWsnaWauSHKg提取码:6s5a接下来打开虚拟机终端
qq_61247494
·
2024-01-21 05:15
hadoop
分布式
linux
linux 部署
Hadoop
完全分布式集群教程
一、准备工作1、本次任务需要三台虚拟机,主机名分别为Master、Slave01、Slave02先在Master上安装好jdk和
Hadoop
(安装教程可以参考这两篇文章)然后为了简便我们直接克隆两台Master
qq_61247494
·
2024-01-21 05:15
hadoop
分布式
linux
Linux修改
hadoop
配置文件及启动
hadoop
集群详细步骤
目录一、配置
Hadoop
环境1.查看
Hadoop
解压位置2.配置环境变量3.编辑环境变量4.重启环境变量5.查看
Hadoop
版本,查看成功就表示
Hadoop
安装成功了二、修改配置文件1.检查三台虚拟机:
CatalinaCatherine
·
2024-01-21 05:45
Linux
linux
hadoop
运维
linux下
hadoop
集群并且配置安装百分百成功
可以去jdk官网下载8或者11版本,别用18因为
hadoop
会不兼容,先卸载本机的自带的jdk,下面我给大家带一个我在用的
hadoop
链接
hadoop
下载链接假设在你的linux上面有三个虚拟机
hadoop
102
hadoop
103
hadoop
104
新城已无旧少年_
·
2024-01-21 05:45
大数据
大数据
Linux-
Hadoop
集群配置
文章目录一、配置
Hadoop
集群1、在master虚拟机上配置
hadoop
(1)编辑
Hadoop
环境配置文件-
hadoop
-env.sh(2)编辑
Hadoop
核心配置文件-core-site.xml(3
人生苦短@我用python
·
2024-01-21 05:44
探索大数据
hadoop
linux
大数据
mapreduce
hdfs
hadoop
分布式集群配置(linux)
linux配置
hadoop
分布式集群一、前期准备二、Jdk的安装三、配置
hadoop
集群安装
hadoop
分布式集群
hadoop
-3.3.0及jdk1.8下载链接一、前期准备1.安装
hadoop
分布式之前先准备好
小-枝-丫
·
2024-01-21 05:44
linux
hadoop
hadoop
分布式
linux
linux上面
hadoop
配置集群
要在Linux上配置
Hadoop
集群,需要按照以下步骤进行操作:安装JavaDevelopmentKit(JDK):首先,确保您的Linux系统上已经安装了JDK。
酷爱码
·
2024-01-21 05:14
大数据基础教程
linux
hadoop
运维
大数据案例分析
摘自https://www.cnblogs.com/ShaYeBlog/p/5872113.html一、
大数据分析
在商业上的应用1、体育赛事预测世界杯期间,谷歌、百度、微软和高盛等公司都推出了比赛结果预测平台
weixin_30252709
·
2024-01-21 04:10
大数据
人工智能
数据结构与算法
大数据分析
案例
一、
大数据分析
在商业上的应用1、体育赛事预测世界杯期间,谷歌、百度、微软和高盛等公司都推出了比赛结果预测平台。百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%。
weixin_34315665
·
2024-01-21 04:10
大数据
人工智能
java
大数据分析
案列
1、体育赛事预测世界杯期间,谷歌、百度、微软和高盛等公司都推出了比赛结果预测平台。百度预测结果最为亮眼,预测全程64场比赛,准确率为67%,进入淘汰赛后准确率为94%。现在互联网公司取代章鱼保罗试水赛事预测也意味着未来的体育赛事会被大数据预测所掌控。“在百度对世界杯的预测中,我们一共考虑了团队实力、主场优势、最近表现、世界杯整体表现和博彩公司的赔率等五个因素,这些数据的来源基本都是互联网,随后我们
TRUEtpc
·
2024-01-21 04:40
WARN util.NativeCodeLoader: Unable to load native-
hadoop
library for your platform... using builtin-
1.问题来源
hadoop
启动时控制台一直提示WARNutil.NativeCodeLoader:Unabletoloadnative-
hadoop
libraryforyourplatform…usingbuiltin-javaclasseswhereapplicableStartingnamenodeson
寂夜了无痕
·
2024-01-21 04:57
大数据搭建问题
hadoop
大数据
mac-
hadoop
3.3.6 源码构建以及踩坑记录
1.为什么需要构建源码因为
hadoop
的可执行文件是在专门的机器上编译的其中native库不一定能适用于每个机器导致在启动
hadoop
过程中出现烦人的警告WARNutil.NativeCodeLoader
寂夜了无痕
·
2024-01-21 04:55
大数据搭建问题
hadoop
大数据
hadoop
源码编译
HDFS中的Erasure Coding纠删码是个什么样的存在?
在
Hadoop
3.x之后就引入了纠删码技术(ErasureCoding)纠删码技术(Erasurecoding)简称EC,是一种编码容错技术。最早用于通信行业,数据传输中的数据恢复。它通过对数
小KKKKKKKK
·
2024-01-21 03:29
ElasticSearch 亿级数据检索深度优化!
一、前言数据平台已迭代三个版本,从头开始遇到很多常见的难题,终于有片段时间整理一些已完善的文档,在此分享以供所需朋友的实现参考,少走些弯路,在此篇幅中偏重于ES的优化,关于HBase,
Hadoop
的设计优化估计有很多文章可以参考
夜空_2cd3
·
2024-01-21 03:53
Redis学习笔记--尚硅谷
、Tomcat、HTML、Linux、JDBC、SVNe解决扩展性的问题:Struts、Spring、SpringMVC、Hibernate、Mybatise解决性能的问题:NoSQL、Java线程、
Hadoop
Geho
·
2024-01-21 02:52
redis
数据库
nosql
java
springboot
大数据技术原理及应用课实验1 熟悉常用的Linux操作和
Hadoop
操作
实验1熟悉常用的Linux操作和
Hadoop
操作一、实验目的
Hadoop
运行在Linux系统上,因此,需要学习实践一些常用的Linux命令。
Blossom i
·
2024-01-21 02:21
大数据编程
大数据
linux
hadoop
大数据技术原理及应用课实验2 :熟悉常用的HDFS操作
实验2熟悉常用的HDFS操作目录实验2熟悉常用的HDFS操作一、实验目的二、实验平台三、实验步骤(每个步骤下均需有运行截图)(一)编程实现以下功能,并利用
Hadoop
提供的Shell命令完成相同任务:(
Blossom i
·
2024-01-21 02:21
大数据编程
大数据
hdfs
hadoop
通过WordCount解析Spark RDD内部源码机制
HelloSparkHelloScalaHello
Hadoop
HelloFlinkSparkisAwesome然后在Eclipse中编写wo
联旺
·
2024-01-21 01:54
客户案例|知名证券机构核心大数据平台升级之路
Hadoop
作为海量数据处理的关键技术框架,自诞生以来就改变了企业对数据的存储、处理和分析的过程,因具备开源低成本、高可靠等特性,在证券行业得到了广泛的应用。
云掣YUNCHE
·
2024-01-21 01:17
产品介绍
大数据
云原生
运维开发
Spark(一): 基本架构及原理
前言:目标:架构及生态:Spark与
hadoop
:运行流程及特点:常用术语:Spark运行模式:RDD运行流程:前言:ApacheSpark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009
贝賏赑钡
·
2024-01-20 22:46
spark
架构
大数据
大数据导论(3)---大数据技术
文章目录1.大数据技术概述2.数据采集与预处理2.1数据采集2.2预处理3.数据存储和管理3.1分布式基础架构
Hadoop
3.2分布式文件系统HDFS3.3分布式数据库HBase3.4非关系型数据库NoSQL4
冒冒菜菜
·
2024-01-20 21:28
大数据导论
大数据导论
大数据技术
课程学习
【
大数据分析
与挖掘技术】概述
目录一、数据挖掘简介(一)数据挖掘对象(二)数据挖掘流程(三)数据挖掘的分析方法(四)经典算法二、Mahout(一)Mahout简介(二)主要特性(三)Mahout安装与配置一、数据挖掘简介需要是发明之母。近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市
Francek Chen
·
2024-01-20 21:18
大数据技术基础
数据分析
数据挖掘
Mahout
【
大数据分析
与挖掘技术】Mahout推荐算法
目录一、推荐的定义与评估(一)推荐的定义(二)推荐的评估二、Mahout中的常见推荐算法(一)基于用户的推荐算法(二)基于物品的推荐算法(三)基于SVD的推荐算法(四)基于线性插值的推荐算法(五)基于聚类的推荐算法三、对GroupLens数据集进行推荐与评价(一)如何使用推荐器进行推荐(二)如何评估推荐器的好坏推荐是Mahout机器学习算法的主题之一,它极大地渗透到了人们日常生活的方方面面,比如,
Francek Chen
·
2024-01-20 21:17
大数据技术基础
数据分析
人工智能
数据挖掘
Mahout
Sqoop与HBase结合使用:实现强大的数据存储
Sqoop用于将数据从关系型数据库导入到
Hadoop
生态系统中,而HBase则用于实时、非关系型数据存储和查询。
晓之以理的喵~~
·
2024-01-20 19:57
sqoop
sqoop
hbase
hadoop
使用Sqoop从Oracle数据库导入数据
在大数据领域,将数据从关系型数据库(如Oracle)导入到
Hadoop
生态系统是一项常见的任务。Sqoop是一个强大的工具,可以帮助轻松完成这项任务。
晓之以理的喵~~
·
2024-01-20 19:27
sqoop
数据库
sqoop
oracle
Sqoop数据传输中的常见挑战及其解决方法
Sqoop是一个用于将数据传输到
Hadoop
生态系统的强大工具,但在实际使用中,可能会面临一些挑战。
晓之以理的喵~~
·
2024-01-20 19:26
sqoop
sqoop
eclipse
hadoop
创建虚拟机
弹出如下对话框,点击“下一步”3.继续点击“下一步”4.选择“稍后安装操作系统”,然后点击“下一步”5.在版本下拉框中选择“CentOS764位”,然后点击“下一步”6.给虚拟机起一个名字,本机叫做“
Hadoop
100
吃草料的羊
·
2024-01-20 19:56
hadoop
大数据
大数据
Hadoop
入门——HDFS分布式文件系统基础
HDFS命令基础语法:【
hadoop
fs具体命令、hdfsdfs具体命令】两个是完全相同的。显示文件列表#hdfsdfs-lsURL创建目录#hdfsdfs-mkdir[-p]URL使用-p参数可以
nucty
·
2024-01-20 16:00
大数据
大数据
hadoop
hdfs
Zookeeper简介
一、Zookeeper简介ZooKeeper是一个分布式的、开放源码的分布式应用程序协调服务,它是Google的Chubby一个开源的实现,是
Hadoop
和Hbase的重要组件。
破茧......
·
2024-01-20 16:35
Zookeeper
zookeeper
分布式
云原生
大数据技术之
Hadoop
伪分布式安装步骤及结果(Ubuntu)
、下载安装虚拟机软件;下载Ubuntu镜像文件,安装Ubuntu虚拟机;2、在Ubuntu系统中创建用户、更新APT、安装SSH并配置SSH无密码登录、安装Java环境、配置PATH环境变量;3、下载
Hadoop
小嘤嘤怪学
·
2024-01-20 16:52
Hadoop
分布式
hadoop
大数据
【大数据】了解 YARN 架构的基础知识
3.1.2ApplicationManager应用程序管理器3.2NodeManager节点管理器3.3ApplicationMaster应用程序主控3.4Container容器4.在YARN中提交应用程序5.
Hadoop
YARN
G皮T
·
2024-01-20 14:23
大数据
大数据
架构
yarn
资源管理
作业调度
hadoop
hdfs
Hive性能优化
sum,count,max,min等UDAF,不怕数据倾斜问题,
hadoop
在map端的汇总合并优化,使数据倾斜不成问题。count(distinct),在数据量大的情况下,效率较
La victoria
·
2024-01-20 13:23
大数据
卓有成效管理者的必备技能:精准分析、掌控支配自己的时间
通过
大数据分析
,每一位卓有成效的管理者身上都有一个共同的特点:精准分析、掌握支配自己的时间。时间是这个世界上最稀有的资源,也是最不可或缺的。
玉言胖胖
·
2024-01-20 13:15
阿里云 EMR 基于 Paimon 和 Hudi 构建 Streaming Lakehouse
01背景信息数据湖与传统的数据仓库相比,可以更灵活地处理各种类型的数据,并支持高度可扩展的存储,通常被用于
大数据分析
。
Apache Spark中国社区
·
2024-01-20 12:51
阿里云
云计算
时评素材 | 年度词汇扎堆, 世界显示不确定性(2020年12月)
1.年度词汇扎堆,世界显示不确定性光明日报,黄典林时事:从2004年开始,作为当今全球最权威的英文词典之一,《牛津英语词典》基于对语料库的
大数据分析
,每年都会发布一个年度词汇。
一把锯子
·
2024-01-20 12:25
hive Error while compiling statement: FAILED: ClassCastException org.apache.
hadoop
.hive.serde2.objec
Errorwhilecompilingstatement:FAILED:ClassCastExceptionorg.apache.
hadoop
.hive.serde2.objectinspector.primitive.WritableConstantStringObjectInspectorcannotbecasttoorg.apache.
hadoop
.hive.serde2
圆周率的后六位
·
2024-01-20 12:35
hive
hadoop
apache
hadoop
运行任务出错,Hive Runtime Error while processing row
Error:java.lang.RuntimeException:org.apache.
hadoop
.hive.ql.metadata.HiveException:HiveRuntimeErrorwhileprocessingrow
圆周率的后六位
·
2024-01-20 12:05
hive
hadoop
big
data
李浩然:从大数据能力提升项目出发,探索化工大数据之路 | 提升之路系列(一)...
项目通过整合建设课程模块,形成了大数据思维与技能、跨界学习、实操应用相结合的大数据课程体系和线上线下混合式教学模式,显著提升了学生
大数据分析
能力和创新
数据派THU
·
2024-01-20 12:59
大数据
Hadoop
配置文件加载
1.
hadoop
使用org.apache.
hadoop
.conf.Configuration类来加载配置文件2.一般我们在写客户端程序等需要连接
hadoop
集群时,需要自己准备好core-site.xml
sf_www
·
2024-01-20 11:52
hadoop
hadoop
大数据
hdfs
程序员必备的面试技巧——大数据工程师面试必备技能
目录前言一、不同工程师的职责和技能要求1、数仓开发工程师2、算法挖掘工程师3、大数据平台开发工程师4、大数据前端开发工程师二、大数据技术架构图三、大数据相关的技术内容四、大数据面试经验1、大数据开发岗位2、
大数据分析
岗位总结前言
Francek Chen
·
2024-01-20 11:22
话题征文
面试
职场和发展
大数据
CPU密集型和IO密集型
CPU密集型CPU密集型工作负载是指需要大量的CPU时间来执行的工作负载,例如
大数据分析
、图像处理或者科学计算等。这种工作负载通常涉及大量的计算和数据处理,需要许多CPU周期才能完成。
mhz2977170
·
2024-01-20 11:52
java
Hadoop
基础知识
Hadoop
基础知识1、
Hadoop
简介广义上来说,
Hadoop
通常是指一个更广泛的概念——
Hadoop
生态圈。
坐在风口上de猪
·
2024-01-20 10:10
hadoop
大数据
分布式
大数据开发之
Hadoop
(完整版+练习)
第1章:
Hadoop
概述1.1
Hadoop
是什么1、
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。2、主要解决,海量数据的存储和海量数据的分析计算问题。
Key-Key
·
2024-01-20 10:36
hadoop
hdfs
mapreduce
分布式
大数据
Kylin安装学习教程
Kylin安装学习教程Kylin是一个开源的分布式分析引擎,提供
Hadoop
/Spark之上的SQL接口及多维分析(OLAP)能力以支持
大数据分析
,最初由eBayInc.开发并贡献到开源社区。
Luo_Yang111
·
2024-01-20 09:28
kylin
黑猴子的家:Linux 文件有空格或特殊字符--转义
1、使用window斜杠""转义处理[victor@
hadoop
102~]$cdwindow\vnc/2、使用英文双引号处理[victor@
hadoop
102~]$cd"windowvnc"
黑猴子的家
·
2024-01-20 07:10
中国人民大学与加拿大女王大学金融硕士项目——金融人员2024年都在关注哪些呢?
从移动支付到区块链技术,再到人工智能和
大数据分析
,金融科技正在改变着金融行业的生态格局。金融人需要关注这些新技术在金融领域的应用,并了解它们如何改变传
xu17160175782
·
2024-01-20 06:53
金融
考研
人工智能
大数据
物联网
Windows平台安装配置
Hadoop
2.7.X
一,准备1.安装jdk1.82.下载
hadoop
2.7.7.tar.gz官网下载地址:https://archive.apache.org/dist/
hadoop
/common/
hadoop
-2.7.7
sun_十一
·
2024-01-20 04:23
比拼Kafka,
大数据分析
新秀Pulsar到底好在哪
在用户选择一个消息系统时,消息模型是用户首先考虑的事情。消息模型应涵盖以下3个方面:消息消费——如何发送和消费消息;消息确认(ack)——如何确认消息;消息保存——消息保留多长时间,触发消息删除的原因以及怎样删除;消息消费模型在实时流式架构中,消息传递可以分为两类:队列(Queue)和流(Stream)。队列(Queue)模型队列模型主要是采用无序或者共享的方式来消费消息。通过队列模型,用户可以创
java菜
·
2024-01-20 04:19
余老师带你学习大数据-Spark快速大数据处理第十章Kafka第八节Kafka-Connect
kafkaKafkaConnect基本概念1、KafkaConnect是Kafka流式计算的一部分,左侧是数据源包括了数据库、
hadoop
、文本等等,右侧是数据结果包括了文本、
hadoop
、数据库,中间上层就是
weixin_45810046
·
2024-01-20 03:41
kafka
上一页
17
18
19
20
21
22
23
24
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他