E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Ubuntu安装hadoop
2018年最强干货!年薪80万+的大数据开发【教程】都在这儿!
技术层面来说,大数据使用的
Hadoop
(在分布式服务器集群上存储海量数据并运行分布式分析应用的一种方法)需要JAVASE基础,即使你没有学过JAVAEE上手
Hadoop
也是可以的。
yoku酱
·
2024-01-03 13:36
ubuntu安装
docker设置非用户权限
https://docs.docker.com/engine/install/ubuntu/#uninstall-docker-enginehttps://docs.docker.com/engine/install/linux-postinstall/#manage-docker-as-a-non-root-user
zhanglongls
·
2024-01-03 12:45
【HBase】——Java API
1环境1.1依赖org.apache.hbasehbase-client2.4.111.2配置文件hbase-site.xmlhbase.zookeeper.quorum
hadoop
102:2181,
hadoop
103
那时的样子_
·
2024-01-03 12:47
hbase
java
数据库
ubuntu安装
supervisor并配置
SupervisorSupervisor是用Python开发的一套通用的进程管理程序,能将一个普通的命令行进程变为后台daemon,并监控进程状态,异常退出时能自动重启。它是通过fork/exec的方式把这些被管理的进程当作supervisor的子进程来启动,这样只要在supervisor的配置文件中,把要管理的进程的可执行文件的路径写进去即可。也实现当子进程挂掉的时候,父进程可以准确获取子进程挂
笙箫竽笛
·
2024-01-03 11:23
大数据实时项目必备技能二:kafka有话说
导读:Kafka是由LinkedIn开发并开源的分布式消息系统,因其分布式及高吞吐率而被广泛使用,现已与Cloudera
Hadoop
,ApacheStorm,ApacheSpark集成。
栀子花_ef39
·
2024-01-03 11:05
数字化转型必备:数睿通 2.0 数据中台升级详解
资源评价)数据集市完善,打通审批流程修复数据生产由于DruidSQLUtils不支持Doris导致无法建表的问题优化贴源数据模块,改为读取数据库的元数据,与同步的数据做关联匹配此外,数据生产模块很多朋友对于
Hadoop
小螺旋丸
·
2024-01-03 10:51
hadoop
git
数据仓库
大数据
新年快乐—数睿通2.0数据中台全新功能模块发布
FlinkSql作业开发调度中心运维中心资源中心配置中心其他模块结语引言离上次发文已经有接近三个月了,这三个月主要在开发数睿通的数据生产模块,同时优化了一下数据集成,目前已经基本开发完毕了,集成了Flink,
Hadoop
小螺旋丸
·
2024-01-03 10:43
大数据
springcloud
java
数据库
大数据
云计算
Hive自定义函数支持国密SM4解密
当前项目背景需要使用到国密SM4对加密后的数据进行解密,Hive是不支持的,尝试了华为DWS数仓,华为只支持在DWS中的SM4加密解密,不支持外部加密数据DWS解密新建Maven工程只需要将引用的第三方依赖打到jar包中,
hadoop
4935同学
·
2024-01-03 08:03
Hive
Java
hive
hadoop
数据仓库
计算机毕业设计吊打导师
hadoop
+spark+hive知识图谱医生推荐系统 医生数据分析可视化大屏 医生爬虫 医疗可视化 医生大数据 机器学习 大数据毕业设计
流程:1.Python爬虫采集中华健康网约10万医生数据,最终存入mysql数据库;2.使用pandas+numpy/
hadoop
+mapreduce对mysql中的医生数据进行数据分析,使用高德地图解析地理位置
计算机毕业设计大神
·
2024-01-03 07:53
纠删码ReedSolomon
随着大数据技术的发展,HDFS作为
Hadoop
的核心模块之一得到了广泛的应用。为了数据的可靠性,HDFS通过多副本机制来保证。
旅僧
·
2024-01-03 07:14
#
大数据计算基础
大数据
分布式
算法
如何在在虚拟机中安装Ubuntu
点击上方导航栏中的产品下载点击图中标记的WorkstationPro根据操作系统选择合适的产品,点击转至下载后序步骤可以参考网站:https://www.cnblogs.com/fuzongle/p/12760193.html二、下载
Ubuntu
ZShiJ
·
2024-01-03 07:11
虚拟机
ubuntu
Clojure 实战(4):编写
Hadoop
MapReduce 脚本
Hadoop
简介众所周知,我们已经进入了大数据时代,每天都有PB级的数据需要处理、分析,从中提取出有用的信息。
Hadoop
就是这一时代背景下的产物。
张吉Jerry
·
2024-01-03 07:35
大数据
hadoop
clojure
Ubuntu安装
Docker步骤
安装Docker使用apt命令更新包列表和软件包:sudoaptupdate安装依赖项以允许apt使用HTTPS通过仓库下载软件包:sudoaptinstallapt-transport-httpsca-certificatescurlsoftware-properties-common添加Docker的官方GPG密钥:curl-fsSLhttps://download.docker.com/li
sail Jamie
·
2024-01-03 06:14
ubuntu
docker
linux
python操作hdfs及hbase
创建目录client.makedirs("/tmp/ct/test51")默认权限755,用户名:dr.who可以创建多层级目录(类似mkdir-p)如果存在权限不足,可以通过命令行对上层目录权限进行修改:
hadoop
dfs-chmod-R777
佛系小懒
·
2024-01-03 04:26
使用Datax将Hive中的表迁移到MySQL
无法上传(2)解压datax压缩包sudotar-zxvfdatax.tar.gz-C/usr/local(解压到的目录,可自己设置)(3)修改文件夹名称 mvdatax.tar datax(4)给
hadoop
孤城暮雨@
·
2024-01-03 04:17
数据迁移
hive
mysql
hadoop
数据库
Azkaban+Spark资源调度
前提条件:各节点之间的免密、登录启动
Hadoop
集群、Spark、Azkaban、Hive免密登录操作ssh-keygen-trsaslave01执行:scp~/.ssh/id_rsa.pub
hadoop
孤城暮雨@
·
2024-01-03 04:46
spark
大数据
分布式
计算机毕业设计大数据类题目
序号题目题目要求(该课题的研究目的、所实现的主要功能等)1基于
Hadoop
的大数据宠物商城推荐系统收集大量有关宠物产品和用户购买行为的数据,并使用
hadoop
进行数据处理和存储,以构建一个个性化的宠物产品推荐系统
程序源码123
·
2024-01-03 00:14
任务书
开题报告
论文
课程设计
大数据
java
spring
boot
旅游
后端
数据库
Ubuntu系统安装+深度学习框架
(Windows系统的深度学习框架安装可查看)一、
Ubuntu安装
1、制作启动盘(镜像:Ubuntu-20.04.3-desktop-amd64.iso;Rufustool:下载,提取码om26)选择对应的
爱吃糖葫芦的大熊
·
2024-01-03 00:34
python
pycharm
finalshell一键安装
注意,FinalShell已经不再支持32位系统注意,
ubuntu安装
后可直接点击图标运行一键安装脚本rm-ffinalshell_install_linux.sh;wgetwww.hostbuf.com
一码胜千言
·
2024-01-02 19:35
hive多分隔符外表支持
CREATEEXTERNALTABLEtext_mid1(idSTRING,nameSTRING)ROWFORMATSERDE'org.apache.
hadoop
.hive.contrib.
甲乙寄几
·
2024-01-02 19:31
hive
hadoop
数据仓库
ubuntu安装
mysql的tar_
ubuntu安装
mysql(tar.gz)
因为某些原因,我需要使用较高一点版本的mysql,而ubuntu使用apt-get安装的mysql版本不是我预期的版本(我试验使用ubuntu-11-04apt-get安装mysql,mysql的版本是5.1.54;ubuntu-10-04apt-get安装的mysql版本是5.1.41)。所以只能使用较高版本的二进制文件安装(当然也可以编译安装,但我自认为自己还太菜,没敢尝试)。下面是安装步骤环
weixin_39645249
·
2024-01-02 17:48
ubuntu安装
mysql以及基本配置
一、环境系统版本:Ubuntu16.04.6LTSmysql版本:MySQL5.7二、安装获取mysql安装包wgethttps://dev.mysql.com/get/mysql-apt-config_0.8.1-1_all.deb执行完成后,可以看到mysql-apt-config_0.8.1-1_all.deb文件已经在当前目录中2.安装配置包sudodpkg-imysql-apt-conf
gavin.liao
·
2024-01-02 17:47
Linux
ubuntu
mysql安装
linux
mysql安装
linux
mysql
Ubuntu安装
MySQL及使用小记
记录一下Ubuntu20.04安装mysql以及基本使用终端输入以下命令即可安装Mysqlsudoaptinstallmysql-serversudoaptinstallmysql-clientsudoaptinstalllibmysqlclient-dev安装完成后查看一下mysql的状态,提示mysql正在运行即安装成功servicemysqlstatus如果没有开启mysql,用以下命令开启
wawawakaokao
·
2024-01-02 17:17
ubuntu
mysql
Hbase介绍以及Hive优势
因为HBase基于
Hadoop
的HDFS完成分布式存储,以及MapReduce完成分布式并行计算,所以它的一些特点与
Hadoop
相同,依靠横向扩展,通过不断增加性价比高的商业服务器来增加计算和存储能力。
毛毛虫同学
·
2024-01-02 14:38
10.
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
__元昊__
·
2024-01-02 13:45
Spark内容分享(二十三):Spark on K8s 在茄子科技的实践
4.EMR类产品的缺陷5.传统
Hadoop
生态,三大组件的前世今生6.SparkonK8s的优势SparkonK8s原理介绍1.Spark的集群部署模式2.Sparkonk8s如何运行3.Spark的dynamicAllocation
之乎者也·
·
2024-01-02 11:30
Spark
内容分享
大数据(Hadoop)内容分享
spark
kubernetes
科技
Spark内容分享(二十二):eBay最佳实践:Spark SQL优化之物化视图
的实现验证部分重写部分物化视图应用场景及收益应用场景:物化视图重写普通视图应用场景:物化视图重定义表结构物化视图应用收益总结及后续计划背景Carmel是eBay内部基于ApacheSpark打造的一款SQL-on-
Hadoop
之乎者也·
·
2024-01-02 11:00
Spark
内容分享
大数据(Hadoop)内容分享
spark
sql
大数据
Spark内容分享(二十一):字节跳动 Spark 支持万卡模型推理实践
-资源匹配未来展望背景介绍随着云原生的发展,Kubernetes由于其强大的生态构建能力和影响力,使得包括大数据、AI在内越来越多类型的负载应用开始向Kubernetes迁移,字节内部探索Spark从
Hadoop
之乎者也·
·
2024-01-02 11:59
Spark
内容分享
大数据(Hadoop)内容分享
spark
大数据
分布式
hadoop
环境搭建
一、平台环境CentOS6.5二、软件版本
hadoop
-2.8.1下载地址jdk-8u45-linux-x64下载地址apache-maven-3.3.9软件下载三、内容目录前置内容1.1jdk安装和配置
熊_看不见
·
2024-01-02 10:00
小肥柴的
Hadoop
之旅
小肥柴的
Hadoop
之旅(目录)(第0章)导航0-0-1写博客的初衷0-0-2参考资料和书籍0-0-3完工部分传送门导航0-0-1写博客的初衷从门外汉边学边上课,到入门的菜鸡,对如何正确的学习
Hadoop
卷毛迷你猪
·
2024-01-02 10:30
Hadoop
hadoop
大数据
分布式
【
Hadoop
】如何启动和关闭
Hadoop
集群
启动
Hadoop
集群关闭
Hadoop
集群启动
Hadoop
集群参考官方文档Apache
Hadoop
3.3.6–
Hadoop
ClusterSetup要启动
Hadoop
集群,需要同时启动HDFS和YARN集群
不怕娜
·
2024-01-02 10:29
hadoop
大数据
分布式
【
Hadoop
】集群配置之主要配置文件(
hadoop
-env.sh、yarn-env.sh、core-site.xml、hdfs-site.xml、mapred-site.xml...)
Hadoop
配置文件模板core-site.xml
hadoop
-env.shhdfs-site.xmlyarn-env-shyarn-site.xmlmapred-site.xmlslaves
Hadoop
不怕娜
·
2024-01-02 10:27
hadoop
xml
hdfs
大数据学习入门到实战教程,精心整理万字长文入门,老奶奶看了都说学会了
换个角度说,大数据是:1、有海量的数据2、有对海量数据进行挖掘的需求3、有对海量数据进行挖掘的软件工具(
hadoop
、spark、storm、flink、tez
悦悦学Python
·
2024-01-02 08:59
ubuntu18备份还原迁移
备份还原迁移流程先将系统文件压缩(如压缩/,/home,/boot等)使用
ubuntu安装
u盘进入liveusb新建文件夹(如backup)挂载到相应的分区将备份压缩包解压到对应的文件夹(backup)
Nuwww
·
2024-01-02 07:03
Hive(二)之bash群起脚本
集群的启动启动HDFS启动namenode$/opt/modules/cdh/
hadoop
-2.5.0-cdh5.3.6/sbin/
hadoop
-daemon.shstartnamenode2.启动datanode
DarrenmondZhang
·
2024-01-02 07:45
大数据 -
Hadoop
系列《三》- HDFS(分布式文件系统)概述
5.1hdfs的概念HDFS分布式文件系统,全称为:
Hadoop
DistributedFileSystem。
王哪跑nn
·
2024-01-02 06:06
大数据
大数据
hadoop
hdfs
Hadoop
运维--Zookeeper--安装配置
一、服务规划服务器IP地址软件服务备注master192.168.71.130zookeeperQuorumPeerMainfollowerslave1192.168.71.129zookeeperQuorumPeerMainleaderslave2192.168.71.132zookeeperQuorumPeerMainfollower二、ZooKeeper安装配置下载地址:https://zo
无剑_君
·
2024-01-02 06:39
【2023】
hadoop
基础介绍
目录
Hadoop
组成HDFSHDFS操作HDFS分布式文件存储NameNode元数据数据读写流程YARN和MapReduceMapReduce:分布式计算YARN:资源管控调度YARN架构提交任务到**
方渐鸿
·
2024-01-02 03:26
数据分析
hadoop
大数据
分布式
python
flink 连接 hdfs 读取文件配置
flink连接hdfs读取文件配置
hadoop
版本为2.7.3window系统本地运行flink程序读取hdfs文件配置1,请导入
hadoop
和httpclient的包org.apache.flinkflink-
hadoop
-fs
eagle隼
·
2024-01-02 02:06
Ubuntu安装
Pycharm免费社区版,命令行启动的IDE,安装中文插件
当然,需要说明的是,虽然在Ubuntu这样的Linux发行版系统下终端命令行最常用,但并不是IDE或者软件都得要用命令行启动的。这里机智客只是说Pycharm在初始安装后,要启动就需要在终端命令行里输入Pycharm.sh脚本文件。而且,Pycharm这款IDE在Ubuntu系统里的安装,也简直简单到令人发指。Pycharm作为Python语言的开发IDE,备受推崇。它本身不是免费软件,不过有一个
机智客
·
2024-01-02 01:02
Ubuntu配置
hadoop
伪分布式
1.设置免密登录伪分布式搭建过程中会涉及各种管理员权限,一次一次输入密码太过麻烦,我们要求各集群间免密码连接sudoapt-getinstallopenssh-server#安装openssh-serversshlocalhost#连接到主机exit#退出刚才的sshlocalhostcd~/.ssh/#若没有该目录,请先执行一次sshlocalhostssh-keygen-trsa#会有提示,都
MA木易YA
·
2024-01-01 23:46
2018-05-21
1.
hadoop
是什么广义就是
hadoop
生态圈,狭义就是单指
hadoop
2.
hadoop
三大组件是什么?
CrUelAnGElPG
·
2024-01-01 23:55
2023.12.31 Python 词频统计
练习:使用Python中的filter、map、reduce实现词频统计样例数据:helloworldjavapythonjavajava
hadoop
sparksparkpython需求分析:1-文件中有如上的示例数据
白白的wj
·
2024-01-01 23:40
python
开发语言
学习
大数据
hdfs数据完整性
hdfs会对写入的所有数据计算校验和,在数据通过不可靠通道传输的时候再次计算校验和,对比就能发现数据是否损坏,常用的通过32位循环冗余校验,在
hadoop
中,可以通过checksum命令得到想要的文件的校验和
文贞武毅
·
2024-01-01 20:45
扩展
Hadoop
3.x新特性概述
扩展
Hadoop
3.x新特性概述
Hadoop
3.x中增强了很多特性,在
Hadoop
3.x中,不再允许使用jdk1.7,要求jdk1.8以上版本。
奋斗的蛐蛐
·
2024-01-01 20:44
(005)linux supervisor 的使用
文章目录
ubuntu安装
centos安装配置网页访问supervisor服务的运行命令修改网页上的标题启动报错附录
ubuntu安装
sudoaptupdate&&sudoaptinstallsupervisorcentos
.卡
·
2024-01-01 18:49
Linux
命令的使用
linux
大数据与
Hadoop
之间是什么关系
Hadoop
只是一种处理大数据的技术手段。“大数据”概念在1980年由维克托·迈尔-舍恩伯格及肯尼斯·库克耶在《第三次浪潮》首次提出,由麦肯锡公司(McKinsey)最早应用。
数据僧
·
2024-01-01 18:21
大数据技术与应用开发赛项笔记
各种启动命令修改mysql数据库编码:alterdatabaseshtd_resultCHARACTERSETutf8;
hadoop
:start-all.shhive服务:hive--servicemetastorehive
南城守护
·
2024-01-01 17:56
大数据
Atlas 2.2.0 安装部署
ApacheAtlas是一套可扩展、可延伸的核心基础治理服务,使企业能够切实有效地满足
Hadoop
中的合规性要求,并允许与整个企业数据生态系统集成。
mba1398
·
2024-01-01 16:33
atlas
大数据
【ROS2】MOMO的鱼香ROS2(一)ROS2入门篇——从Ubuntu操作系统开启
从Ubuntu操作系统开启引言1术语汇总2Ubuntu(操作系统)2.1Ubuntu权限管理2.2
Ubuntu安装
软件2.2.1使用apt命令安装2.2.2dpkg安装deb包2.2.3makeinstall
摇曳的树
·
2024-01-01 15:16
ubuntu
linux
运维
上一页
35
36
37
38
39
40
41
42
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他