E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop大数据分析
人工智能与工业4.0在智能制造的应用
美国辛辛那提大学特聘讲座教授,美国白宫信息物理系统与美国挑战项目顾问李杰,在2017中国大数据应用大会上,分享了对工业大数据,以及人工智能怎么改进工业
大数据分析
的见解。
weixin_30649859
·
2024-02-07 07:15
大数据
人工智能
win10 spark scala 本地运行wordcount
注意每次修改环境变量都要重启cmd本机运行需要
hadoop
common,可以从github下载zip,解包以后设置
HADOOP
_HOME环境变量指向它,然后在PATH里加上
HADOOP
_HOME\bin
疯琴
·
2024-02-07 06:06
大数据
java/scala
flink/spark
同是ZooKeeper,你和架构师的理解差在哪里?
Dubbo,Kafka,
Hadoop
等等项目里都能看到它的影子。但是你真的了解ZooKeeper吗?如果面试官让你给他讲讲ZooKeeper是个什么东西,你能回答到什么地步呢?
l鹿狸i
·
2024-02-07 06:12
Hadoop
-IDEA开发平台搭建
1.安装下载
Hadoop
文件1)
hadoop
-3.3.5将下载的文件保存到英文路径下,名称一定要短。
Snower_2022
·
2024-02-07 05:02
hadoop
eclipse
大数据
【实验1】分布式模式的CentOS 6上安装
Hadoop
(1个master节点,2个slave节点)
实验环境:二、实验内容与步骤(过程及数据记录):1.安装VMWareWorkstation162.VMWare10安装CentOS62.1CentOS系统安装2.2CentOS系统安装中的关键问题2.3克隆
Hadoop
Slave3
-借我杀死庸碌的情怀-
·
2024-02-07 05:31
分布式
centos
hadoop
在多台阿里云服务器上部署
Hadoop
分布式系统及WordCount实验
一、实现master与slave之间无密码连接分别在master及slave上生成rsa密钥:mkdir~/.sshcd~/.sshssh-keygen-t-rsa一路回车(选择默认设置),此时,ssh文件夹中生成了id_rsa.pub和id_rsa两个,然后使用scp命令将公钥(id_rsa.pub)分别拷到对方机器中scpid_rsa.pubh1@对方机器IP:~/.ssh/authorize
Clearlove灬Star
·
2024-02-07 05:01
大数据
阿里云
Hadoop
分布式
Wordcount
合肥工业大学2022大数据技术实验二
实验序号及名称:实验二在
Hadoop
平台上部署WordCount程序实验时间∶2022年5月14日预习内容一、实验目的和要求∶在
Hadoop
平台上部署WordCount程序。
一头骇人鲸
·
2024-02-07 05:00
大数据技术
大数据
hadoop
java
hadoop
wordcount代码分析
输入输出文件异常类importjava.util.Iterator;Iterator是迭代器类importjava.util.StringTokenizer;用来对字符串进行切importorg.apache.
hadoop
.fs.Path
姹紫_嫣红
·
2024-02-07 05:57
大数据hadoop
Java
【实验2】在
Hadoop
平台上部署WordCount程序
HDFS6.分布式文件系统HDFS上的编程实践6.1安装Eclipse6.2创建Eclipse工程6.3编写一个Java应用程序检测HDFS中是否存在一个文件7.Eclipse上的HDFS操作7.1安装
Hadoop
-Eclipse
-借我杀死庸碌的情怀-
·
2024-02-07 05:27
hadoop
npm
大数据
centos
分布式
如何将日志文件和二进制文件快速导入HDFS?
日志数据在应用程序中一直很常见,
Hadoop
能够处理生产系统生成的大量日志数据,比如网络设备、操作系统、Web服务器和应用程序的日志数据。
weixin_34159110
·
2024-02-07 05:36
大数据
数据库
python
数据仓库-Hive基础(二)Hive 的基本概念
什么是HiveHive是基于
Hadoop
的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。
做个合格的大厂程序员
·
2024-02-07 03:42
Spark RDD的学习(JAVA)
注:本文是跟着《Spark快速
大数据分析
》一书学习的笔记式总结,不喜勿喷。RDD(ResilientDistributedDataset)弹性分布式数据集是Spark对数据的核心抽象。
啊其11
·
2024-02-07 02:47
Spark Chapter 8 Spark SQL
参考以慕课网日志分析为例进入大数据Sparksql】0导读SQL:MySQL,Oracle,DB2,SQLServer在大数据平台上实现大数据计算:Hive/SparkSQL/SparkCore直接使用SQL语句进行
大数据分析
深海suke
·
2024-02-07 01:34
自学Python 1 介绍
Python是一款计算机语言,对
大数据分析
、人工智能等机器学习、深度学习都提供了大力的支持。它背后有最庞大的“代码库”,也称之它为“胶水语言”。
江南赴艽野
·
2024-02-07 01:58
Python学习
python
一、Python的自述
1.我们为什么要学习pythonpython应用范围广对
大数据分析
、人工智能中至关重要的机器学习、深度学习都提供了大力支持背后有最庞大的“代码库”习惯称为“胶水语言”2.python能做啥能抢票,数据分析
多斯Niko
·
2024-02-07 01:54
python
Spark
大数据分析
与实战笔记(第三章 Spark RDD弹性分布式数据集-01)
文章目录每日一句正能量第3章SparkRDD弹性分布式数据集章节概要3.1RDD简介3.2RDD的创建方式3.2.1从文件系统加载数据创建RDD3.2.2通过并行集合创建RDD每日一句正能量学如积薪,后来者居上。第3章SparkRDD弹性分布式数据集章节概要传统的MapReduce虽然具有自动容错、平衡负载和可拓展性的优点,但是其最大缺点是采用非循环式的数据流模型,使得在迭代计算式要进行大量的磁盘
想你依然心痛
·
2024-02-07 01:53
分布式
spark
数据分析
Hadoop
集群(第10期副刊)_常用MySQL数据库命令
1、系统管理1.1连接MySQL格式:mysql-h主机地址-u用户名-p用户密码举例:例1:连接到本机上的MySQL。首先在打开DOS窗口,然后进入目录mysqlbin,再键入命令"mysql–uroot–p",回车后提示你输密码,如果刚安装好MySQL,超级用户"root"是没有密码的,故直接回车即可进入到MySQL中了,MySQL的提示符是:mysql>。例2:连接到远程主机上的MYSQL。
阿布2
·
2024-02-07 00:08
Hadoop学习之道
hadoop集群
hadoop
mapreduce
集群
数据挖掘
2024-02-06(Sqoop)
1.SqoopApacheSqoop是
Hadoop
生态体系和RDBMS(关系型数据库)体系之间传递数据的一种工具。Sqoop工作机制是将导入或者导出命令翻译成MapReduce程序来实现。
陈xr
·
2024-02-06 23:29
随记日志
sqoop
大数据
2021-11-02
CancerCell|单细胞测序检测揭示CAR-T脱靶效应(2)原创风不止步图灵基因今天收录于话题#前沿生物
大数据分析
撰文:风不止步IF=31.743推荐度:⭐⭐⭐⭐⭐亮点:研究利用单细胞分析报告了CAR
图灵基因
·
2024-02-06 20:51
java推荐算法_基于内容的推荐算法实现
javapackagecom.oracle.moviecf;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.
hadoop
.conf.Configuration
RED韵
·
2024-02-06 19:54
java推荐算法
大数据学习入门级书籍推荐,零基础小伙伴们关注一下吧
《
大数据分析
:点“数”成金》大数据学习入门级书籍推荐你现在正坐在一座金矿之上,这些金子或被深埋于备份、存档数据之中,或正藏在你眼前的数据集里,它们是提升公司效益、拓展新的商业关系、制订更直观决策的秘诀所在
kuntoria
·
2024-02-06 18:45
Spark简介
Spark作为第二代大数据处理工具,跟
hadoop
对比,它是基于内存的,所以在迭代计算方便速度有了很大提升。我用到的主要是SparkCore,SparkSQL,SparkStreaming。
麦克阿瑟99
·
2024-02-06 18:07
大数据测试
一.功能性测试大数据功能主要涉及系统实现面向
大数据分析
应用的POSIXAPI,包括文件读取与访问控制,元数据操作,锁操作等功能;
大数据分析
系统的POSIX语义不同,实现的文件系统API也不同,功能测试要覆盖到大数据系统涉及实现的
jinhm007
·
2024-02-06 17:53
致IT领域那些忽悠过的概念
这里我要说的是:1:
Hadoop
是大数据解决方案之一,是个代名词,但是不是全部。2:除了少数公司,绝大多数(99.99%)的公
薛晓刚
·
2024-02-06 15:08
数据库
Hbase 数据迁移
Hbase数据迁移可选方案对比l已验证方案操作说明:nExport&importu导出命令及示例hbaseorg.apache.
hadoop
.hbase.mapreduce.Export“表名”文件路径导出至本地文件系统
运维那些事儿
·
2024-02-06 14:44
hbase
hbase
hadoop
大数据
flink学习记录
flink-conf.yaml配置文件:jobmanager.rpc.address:
hadoop
1jobmanager.rpc.port:6123jobmanager.heap.size:512mtaskmanager.heap.size
戏 剧
·
2024-02-06 14:34
flink
Hadoop
命令手册
翻译:http://
hadoop
.apache.org/docs/stable/
hadoop
-project-dist/
hadoop
-common/CommandsManual.html版本:2.9.0
金刚_30bf
·
2024-02-06 13:29
2022-01-31
Cell|计算机模拟人造细胞模型揭示生命奥秘原创旧岛望月亮图灵基因2022-01-3107:03收录于话题#前沿生物
大数据分析
撰文:旧岛望月亮IF=41.582推荐度:⭐⭐⭐⭐⭐亮点:利用计算机模拟人造细胞
图灵基因
·
2024-02-06 10:29
Python中的pyarrow入门
它提供了跨平台、高性能的数据传输和存储解决方案,在数据处理、机器学习和
大数据分析
等领域有广泛应
牛肉胡辣汤
·
2024-02-06 10:42
python
开发语言
热数据存储在HDFS,冷备数据存储于对象存储中
改方案均采用同一套
Hadoop
架构,使用hive均可以读取到,在降低成本的同时提高数据的利用率。2.准备条件c
tuoluzhe8521
·
2024-02-06 10:11
云原生
hdfs
hadoop
大数据
cos
对象存储
5G智能卷烟工厂数字孪生可视化平台,推进烟草行业数字化转型
5G智能卷烟工厂数字孪生可视化平台是一个集成了5G通信技术、物联网技术、
大数据分析
技术和人工智能技术的综合性平
数字孪生巨蟹数科
·
2024-02-06 09:39
三维数据可视化
数字孪生智慧工厂
数字孪生3d可视化
智能卷烟工厂
智能卷烟数字孪生
智能卷烟工厂可视化
智慧烟草数字孪生
巨蟹数科
烟草行业数字化转型
工业互联网
决胜大数据时代:
Hadoop
&Yarn&Spark企业级最佳实践(8天完整版脱产式培训版本)...
Hadoop
、Yarn、Spark是企业构建生产环境下大数据中心的关键技术,也是大数据处理的核心技术,是每个云计算大数据工程师必修课。
weixin_30273931
·
2024-02-06 09:08
java
人工智能
移动开发
地下停车场智慧监查系统:科技让停车更智能
地下停车场智慧监查系统运用了先进的物联网技术和
大数据分析
技术,可以对停车场进行全方位的实时监控和管理。该系统具备以下几大功能:(1)智能监控:通过高清摄像头和
久数君
·
2024-02-06 08:19
科技
物联网
人工智能
信息可视化
数据分析
linux安装
hadoop
详细步骤(伪分布式)
今天重装了下
hadoop
,特在此记录下!
红烧柯基
·
2024-02-06 08:28
linux
hadoop
linux
Hadoop
-Yarn-启动篇
一、源码下载下面是
hadoop
官方源码下载地址,我下载的是
hadoop
-3.2.4,那就一起来看下吧Indexof/dist/
hadoop
/core二、脚本部分1、start-yarn.sh如果我们想单独启动
隔着天花板看星星
·
2024-02-06 07:16
hadoop
大数据
分布式
ES核心干货学习(原理及数据结构)
2.需要进行分词检索,语义检索3.需要
大数据分析
符合上面特征都可以考虑,如日志收集、订单数据链查询,文章检索等。1.3为啥选
li644872790
·
2024-02-06 07:23
elasticsearch
lucene
java
全文检索
搜索引擎
Spark
大数据分析
与实战笔记(第二章 Spark基础-06)
文章目录每日一句正能量2.6IDEA开发WordCount程序2.6.1本地模式执行Spark程序2.6.2集群模式执行Spark程序每日一句正能量我们全都要从前辈和同辈学习到一些东西。就连最大的天才,如果想单凭他所特有的内在自我去对付一切,他也决不会有多大成就。2.6IDEA开发WordCount程序Spark-Shell通常在测试和验证我们的程序时使用的较多,然而在生产环境中,通常会在IDEA
想你依然心痛
·
2024-02-06 07:38
#
Spark大数据分析与实战
spark
数据分析
笔记
想学大数据?先看完这几本书再说
除了这些技术领域,还有一些特定的技术和语言需要你继续研究:
Hadoop
,Spark,Python,和R等等,还有无数实现自动化的工具等等,这些工具几乎每天都会用到,这就需要你不断的学习。
yoku酱
·
2024-02-06 06:55
CentOS 8 安装配置
Hadoop
3.3.6 伪分布式安装方式(适用于开发和调试)
1.配置服务器ssh免密登录,否则后面启动会报错:尝试通过SSH连接到主机出现认证错误的提示配置服务器ssh免密登录:1.生成SSH密钥对(如果尚未生成):执行下面的命令生成密钥对,一直回车即可ssh-keygen-trsa出现下面的提示说明生成成功了:2.第二步,将公钥添加到~/.ssh/authorized_keys文件:cat~/.ssh/id_rsa.pub>>~/.ssh/authori
鱼大虾
·
2024-02-06 05:39
centos
linux
运维
HDFS入门基础
HDFS命令基础语法:【
hadoop
fs具体命令、hdfsdfs具体命令】两个是完全相同的。显示文件列表#hdfsdfs-lsURL创建目录#hdfsdfs-mkdir[-p]URL使用-p参数可以
nucty
·
2024-02-06 05:33
大数据
hdfs
hadoop
大数据
电商推荐系统
一、获取用户对商品的偏好值代码实现packagezb.grms;importorg.apache.
hadoop
.conf.Configuration;importorg.apache.
hadoop
.conf.Configured
nucty
·
2024-02-06 05:31
大数据
mapreduce
hadoop
Apache
Hadoop
Apache
Hadoop
_狭义上说,
Hadoop
指Apache一款java语言开发的开源框架,它的核心组件有:HDFS(分布式文件系统):解决海量数据存储YARN(作业调度和集群资源管理的框架):解决资源任务调度
VincentLeon
·
2024-02-06 05:28
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装
Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装1简介Ambari跟
Hadoop
等开源软件一样,也是ApacheSoftwareFoundation中的一个项目,并且是顶级项目。
WaiSaa
·
2024-02-06 02:53
关于Spark/
Hadoop
中Master/Slave IP不正确的问题
在配置SparkStandAloneMode的时候,我遇到了Slave无法向正确的MasterIP发送数据的问题。通常这类问题都来源于没有正确配置./conf/spark_env.sh文件,只要在这个文件里定义好了SPARK_LOCAL_IP和SPARK_MASTER_HOST,就可以解决这个问题。而我设置了configure文件之后问题依然存在。原因在于MasterNode上有多个网卡,每个网卡
ecce
·
2024-02-06 02:37
hbase基本命令
1、进入hbase的shellhbase提供了一个shell的终端给用户交互[root@
hadoop
3conf]#hbaseshell退出使用quit或者ctrl+c需要关闭
hadoop
的安全模式不然进行一些操作
小月半会飞
·
2024-02-06 01:52
shell中正则表达式
[atguigu@
hadoop
101shells]$cat/etc/passwd|grepatguigu1.常用特殊字符^$.*[]\^:匹配一行的开头$:匹配一行的结束.
看山不是山a
·
2024-02-05 23:07
Linux
正则表达式
linux
运维
大数据开发之机器学习总结(一)
前者就是很多时候的
大数据分析
场景,后者则涉及到算法模型,机器学习的范畴。更进一步,人工智能,但机器学习和人工智能,本身其实技术上并没有非常严格的界限。
闻香识代码
·
2024-02-05 21:41
大数据
机器学习
用户画像
机器学习
大数据
算法
大数据之 ZooKeeper原理及其在
Hadoop
和HBase中的应用
链接:https://blog.csdn.net/zhang123456456/article/details/78008626ZooKeeper是一个开源的分布式协调服务,由雅虎创建,是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeep
yangfhit
·
2024-02-05 20:29
大数据分析
|
大数据分析
的十大应用领域
有许多技术可用于分析大数据。这项工作介绍了BDA适用的各种分析技术领域如下。(1)社会分析社交分析是实时数据分析中一个重要且不断发展的分析方法。它分为社交网络(例如,Facebook和LinkedIn),博客(例如,Blogger和WordPress),微博客(例如,Twitter和Tumblr),社会新闻(例如,Digg和Reddit),社交书签(例如,Delicious和StumbleUpon
封印师请假去地球钓鱼
·
2024-02-05 20:35
统计与数据分析素养max
BDA
大数据分析
数据可视化
大数据分析应用
Hadoop
Start(1) ——Google与
Hadoop
的前世今生
参考文档:《
Hadoop
权威指南(第4版)》网址:http://
hadoop
.apache.org/[1]HDFS:
Hadoop
DistributionFileSystem
Hadoop
分布式文件系统[2
bclz
·
2024-02-05 18:41
上一页
5
6
7
8
9
10
11
12
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他