Hadoop大数据分析第9页

人工智能与工业4.0在智能制造的应用

美国辛辛那提大学特聘讲座教授,美国白宫信息物理系统与美国挑战项目顾问李杰，在2017中国大数据应用大会上，分享了对工业大数据，以及人工智能怎么改进工业大数据分析的见解。

weixin_30649859·2024-02-07 07:15

win10 spark scala 本地运行wordcount

注意每次修改环境变量都要重启cmd本机运行需要hadoopcommon，可以从github下载zip，解包以后设置HADOOP_HOME环境变量指向它，然后在PATH里加上HADOOP_HOME\bin

疯琴·2024-02-07 06:06

同是ZooKeeper，你和架构师的理解差在哪里？

Dubbo，Kafka,Hadoop等等项目里都能看到它的影子。但是你真的了解ZooKeeper吗？如果面试官让你给他讲讲ZooKeeper是个什么东西，你能回答到什么地步呢？

l鹿狸i·2024-02-07 06:12

Hadoop-IDEA开发平台搭建

1.安装下载Hadoop文件1）hadoop-3.3.5将下载的文件保存到英文路径下，名称一定要短。

Snower_2022·2024-02-07 05:02

【实验1】分布式模式的CentOS 6上安装Hadoop（1个master节点，2个slave节点）

实验环境：二、实验内容与步骤（过程及数据记录）：1.安装VMWareWorkstation162.VMWare10安装CentOS62.1CentOS系统安装2.2CentOS系统安装中的关键问题2.3克隆HadoopSlave3

-借我杀死庸碌的情怀-·2024-02-07 05:31

在多台阿里云服务器上部署Hadoop分布式系统及WordCount实验

一、实现master与slave之间无密码连接分别在master及slave上生成rsa密钥：mkdir~/.sshcd~/.sshssh-keygen-t-rsa一路回车（选择默认设置），此时，ssh文件夹中生成了id_rsa.pub和id_rsa两个，然后使用scp命令将公钥（id_rsa.pub）分别拷到对方机器中scpid_rsa.pubh1@对方机器IP：~/.ssh/authorize

Clearlove灬Star·2024-02-07 05:01

合肥工业大学2022大数据技术实验二

实验序号及名称：实验二在Hadoop平台上部署WordCount程序实验时间∶2022年5月14日预习内容一、实验目的和要求∶在Hadoop平台上部署WordCount程序。

一头骇人鲸·2024-02-07 05:00

hadoopwordcount代码分析

输入输出文件异常类importjava.util.Iterator;Iterator是迭代器类importjava.util.StringTokenizer;用来对字符串进行切importorg.apache.hadoop.fs.Path

姹紫_嫣红·2024-02-07 05:57

【实验2】在Hadoop平台上部署WordCount程序

HDFS6.分布式文件系统HDFS上的编程实践6.1安装Eclipse6.2创建Eclipse工程6.3编写一个Java应用程序检测HDFS中是否存在一个文件7.Eclipse上的HDFS操作7.1安装Hadoop-Eclipse

-借我杀死庸碌的情怀-·2024-02-07 05:27

如何将日志文件和二进制文件快速导入HDFS？

日志数据在应用程序中一直很常见，Hadoop能够处理生产系统生成的大量日志数据，比如网络设备、操作系统、Web服务器和应用程序的日志数据。

weixin_34159110·2024-02-07 05:36

数据仓库-Hive基础（二）Hive 的基本概念

什么是HiveHive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供类SQL查询功能。

做个合格的大厂程序员·2024-02-07 03:42

Spark RDD的学习(JAVA)

注：本文是跟着《Spark快速大数据分析》一书学习的笔记式总结，不喜勿喷。RDD(ResilientDistributedDataset)弹性分布式数据集是Spark对数据的核心抽象。

啊其11·2024-02-07 02:47

Spark Chapter 8 Spark SQL

参考以慕课网日志分析为例进入大数据Sparksql】0导读SQL：MySQL，Oracle，DB2，SQLServer在大数据平台上实现大数据计算：Hive/SparkSQL/SparkCore直接使用SQL语句进行大数据分析

深海suke·2024-02-07 01:34

自学Python 1 介绍

Python是一款计算机语言，对大数据分析、人工智能等机器学习、深度学习都提供了大力的支持。它背后有最庞大的“代码库”，也称之它为“胶水语言”。

江南赴艽野·2024-02-07 01:58

一、Python的自述

1.我们为什么要学习pythonpython应用范围广对大数据分析、人工智能中至关重要的机器学习、深度学习都提供了大力支持背后有最庞大的“代码库”习惯称为“胶水语言”2.python能做啥能抢票，数据分析

多斯Niko·2024-02-07 01:54

Spark大数据分析与实战笔记（第三章 Spark RDD弹性分布式数据集-01）

文章目录每日一句正能量第3章SparkRDD弹性分布式数据集章节概要3.1RDD简介3.2RDD的创建方式3.2.1从文件系统加载数据创建RDD3.2.2通过并行集合创建RDD每日一句正能量学如积薪，后来者居上。第3章SparkRDD弹性分布式数据集章节概要传统的MapReduce虽然具有自动容错、平衡负载和可拓展性的优点，但是其最大缺点是采用非循环式的数据流模型，使得在迭代计算式要进行大量的磁盘

想你依然心痛·2024-02-07 01:53

Hadoop集群（第10期副刊）_常用MySQL数据库命令

1、系统管理1.1连接MySQL格式：mysql-h主机地址-u用户名－p用户密码举例：例1：连接到本机上的MySQL。首先在打开DOS窗口，然后进入目录mysqlbin，再键入命令"mysql–uroot–p"，回车后提示你输密码，如果刚安装好MySQL，超级用户"root"是没有密码的，故直接回车即可进入到MySQL中了，MySQL的提示符是：mysql>。例2：连接到远程主机上的MYSQL。

阿布2·2024-02-07 00:08

2024-02-06（Sqoop）

1.SqoopApacheSqoop是Hadoop生态体系和RDBMS（关系型数据库）体系之间传递数据的一种工具。Sqoop工作机制是将导入或者导出命令翻译成MapReduce程序来实现。

陈xr·2024-02-06 23:29

2021-11-02

CancerCell|单细胞测序检测揭示CAR-T脱靶效应（2）原创风不止步图灵基因今天收录于话题#前沿生物大数据分析撰文：风不止步IF=31.743推荐度：⭐⭐⭐⭐⭐亮点：研究利用单细胞分析报告了CAR

图灵基因·2024-02-06 20:51

java推荐算法_基于内容的推荐算法实现

javapackagecom.oracle.moviecf;importjava.io.IOException;importjava.util.ArrayList;importjava.util.List;importorg.apache.hadoop.conf.Configuration

RED韵·2024-02-06 19:54

大数据学习入门级书籍推荐，零基础小伙伴们关注一下吧

《大数据分析：点“数”成金》大数据学习入门级书籍推荐你现在正坐在一座金矿之上，这些金子或被深埋于备份、存档数据之中，或正藏在你眼前的数据集里，它们是提升公司效益、拓展新的商业关系、制订更直观决策的秘诀所在

kuntoria·2024-02-06 18:45

Spark简介

Spark作为第二代大数据处理工具，跟hadoop对比，它是基于内存的，所以在迭代计算方便速度有了很大提升。我用到的主要是SparkCore,SparkSQL,SparkStreaming。

麦克阿瑟99·2024-02-06 18:07

大数据测试

一.功能性测试大数据功能主要涉及系统实现面向大数据分析应用的POSIXAPI，包括文件读取与访问控制，元数据操作，锁操作等功能；大数据分析系统的POSIX语义不同，实现的文件系统API也不同，功能测试要覆盖到大数据系统涉及实现的

jinhm007·2024-02-06 17:53

致IT领域那些忽悠过的概念

这里我要说的是：1：Hadoop是大数据解决方案之一，是个代名词，但是不是全部。2：除了少数公司，绝大多数（99.99%）的公

薛晓刚·2024-02-06 15:08

Hbase 数据迁移

Hbase数据迁移可选方案对比l已验证方案操作说明：nExport&importu导出命令及示例hbaseorg.apache.hadoop.hbase.mapreduce.Export“表名”文件路径导出至本地文件系统

运维那些事儿·2024-02-06 14:44

flink学习记录

flink-conf.yaml配置文件：jobmanager.rpc.address:hadoop1jobmanager.rpc.port:6123jobmanager.heap.size:512mtaskmanager.heap.size

戏剧·2024-02-06 14:34

Hadoop 命令手册

翻译：http://hadoop.apache.org/docs/stable/hadoop-project-dist/hadoop-common/CommandsManual.html版本：2.9.0

金刚_30bf·2024-02-06 13:29

2022-01-31

Cell|计算机模拟人造细胞模型揭示生命奥秘原创旧岛望月亮图灵基因2022-01-3107:03收录于话题#前沿生物大数据分析撰文：旧岛望月亮IF=41.582推荐度：⭐⭐⭐⭐⭐亮点：利用计算机模拟人造细胞

图灵基因·2024-02-06 10:29

Python中的pyarrow入门

它提供了跨平台、高性能的数据传输和存储解决方案，在数据处理、机器学习和大数据分析等领域有广泛应

牛肉胡辣汤·2024-02-06 10:42

热数据存储在HDFS，冷备数据存储于对象存储中

改方案均采用同一套Hadoop架构，使用hive均可以读取到，在降低成本的同时提高数据的利用率。2.准备条件c

tuoluzhe8521·2024-02-06 10:11

5G智能卷烟工厂数字孪生可视化平台，推进烟草行业数字化转型

5G智能卷烟工厂数字孪生可视化平台是一个集成了5G通信技术、物联网技术、大数据分析技术和人工智能技术的综合性平

数字孪生巨蟹数科·2024-02-06 09:39

决胜大数据时代：Hadoop&Yarn&Spark企业级最佳实践（8天完整版脱产式培训版本）...

Hadoop、Yarn、Spark是企业构建生产环境下大数据中心的关键技术，也是大数据处理的核心技术，是每个云计算大数据工程师必修课。

weixin_30273931·2024-02-06 09:08

地下停车场智慧监查系统：科技让停车更智能

地下停车场智慧监查系统运用了先进的物联网技术和大数据分析技术，可以对停车场进行全方位的实时监控和管理。该系统具备以下几大功能：（1）智能监控：通过高清摄像头和

久数君·2024-02-06 08:19

linux安装hadoop详细步骤（伪分布式）

今天重装了下hadoop，特在此记录下！

红烧柯基·2024-02-06 08:28

Hadoop-Yarn-启动篇

一、源码下载下面是hadoop官方源码下载地址，我下载的是hadoop-3.2.4，那就一起来看下吧Indexof/dist/hadoop/core二、脚本部分1、start-yarn.sh如果我们想单独启动

隔着天花板看星星·2024-02-06 07:16

ES核心干货学习（原理及数据结构）

2.需要进行分词检索，语义检索3.需要大数据分析符合上面特征都可以考虑，如日志收集、订单数据链查询，文章检索等。1.3为啥选

li644872790·2024-02-06 07:23

Spark大数据分析与实战笔记（第二章 Spark基础-06）

文章目录每日一句正能量2.6IDEA开发WordCount程序2.6.1本地模式执行Spark程序2.6.2集群模式执行Spark程序每日一句正能量我们全都要从前辈和同辈学习到一些东西。就连最大的天才，如果想单凭他所特有的内在自我去对付一切，他也决不会有多大成就。2.6IDEA开发WordCount程序Spark-Shell通常在测试和验证我们的程序时使用的较多，然而在生产环境中,通常会在IDEA

想你依然心痛·2024-02-06 07:38

想学大数据？先看完这几本书再说

除了这些技术领域，还有一些特定的技术和语言需要你继续研究：Hadoop，Spark，Python，和R等等，还有无数实现自动化的工具等等，这些工具几乎每天都会用到，这就需要你不断的学习。

yoku酱·2024-02-06 06:55

CentOS 8 安装配置 Hadoop3.3.6 伪分布式安装方式（适用于开发和调试）

1.配置服务器ssh免密登录，否则后面启动会报错：尝试通过SSH连接到主机出现认证错误的提示配置服务器ssh免密登录：1.生成SSH密钥对（如果尚未生成）：执行下面的命令生成密钥对，一直回车即可ssh-keygen-trsa出现下面的提示说明生成成功了：2.第二步，将公钥添加到~/.ssh/authorized_keys文件：cat~/.ssh/id_rsa.pub>>~/.ssh/authori

鱼大虾·2024-02-06 05:39

HDFS入门基础

HDFS命令基础语法：【hadoopfs具体命令、hdfsdfs具体命令】两个是完全相同的。显示文件列表#hdfsdfs-lsURL创建目录#hdfsdfs-mkdir[-p]URL使用-p参数可以

nucty·2024-02-06 05:33

nucty·2024-02-06 05:31

Apache Hadoop

ApacheHadoop_狭义上说，Hadoop指Apache一款java语言开发的开源框架，它的核心组件有：HDFS（分布式文件系统）：解决海量数据存储YARN（作业调度和集群资源管理的框架）：解决资源任务调度

VincentLeon·2024-02-06 05:28

Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装

Centos7.5+Ambari2.7.3+HDP3.1.0.0离线安装1简介Ambari跟Hadoop等开源软件一样，也是ApacheSoftwareFoundation中的一个项目，并且是顶级项目。

WaiSaa·2024-02-06 02:53

关于Spark/Hadoop中Master/Slave IP不正确的问题

在配置SparkStandAloneMode的时候，我遇到了Slave无法向正确的MasterIP发送数据的问题。通常这类问题都来源于没有正确配置./conf/spark_env.sh文件，只要在这个文件里定义好了SPARK_LOCAL_IP和SPARK_MASTER_HOST，就可以解决这个问题。而我设置了configure文件之后问题依然存在。原因在于MasterNode上有多个网卡，每个网卡

ecce·2024-02-06 02:37

hbase基本命令

1、进入hbase的shellhbase提供了一个shell的终端给用户交互[root@hadoop3conf]#hbaseshell退出使用quit或者ctrl+c需要关闭hadoop的安全模式不然进行一些操作

小月半会飞·2024-02-06 01:52

shell中正则表达式

[atguigu@hadoop101shells]$cat/etc/passwd|grepatguigu1.常用特殊字符^$.*[]\^：匹配一行的开头$：匹配一行的结束.

看山不是山a·2024-02-05 23:07

大数据开发之机器学习总结（一）

前者就是很多时候的大数据分析场景，后者则涉及到算法模型，机器学习的范畴。更进一步，人工智能，但机器学习和人工智能，本身其实技术上并没有非常严格的界限。

闻香识代码·2024-02-05 21:41

大数据之 ZooKeeper原理及其在Hadoop和HBase中的应用

链接：https://blog.csdn.net/zhang123456456/article/details/78008626ZooKeeper是一个开源的分布式协调服务，由雅虎创建，是GoogleChubby的开源实现。分布式应用程序可以基于ZooKeeper实现诸如数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等功能。简介ZooKeep

yangfhit·2024-02-05 20:29

大数据分析|大数据分析的十大应用领域

有许多技术可用于分析大数据。这项工作介绍了BDA适用的各种分析技术领域如下。（1）社会分析社交分析是实时数据分析中一个重要且不断发展的分析方法。它分为社交网络(例如，Facebook和LinkedIn)，博客(例如，Blogger和WordPress)，微博客(例如，Twitter和Tumblr)，社会新闻(例如，Digg和Reddit)，社交书签(例如，Delicious和StumbleUpon

封印师请假去地球钓鱼·2024-02-05 20:35

Hadoop Start(1) ——Google与Hadoop的前世今生

参考文档:《Hadoop权威指南(第4版)》网址:http://hadoop.apache.org/[1]HDFS：HadoopDistributionFileSystemHadoop分布式文件系统[2

bclz·2024-02-05 18:41

推荐频道

Hadoop大数据分析