E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
Hadoop实操
【spark床头书系列】如何在YARN上启动Spark官网权威详解说明
属性重要说明KerberosYARN特定的Kerberos配置Kerberos故障排除配置外部Shuffle服务使用ApacheOozie启动应用程序使用Spark历史服务器替代SparkWebUI官网链接确保
HADOOP
_CONF_DIR
BigDataMLApplication
·
2025-01-26 18:20
spark
spark
大数据
分布式
xgboost在spark集群使用指南
相同的代码在主要的分布式环境(
Hadoop
、SGE、MPI)上运行,可以解决数十亿个示例的训练问题。xgb相对于gbt所做的改进:1.2.3.XGBoost可以使用R、python、java
一颗小草333
·
2025-01-26 17:49
算法
mapreduce
spark
数据挖掘
解决Python中libhdfs.so的共享库找不到的问题
这个错误通常发生在使用Python访问
Hadoop
分布式文件系统(
Hadoop
DistributedFileSystem,简称HDFS)时,由于缺少libhdfs.so共享库文件而
code_welike
·
2025-01-26 16:34
python
开发语言
Python
《Spark大数据分析与内存计算》——第三章
(单选题)并不是所有企业都能自己产生数据,从而用于决策辅助,而更多的互联网企业如电商等大部分是要靠什么来抓取互联网数据进行分析A.
Hadoop
B.pythonC.SparkD.网路爬虫正确答案:D:网路爬虫
阿万古
·
2025-01-26 05:07
课程作业
spark
数据分析
大数据
Hive数据仓库中的数据导出到MySQL的数据表不成功
可能的原因:(1)没有下载flume和sqoop(2)权限问题:因为MySQL数据库拒绝了root用户从
hadoop
3主机的连接请求,root用户没有从
hadoop
3主机进行连接的权限解决:通过MySQL
sin2201
·
2025-01-26 04:01
出错问题
数据仓库
hive
mysql
探秘FreeMovie:一个开源的电影推荐系统
技术分析FreeMovie的核心架构包括以下关键组件:数据处理-项目采用
Hadoop
进行大数据预处
孟振优Harvester
·
2025-01-26 02:39
用 Docker 搭建 Spark 集群
简介Spark是Berkeley开发的分布式计算的框架,相对于
Hadoop
来说,Spark可以缓存中间结果到内存而提高某些需要迭代的计算场景的效率,目前收到广泛关注。
yeasy
·
2025-01-26 00:22
Bigdata
Docker
spark
Docker
云计算
集群
分布式计算
不同hive集群中基于表的数据一致性比对
前阵子博主遇到一个需求,因对
hadoop
集群进行数据迁移,数据迁移完毕后进行两个hive库的数据一致性的比对,不仅对源表数据进行比对,而且要同时使用两个集群加工相同数据,对加工后的数据进行数据一致性比对
AA赵师傅
·
2025-01-25 07:19
hadoop数据管理
hive
数据验证
数据迁移
hadoop
Hadoop
、Hive、Hbase集群间的数据迁移
一、
hadoop
集群间拷贝数据:迁移之前需要把两个集群的所有节点都互通/etc/hosts文件(重要,包括各个数据节点)两个集群版本不相同
hadoop
distcphftp://192.168.57.73
这个操蛋的人生!!!
·
2025-01-25 07:18
Hive面试题汇总
Hive定义Hive是建立在
Hadoop
上的数据仓库基础构架。可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
大数据侠客
·
2025-01-25 07:18
hive相关问题汇总及解决
hive
hadoop
数据仓库
面试
CDH大数据平台
CDH概念CDH(ClouderaDistributionIncludingApache
Hadoop
)是由Cloudera公司提供的一个集成了Apache
Hadoop
以及相关生态系统的发行版本。
梦龙zmc
·
2025-01-25 06:44
大数据
大数据
【大数据入门核心技术-Hive】(十六)hive表加载csv格式数据或者json格式数据
高可用集群搭建二、hive加载Json格式数据1、数据准备vistu.json[{"id":111,"name":"name111"},{"id":222,"name":"name22"}]上传到hdfs
hadoop
fs-putstu.j
forest_long
·
2025-01-24 12:27
大数据技术入门到21天通关
大数据
hive
hadoop
开发语言
后端
数据仓库
cascading 入门 (一)
1cascading是什么cascading是一个架构在
Hadoop
上的API,用来创建复杂和容错数据处理工作流。
zhumin726
·
2025-01-24 01:28
MySQL 分库分表方案
(但更期待后期的
实操
)会从以下几个方面说起:第一部分:实际网站发展过程中面临的问题。第二部分:有哪几种切分方式,垂直
·
2025-01-23 22:31
数据库mysql
搭建单机伪分布式
Hadoop
+spark+scala
五、免密登陆1.创建ssh秘钥,输入如下命令,生成公私密钥2.将master公钥id_dsa复制到master进行公钥认证,实现本机免密登陆,测试完exit退出六、安装
Hadoop
软件1.解压hadoo
啥也不会0-0
·
2025-01-23 16:21
分布式
hadoop
spark
Hadoop
与 Spark:大数据处理的比较
大数据技术:涵盖
Hadoop
(HDFS)、Hive、Spark、Fli
王子良.
·
2025-01-23 16:50
大数据
经验分享
hadoop
spark
大数据
虚拟机VMware Workstation Pro安装集群+
hadoop
+spark+scala
参考资料:参考视频教程链接:大数据实验虚拟机安装
Hadoop
和Spark_哔哩哔哩_bilibiliup主:孤独时代的硕硕namenode安装选择镜像、路径、磁盘(最好不要c盘)、内存和处理器编辑名称与位置可点击此处自定义硬盘进行设置
落枫兮
·
2025-01-23 15:16
hadoop
spark
scala
Hadoop
分布式文件系统-HDFS架构
一、HDFS的简介HDFS全称
Hadoop
DistributedFileSystem,是分布式文件管理系统。
Fancs2024
·
2025-01-23 09:37
hadoop
hadoop
hdfs
【Python实战】元组!编程小白的必修课!
想对大家说的话:大家好呀,耶耶最近打算开一起新的专栏,带着大家敲代码,让大家在了解python理论的基础上学会
实操
,真正做到大彻大悟!
努力学习的耶耶
·
2025-01-23 07:49
python
TiDB 对
Hadoop
的影响:大数据时代的新选择
TiDB对
Hadoop
的影响:大数据时代的新选择随着大数据时代的到来,各种处理和存储海量数据的技术应运而生。
狮歌~资深攻城狮
·
2025-01-23 06:10
tidb
数据仓库
数据分析
数据库
分布式
Azure学生订阅上手
实操
:在Ubuntu VPS上利用Docker快速部署PostgreSQL数据库
引言本文将详细指导您如何在Azure100学生订阅中,利用Ubuntu虚拟机,通过Docker容器技术快速搭建PostgreSQL数据库。我们将从Docker和PostgreSQL的基础知识入手,逐步讲解部署过程中的每一个步骤,并提供完整的命令和配置文件示例。Docker和PostgreSQL简介Docker是一种开源的容器化平台,它可以让开发者打包他们的应用以及依赖项到一个可移植的容器中。这些容
shelby_loo
·
2025-01-23 05:58
数据库
azure
ubuntu
Azure学生订阅上手
实操
:快速搭建Docker+WordPress环境
引言本文将详细指导您如何在Azure100学生订阅中,创建一台Ubuntu虚拟机,并利用Docker快速部署一个WordPress站点。这对于初学者和想要搭建个人博客或小型网站的用户来说,是一个非常实用的教程。Docker和WordPress简介Docker是一个开源的应用容器引擎,它可以让开发者打包他们的应用以及依赖包到一个轻量级、可移植的容器中,然后发布到任何流行的Linux机器上,甚至是云平
shelby_loo
·
2025-01-23 04:18
azure
docker
microsoft
Apache DolphinScheduler 限制秒级别的定时调度
但历史上出现过因配置的疏忽大意而产生故障时间,如应该配置每分钟执行的工作流被配置长了每秒执行,造成短时间内产生大量工作流实例,对ApacheDolphinScheduler服务可用性和提交任务的
Hadoop
·
2025-01-22 16:58
数据库
有了TiDB,是否还需要“散装”大数据组件?
最近和同事们讨论一个问题:在大数据应用日益增多的今天,如果使用了TiDB这样的一体化数据库,还需要使用那些传统的大数据组件(比如
Hadoop
、Spark等)吗?
狮歌~资深攻城狮
·
2025-01-22 15:02
tidb
数据仓库
数据分析
数据库
分布式
Hadoop
是什么,怎么部署安装?
Hadoop
是什么?
Hadoop
是一个由Apache基金会开发的开源分布式系统基础架构,主要用于处理和存储大规模数据集。
狮歌~资深攻城狮
·
2025-01-22 15:01
hadoop
大数据
分布式
你有一份待查收的TextIn文档解析内测邀请函!
内测功能详情见下:1内置参数,去除图片和PDF水印
实操
场景下,部分带有明显水印的文件,会在解析过程中由于水印干扰产生错漏字现象。TextInParseX将去水印功能
·
2025-01-22 11:19
内测分发人工智能解析文本
鸿蒙 Flutter 实战:14-现有 Flutter 项目支持鸿蒙 II
文中讲述了整体的理念和思路,本文更进一步,结合可
实操
的项目代码,详细说明如何实施。
星释
·
2025-01-22 04:06
鸿蒙
Flutter
实战
harmonyos
flutter
华为
小白学JVM调优一: 三种场景模拟OOM获得dump文件
小白学JVM调优一:三种场景模拟OOM获得dump文件三种场景模拟OOM获得dump文件
实操
一.mac用idea启动main方法导致堆内存溢出,使用EclipseMemoryAnalyzer分析://VMoption
hinsss
·
2025-01-22 00:13
Java
jvm
java
linux
azkaban的概况
Azkaban的性质azkaban是一个任务调度,管理系统,可以帮用户管理,调度各种运算任务的一个web服务器可以调度任何任务,只要你的任务能用脚本启动azkaban的类似的产品还有很多,例如
hadoop
北京小峻
·
2025-01-21 23:35
大数据
azkaban
mysql
数据库
基于
hadoop
的协同过滤算法电影推荐系统的设计与实现
基于
hadoop
的协同过滤算法电影推荐系统的设计与实现文章目录基于
hadoop
的协同过滤算法电影推荐系统的设计与实现1.背景介绍1.1电影推荐系统的重要性1.2传统推荐系统的缺陷1.3
Hadoop
在大数据处理中的作用
AI天才研究院
·
2025-01-21 23:32
大数据AI人工智能
AI大模型企业级应用开发实战
计算科学
神经计算
深度学习
神经网络
大数据
人工智能
大型语言模型
AI
AGI
LLM
Java
Python
架构设计
Agent
RPA
hive电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档]【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到
hadoop
QQ-1305637939
·
2025-01-21 22:28
毕业设计
大数据毕设
计算机毕业设计
hive
spring
boot
爬虫
hadoop
电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
全套视频教程全套开发文档
hadoop
电影数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示【
Hadoop
项目】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv
QQ-1305637939
·
2025-01-21 22:28
计算机毕业设计
毕业设计
大数据毕设
hadoop
spring
boot
爬虫
spark电影数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫2万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
协同过滤-余弦函数推荐系统爬虫2万+数据大屏数据展示+[手把手视频教程和开发文档【功能介绍】1.java爬取【豆瓣电影】网站中电影数据,保存为data.csv文件,数据量2万+2.data.csv上传到
hadoop
QQ-1305637939
·
2025-01-21 22:58
毕业设计
大数据毕设
计算机毕业设计
spark
spring
boot
爬虫
大数据
电影推荐
电影分析
hadoop
图书数据分析系统 Springboot协同过滤-余弦函数推荐系统 爬虫1万+数据 大屏数据展示 + [手把手视频教程 和 开发文档]
hadoop
图书数据分析系统Springboot协同过滤-余弦函数推荐系统爬虫1万+数据大屏数据展示+[手把手视频教程和开发文档]【亮点功能】1.Springboot+Vue+Element-UI+Mysql
QQ-1305637939
·
2025-01-21 22:57
毕业设计
大数据毕设
图书数据分析
hadoop
spring
boot
爬虫
2024年最全(一)大数据---
Hadoop
整体介绍(架构层)----(组件,并发知识体系大全
Hadoop
方案一、大数据介绍============
2401_84586689
·
2025-01-21 21:19
程序员
大数据
hadoop
架构
嵌入式工程师必学(77):如何用Cadence17.4画一张PCB原理图
一个设计PCBSchematic的
实操
例子,这个例子是基于pspice的。
芯片-嵌入式
·
2025-01-21 21:45
schemetic
大数据分析专业毕业设计最新最全选题精华汇总--持续更新中⑤
以下是学长精心整理的一些选题:21.基于
Hadoop
和Spa
源码空间站11
·
2025-01-21 20:37
python
django
大数据分析
数据可视化
hadoop
hive
大数据分析毕设
解锁辅助驾驶新境界:基于昇腾 AI 异构计算架构 CANN 的应用探秘
的定义和作用3.CANN的技术优势三、基于CANN的辅助驾驶AI应用原理1.目标检测算法2.智能检测流程3.算力平台支持四、基于CANN的辅助驾驶AI优势1.高效训练2.精准检测3.快速编程4.产业应用五、部署
实操
六
倔强的石头_
·
2025-01-21 19:25
AIGC
人工智能
架构
Hive SQL 分组与连接操作详解
目录分组GroupBy语句1.案例
实操
Having语句1.having与where不同点2.案例
实操
Join语句等值Join1.案例
实操
表的别名1.好处2.案例
实操
内连接左外连接右外连接满外连接多表连接
大数据深度洞察
·
2025-01-21 18:48
Hive
数据库
hive
大数据
数据仓库
sql
Hadoop
常用命令
查看指定目录下的文件及文件夹
hadoop
fs-ls/user/hive/warehouse/查看指定目录下的文件及文件夹大小#文件大小(单位Byte)
hadoop
fs-du/user/hive/warehouse
ZenPower
·
2025-01-21 06:59
hadoop
大数据
分布式
hadoop
常用命令汇总
1、查看目录下的文件列表:
hadoop
fs–ls[文件目录]
hadoop
fs-ls-h/lance2、将本机文件夹存储至
hadoop
上:
hadoop
fs–put[本机目录][
hadoop
目录]
hadoop
fs-putlance
m0_67402026
·
2025-01-21 06:59
java
java
后端
hadoop
常用命令
Yarn查看提交到资源调度器的任务(任何用yarn资源的都可以看,比如spark、tez、mapreduce)看正在运行的yarn任务yarnapplication-list杀死对应的yarn任务yarnapplication-kill{application_Id}(id可以通过-list看到)hdfs查看hdfs目录hdfsdfs-ls/(查看本集群的目录)hdfsdfs-lshdfs://i
我要用代码向我喜欢的女孩表白
·
2025-01-21 05:54
hadoop
npm
大数据
Python气象数据分析:风速预报订正、台风预报数据智能订正、机器学习预测风电场的风功率、浅水模型、预测ENSO等
目录专题一Python和科学计算基础专题二机器学习和深度学习基础理论和
实操
专题三气象领域中的机器学习应用实例专题四气象领域中的深度学习应用实例更多应用Python是功能强大、免费、开源,实现面向对象的编程语言
小艳加油
·
2025-01-21 05:20
大气科学
python
人工智能
气象
机器学习
实操
数据预处理:从理论到实践的基础步骤
在快速发展的人工智能领域,数据不仅是基础,更是推动技术创新的关键力量。高质量的数据集是构建高效、准确模型的前提。本文将全面深入探讨数据预处理的各个环节,从基础的数据清洗到复杂的数据增强,再到高效的Python应用实践,为你提供一站式的数据处理解决方案。无论你的经验如何,这篇文章都将成为你宝贵的资源。数据清洗:打好数据质量的基础数据清洗是提升数据质量的首要步骤,涵盖了如下几个关键操作:缺失值的智能处
炼丹侠
·
2025-01-21 03:30
python
机器学习
人工智能
java nat 端口转发_NAT网络地址转换——静态NAT,端口映射(
实操
!!)
NAT概述NAT(NetworkAddressTranslation,网络地址转换)是1994年提出的。当在专用网内部的一些主机本来已经分配到了本地IP地址(即仅在本专用网内使用的专用地址),但现在又想和因特网上的主机通信(并不需要加密)时,可使用NAT方法NAT的工作原理借助于NAT,私有(保留)地址的"内部"网络通过路由器发送数据包时,私有地址被转换成合法的IP地址,一个局域网只需使用少量IP
西街以西
·
2025-01-21 01:38
java
nat
端口转发
linux配置nat端口转换,NAT网络地址转换——静态NAT,端口映射(
实操
!!)
NAT概述NAT(NetworkAddressTranslation,网络地址转换)是1994年提出的。当在专用网内部的一些主机本来已经分配到了本地IP地址(即仅在本专用网内使用的专用地址),但现在又想和因特网上的主机通信(并不需要加密)时,可使用NAT方法NAT的工作原理借助于NAT,私有(保留)地址的"内部"网络通过路由器发送数据包时,私有地址被转换成合法的IP地址,一个局域网只需使用少量IP
胡大水
·
2025-01-21 01:06
linux配置nat端口转换
人体关键点
实操
网站
1、Face++:https://www.faceplusplus.com.cn/skeleton-detection/2、百度AI开放平台:https://ai.baidu.com/tech/body/pose?track=cp:ainsem|pf:pc|pp:chanpin-rentifenxi|pu:rentifenxi-guanjiandianshibie|ci:|kw:100065423
3TV
·
2025-01-20 20:26
人体关键点检测
Kylin入门教程
引言ApacheKylin是一个开源的分布式分析引擎,提供
Hadoop
上的多维分析(OLAP)能力,使得超大规模数据集的实时查询和分析成为可能。
-龙川-
·
2025-01-20 20:23
介绍
学习笔记
kylin
flume系列之:flume落cos
flume系列之:flume落cos一、参考文章二、安装cosjar包三、添加
hadoop
-cos的相关配置四、flume环境添加
hadoop
类路径五、使用cos路径六、启动/重启flume一、参考文章
快乐骑行^_^
·
2025-01-20 13:42
日常分享专栏
flume系列
Hadoop
和 Spark 的内存管理机制分析
大数据技术:涵盖
Hadoop
(HDFS)、Hive、Spark、Fli
王子良.
·
2025-01-20 03:27
经验分享
hadoop
spark
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他