E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop海量数据
基于
Hadoop
的网上购物行为大数据分析及预测系统【flask+echarts+机器学习】前后端交互
有需要本项目或者部署的系统可以私信博主,提供远程部署和讲解本研究基于淘宝用户行为的开源数据展开大数据分析研究,通过
Hadoop
大数据分析平台对阿里天池公开的开源数据集进行多维度的用户行为分析,为电商销售提供可行性决策
王小王-123
·
2024-01-13 06:53
hadoop
flask
网上购物行为分析
Hadoop大数据淘宝
Hadoop系统
使用Sqoop将数据从
Hadoop
导出到关系型数据库
当将数据从
Hadoop
导出到关系型数据库时,ApacheSqoop是一个非常有用的工具。
晓之以理的喵~~
·
2024-01-13 06:23
sqoop
hadoop
数据库
sqoop
盘点大数据在游戏行业中的应用
基于玩家所产生的
海量数据
,我们怎样去获取玩家的具体画像
weixin_34378767
·
2024-01-13 06:45
大数据
人工智能
后端
NameNode瞬时高并发导致短暂不可用,
Hadoop
2.7二次开发
版本
hadoop
2.7分段锁优化Namenode的FSNamesystem类中主要有三块。
邵红晓
·
2024-01-13 06:24
实验二 :HIve数据定义操作实验
二、实验环境要首先自行搭建由3台虚拟机构成的
Hadoop
环境及Hive环境。
又是被bug折磨的一天
·
2024-01-13 04:55
hive
sql
大数据
企业数据中台整体介绍及建设方案:文件全文51页,附下载
数据中台是指通过数据技术,对
海量数据
进行采集、计算、存储、加工,同时统一标准和口径。数据中台把数据统一之后,会形成标准数据,再进行存储,形成大数据资产层,进而为客户提供高效服务。
方案365
·
2024-01-13 04:46
数据中台
大数据
数据治理
数据中台
大数据
数据治理
Hadoop
/Spark安装
单机安装
Hadoop
安装Javasudoapt-getinstalldefault-jdkjava-version2.设置
Hadoop
用户和组sudoaddgroup
hadoop
sudoadduser-
周倜吉
·
2024-01-13 03:40
2022字节跳动【数据仓库工程师】日常实习面经-----一面
都还没学扎实)一,自我介绍二,问答阶段shuffle阶段详细介绍回答环形缓冲区,分区排序,溢写磁盘,reduce再抽取归并等等计算单元和实际block存储单元不在一个机器节点上,这样会带来大量的IO操作,
Hadoop
dyson不只是吹风机
·
2024-01-13 03:34
面试
数据仓库
大数据
Flink
GoogleFileSystemBigTableMapReduceHDFSHBase
Hadoop
Hadoop
基于硬盘,可以处理
海量数据
;Spark基于内存,性能提高百倍,微批(500ms);Flink基于
三半俊秀
·
2024-01-13 01:53
设置5台SSH互免的虚拟机服务器配置
步骤如下——1、准备五台机器服务器名字服务器IP
hadoop
1192.168.31.130
hadoop
2192.168.31.131
hadoop
3192.168.31.132
hadoop
4192.168.31.133
hadoop
5192.168.31.134
朱季谦
·
2024-01-12 23:24
Linux
ssh
服务器
eclipse
hadoop
(4)--NameNode元数据管理
这是分享的第四篇文章了,可能有些小伙伴看到标题后,很纳闷,完全是跳跃式的,NameNode是什么呢?NameNode是管理元数据的,这个和大数据有什么关系呢?对了,就爱带着问题去探索,NameNode是HDFS的一个组件,可以说一个进程,HDFS中共有三个组件NameNode,DataNode,SecondNameNode。这三个都是做什么的呢?NameNode:管理元数据的DataNode:保存
ROCK_杰哥
·
2024-01-12 22:41
如何进行大数据系统测试
大数据系统常见的架构形式有如下几种:
Hadoop
架构:
Hadoop
DistributedFileSystem(HDFS):这是一种分布式文件系统,设计用于存储
海量数据
并允许跨多台机器进行高效访问。
Feng.Lee
·
2024-01-12 21:41
系统测试
项目管理
测试工具
大数据
五险一金的工作有哪些?什么工作有五险一金?
基于第三方电商平台
海量数据
挖掘与分析,“高省”APP通过内容制作、分享等方式,为消费者打通吃喝玩乐购全场景全业态,让消费者省心省钱省时省力,为平台和品牌方导流创造收入,拓展了商家新的销售渠道。
优惠券高省
·
2024-01-12 21:04
初识NoSql
大数据飞速的发展,然而,大数据在推动技术变革的同时,企业对
海量数据
的存储、并发访问、扩展等要求越来越高。
努力的小陈、
·
2024-01-12 20:17
NoSql
nosql
数据库
redis
手把手教你搭建一个Elasticsearch集群
(1)高可用性Elasticsearch作为一个搜索引擎,我们对它的基本要求就是存储
海量数据
并且可以在非常短的时间内查询到我们想要的信息。
Sql强
·
2024-01-12 19:54
ZooKeeper 安装与部署
1.1认识Zookeeper介绍Zookeeper前,看下面这个图:在这张图片里,我们可以看到
Hadoop
是一只大象,HIVE是一只蜜蜂,Bigtop是马戏团,Pig是一只猪,HAMA是一只河马…只有Zookeeper
Destiny_-Sky
·
2024-01-12 18:48
ZooKeeper
zookeeper
分布式
java
Linux学习笔记——ZooKeeper集群安装部署
5.8、ZooKeeper集群安装部署5.8.1、简介Zookeeper是一个分布式的、开放源码的分布式应用程序协调服务,是
Hadoop
和HBase的重要组件。
kxttmx
·
2024-01-12 18:16
linux
学习
zookeeper
Zookeeper安装与部署
由于ZooKeeper便捷的使用方式、卓越的性能和良好的稳定性,被广泛地应用于诸如
Hadoop
、HBase、Kafka和Dubbo等大型分布式系统中。一个分布式系统最多只能同时满足一致性
HRX98
·
2024-01-12 18:12
经验贴
zookeeper
分布式
zookeeper下载安装部署
zookeeper是一个为分布式应用提供一致性服务的软件,它是开源的
Hadoop
项目的一个子项目,并根据google发表的一篇论文来实现的。
倚-天-照-海
·
2024-01-12 18:38
kafka
zookeeper
linux
分布式
Hadoop
常用命令
启动
Hadoop
所有进程:start-all.sh关闭
Hadoop
所有进程:stop-all.sh单进程启动:start-dfs.sh和start-yarn.sh分别启动HDFS和YARNhdfsdfs-xxx
在努力的Jie
·
2024-01-12 16:16
Hadoop
的核心 —— HDFS(1)
首先来看看
Hadoop
是什么?
土冥王
·
2024-01-12 16:13
kafka下载安装部署
它现在是Apache旗下的一个开源系统,作为
hadoop
生态系统的一部分,被各种商业公司广泛应用。
倚-天-照-海
·
2024-01-12 15:25
kafka
kafka
分布式
Hbase2.1 集群搭建
Hbase在大数据的体系中扮演着DB角色,不得不说是重要的一员,在上一篇,大猪已经给大家演示了
Hadoop
3.2集群搭建了,本次我们将继续紧接着搭建Hbase集群。
kikiki2
·
2024-01-12 15:31
Hadoop
框架下MapReduce中的map个数如何控制
一个job的map阶段并行度由客户端在提交job时决定客户端对map阶段并行度的规划基本逻辑为:一、将待处理的文件进行逻辑切片(根据处理数据文件的大小,划分多个split),然后每一个split分配一个maptask并行处理实例二、具体切片规划是由FileInputFormat实现类的getSplits()方法完成切分规则如下:1.简单地按照文件的内容长度进行切片2.切片大小默认是datanode
数据萌新
·
2024-01-12 14:31
解决java连接Hbase程序卡住执行也不报错的问题
程序运行不知多久,就报错了(截取一行有用的):java.net.UnknownHostException:cannotresolve
hadoop
01,1
向他一样rap
·
2024-01-12 14:37
hbase
java
big
data
查询速度提升15倍!银联商务基于 Apache Doris 的数据平台升级实践
为更好提供数据服务,银联商务实现了从
Hadoop
到ApacheDoris的架构升级,使数据导入性能提升2-5倍、ETL场景性能提升3-12倍、查询分析响应速度提升10-15倍,满足大规模数据导入和实时极速查询的业务需求
SelectDB技术团队
·
2024-01-12 13:28
apache
数据库
大数据
数据分析
数据仓库
GBASE南大通用 GBase 8a 产品构建数仓系统架构
架构技术实现特点适用场景独立数据仓库(集市)系统架构一套GBase8a物理集群适用于数据规模较小的业务场景适用于各业务之间数据互访较频繁的业务场景适用于单一独立的业务场景企业级数仓系统架构多套GBase8a物理集群,根据需要搭配
Hadoop
GBASE数据库
·
2024-01-12 12:04
数据库
GBASE南大通用
GBASE
Hive安装与配置
注意:Hive的安装与配置建立在
Hadoop
已安装配置好的情况下。hadopp安装与配置Hive的基本安装从官网下载Hive二进制包,下载好放在/opt目录下。
qq_58647543
·
2024-01-12 11:50
hive
hive
hbase回顾
Hbase是分布式的存储
海量数据
的NoSql数据库2、场景:实时场景3、Hbase数据模型:Table:数据存储的形式列簇:Hbase的表结构,一般在创建表的时候指定rowkey:数据的主键,数据在hbase
cc708754edc4
·
2024-01-12 10:33
如何高效实现 MySQL 与 elasticsearch 的数据同步
原数据库的同步问题由于传统的mysql数据库并不擅长
海量数据
的检索,当数据量到达一定规模时(估算单表两千万左右),查询和插入的耗时会明显增加
273abf195ee7
·
2024-01-12 10:13
冰河开始对Dubbo下手了!
写在前面对冰河有一定了解的读者都知道,冰河经历了一个高并发电商系统用户从零到上亿的整个研发过程,后期也由此衍生出电商系统(商城+秒杀)和基于
海量数据
的实时精准商品推荐平台。
冰河团队
·
2024-01-12 08:52
关于hive在运行insert时失败原因刨析
yarn容器最大内存、容器最小内存等Theclasstouseastheresourcescheduler.yarn.resourcemanager.scheduler.classorg.apache.
hadoop
.yarn.server.resourcemanager.scheduler
Alonzo de blog
·
2024-01-12 08:57
hadoop
hadoop
大数据
hive
mapreduce
hadoop
分布式文件系统
Hadoop
分布式文件系统分布式文件系统:管理网络中跨多台计算机存储的文件系统称为分布式文件系统。
Alonzo de blog
·
2024-01-12 08:27
hadoop
hadoop
大数据
hdfs
【金猿案例展】智谱AI——基于全闪分布式并行文件存储打造高速大模型训练平台...
《中国人工智能大模型地图研究报告》显示,截至2023年5月底,国内10亿级参数规模以上基础大模型至少已经发布79个,大模型所需数据丰富,而
海量数据
需要强悍的储存
数据猿
·
2024-01-12 08:01
人工智能
分布式
【数据库学习】hive
1,HIVE
Hadoop
的数据仓库处理工具,数据存储在
Hadoop
兼容的文件系统(例如,AmazonS3、HDFS)中。
兔兔西
·
2024-01-12 08:50
数据库
学习
hive
基于JavaWeb+BS架构+SpringBoot+Vue基于hive旅游数据的分析与应用系统的设计和实现
文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》源码获取文末获取源码Lun文目录1概述51.1研究背景51.2研究意义51.3研究内容52关键技术介绍72.1Java介绍72.2MySql数据库72.3
Hadoop
FREE技术
·
2024-01-12 07:01
架构
spring
boot
vue.js
计算机专业毕业设计
Spark基础
pipinstall-ihttps://pypi.tuna.tsinghua.edu.cn/simplepandas更新最新版本pippython-mpipinstall--upgradepip1、启动服务
Hadoop
中长跑路上crush
·
2024-01-12 07:33
Spark阶段
spark
大数据
分布式
Zookeeper+
Hadoop
+Spark+Flink+Kafka+Hbase+Hive
说明Zookeeper+
Hadoop
+Spark+Flink+Kafka+Hbase+Hive完全分布式高可用集群搭建下载https://archive.apache.org/dist/我最终选择Zookeeper3.7.1
nsa65223
·
2024-01-12 06:08
hadoop
zookeeper
spark
LightGBM原理和调参
背景知识LightGBM(LightGradientBoostingMachine)是一个实现GBDT算法的框架,具有支持高效率的并行训练、更快的训练速度、更低的内存消耗、更好的准确率、支持分布式可以处理
海量数据
等优点
沉住气CD
·
2024-01-12 05:46
机器学习常用算法
python
机器学习
算法
人工智能
数据挖掘
黑猴子的家:Redis 客户端访问
1、一个端口[root@
hadoop
102redis-3.2.5]#redis-cli2、多个端口客户端访问有多个端口的情况下[root@
hadoop
102redis-3.2.5]#redis-cli-p63793
黑猴子的家
·
2024-01-12 03:21
MySql
海量数据
存储与优化
一、Mysql架构原理和存储机制1.体系结构2.查询缓存3.存储引擎存储引擎的分类innodb:支持事务,具有支持回滚,提交,崩溃恢复等功能,事务安全myisam:不支持事务和外键,查询速度高Memory:利用内存创建表,访问速度非常快,因为数据在内存,而且默认使用Hash索引,但是一旦关闭,数据就会丢失Archive:归档类型引擎,仅能支持insert和select语句Csv:以CSV文件进行数
softshow1026
·
2024-01-12 02:44
mysql
数据库
Linux操作系统下,彻底删除MySQL
背景:部署Hive时,遇到了无法访问数据库的问题;此时Linux中的环境是,已安装MySQL-8.0.35的版本,JDK8和
Hadoop
-3.3.4版本;然后开始上传Hive-3.1.3版本的的安装包和
zhiweizhang_zzw
·
2024-01-12 02:59
大数据
linux
mysql
hive
升腾威讯怎么恢复集群_如何做到 10T 集群数据安全备份、1GB/s 快速恢复?
如果你业务产生
海量数据
,并极度重视数据安全、备份恢复的效率,那么TiDB
李德邻
·
2024-01-12 01:51
升腾威讯怎么恢复集群
Spark完全分布式集群搭建
环境准备服务器集群我用的CentOS-6.6版本的4个虚拟机,主机名为
hadoop
01、
hadoop
02、
hadoop
03、
hadoop
04,另外我会使用
hadoop
用户搭建集群(生产环境中root用户不是可以任意使用的
小猪Harry
·
2024-01-12 00:41
Hadoop
伪集群模式搭建MAC版[Linux依旧适用]
[TOC]
Hadoop
1环境搭建1.1ssh免密登录需要生产sshkey[可以忽略,但是启动的时候,每次都需要输入密码]首先在用户根目录下ls-a查看包括隐藏的文件夹,应该能发现.ssh,如果没有就安装
zZeroZz
·
2024-01-12 00:45
pyspark config设置、增加配置、限制_success文件生成;spark-submit 集群提交参数
1、pyspark增加config设置javaheap错误增加内存spark=(SparkSession.builder.config("spark.
hadoop
.hive.exec.dynamic.partition
loong_XL
·
2024-01-11 18:00
机器学习
python
数据挖掘
linux
运维
服务器
MPP架构与
Hadoop
架构是一回事吗?
它的“谬误”之处在于,明明叫做“MassivelyParallelProcessing(大规模并行处理)”,却让非常多的人拿它与大规模并行处理领域最著名的开源框架
Hadoop
相关框架做对比,这实在是让人困惑
ThoughtWorks
·
2024-01-11 17:47
《PySpark大数据分析实战》-27.数据可视化图表Pyecharts介绍
对大数据技术栈
Hadoop
、Hive、Spark、Kafka等有深入研究,对Data
wux_labs
·
2024-01-11 16:21
PySpark大数据分析实战
数据分析
数据挖掘
大数据
数据科学
PySpark
【2019-05-06】map reduce工作机制
mapreduce作业运行机制
Hadoop
运行mapreduce作业的工作原理(1)作业提交Job的submit()方法创建一个内部的JobSubmitter实例,并且调用其submitJobInternal
BigBigFlower
·
2024-01-11 15:31
TDengine 签约西电电力
在这个过程中,电力物联网领域产生的数据采集量呈现爆炸式增长,应对
海量数据
处理需求成为推动行业改革的重要任务。近日,TDengine与西电电力达成签约合作,助力其智慧能源系统的优化发展。TD
涛思数据(TDengine)
·
2024-01-11 15:12
新闻
tdengine
大数据
时序数据库
上一页
23
24
25
26
27
28
29
30
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他