E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop离线数仓
经验笔记:
Hadoop
Hadoop
经验笔记一、
Hadoop
概述
Hadoop
是一个开源软件框架,用于分布式存储和处理大规模数据集。其设计目的是为了在商用硬件上运行,具备高容错性和可扩展性。
漆黑的莫莫
·
2024-09-02 03:54
随手笔记
笔记
hadoop
大数据
DBeaver连接Mysql和Hive踩坑-提供驱动下载链接
配置DBeaver驱动方法(可
离线
):填写完连接信息后
dengxc
·
2024-09-01 22:21
数仓
分层架构:DWS
在数据仓库的分层架构中,"DWS"通常指的是数据仓库的"服务层"或"汇总层",但这个缩写可能根据不同的上下文有不同的含义。以下是几种可能的解释:1.**数据仓库服务层(DataWarehouseServices)**:-在一些云服务提供商的数据平台中,DWS可能指的是提供数据仓库功能的一组服务,这些服务可能包括数据存储、管理和分析工具。2.**数据仓库星型模式(DataWarehouseStarS
大连赵哥
·
2024-09-01 16:11
大数据
大数据
前端PWA(Progressive Web App)技术(二)
具有以下显著优势:四、PWA的应用场景PWA技术因其独特的优势,在多个领域得到了广泛的应用,包括但不限于:五、结论PWA技术作为一种结合了Web应用和原生应用优点的新型应用开发模式,具有跨平台兼容性、可安装性、
离线
访问
Good_tea_h
·
2024-09-01 13:30
前端
web
app
Python大数据之
Hadoop
学习——day06_hive学习02
一.hive内外表操作1.建表语法create[external]table[ifnotexists]表名(字段名字段类型,字段名字段类型,...)[partitionedby(分区字段名分区字段类型)]#分区表固定格式[clusteredby(分桶字段名)into桶个数buckets]#分桶表固定格式[sortedby(排序字段名asc|desc)][rowformatdelimitedfiel
笨小孩124
·
2024-09-01 11:18
大数据
hadoop
学习
大数据毕业设计
hadoop
+spark+hive微博舆情情感分析 知识图谱微博推荐系统
爬虫工具采集新浪微博评论、热搜、文章等约10万条存入.csv文件作为数据集;(二)使用pandas+numpy或MapReduce对数据进行数据清洗,生成最终的.csv文件并上传到hdfs;(三)使用hive
数仓
技术建表建库
qq_79856539
·
2024-09-01 11:16
javaweb
大数据
hadoop
课程设计
基于
hadoop
+spark的旅游大数据分析平台
S2023132基于
hadoop
+spark的旅游大数据分析平台使用BeautifulSoup爬取数据,爬取成功以后使用spark分析数据,将分析的结果保存到mysql,flask读取mysql数据,结合
源码空间站11
·
2024-09-01 11:16
hadoop
spark
旅游
大数据毕业设计天
hadoop
+spark+hive游戏推荐系统 游戏数据分析可视化大屏 steam游戏爬虫 游戏大数据 机器学习 知识图谱 计算机毕业设计 机器学习 深度学习 人工智能 知识图谱
|—||一、选题的目的和意义用户往往因为不能及时查看游戏信息而造成许多烦恼。另一方面,游戏商城平台没能进行系统的管理与维护使游戏信息没能及时的更新。而传统的游戏信息管理,采用的还是手工备案、人工查询的方式。但是随之游戏信息的增多这种管理方式的工作量不断加大,这种做法就存在费时费力、缺乏时效性、不利于调动人员的积极性等缺点。一旦网站建立好之后,一方面,用户可以在第一时间在系统里查询所需的信息,另一方
2401_84159688
·
2024-09-01 11:45
程序员
大数据
hadoop
人工智能
本地电脑大模型系列之 20
离线
AI:使用 Ollama+llama3+privateGPT+Langchain+GPT4ALL+ChromaDB 与 Pdf、Excel、CSV、PPTX、PPT、
简介Ollama在Mac/Windows/Ubuntu上与llama3一起运行MAC至少需要8GBRAM,Ubuntu和Windows至少需要16GBRAMpython3.10和git系列文章《本地电脑搭建StreamDiffusion:用眼睛见证实时人工智能创意利用交互式高速扩散技术彻底改变图像生成》权重1,本地类《使用本地Llama2模型和向量数据库建立私有检索增强生成(RAG)系统LangC
知识大胖
·
2024-09-01 10:10
NVIDIA
GPU和大语言模型开发教程
人工智能
langchain
pdf
银河麒麟v10-arm SEALOS
离线
部署k8s集群(v1.22.8)
一、环境说明1.版本说明1.1.操作系统版本银河麒麟V10SP3[root@localhost~]#cat/etc/os-releaseNAME="KylinLinuxAdvancedServer"VERSION="V10(Lance)"ID="kylin"VERSION_ID="V10"PRETTY_NAME="KylinLinuxAdvancedServerV10(Lance)"ANSI_CO
xjudt
·
2024-09-01 09:29
arm开发
kubernetes
docker
麒麟v10 sp1 arm安装pip
1.pip的下载导入安装https://pypi.tuna.tsinghua.edu.cn/simple/pip/2.上传压缩包到
离线
服务器上并解压3.进去解压后的文件夹执行安装命令python3setup.pyinstall
宇宙成为宇宙
·
2024-09-01 09:27
python
开发语言
【基于
Hadoop
3.3.6+Spark3.4.3电商用户行为分析】
基于
Hadoop
3.3.6+Spark3.4.3电商用户行为分析一、摘要二、正文2.1需求分析2.2架构设计2.3实施过程2.3.1系统环境说明2.3.2系统开发思路说明2.3.4代码实现及测试2.3.5
若兰幽竹
·
2024-09-01 00:09
大数据项目
大数据
基于
Hadoop
的高校教学管理平台设计与实现
文中就高校大数据平台的关键技术和架构进行阐述,结合高校实际情况,设计高校大数据平台架构,通过搭建
Hadoop
集群环境,以业务系统和平台之间的数据交互验证平台设计的可行性和优势。
这是辰辰啊
·
2024-09-01 00:38
hadoop
hadoop
大数据
Hive SQL练习之影评案例
找的练习hive,内容非原创链接https://www.cnblogs.com/frankdeng/p/9309668.html一、建表,导入数据1、建表[root@master
hadoop
]#hiveLogginginitializedusingconfigurationinjar
软件手
·
2024-08-31 17:23
Hive
mysql
hive
hadoop
sql
大数据
hadoop
日志文件
路径:/opt/homebrew/Cellar/
hadoop
/3.4.0/libexec/logs从你提供的输出信息来看,你正在查看
Hadoop
的日志文件目录(logs目录)。
静听山水
·
2024-08-31 17:51
Spark
hadoop
hadoop
常用地址
java:"/opt/homebrew/Cellar/openjdk/22.0.1/libexec/openjdk.jdk/Contents/Home"
hadoop
:1】sbin:/opt/homebrew
静听山水
·
2024-08-31 16:49
Spark
hadoop
Hadoop
技术栈
1.什么是
hadoop
(分布式软件框架)他提供了分步式数据存储分布式数据计算分布式资源调度为一体的整体解决方案1.1
hadoop
的用处可以部署在1台乃至成千上万台服务器节点上协同工作。
XingChen.
·
2024-08-31 16:48
分布式
hadoop
大数据
【Mysql】通过Keepalived搭建mysql双主高可用集群
一、环境信息主机名ip操作系统mysql版本VIP(虚拟ip)
hadoop
01192.168.10.200centos7_x865.7192.168.10.253
hadoop
03192.168.10.202centos7
维运
·
2024-08-31 15:13
数据库
mysql
数据库
C++(Qt)-GIS开发-QGraphicsView显示瓦片地图简单示例2
显示瓦片地图简单示例2文章目录C++(Qt)-GIS开发-QGraphicsView显示瓦片地图简单示例21、概述2、实现效果3、主要代码4、源码地址更多精彩内容个人内容分类汇总GIS开发1、概述支持多线程加载显示本地
离线
瓦片地图
mahuifa
·
2024-08-31 13:27
#
GIS开发
c++
qt
瓦片地图
GIS
Bing地图
《
Hadoop
系列》Docker安装
Hadoop
文章目录Docker安装
Hadoop
1安装docker1.1添加docker到yum源1.2安装docker2安装
Hadoop
2.1使用docker自带的
hadoop
安装2.2免密操作2.2.1master
DATA数据猿
·
2024-08-31 12:16
Hadoop
Docker
docker
hadoop
docker安装
Hadoop
拉取镜像[root@ecs-e722~]#dockerpullregistry.cn-hangzhou.aliyuncs.com/
hadoop
_test/
hadoop
_baseUsingdefaulttag
悾说
·
2024-08-31 11:16
docker
hadoop
hadoop
docker
大数据
推荐召回中ALS(交替最小二乘法)算法验证
性能评估代码实现导入依赖Mysql获取数据分批加载到矩阵目标coo_matrixvstackbm25_weight模型训练测试评估完整代码需求为了验证推荐系统中ALS(交替最小二乘)算法的召回效果以及
离线
数据推荐的效果
山水阳泉曲
·
2024-08-31 09:59
算法
最小二乘法
机器学习
推荐算法
python
008. 如何锻炼自己的深入思考能力
1.独立思考的时间(
离线
模式)。设定每天专属的
离线
思考时间段。找出自己一天中,大脑表现最好的时间段,然后在这段时间里进行
离线
思考和工作。所谓
离线
时间段,举个例
IT民工金鱼哥
·
2024-08-31 04:54
IT民工金鱼哥日常总结与顿悟
经验分享
双十一云起实验室体验专场,七大场景,体验有礼
\大数据计算场景《基于EMR
离线
数据分析》E-MapReduce(简称“EMR”)是
阿里云天池
·
2024-08-31 01:30
体验场景
活动
云计算
大数据
容器
云原生
kafka2.8.2集群
离线
安装
版本:Centos7、kafka_2.13-2.8.2节点:27.196.38.200kafka127.196.38.201kafka227.196.38.202kafka3基础配置在所有节点操作[root@localhost~]#systemctlstopfirewalld[root@localhost~]#systemctldisablefirewalldRemovedsymlink/etc/
xiongmao0304
·
2024-08-31 00:23
elk
1024程序员节
kafka
(四)Kafka
离线
安装 - Kafka下载及安装
Kafka官方下载地址:ApacheKafka这时候下载安装版本。我这里的安装目录在/usr/local/cd/usr/local/#创建目录mkdirkafkacdkafkamkdirkafka_log把下载的压缩包,放入到/usr/local/kafka/目录下,解压。#解压tar-zxvfkafka_2.12-3.8.0.tgz修改配置文件#修改配置文件cd/usr/local/kafka/
清风ai明月
·
2024-08-30 23:53
Kafka
kafka
Docker安装minio
一、获取镜像方式一:
离线
装载镜像(minio.tar)上传mioio.tar到服务器cd/home/data/install_pkg/minio/dockerload-iminio.tar方式二:下载Minio
五月高高
·
2024-08-30 23:22
docker
运维
mi
Bert中文预训练模型(Bert-base-chinese)
使用importtorchfromtransformersimportBertTokenizer,BertModel#第一步:
离线
下载#fromtran
好好学习Py
·
2024-08-30 22:14
自然语言处理
bert
人工智能
深度学习
pytorch
python
自然语言处理
Centos7
离线
安装Kafka+zookeeper+SASL安全认证
1.安装zookeeper1.下载apache-zookeeper-3.5.8-bin.tar.gz2.解压:tar–zxvfapache-zookeeper-3.5.8-bin.tar.gz3.进入到conf目录cd/opt/apache-zookeeper-3.5.8-bin/conf/4.复制配置文件cfgcpzoo_sample.cfgzoo.cfg5.修改zoo.cfg配置文件:vi/o
weixin_38683859
·
2024-08-30 16:36
centos
kafka
动手学深度学习(pytorch)学习记录21-读写文件(模型与参数)[学习记录]
离线
使用:保存的模型可以在没有网络连接的情况
walfar
·
2024-08-30 12:42
pytorch
深度学习
pytorch
学习
小白学习大数据测试之
hadoop
hdfs和MapReduce小实战
转发是对小编的最大支持在湿货|大数据测试之
hadoop
单机环境搭建(超级详细版)这个基础上,我们来运行一个官网的MapReducedemo程序来看看效果和处理过程。
大数据学习02
·
2024-08-30 11:39
常见的实时
数仓
方案
常见的实时
数仓
架构有三种。第一种是Lambda架构,是目前主流的一套实时
数仓
架构,存在
离线
和实时两条链路。
北极冰雨
·
2024-08-30 05:27
大数据
大数据
虚拟机安装
hadoop
,hbase(单机伪集群模式)
虚拟机安装
Hadoop
,Hbase工作中遇到了大数据方面的一些技术栈,没有退路可言,只能去学习掌握它,就像当初做爬虫一样(虽然很简单),在数据爆发的现在,传统的数据库mysql,oracle显然在处理大数据量级的数据时显得力不从心
流~星~雨
·
2024-08-29 21:31
大数据相关
hadoop
hbase
大数据
hive中的数据同步到hbase
关于
hadoop
,hive,hbase这三个技术栈我写了两篇博客简单的分享了我对这三个技术栈的一些看法,在我目前的认知里,
hadoop
提供hdfs这个组件来存储大数据量的数据(相比于mysql,oracle
流~星~雨
·
2024-08-29 21:31
大数据相关
hive
hbase
hadoop
微信小程序开发中的数据缓存和
离线
存储
微信小程序开发中的数据缓存和
离线
存储是非常重要的,可以提高小程序的性能和用户体验。在本篇文章中,我将详细介绍数据缓存和
离线
存储的概念以及如何在微信小程序中使用它们。
大黄鸭duck.
·
2024-08-29 21:28
微信小程序
缓存
小程序
chrome扩展程序本地打包
简介本文为Chrome浏览器已安装的扩展程序打包为
离线
.crx文件,便于在无法访问Chrome商店场景下使用扩展管理页面chrome://extensions/确定自己需要打包的扩展程序ID找到扩展程序路径
丿似锦
·
2024-08-29 20:25
Google
chrome
前端
Hive 数据模型切换后的数据验证方案
标签系统一般属于ads集市层加工的模型数据,如果上游(
数仓
/业务)表进行了切换,比如我们项目最近上游从fdl/gdl切换到了dwd/dws,切换完毕后的数据一般都会出现问题,如何进行数据验证是一个需要好好思考的问题
小菜菜1223
·
2024-08-29 19:16
Hive
hive
hbase ExportSnapshot迁移hbase表
在源集群上准备快照:snapshot'credit_dict','credit_dict_snapshot20221117'list_snapshots复制快照到目标集群:hbaseorg.apache.
hadoop
.hbase.snapshot.ExportSnapshot
Rjunxiang
·
2024-08-29 16:56
hbase
hbase
大数据
hadoop
基于yolov8的8种人脸表情检测系统python源码+onnx模型+评估指标曲线+精美GUI界面
【算法介绍】基于YOLOv8的人脸表情检测系统是一个结合了先进目标检测算法(YOLOv8)与深度学习技术的项目,旨在实时或
离线
地识别并分类人脸表情(如快乐、悲伤、愤怒、惊讶、恐惧、厌恶、中立等)。
FL1623863129
·
2024-08-29 15:52
深度学习
YOLO
python
开发语言
全量、增量数据在HBase迁移的多种技巧实践
大多数情况下,可以用
离线
的方式进行迁移,迁移
离线
数据的方式就比较容易了,将整个hbase的data存储目录进行搬迁就
华为云技术精粹
·
2024-08-29 15:52
云计算
华为云
Hbase
离线
迁移
hadoop
distcp-Dmapreduce.job.hdfs-servers.token-renewal.exclude="xx.xx.xx.xx"-i-strat
我要用代码向我喜欢的女孩表白
·
2024-08-29 15:22
hbase
数据库
大数据
Python知识点:如何使用HBase与HappyBase进行分布式存储
HBase是一个基于
Hadoop
的开源分布式数据库,可以处理非常大的表。HappyBase是一个Python库,它提供了一个友好的接口来与HBase交互。
杰哥在此
·
2024-08-29 15:51
Python系列
分布式
python
hbase
编程
面试
大数据分析与大数据开发两者的区别是怎样的?
大数据开发②大数据分析大数据分析:主要负责现有数据价值提炼与挖掘,包括业务增长点挖掘,产品改进点挖掘,业务分析指标体系构建,业务分析报告出具等大数据开发:主要负责大数据平台与应用开发,包括数据仓库构建,
离线
计算
泰迪智能科技01
·
2024-08-29 10:18
就业班
大数据
Spark-RDD迭代器管道计算
一、上下文《Spark-Task启动流程》中讲到我们提交Stage是传入的是这个Stage最后一个RDD,当Task中触发ShuffleWriter、返回Driver数据或者写入
Hadoop
文件系统时才触发这个
隔着天花板看星星
·
2024-08-29 07:24
spark
大数据
scala
关于这道填空题,你会如何回答?(附带学习链接)
小白的答案是:Java是铜牌,Linux是银牌,
Hadoop
是金牌,大数据是王牌。因为Java是学大数据的基础,有基础然后就可以学后续的;最后只有学好大数据这一王牌才能出去找一份比较好的工作。
csdn业界要闻
·
2024-08-29 05:09
Hdfs的机架感知与副本放置策略
1.介绍Apache
hadoop
机架感知
Hadoop
分布式文件系统(Hdfs)作为Apache
Hadoop
生态系统的的核心组件之一,通过机架感知和副本放置策略来优化数据的可靠性,可用和性能.Hdfs的机架感知和副本放置策略是其设计的关键组成部分
sheansavage
·
2024-08-29 01:42
hdfs
hadoop
大数据
数仓
之TABLESAMPLE采样
数仓
中的抽样方法有很多,这里主要介绍一下:随机抽样、块抽样、桶抽样、分组抽样这四种,话不多说,直接上干货。
Luckyforever%-
·
2024-08-29 00:39
Hive
MaxCompute
maxcompute
hive
sql
大数据
数据仓库
数据分析
JAVA基础 - HTTRACK安装使用教程
计划使用HTTRACK将文档克隆到本地,然后
离线
查看。
cloneme01
·
2024-08-28 22:50
其他技术博文
JAVA基础知识
网页抓取
Java高级技术day75:Zookeeper与Dubbo
一、Zookeeper的介绍1.Zookeeper介绍:顾名思义zookeeper就是动物园管理员,他是用来管
hadoop
(大象)、Hive(蜜蜂)、pig(小猪)的管理员,ApacheHbase和ApacheSolr
开源oo柒
·
2024-08-28 20:54
【
离线
安装clickhouse集群】
离线
安装clickhouse集群clickhouse介绍Clickhouse是俄罗斯yandex公司于2016年开源的一个列式数据库管理系统,在OLAP领域像一匹黑马一样,以其超高的性能受到业界的青睐。
eddianliu
·
2024-08-28 14:56
bigdata
clickhouse
centos
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他