E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hadoop离线数仓
关于CarbonData+Spark SQL的一些应用实践和调优经验分享
行业亟需一个高效、统一的融合
数仓
,从海量数据中快速获取有效信息,从而洞察机遇、规避风险。
weixin_34075551
·
2024-01-17 15:31
大数据
人工智能
后端
hadoop
3.3.4 编译报错记录
现在centos7.6,docker19.x版本会缺少一些依赖包不能一次编译过
hadoop
3.3.4注意BUILDING.txt依赖环境的版本二,报错信息1.cmake-compile(cmake-compile
第一次看海
·
2024-01-17 15:31
hadoop
hdfs
大数据
数仓
数据含有特殊字符,如何更方便的导出成excel文件
如果遇到数据中含有特殊字符,"\n","\r","\t",或者其他的特殊分隔符在数据导出时造成错位,都用sql替换,但是需求是导出的数据要保持原有内容格式,就不能替换剔除这些特殊字符,这种情况下使用json方式1,在hive
数仓
建一个临时的
第一次看海
·
2024-01-17 15:00
1024程序员节
spark sql实践开发后端引擎
-------------“何以解忧,唯有暴富”需求开发一个系统,主要是将
数仓
中治理完用于检索的数据灌入Elasticsearch中,一般情况,开源的一些系
第一次看海
·
2024-01-17 14:28
spark
sql
大数据
大数据——CentOS 7加装虚拟机存储空间、CPU和内存
和内存准备条件一台已经配置好的虚拟机虚拟机安装和配置扩容前扩展空间点击扩展增加存储空间,点击扩展这时会提醒你,让你从操作系统中重新进行分区点击确定打开虚拟机操作系统中进行分区扩展文件系统打开虚拟机查看一下磁盘大小[root@
hadoop
1002
蜂蜜柚子加苦茶
·
2024-01-17 13:05
linux
centos
操作系统
大数据
TodoList本地存储
它也可以用于
离线
工作,备份数据或存储敏感信息,如
Zy000428
·
2024-01-17 11:20
前端
介绍 Apache Spark 的基本概念和在大数据分析中的应用
Spark的主要特点包括:快速:Spark使用内存计算技术,可以比传统的批处理系统(如
Hadoop
)快上数十倍甚至更多。它通过将数据存储在内存中来避免磁盘读写的开销,从而提供更快的数据处理速度。灵活:
酷爱码
·
2024-01-17 11:45
经验分享
spark
大数据
分布式
uniapp 原生安卓开发插件(module),以及android环境本地调试(二)————————————————版权声明:本文为CSDN博主「深圳程序员打工崽」的原创文章,遵循CC 4.0
1、前景承接上一篇文章,由于uniapp每天只有限定的打包次数,所以每次插件调试都打包成为基座,这个不太方便,因此,采用另外一种方式:android原生环境本地调试2、准备工作
离线
AppKeyuniapp
修行者对666
·
2024-01-17 10:53
安卓gradle
uni-app
大数据开发之
Hadoop
(HDFS)
2、HDFS定义HDFS(
Hadoop
DistributedFileSystem),它是一个文件系统,用于存储文
Key-Key
·
2024-01-17 10:22
大数据
hadoop
hdfs
hadoop
-common /native/src/exception.c : error: function-like macro ‘__GLIBC_PREREQ‘ is not defined
1.问题来源mac上编译
hadoop
源码的时候遇到如下错误1errorgenerated.
寂夜了无痕
·
2024-01-17 10:21
大数据搭建问题
hadoop
大数据
大数据开发之
Hadoop
(入门)
第1章:
Hadoop
概述1.1
Hadoop
是什么1、
Hadoop
是一个由Apache基金会所开发的分布式系统基础架构。2、主要解决,海量数据的存储和海量数据的分析计算问题。
Key-Key
·
2024-01-17 09:19
大数据
hadoop
分布式
hadoop
-common: CMake failed with error code 1
问题在编译
hadoop
源码时遇到如下错误
hadoop
-common:CMakefailedwitherrorcode1看了这个错误表示一脸懵逼排查在mvn的命令中增加-X和-emvncleanpackage-e-X-Pdist
寂夜了无痕
·
2024-01-17 09:49
大数据搭建问题
hadoop
hadoop
源码编译
linux |
离线
安装软件 | rpm命令
离线
安装包管理命令rpm######检查安装包是否认证成功简单讲来源是否可靠rpm--checksigxxx.rpmrpm--checksignmap-7.92-1.x86_64.rpmnmap-7.92
ttxiaoxiaobai
·
2024-01-17 08:59
综合部
操作系统
linux
linux
数据库
运维
Hive数据导出的四种方法
hive数据仓库有多种数据导出方法,我在本篇文章中介绍下面的四种方法供大家参考:Insert语句导出、
Hadoop
命令导出、Hiveshell命令导出、Export语句导出。
冬瓜的编程笔记
·
2024-01-17 08:31
大数据
hive
hadoop
数据仓库
java链接hive数据库实现增删改查操作
首先,确保已经安装了Hive,并且
Hadoop
集群正在运行。然后,根据Hive版本下载相应的HiveJDBC驱动程序。可以从ApacheHive官方网站下载。
酷爱码
·
2024-01-17 08:30
java技术教程
java
hive
数据库
hive除数取整
简介Hive是一个构建在
Hadoop
上的数据仓库基础设施,它提供了一个类似于SQL的查询语言,用于处理大规模的结构化数据。在Hive中,我们常常需要对数据进行数学运算,包括除法操作。
cuisidong1997
·
2024-01-17 08:30
hive
hadoop
数据仓库
idea安装Lombok incompatible with the current ieda version
文章目录一、idea安装插件包incompatiblewiththecurrentiedaversion二、下载对应版本插件三、
离线
安装四、安装完成重启一、idea安装插件包incompatiblewiththecurrentiedaversion
ccddsdsdfsdf
·
2024-01-17 07:16
IDEA常用
Kafka详解及常见面试问题解析(值得珍藏)
对于像
Hadoop
一样的日志数据和
离线
分析系统,但又要求实时处理的限制,
孤蓬&听雨
·
2024-01-17 07:29
知识库
面试资料
kafka
面试
分布式
消息队列
Mac M1芯片本地安装
hadoop
集群填坑之路
文章目录背景环境前置知识安装过程#bug1#bug2#bug3背景学习一项技能的最好方式自然是理解+实践,在了解了
hadoop
的基本概念后我开始尝试在本地搭建一个集群环境用于进一步学习。
喵王叭
·
2024-01-17 06:46
大数据
hadoop
macos
大数据
前端实习——H5新特性+css3
1、HTML5的新特性1)在网页上绘制图形的canvas元素2)多媒体相关video和audio元素3)对本地
离线
存储的更好支持本地存储:提供了两种在客户端存储数据的新方法localStorage没有时间限制的数据存储
是吱吱
·
2024-01-17 06:12
html总结
html
css
Hadoop
——HDFS、MapReduce、Yarn期末复习版(搭配尚硅谷视频速通)
一、HDFS1.HDFS概述1.1HDFS定义HDFS(
Hadoop
DistributedFileSystem),它是一个文件系统,用于存储文件,通过目录树来定位文件;其次,它是分布式的,由很多服务器联合起来实现其功能
革斤要加油
·
2024-01-17 06:10
专业课
hadoop
hdfs
mapreduce
yarn
阿里云服务器ECS安装图形界面
系列文章目录华为云耀云服务器试用领取领取的试用云耀云服务器在哪阿里云服务器免费试用领取
Hadoop
3.3.5云耀云服务器安装教程-单机/伪分布式配置阿里云服务器ECS安装图形界面文章目录系列文章目录前言安装步骤前言我们在安装图形界面时
柔雾
·
2024-01-17 06:59
阿里云
服务器
云计算
Centos7.0上docker的使用
Centos7.0上docker的使用前言安装dockerdocker打包SpringBoot项目docker搭建
hadoop
集群前言docker是基于go语言而开发的容器,和虚拟机如OracleVm有着异曲同工之妙
legendaryhaha
·
2024-01-17 06:51
Linux
docker
Springboot打包
hadoop搭建
HBase的协处理器
比如,在旧版本的(hbase.coprocessor.user.region.classesorg.apache.
hadoop
.hbase.coprocessor.AggregateImplementation
临界爵迹
·
2024-01-17 06:43
大数据
数据库
hbase
hadoop
之yarn
yarn简单介绍:yarn是
hadoop
集群当中的资源管理系统模块,从
hadoop
2.x开始引入yarn来进行管理集群当中的资源(主要是服务器的各种硬件资源,包括CPU,内存,磁盘,网络IO等)以及运行在
临界爵迹
·
2024-01-17 06:42
大数据
hadoop
hadoop
之shuffle
map端:1、读取数据源2、将数据切片(每片128M),切分成一个个的split3、启动mapTask,mapTask个数和split个数一样,开始执行任务4、mapTask将数据读入内存,存在一个内存环形缓冲区(mapreduce.task.io.sort.mb=100,可自定义);当该区域中的容量到达80%(默认mapreduce.map.sort.spill.percent=0.8,可自定义
临界爵迹
·
2024-01-17 06:42
大数据
hadoop
从 Linux 安装到
Hadoop
环境搭建全过程
Hadoop
环境搭建从Linux的最小化安装到
Hadoop
环境的搭建,尽可能详尽介绍每个步骤。
奇妙的代码
·
2024-01-17 05:58
Linux
hadoop
linux
大数据
【教程】集群搭建准备工作全流程
基于VMware创建虚拟机进行集群搭建,适用于
hadoop
/GreenPlum等集群之前已经创建了三台虚拟机
hadoop
102,
hadoop
103,
hadoop
104来搭建
hadoop
集群,因为目前学习到了
THE WHY
·
2024-01-17 04:12
大数据
大数据
分布式
运维
hadoop
学习
centos
离线
安装python3
方法一首先找到一台有网络的相同环境电脑如果是centos6,因为国内yum镜像源已经将其迁移到vault需要修改yum源为清华源vault源修改镜像源#CentOS-Base.repo##ThemirrorsystemusestheconnectingIPaddressoftheclientandthe#updatestatusofeachmirrortopickmirrorsthatareupd
啊这a
·
2024-01-17 04:13
QT软件在线安装与维护
一.安装安装QT开发环境分
离线
安装和在线安装两种方式,具体步骤如下:QT官网注册账号----下载安装包-----安装-----选择要安装的版本与开发包----版本维护注意:Qt5.14.2是最后提供二进制安装包的版本
AI+程序员在路上
·
2024-01-17 04:02
QT系列
qt
开发语言
indexedDB使用指南
基本概念IndexedDB是一种在浏览器中持久存储数据的方法,允许我们不考虑网络可用性,创建具有丰富查询能力的可
离线
web应用程序。
cc要坚定自己的脚步
·
2024-01-17 03:44
电商项目实战
Hadoop
实现
1、用户行为日志概述每一次访问的行为(包括访问,搜索、等)产生的日志历史行为数据《==历史订单==》推荐==〉订单的转换率2、为什么要记录用户行为日志根据行为日志分析可以很好的有针对性的对不同用户推荐不同商品,以及不同广告的推送3、日志内容介绍日志产生的渠道有nginx日志、ajax加载的一些动态的图片、位置啊等等信息。本次我们提供了一个电商日志打~/data/trackinfo_20130721
zhaoxiaoba123
·
2024-01-17 02:44
Hadoop
hadoop
数据库
大数据
securecrt密码与账户正确却登不上ubuntu
我的账户名为
hadoop
如下:于是尝试用这个账户名和密码去登录ssh报错:根本原因在于这个username是错的,应该用控制台中的名字:ps:密码是一样的
linpaomian
·
2024-01-17 02:43
ssh
linux
运维
hadoop
【项目实战】基于
Hadoop
大数据电商平台用户行为分析与可视化系统Hive、Spark计算机程序开发
注意:该项目只展示部分功能,如需了解,评论区咨询即可。本文目录1设计背景2设计意义3系统展示3.1页面展示3.2视频展示4更多推荐5部分功能代码1设计背景在当今数字化时代,电商行业成为全球商业生态系统的关键组成部分,电商平台已经深入各行各业,影响了人们的购物方式和消费习惯。随着互联网技术的不断发展,电商平台产生了大量的用户数据,包括点击、购买、搜索、浏览历史等行为数据。这些数据蕴含着宝贵的商业洞察
Q2643365023
·
2024-01-17 02:43
项目
大数据
hadoop
大数据
hive
大数据实战(
hadoop
+spark+python):淘宝电商数据分析
一,运行环境与所需资源:虚拟机:Ubuntu20.04.6LTSdocker容器
hadoop
-3.3.4spark-3.3.2-bin-
hadoop
3python,pyspark,pandas,matplotlibmysql
linpaomian
·
2024-01-17 02:13
大数据
hadoop
spark
docker
数据分析
工作十年总结的六条面试技巧,助力你拿到理想的offer
大数据开发的领域不同,面试的锚定点也不同,从我过往的经验来说,可以大致来将大数据领域的开发分为如下几种:
离线
开发:数据仓库、
离线
计算、ETL开发实时开发:流计算开发基础架构:组件二次开发,底层组件稳定性维护大数据运维方向数据平台开发一
KubeData
·
2024-01-17 02:12
个人成长
面试
职场和发展
大数据
干货分享|使用Yarn标签机制实现任务资源隔离
在
Hadoop
YARN中,标签(Labels)机制是一种资源管理的特性,它允许你对节点和应用程序进行分类,可以有效地进行资源管理和调度。
KubeData
·
2024-01-17 02:11
大数据技术
大数据
yarn
HDFS 机架感知配置导致数据不均衡
HDFS机架感知是一种逻辑上的网络架构设计,它主要是用来区分不同节点的网络拓扑情况下,保证数据是能够高性能写入和查询的一种机制,毕竟跨网络的数据读写是有网络带宽消耗的,当没有配置机架信息时,所有的机器
hadoop
KubeData
·
2024-01-17 02:41
hdfs
hadoop
大数据
Hive数学函数讲解
Hive是一个基于
Hadoop
的数据仓库工具,它支持类似于SQL的查询语言HiveQL,并且提供了许多内建的数学函数来处理数值数据。下面我将逐一讲解您提到的这些数学函数,并提供一些使用案例和注意事项。
田晖扬
·
2024-01-17 02:55
hive内置函数讲解
hive
hadoop
数据仓库
Ubuntu
离线
安装MySQL5.7.9
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档解压MySQL安装包sudotar-zvxfmysql-5.7.9-linux-glibc2.5-x86_64.tar.gz-C/usr/local创建软连接sudoln-s/usr/local/mysql-5.7.9-linux-glibc2.5-x86_64//usr/local/mysql创建MySQL用户sudouseradd
晓夜残歌
·
2024-01-17 01:18
数据库
ubuntu
分布式搜索引擎ElasticSearch——基础
elasticsearchelasticsearch的发展正向索引和倒排索引安装elasticsearch,kibana部署单点es创建网络加载镜像运行部署kibana部署DevTools安装IK分词器在线安装ik插件(较慢)
离线
安装
shall_zhao
·
2024-01-17 01:44
搜索引擎
分布式
elasticsearch
推荐算法常见的评估指标
推荐算法评估指标比较复杂,可以分为
离线
和在线两部分。召回、粗排、精排和重排由于定位区别,其评估指标也会有一定区别,下面详细讲解。
谢杨易
·
2024-01-16 21:06
推荐算法
机器学习
人工智能
Hadoop
详解
Hadoop
概念就是一个大数据解决方案。它提供了一套分布式系统基础架构。核心内容包含hdfs和mapreduce。
武昌库里写JAVA
·
2024-01-16 21:20
高手面试
hadoop
大数据
分布式
「Kafka」Broker篇
KafkaBroker总体工作流程Zookeeper存储的Kafka信息启动Zookeeper客户端:[atguigu@
hadoop
102zookeeper-3.5.7]$bin/zkCli.sh通过ls
小成同学_
·
2024-01-16 21:44
Kafka
kafka
分布式
java
后端
中间件
Hudi0.14.0最新编译(修订版)
1编译环境Java1.8maven3.9.3
hadoop
3.3.4hive3.1.3spark3.2.1flink1.16.0hudi0.14.02hudi准备2.1源码$gitclonehttps:/
跟着大数据和AI去旅行
·
2024-01-16 20:40
大数据企业级实战
hudi
免费开源OCR 软件Umi-OCR
Umi-OCR是一款免费、开源、可批量的
离线
OCR软件,基于PaddleOCR,适用于Windows10/11平台免费:本项目所有代码开源,完全免费。方便:解压即用,
离线
运行,无需网络。
linux实践操作记录
·
2024-01-16 19:20
ocr
6K star! 100%本地运行LLM的AI助手
Jan是一个开源ChatGPT替代品,可以在您的计算机上100%
离线
运行。Jan支持从PC到多GP
IT咖啡馆
·
2024-01-16 18:34
开源推荐
人工智能
github
开源软件
架构简介,到底什么是架构?
我们经常对新员工培训整个系统的架构,参加架构设计评审,学习业界开源系统(例如,MySQL、
Hadoop
)的架构,研究大公司的架构实现(例如,微信架构、淘宝架构)……虽然“架构”这个词常见,但如果深究一下
星猿杂谈
·
2024-01-16 18:51
软件架构
编程经验
架构
大数据学习入门到实战教程,精心整理万字长文入门,老奶奶看了都说学会了
换个角度说,大数据是:1、有海量的数据2、有对海量数据进行挖掘的需求3、有对海量数据进行挖掘的软件工具(
hadoop
、spark、storm、flink、tez
悦悦学Python
·
2024-01-16 18:10
你不能从此位置安装应用,因为它已经从其他位置安装
使用
离线
安装github后,卸载掉重新安装出现问题:你不能从此位置安装应用,因为它已经从其他位置安装Youcannotstartapplicationfromthislocationbecauseitisalreadyinstalledfromadifferentlocation
青盏
·
2024-01-16 16:06
other
github
应用
上一页
30
31
32
33
34
35
36
37
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他