E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
hive统计信息
第五阶段【MySQL数据库:常用PT工具】06:使用pt-arc
hive
r来进行数据归档
也就是一个单机部署的MySQL192.168.5.130主库192.168.5.132从库归档库192.168.5.129归档2、创建用户创建归档用户,主库130创建CREATEUSER'dba_arc
hive
做一个有趣的人Zz
·
2025-03-11 00:25
DBA数据工程师成长之路
数据库
mysql
dba
python数据分析一周速成2.连表查询【含数据库实战项目】
连表查询结合数据库实战(sql和
hive
跨库取数)数据准备#前面省略数据库连接,提示:可以用pymysql和py
hive
模块pre_sql="""selectap,timefrombiaoyiawherea.time
噼里啪啦噼酷啪Q
·
2025-03-10 18:35
数据分析
数据分析
CDA
python
利用神经网络来解决鸢尾花分类任务(附实验结果和代码)
鸢尾花数据集的介绍https://arc
hive
.ics.uci.edu/ml/index.php大家可以通过这个网站下载鸢尾花数据集,里面有各种经典数据集供大家使用。
侠之大者231
·
2025-03-10 15:49
深度学习实战
机器学习
深度学习
人工智能
分类
神经网络
Linux(Centos 7.6)命令详解:unzip
1.命令作用unzip用于在一个ZIP存档压缩文件中进行陈列/检测/提取文件(list,testandextractcompressedfilesinaZIParc
hive
);unzip命令是Linux
豆是浪个
·
2025-03-10 06:10
linux
centos
运维
Linux(Centos 7.6)命令详解:zip
1.命令作用打包和压缩(存档)文件(packageandcompress(arc
hive
)files);该程序用于打包一组文件进行分发;存档文件;通过临时压缩未使用的文件或目录来节省磁盘空间;且压缩文件可以在
豆是浪个
·
2025-03-10 05:37
linux
运维
服务器
大数据实战:Spark +
Hive
逐笔计算用户盈亏
简介本文将通过使用Spark+
Hive
实现逐笔计算区块链上用户交易数据的盈亏需求。
WuJiWeb3
·
2025-03-10 00:56
区块链链上数据分析
从0到1搭建区块链大数据平台
spark
hive
大数据
web3
区块链
hadoop
如何查看Linux服务器的硬件配置
下面是一些常用的方法:1.CPU信息lscpu:提供CPU的详细
统计信息
,包括型号、核心数、线程数、缓存大小等。
Ray.1998
·
2025-03-09 22:34
各种命令
服务器
linux
运维
Ubuntu系统下交叉编译szip
一、交叉编译szip1.下载源码下载Szip:https://docs.hdfgroup.org/arc
hive
/support/doc_resource/SZIP/i...下载并解压源码。
·
2025-03-09 16:47
linux运维
Hbase在hdfs上的arc
hive
目录占用空间过大
hbase版本:1.1.2hadoop版本:2.7.3Hbase在hdfs上的目录/apps/hbase/data/arc
hive
占用空间过大,导致不停地发出hdfs空间使用率告警。
宝罗Paul
·
2025-03-09 13:50
大数据
hbase
hbase集群arc
hive
目录过大问题处理
1.问题现象现场反馈hbase集群/hbase/arc
hive
目录过大,大小约为1.52PB现场集群已经清理掉2个月以前的snapshot文件,当前arc
hive
目录文件仍不能释放现场发现1T以上的arc
hive
spring208208
·
2025-03-09 12:15
大数据组件线上问题分析
hbase
数据库
大数据
在mac上如何配置clion使用googletest进行测试
1、下载googletest并且编译wgethttps://github.com/google/googletest/arc
hive
/release-1.8.0.tar.gz&&\tarzxfrelease
rd_cheng
·
2025-03-08 21:05
c++
c++
clion
googletest
gtest
Hive
JDBC 大数据查询场景下的 Socket 读超时问题及实战解决方案
文章目录
Hive
JDBC大数据查询场景下的Socket读超时问题及实战解决方案问题背景️解决方案方案一:通过JDBCURL直接配置超时(推荐)方案二:动态设置全局loginTimeout(兼容旧版本)总结与建议
窝窝和牛牛
·
2025-03-07 20:48
大数据
hive
hadoop
ASIHTTPRequest类库简介和使用说明
一、简介原文链接http://www.cnblogs.com/dotey/arc
hive
/2011/05/10/2041966.html1.下载源码官方网站:http://allseeing-i.com
从小爱吃苹果干
·
2025-03-07 17:44
iOS
ASIHttpRequest
ASIHTTPRequest
查看归档日志及rman备份文件
[root@his1/]#ls----查看**/**根目录下的文件arc
hive
bootdevhomelib64mediamntoptrmansbinsrvtmpusrbincgroupetcliblost
大叶梧桐
·
2025-03-07 15:51
LINUX
归档日志
man备份
Ubuntu系统中下载安装使用Anaconda
Anaconda管理虚拟环境一、下载官网下载地址:https://www.anaconda.com/download中科大镜像源官网:https://mirrors.ustc.edu.cn/anaconda/arc
hive
xxxn1102_
·
2025-03-07 12:28
ubuntu
ubuntu
conda
达梦数据库备份
需通过disql工具执行以下操作:alterdatabasemount;alterdatabaseARC
HIVE
LOG;例子:[dmdba@server~]$cd/opt/dmdbms/bin[dmdba
huazhixuthink
·
2025-03-07 03:29
数据库
oracle
sql
Linux系统性能调优技巧
vmstat:显示系统的虚拟内存
统计信息
。示例:top或者htop查看系统的内存、CPU、IO等使用情况。你可以按M键排序内存,按P键排
迷路的小犀牛
·
2025-03-07 01:16
linux
基于
hive
的电信离线用户的行为分析系统
标题:基于
hive
的电信离线用户的行为分析系统内容:1.摘要随着电信行业的快速发展,用户行为数据呈现出海量、复杂的特点。
赵谨言
·
2025-03-06 17:29
论文
经验分享
毕业设计
安装httpd
//下载软件包[root@openEulter-1~]#wgethttps://arc
hive
.apache.org/dist/httpd/httpd-2.
m0_74536424
·
2025-03-06 15:48
Linux学习笔记
apache
linux
网络
数据分析学习目录
在未来5个月里,将会陪伴大家一起来学习关于数据分析的相关内容,包括从数据思维,数据工具(Excel,Mysql,
Hive
,Python),数据方法论,数据展示(Tableau,BI),数据挖掘、数据实战项目一整套的内容
且行且安~
·
2025-03-06 14:35
数据分析进阶之路
#
数据分析目录
数据分析
第十五篇 10分钟变身SQL优化大师 执行计划一看就懂
二、
统计信息
:路况实时更新2.1为什么需要路况?2.2如何更新路况?
随缘而动,随遇而安
·
2025-03-06 11:07
SQL之道——从入门到精通
数据库
sql
Python进阶--多线程
原文链接:http://www.juzicode.com/arc
hive
s/841在《Python进阶教程m9–网络通信–socket通信》中我们实现了一个socket服务端和客户端通信的例子,这个例子中服务端需要等待客户端发送消息后才能返回消息给客户端
桔子code
·
2025-03-06 06:57
Python笔记本
多线程
python
安装mysql
1、安装数据库下载链接https://downloads.mysql.com/arc
hive
s/community/下载zip安装包,解压到某个路径下,将bin文件夹添加到系统环境变量。
大霞上仙
·
2025-03-05 17:51
数据库
mysql
数据库
Databend 产品月报(2025年2月)
从MySQL迁移到DatabendDatabend推荐使用db-arc
hive
r进行MySQL批量迁移,使用FlinkCDC进行实时变更数据捕获(CDC)迁移。
·
2025-03-05 15:15
数据库
doris:
Hive
自2.1.3版本开始,ApacheDoris支持对
Hive
的DDL和DML操作。用户可以直接通过ApacheDoris在
Hive
中创建库表,并将数据写入到
Hive
表中。
向阳1218
·
2025-03-05 11:17
大数据
hive
hadoop
数据仓库
doris
hive
-DML语法(超级详细)
N.0变量使用setwindow_day=50--定义变量select${
hive
conf:window_day}--使用变量N.1单表查询语句N.1.1语法
研发咨询顾问
·
2025-03-05 06:47
核心库-大数据
hive
hadoop
数据仓库
Hive
SQL 优化
标题一、
HIVE
SQL执##标题行顺序了解
hive
sql的执行顺序,有助于写出更高质量的代码。
大数据侠客
·
2025-03-05 06:45
大数据
相关技术
文档总结
hive
sql
性能优化
Hive
--桶表
目录1.为什么要使用桶表???2.桶表分桶规则3.桶表的创建3.1DLL3.2数据3.3DML3.4查看桶表里面的数据3.5临时表创建并加载数据3.6把临时表的数据加载到桶表里面4.桶表的查询4.1桶表查询全表的数据4.2桶表查看第一个桶里面的数据4.3查看第二个桶里面的数据4.4查看第三个桶里面的数据4.5查看桶表固定行数据4.6桶表查询语法4.7其他查询5桶表、分区表的区别6两个桶表之间的Jo
XK&RM
·
2025-03-05 06:44
Hive
hive
HIVE
的执行计划实操
HIVE
(我们的自驾工具)提供了EXPLAIN命令来展示一个查询的执行计划(什么路线),这个执行计划对于我们
不爱学习的小枫
·
2025-03-05 06:43
大数据
hive
大数据
hive
alter table add columns 是否使用 cascade 的方案
结论altertablexxxaddcolumns时加上cascade时,会把所有的分区都加上此字段。如果不加则只有新的分区会加上此字段,旧的分区没有此字段,即便数据文件里有对应的数据,也不能显示内容。如果分区都是insertoverwrite生成的,并且旧分区的数据不再重新生成,可以在addcolumns不用cascade,这样旧的分区对应的列显示null。新的分区正常显示新增的列。如果分区都是
houzhizhen
·
2025-03-05 06:12
hive
hive
Hive
Exception: Too many counters: 2001 max=2000 的解决方法
在
hive
任务的执行过程中,可能出现Toomanycounters的异常。如果执行引擎时tez,则说明当前作业的counters数量超过tez默认的counters限制。
houzhizhen
·
2025-03-05 06:12
hive
hive
hadoop
big
data
Hive
3.1 在 metastore 运行的 remote threads
Remotethreads是仅当
Hive
metastore作为单独的服务运行是启动,请求需要开启compactor。
houzhizhen
·
2025-03-05 05:07
hive
hive
hadoop
数据仓库
linux iostat 命令详解
iostat主要用于监控系统设备的IO负载情况,iostat提供了丰富的参数给我们查询各种维度的io数据,iostat首次运行时显示自系统启动开始的各项
统计信息
,之后运行iostat将显示自上次运行该命令以后的
统计信息
夜光小兔纸
·
2025-03-05 04:49
Linux
linux
运维
服务器
通过spark-redshift工具包读取redshift上的表
spark用户可以读取各种各样数据源的数据,比如
Hive
表、JSON文件、列式的Parquet表、以及其他表。通过spark包可以获取第三方数据源。
stark_summer
·
2025-03-04 22:02
spark
spark
redshift
parquet
api
数据
UBuntu 软件安装
sudoapt-getupdatesudoapt-getdist-upgradesudoapt-getupgrade-y有一个简单办法可以使更新速度更快,把以前更新的时候下载的软件包备份一下,把var/cache/apt/arc
hive
s
denlee
·
2025-03-04 17:53
Linux
ubuntu
deb
windows
firefox
linux
工具
初学者如何用 Python 写第一个爬虫?
大数据技术:涵盖Hadoop(HDFS)、
Hive
、Spark
ADFVBM
·
2025-03-04 16:19
面试
学习路线
阿里巴巴
python
爬虫
开发语言
Hive
之正则表达式
Hive
版本:
hive
-3.1.2目录一、
Hive
的正则表达式概述1.1字符集合1.2边界集合1.3量词(重复次数)集合1.4转义操作符1.5运算符优先级二、
Hive
正则表达式案例2.1like2.2rlike2.3regexp2.4regexp_replace
三生暮雨渡瀟瀟
·
2025-03-04 03:39
hive
hive
正则表达式
Hive
之正则表达式RLIKE详解及示例
目录一、RLIKE语法及核心特性1.基本语法2.核心特性二、常见业务场景及示例场景1:过滤包含特定模式的日志(如错误日志)场景2:验证字段格式(如邮箱、手机号)场景3:提取复杂文本中的关键词场景4:排除无效数据(如非数字字符)三、高级用法与技巧1.忽略大小写匹配2.匹配多行文本3.组合多个条件四、性能优化建议1.避免全表扫描2.预编译正则模式3.简化正则表达式五、常见问题与注意事项1.转义字符问题
三生暮雨渡瀟瀟
·
2025-03-04 03:09
hive
hive
正则表达式
kafka入门基础
1.Java安装1.1下载https://download.oracle.com/java/18/arc
hive
/jdk-18.0.2.1_linu...1.2安装tarzxvfjdk-18.0.2.1
·
2025-03-04 02:42
kafka
hive
-staging文件问题——DataX同步数据重复
1.产生原因1.使用Hue的界面工具执行
Hive
-sql。
Aldebaran α
·
2025-03-03 23:38
Hive
sql
hive
大数据
hdfs
spark
避免
Hive
和Spark生成HDFS小文件
Hive
和spark-sql是两个在常用的大数据计算分析引擎,用户直接以SQL进行大数据操作,底层的数据存储则多由HDFS提供。
穷目楼
·
2025-03-03 22:36
数据库
大数据
大数据
spark
hive
hadoop
Linux 下
Hive
安装(Remote Metastore Database 单节点)
1、Linux下安装好mysql:Linux下Mysql安装2、启动hadoop集群:1、zk启动[root@node02~]#zkServer.shstartZooKeeperJMXenabledbydefaultUsingconfig:/opt/software/apache-zookeeper-3.6.2-bin/bin/../conf/zoo.cfgStartingzookeeper...
A6-母婴小店-第6分店
·
2025-03-03 22:33
HIVE
hadoop
2025年上海安卓发展机遇
文章目录一、上海重点打造的产业集群规划二、安卓开发者的机遇与行动建议三、政策与资源支持总结本文首发地址https://h89.cn/arc
hive
s/320.html最新更新地址https://gitee.com
清霜辰
·
2025-03-03 19:37
android
Python查看变量及对象占用内存情况
在之前的文章中,我们也介绍过基于psutil库监控程序的内存占用量的方法,参见博客:Python监控程序的内存占用量其中,psutil库可以用来获取与操作系统相关的
统计信息
,如CPU使用率、内存使用
酒酿小圆子~
·
2025-03-03 10:32
Python
python
开发语言
Linux 下使用vmstat监控系统性能
vmstat[options][delay][count]delay:更新之间的间隔(以秒为单位)count:命令在停止之前运行的次数示例用法不带参数运行vmstat这将显示一份包含自上次重启以来的系统
统计信息
的报告
我是唐青枫
·
2025-03-03 10:27
Linux
linux
运维
服务器
Hive
的内置函数
HIVE
除了提供了类似mysql的sql的语法外,还提供了大量内置的函数,方便开发者来调用,编写功能丰富的处理程序。使用如下命令查看当前
hive
版本支持的所有内置函数。
不爱学习的小枫
·
2025-03-03 10:56
大数据
hive
数据仓库
大数据
Zookeeper(84)Zookeeper的快照文件格式是什么?
统计信息
:包括Zookeeper服务器的统计数据。文件头文件头在每个快照文件的开头,包含以下信息:魔数(MagicNumber):用于标识文件类
辞暮尔尔-烟火年年
·
2025-03-03 08:15
微服务
zookeeper
debian
分布式
hive
之leg函数
整理学习LAG函数是
Hive
中常用的窗口函数,用于访问同一分区内前一行(或前N行)的数据。它在分析时间序列数据、计算相邻记录差异等场景中非常有用。
三生暮雨渡瀟瀟
·
2025-03-03 07:34
hive
hive
使用DataX将ClickHouse数据导入
Hive
在将ClickHouse数据导入
Hive
时,如果字段中包含回车符(\n)或换行符(\r),会导致
Hive
在读取数据时将其误认为是行分隔符,从而导致数据错列的问题。
MYH516
·
2025-03-03 07:01
clickhouse
hive
hadoop
hive
开窗函数详解
1.OVER():用于指定分析函数工作时的数据窗口大小,这个数据窗口大小可能会随着行的变而变化;2.CURRENTROW:当前行;nPRECEDING:往前n行数据;nFOLLOWING:往后n行数据;UNBOUNDED:起点,UNBOUNDEDPRECEDING表示从前面的起点,UNBOUNDEDFOLLOWING表示到后面的终点;LAG(col,n,default_val):往前第n行数据;L
WakeUpCcc
·
2025-03-03 06:31
hive
hadoop
数据仓库
大数据
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他