hive 第6页

Hbase在hdfs上的archive目录占用空间过大

hbase版本：1.1.2hadoop版本：2.7.3Hbase在hdfs上的目录/apps/hbase/data/archive占用空间过大，导致不停地发出hdfs空间使用率告警。

宝罗Paul·2025-03-09 13:50

hbase集群archive目录过大问题处理

1.问题现象现场反馈hbase集群/hbase/archive目录过大，大小约为1.52PB现场集群已经清理掉2个月以前的snapshot文件，当前archive目录文件仍不能释放现场发现1T以上的archive

spring208208·2025-03-09 12:15

在mac上如何配置clion使用googletest进行测试

1、下载googletest并且编译wgethttps://github.com/google/googletest/archive/release-1.8.0.tar.gz&&\tarzxfrelease

rd_cheng·2025-03-08 21:05

Hive JDBC 大数据查询场景下的 Socket 读超时问题及实战解决方案

文章目录HiveJDBC大数据查询场景下的Socket读超时问题及实战解决方案问题背景️解决方案方案一：通过JDBCURL直接配置超时（推荐）方案二：动态设置全局loginTimeout（兼容旧版本）总结与建议

窝窝和牛牛·2025-03-07 20:48

ASIHTTPRequest类库简介和使用说明

一、简介原文链接http://www.cnblogs.com/dotey/archive/2011/05/10/2041966.html1.下载源码官方网站：http://allseeing-i.com

从小爱吃苹果干·2025-03-07 17:44

查看归档日志及rman备份文件

[root@his1/]#ls----查看**/**根目录下的文件archivebootdevhomelib64mediamntoptrmansbinsrvtmpusrbincgroupetcliblost

大叶梧桐·2025-03-07 15:51

Ubuntu系统中下载安装使用Anaconda

Anaconda管理虚拟环境一、下载官网下载地址：https://www.anaconda.com/download中科大镜像源官网：https://mirrors.ustc.edu.cn/anaconda/archive

xxxn1102_·2025-03-07 12:28

达梦数据库备份

需通过disql工具执行以下操作：alterdatabasemount;alterdatabaseARCHIVELOG;例子：[dmdba@server~]$cd/opt/dmdbms/bin[dmdba

huazhixuthink·2025-03-07 03:29

基于hive的电信离线用户的行为分析系统

标题:基于hive的电信离线用户的行为分析系统内容:1.摘要随着电信行业的快速发展，用户行为数据呈现出海量、复杂的特点。

赵谨言·2025-03-06 17:29

安装httpd

//下载软件包[root@openEulter-1~]#wgethttps://archive.apache.org/dist/httpd/httpd-2.

m0_74536424·2025-03-06 15:48

数据分析学习目录

在未来5个月里，将会陪伴大家一起来学习关于数据分析的相关内容，包括从数据思维，数据工具（Excel，Mysql，Hive，Python），数据方法论，数据展示（Tableau,BI），数据挖掘、数据实战项目一整套的内容

且行且安~·2025-03-06 14:35

Python进阶--多线程

原文链接：http://www.juzicode.com/archives/841在《Python进阶教程m9–网络通信–socket通信》中我们实现了一个socket服务端和客户端通信的例子，这个例子中服务端需要等待客户端发送消息后才能返回消息给客户端

桔子code·2025-03-06 06:57

安装mysql

1、安装数据库下载链接https://downloads.mysql.com/archives/community/下载zip安装包，解压到某个路径下，将bin文件夹添加到系统环境变量。

大霞上仙·2025-03-05 17:51

Databend 产品月报（2025年2月）

从MySQL迁移到DatabendDatabend推荐使用db-archiver进行MySQL批量迁移，使用FlinkCDC进行实时变更数据捕获（CDC）迁移。

·2025-03-05 15:15

doris: Hive

自2.1.3版本开始，ApacheDoris支持对Hive的DDL和DML操作。用户可以直接通过ApacheDoris在Hive中创建库表，并将数据写入到Hive表中。

向阳1218·2025-03-05 11:17

hive-DML语法(超级详细)

N.0变量使用setwindow_day=50--定义变量select${hiveconf:window_day}--使用变量N.1单表查询语句N.1.1语法

研发咨询顾问·2025-03-05 06:47

Hive SQL 优化

标题一、HIVESQL执##标题行顺序了解hivesql的执行顺序，有助于写出更高质量的代码。

大数据侠客·2025-03-05 06:45

Hive--桶表

目录1.为什么要使用桶表？？？2.桶表分桶规则3.桶表的创建3.1DLL3.2数据3.3DML3.4查看桶表里面的数据3.5临时表创建并加载数据3.6把临时表的数据加载到桶表里面4.桶表的查询4.1桶表查询全表的数据4.2桶表查看第一个桶里面的数据4.3查看第二个桶里面的数据4.4查看第三个桶里面的数据4.5查看桶表固定行数据4.6桶表查询语法4.7其他查询5桶表、分区表的区别6两个桶表之间的Jo

XK&RM·2025-03-05 06:44

HIVE的执行计划实操

HIVE（我们的自驾工具）提供了EXPLAIN命令来展示一个查询的执行计划（什么路线）,这个执行计划对于我们

不爱学习的小枫·2025-03-05 06:43

hive alter table add columns 是否使用 cascade 的方案

结论altertablexxxaddcolumns时加上cascade时，会把所有的分区都加上此字段。如果不加则只有新的分区会加上此字段，旧的分区没有此字段，即便数据文件里有对应的数据，也不能显示内容。如果分区都是insertoverwrite生成的，并且旧分区的数据不再重新生成，可以在addcolumns不用cascade，这样旧的分区对应的列显示null。新的分区正常显示新增的列。如果分区都是

houzhizhen·2025-03-05 06:12

Hive Exception: Too many counters: 2001 max=2000 的解决方法

在hive任务的执行过程中，可能出现Toomanycounters的异常。如果执行引擎时tez，则说明当前作业的counters数量超过tez默认的counters限制。

houzhizhen·2025-03-05 06:12

Hive 3.1 在 metastore 运行的 remote threads

Remotethreads是仅当Hivemetastore作为单独的服务运行是启动，请求需要开启compactor。

houzhizhen·2025-03-05 05:07

通过spark-redshift工具包读取redshift上的表

spark用户可以读取各种各样数据源的数据，比如Hive表、JSON文件、列式的Parquet表、以及其他表。通过spark包可以获取第三方数据源。

stark_summer·2025-03-04 22:02

UBuntu 软件安装

sudoapt-getupdatesudoapt-getdist-upgradesudoapt-getupgrade-y有一个简单办法可以使更新速度更快，把以前更新的时候下载的软件包备份一下，把var/cache/apt/archives

denlee·2025-03-04 17:53

初学者如何用 Python 写第一个爬虫？

大数据技术：涵盖Hadoop（HDFS）、Hive、Spark

ADFVBM·2025-03-04 16:19

Hive之正则表达式

Hive版本：hive-3.1.2目录一、Hive的正则表达式概述1.1字符集合1.2边界集合1.3量词（重复次数）集合1.4转义操作符1.5运算符优先级二、Hive正则表达式案例2.1like2.2rlike2.3regexp2.4regexp_replace

三生暮雨渡瀟瀟·2025-03-04 03:39

Hive之正则表达式RLIKE详解及示例

目录一、RLIKE语法及核心特性1.基本语法2.核心特性二、常见业务场景及示例场景1：过滤包含特定模式的日志（如错误日志）场景2：验证字段格式（如邮箱、手机号）场景3：提取复杂文本中的关键词场景4：排除无效数据（如非数字字符）三、高级用法与技巧1.忽略大小写匹配2.匹配多行文本3.组合多个条件四、性能优化建议1.避免全表扫描2.预编译正则模式3.简化正则表达式五、常见问题与注意事项1.转义字符问题

三生暮雨渡瀟瀟·2025-03-04 03:09

kafka入门基础

1.Java安装1.1下载https://download.oracle.com/java/18/archive/jdk-18.0.2.1_linu...1.2安装tarzxvfjdk-18.0.2.1

·2025-03-04 02:42

hive-staging文件问题——DataX同步数据重复

1.产生原因1.使用Hue的界面工具执行Hive-sql。

Aldebaran α·2025-03-03 23:38

避免Hive和Spark生成HDFS小文件

Hive和spark-sql是两个在常用的大数据计算分析引擎，用户直接以SQL进行大数据操作，底层的数据存储则多由HDFS提供。

穷目楼·2025-03-03 22:36

Linux 下Hive 安装(Remote Metastore Database 单节点)

1、Linux下安装好mysql：Linux下Mysql安装2、启动hadoop集群：1、zk启动[root@node02~]#zkServer.shstartZooKeeperJMXenabledbydefaultUsingconfig:/opt/software/apache-zookeeper-3.6.2-bin/bin/../conf/zoo.cfgStartingzookeeper...

A6-母婴小店-第6分店·2025-03-03 22:33

2025年上海安卓发展机遇

文章目录一、上海重点打造的产业集群规划二、安卓开发者的机遇与行动建议三、政策与资源支持总结本文首发地址https://h89.cn/archives/320.html最新更新地址https://gitee.com

清霜辰·2025-03-03 19:37

Hive的内置函数

HIVE除了提供了类似mysql的sql的语法外，还提供了大量内置的函数，方便开发者来调用，编写功能丰富的处理程序。使用如下命令查看当前hive版本支持的所有内置函数。

不爱学习的小枫·2025-03-03 10:56

hive之leg函数

整理学习LAG函数是Hive中常用的窗口函数，用于访问同一分区内前一行（或前N行）的数据。它在分析时间序列数据、计算相邻记录差异等场景中非常有用。

三生暮雨渡瀟瀟·2025-03-03 07:34

使用DataX将ClickHouse数据导入Hive

在将ClickHouse数据导入Hive时，如果字段中包含回车符（\n）或换行符（\r），会导致Hive在读取数据时将其误认为是行分隔符，从而导致数据错列的问题。

MYH516·2025-03-03 07:01

hive开窗函数详解

1.OVER()：用于指定分析函数工作时的数据窗口大小，这个数据窗口大小可能会随着行的变而变化；2.CURRENTROW：当前行；nPRECEDING：往前n行数据；nFOLLOWING：往后n行数据；UNBOUNDED：起点，UNBOUNDEDPRECEDING表示从前面的起点，UNBOUNDEDFOLLOWING表示到后面的终点；LAG(col,n,default_val)：往前第n行数据；L

WakeUpCcc·2025-03-03 06:31

大数据技术学习框架（更新中......）

小技工丨·2025-03-03 04:05

前端项目中脚本文件打包，vscode中如何正确使用gtar命令

1、下载gtarhttps://gnuwin32.sourceforge.net/packages/libarchive.htm2、傻瓜式安装一路下一步即可。

今天吃了嘛o·2025-03-02 17:43

win11编译pytorchvision cuda128版本流程

访问https://kkgithub.com/pytorch/vision/archive/refs/tags/v0.21.0.tar.gz下载源码，下载后解压。

System_sleep·2025-03-02 13:04

‌Tomcat 8.0.12安装流程

Windows系统安装流程步骤1：下载Tomcat8.0.12打开浏览器，访问ApacheTomcat的存档页面：https://archive.apache.org/dist/t

小魚資源大雜燴·2025-03-02 08:53

京东Hive SQL面试题实战：APP路径分析场景解析与幽默生存指南

京东HiveSQL面试题实战：APP路径分析场景解析与幽默生存指南“数据开发工程师的终极浪漫，就是把用户路径写成诗——用HiveSQL押韵。”

数据大包哥·2025-03-02 07:13

【Apache Paimon】-- 13 -- 利用 paimon-flink-action 同步 mysql 表数据

诞生以前，若mysql/pg等数据源的表结构发生变化时，我们有几种处理方式（1）人工通知（比如常规的使用邮件），然后运维人员手动同步到数据仓库中（2）使用flink消费DDLbinlog，然后自动更新Hive

oo寻梦in记·2025-03-02 04:51

jdbc连接数据库步骤oracle,jdbc连接oracle数据库的步骤

使用E-MapReduce集群sqoop组件同步云外Oracle数据库数据到集群hiveE-MapReduce集群sqoop组件可以同步数据库的数据到集群里，不同的数据库源网络配置有一些差异网络配置。

weixin_39726044·2025-03-02 02:05

Anaconda配置tensorflow-gpu教程

里面怎么调都识别不到GPU）打开Nvidia控制面板，左上角帮助-系统信息-组件NVCUDA64.DLL后面的NVIDIACUDA12.1就是你的显卡支持的CUDA版本，去CUDA官网CUDAToolkitArchive

rubisco214·2025-02-28 22:19

linux压缩解压文件夹命令 zip unzip 和 tar

示例：zip-rmyarchive.zipmydir解压文件unzip压缩包名.zip-d目标目录-d:指定解压目录（默认当前目录）。

luoluosheng07·2025-02-28 20:35

python 一小时教程

Java和Javascript,不用1小时你就可以用Python快速流畅地写有用的Python程序.Python3.x用户请参考:http://www.cnitblog.com/yunshichen/archive

wsf_123456·2025-02-28 12:03

HIVE 面试题总结

Hive依赖于HDFS存储数据，Hive将HQL转换成MapReduce执行，所以说Hive是基于Hadoop的一个数据仓库工具，实质就是一款基于HDFS的MapReduce计算框架，对存储在HDFS中的数据进行分析和管理

小余真旺财·2025-02-28 11:00

Hive 面试题

什么是Hive?Hive是基于Hadoop的一个数据仓库工具，用来进行数据提取、转化、加载，这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。

昨夜为你摘星·2025-02-28 11:59

hivePB级迁移方案

1、评估磁盘空间大小、调整副本数、设置heapsize大小2、distcp-i-skipcrccheck源端到目标端，迁移3、元数据迁移，建表，替换location地址，或者导出db4、表分区修复5、配置增量T-1迁移或者T-26、校验历史分区脚本，表结构，大小，文件数7、根据ditcp不对的，进行补数脚本，删分区，重拉8、任务校验，客户跑完任务后，校验指定分区的count数和内容的md59、任务

我要用代码向我喜欢的女孩表白·2025-02-28 10:51

Hive基本操作

Hive基本操作1.Hive常用命令1.1Hive启动1.2Hive退出1.3Hive查看历史命令1.4Hive常用交互命令2.数据库基本操作2.1创建数据库2.2创建数据库并指定hdfs存储位置2.3

小肥柴呀·2025-02-28 04:01

推荐频道

hive