爱是与世界平行

Linux环境Hive安装配置及使用

一、Hive

Hive环境前提

二、Hive架构原理解析
三、Hive-1.2.2单机安装流程

(1) 解压apache-hive-1.2.2-bin.tar.gz安装包到目标目录下：
(2) 为后续方便，重命名Hive文件夹：
(3) 修改配置文件：
(4) 配置环境变量：
(5) 启动
(6) 退出
(7) 配置MySQL元数据库

四、Hive数据类型
五、Hive-DDL(Data Definition Language)

(1) 查看数据库
(2) 创建库
(3) 创建库(标准写法)
(4) 创建库指定hdfs路径
(5) 创建表
(6) 查看表类型：
(7) 查询表
(8) 分区表操作
(9) 分桶表操作
(10) 查看数据库结构
(11) 添加数据库额外描述信息
(12) 查询数据库额外信息
(13) 查看指定的数据库(使用通配符)
(14) 删除空库
(15) 删除非空库标准写法
(16) 删除非空库
(17) 删除非空库标准写法

六、Hive-DML(Data Manipulation Language)

(1) 导入数据
(2) 向表中插入数据
(3) 向表中插入sql查询结果数据
(4) 创建表直接加载数据
(5) 把操作结果导出到本地linux
(6) 把hive中表数据导出到hdfs中(拷贝操作)
(7) 把hdfs数据导入到hive中(拷贝操作)
(8) 清空表数据

七、Hive命令

(1) 不登录Hive客户端直接输入命令操作：
(2) 直接把sql写入到文件中：
(3) 在Hive中可以直接执行hdfs命令操作：
(4) 查看历史操作

八、UDF自定义函数

(1) 相关概念：
(2) 查看系统自带函数：
(3) 查看系统自带函数示范用法：
(4) UDF自定义函数使用：

九、Hive压缩——大量数据节省时间

(1) Map输出阶段压缩方式：
(2) Reduce输出阶段压缩方式：

十、Hive进阶

(1) Hive集群搭建

转载自：YBCarry

一、Hive

Hive环境前提

1）启动hdfs集群
2）启动yarn集群
如果想用hive的话，需要提前安装部署好hadoop集群。

二、Hive架构原理解析

三、Hive-1.2.2单机安装流程

(1) 解压apache-hive-1.2.2-bin.tar.gz安装包到目标目录下：

tar -zxvf .tar.gz -C 目标目录

(2) 为后续方便，重命名Hive文件夹：

mv apache-hive-1.2.2-bin/ hive-1.2.2

(3) 修改配置文件：

进入hive-1.2.2/conf路径，重命名配置文件：

mv hive-env.sh.template hive-env.sh

修改hive-env.sh信息：

vi hive-env.sh

# Set HADOOP_HOME to point to a specific hadoop install directory
# 指定Hadoop安装路径
HADOOP_HOME=Hadoop安装路径

# Hive Configuration Directory can be controlled by:
# 指定Hive配置文件夹
export HIVE_CONF_DIR=/XXXXXX/hive-1.2.2/conf

(4) 配置环境变量：

修改配置文件：

vi /etc/profile

增加以下内容：

export HIVE_HOME=hive安装路径
export PATH=$PATH:$HIVE_HOME/bin
# Hadoop环境加入Hive依赖
export HADOOP_CLASSPATH=$HADOOP_CLASSPATH:$HIVE_HOME/lib/*

声明环境变量：

source /etc/profile

(5) 启动

hive

(6) 退出

quit;

(7) 配置MySQL元数据库

<1>. 上传mysql驱动到hive/lib
<2>. 在hive-1.2.2/conf路径创建配置文件hive-site.xml：

vi hive-site.xml




	
	  javax.jdo.option.ConnectionURL
	  jdbc:mysql://主机名:3306/metastore?createDatabaseIfNotExist=true
	  JDBC connect string for a JDBC metastore
	

	
	  javax.jdo.option.ConnectionDriverName
	  com.mysql.jdbc.Driver
	  Driver class name for a JDBC metastore
	

	
	  javax.jdo.option.ConnectionUserName
	  root
	  username to use against metastore database
	

	
	  javax.jdo.option.ConnectionPassword
	  密码
	  password to use against metastore database
	
	
	# 查询表时显示表头信息
    
      hive.cli.print.header
      true
    

    # 显示当前所在的数据库
    
      hive.cli.print.current.db
      true

<3>. 重启hadoop集群
<4>. 启动hive：hive
<5>. 此时mysql中自动创建metastore元数据库

四、Hive数据类型

五、Hive-DDL(Data Definition Language)

(1) 查看数据库

show databases;

(2) 创建库

create database 数据库名;

(3) 创建库(标准写法)

create database if not exists 数据库名;

(4) 创建库指定hdfs路径

create database 数据库名 location '路径';

(5) 创建表

create [external] table [if not exists] 表名(参数) [partitioned by(字段信息)] [clustered by(字段信息)] [sorted by(字段信息)]
row format ---根据行格式化
delimited fields ---分割字段
terminated by '切割符'; ---分割依据

external：可选操作，加上创建的是外部表，去掉创建的是管理表（内部表）
if not exists：可选操作，加上为标准写法
partitioned by(字段信息)：可选操作，分区
clustered by(字段信息)：可选操作，分桶
sorted by(字段信息)：可选操作，排序
**注意：**如果指定了hdfs路径，创建的表存放于该路径下

(6) 查看表类型：

desc formatted 表名;

Table Type:

MANAGED_TABLE——内部表
EXTERNAL_TABLE——外部表
**区别：**管理表删除时hdfs中数据删除，外部表删除时hdfs中数据不删除

(7) 查询表

普通表查询：

select * from 表名;

指定列查询：

select 表名.列1, 表名.列2 from 表名;

指定列查询设置别名

select 表名.列 (as) 列别名 from 列原名;

分区表查询：

全查询：

select * from 表名;
**注意：**此时查看的是整个分区表中的数据

单分区查询：

select * from 表名 where 分区条件;
**注意：**此时查看的是指定分区中的数据

联合查询：

    select * from 表名1 where 分区条件 union select * from 表名1 where 分区条件;

常用基础查询函数：
查询总行数：select count(1) from 表名;
查询最大值：select max(列名) from 表名;
查询最小值：select min(列名) from 表名;
查询列总和：select sum(列名) from 表名;
查询列平均值：select avg(列名) from 表名;
查询结果只显示前n条：select * from 表名 limit n;

where——过滤：

查询A列n~m之间的数据：

select * from 表名 where A>n and A

 
   
   查询A列小于n或者大于m之间的数据：select * from 表名 where Am; 
   查询A列不在n~m之间的数据：select * from 表名 where A not in(n,m); 
   查询A列不为空的数据：`select * from 表名 where A is not null; 
   
  like——模糊查询(使用通配符)：` 
   
   查询以n开头的A列：select * from 表名 where A like 'n%'; 
   查询第二位是n的A列：select * from 表名 where A like '_n%'; 
   查询包含n的A列：select * from 表名 where A like '%n%'; 
   
  group by——分组： 
   
   查询按B分组的A列数据：select A,B from 表名 group by B; 
   分组查询中用having代替where 
   
  Join操作： 
   
   join(内连接)：只有连接的两张表中都存在与条件向匹配的数据才会被保留下来 
   left join(左外连接)：保留左表数据，右表没有join上的字段显示为null 
   right join(右外连接)：保留右表数据，左表没有join上的字段显示为null 
   full join(满外连接)：结果会返回所有表中符合条件的所有记录，如果有字段没有符合条件用null值代替 
   
  排序： 
  Order By(全局排序)： 
   
   升序排序(可省略asc)：select * from 表名 order by 列名 asc; 
   降序排序：select * from 表名 order by 列名 desc; 
   
  Sort By(内部排序)： 
   
   对每个reducer端数据进行排序，若只有一个reducer端结果与全局排序相同。 
   设置reduce个数属性(临时)：set mapreduce.job.reduces = n; 
   升序排序(可省略asc)：select * from 表名 sort by 列名; 
   降序排序：select * from 表名 sort by 列名 desc; 
   
  Distribute By： 
   
   distribute by控制在map端如何拆分数据给reducer端。hive会根据distribute by指定的列，对应reducer的个数进行分发，默认是采用hash算法。sort by为每个reduce产生一个排序文件。在有些情况下，需要控制某个特定行应该到哪个reducer，这通常是为了进行后续的聚集操作，distribute by刚好可以做这件事。因此，distribute by经常和sort by配合使用。 
   先按A列进行排序再按B列进行降序排序： 
   select * from 表名 distribute by A sort by B desc; 
   
  Cluster By: 
   
   若distrbute by和sort by是相同字段时，cluster by是distribute by和sort by相结合。 
   被cluster by排序的列只能是降序，不能指定asc和desc。 
   按A列进行排序： 
   
  select * from 表名 cluster by A;
select * from 表名 distribute by A sort by A;
上述两语句等价
 
  (8) 分区表操作 
   
   分区表在hdfs中分目录文件夹。 
   添加单个分区：alter table 表名 add partition(新分区信息); 
   一次添加多个分区用空格分割即可 
   查看分区：show partitions 表名; 
   删除分区：alter table 表名 drop partition(分区信息); 
   修复分区：（通过hdfs上传分区文件）msck repair table dept_partitions; 
   
  (9) 分桶表操作 
   
   分桶表在hdfs中分文件。 
   适用于非常大的数据集。 
   用户需要统计一个具有代表性的结果或反映趋势(抽样)。 
   创建分桶表语句： clustered by(字段信息) into n buckets 
   开启分桶： 
   
  set hive.enforce.bucketing = true; set mapreduce.job.reduces = -1;
 
   
   共m桶，从第n桶开始抽，查看a桶的A列数据(a 
   
      select * from 表名(bucket n out of a on   A);
 
  (10) 查看数据库结构 
  desc database 数据库名;
 
  (11) 添加数据库额外描述信息 
  alter database 数据库名 set dbproperties('key'='value');
 
  (12) 查询数据库额外信息 
  desc database extended 数据库名;
 
  (13) 查看指定的数据库(使用通配符) 
  show databases like 'i*';
 
  (14) 删除空库 
  drop database 数据库名;
 
  (15) 删除非空库标准写法 
  drop database if exists 数据库名;
 
  (16) 删除非空库 
  drop database 数据库名 cascade;
 
  (17) 删除非空库标准写法 
  drop database if exists 数据库名 cascade;
 
  六、Hive-DML(Data Manipulation Language) 
  (1) 导入数据 
   
   load data [local] inpath ‘/XXXX/文件名’ into table 表名 [partition(分区位置)]; 
   load data：加载数据 
   local：可选操作，加上local导入是本地Linux中的数据，去掉local那么导入的是hdfs数据 
   inpath：表示的是加载数据的路径 
   into table：表示要加载的对应表 
   partition(分区位置)：可选操作，向分区表中导入数据时需要指定 
   
  (2) 向表中插入数据 
  insert into table 表名 partition(分区信息) values(数据内容);
 
  (3) 向表中插入sql查询结果数据 
  insert overwrite table 表名 partition(分区信息) select * from 表名 where 查询条件;
create table if not exists 表名 as select * from 表名 where 查询条件;
 
  (4) 创建表直接加载数据 
  create table 表名(参数) row fromat delimited fields terminated by '切割符' locatition '';
 
  **注意：**locatition路径是hdfs文件的上一层文件夹，且文件夹内只有这一个文件。 
  (5) 把操作结果导出到本地linux 
  insert overwrite local directory '本地路径' select * from 表名;
 
  (6) 把hive中表数据导出到hdfs中(拷贝操作) 
  export table 表名 to 'hdfs路径';
 
  (7) 把hdfs数据导入到hive中(拷贝操作) 
  import table 表名 from 'hive路径';
 
  (8) 清空表数据 
  truncate table 表名;
 
  七、Hive命令 
  (1) 不登录Hive客户端直接输入命令操作： 
  hive -e "Hive-DDL语句(注意分号)"
 
  (2) 直接把sql写入到文件中： 
  hive -f sql路径
 
  (3) 在Hive中可以直接执行hdfs命令操作： 
  查看hdfs文件： 
  dfs -ls 路径;
 
  查看hdfs文件内容： 
  dfs -cat 文件路径;
 
  创建hdfs目录： 
  dfs -mkdir -p 目录路径;
 
  上传hdfs文件： 
  dfs -put 文件路径 目录路径;
 
  (4) 查看历史操作 
  cat ~/.hivehistory
 
  八、UDF自定义函数 
  (1) 相关概念： 
  UDF:一进一出
 UDAF:聚合函数，多进一出 e.g. count /max/avg
 UDTF:一进多出 
  (2) 查看系统自带函数： 
  show functions;
 
  (3) 查看系统自带函数示范用法： 
  desc function extended 函数名;
 
  (4) UDF自定义函数使用： 
   
   <1>. 使用java编写函数(类继承org.apache.hadoop.hive.ql.exec.UDF)，导出jar包。 
   <2>. 上传至Linux中。 
   <3>. 添加jar包： 
   
  临时添加： 
   
   在Hive客户端下输入命令：add jar jar包路径; 
   创建关联：create temporary function 别名 as "java函数类"; 
   
  注册永久： 
   
   修改hive-site.xml配置文件： 
   
  
    hive.aux.jars.path
    file://文件夹路径


 
  九、Hive压缩——大量数据节省时间 
  (1) Map输出阶段压缩方式： 
   
   开启hive中间传输数据压缩功能：set hive.exec.compress.intermediate = true; 
   开启map输出压缩：set mapreduce.map.output.compress = true; 
   指定压缩编码——设置Snappy压缩方式(高版本Hive自带Snappy)： 
   
  set mapreduce.map.output.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;
 
  (2) Reduce输出阶段压缩方式： 
   
   开启hive输出数据压缩功能：set hive.exec.compress.output= true; 
   开启mr输出数据压缩：set mapreduce.output.fileoutputformat.compress = true; 
   指定压缩编码——设置Snappy压缩方式： 
   
  set mapreduce.output.fileoutputformat.compress.codec = org.apache.hadoop.io.compress.SnappyCodec;
 
   
   指定压缩类型块压缩：set mapreduce.output.fileoutputformat.compress.type = BLOCK; 
   
  十、Hive进阶 
  (1) Hive集群搭建 
  server端配置文件： 
  
            
                    hive.metastore.warehouse.dir
                    /opt/module/hive-1.2.2/warehouse
            
            
                    javax.jdo.option.ConnectionURL
                   # MySQL数据库位置 jdbc:mysql://bigdata01:3306/metastore?createDatabaseIfNotExist=true
                    JDBC connect string for a JDBC metastore
            

            
                    javax.jdo.option.ConnectionDriverName
                    com.mysql.jdbc.Driver
                    Driver class name for a JDBC metastore
            

            
                    javax.jdo.option.ConnectionUserName
                    MySQL用户名
                    username to use against metastore database
            

            
                    javax.jdo.option.ConnectionPassword
                    MySQL密码
                    password to use against metastore database
            
    

 
  client端配置文件： 
  
            
                    hive.metastore.warehouse.dir
                    /opt/module/hive-1.2.2/warehouse
            
            
                    hive.metastore.local
                    false
            
            
                    hive.metastore.uris
                    # server端地址信息
                    thrift://bigdata01:9083
            
            # 查询表时显示表头信息
            
                    hive.cli.print.header
                    true
            
            # 显示当前所在的数据库
            
                    hive.cli.print.current.db
                    true
            
    

 
  启动： 
  启动服务器端：hive --service metastore
启动客户端：hive

android系统selinux中添加新属性property 辉色投像
1.定位/android/system/sepolicy/private/property_contexts声明属性开头：persist.charge声明属性类型：u:object_r:system_prop:s0图12.定位到android/system/sepolicy/public/domain.te删除neverallow{domain-init}default_prop:property
Linux下QT开发的动态库界面弹出操作（SDL2） 13jjyao QT类 qt 开发语言 sdl2 linux
需求：操作系统为linux，开发框架为qt，做成需带界面的qt动态库，调用方为java等非qt程序难点：调用方为java等非qt程序，也就是说调用方肯定不带QApplication::exec()，缺少了这个，QTimer等事件和QT创建的窗口将不能弹出(包括opencv也是不能弹出)；这与qt调用本身qt库是有本质的区别的思路：1.调用方缺QApplication::exec()，那么我们在接口
linux sdl windows.h,Windows下的SDL安装奔跑吧linux内核 linux sdl windows.h
首先你要下载并安装SDL开发包。如果装在C盘下，路径为C:\SDL1.2.5如果在WINDOWS下。你可以按以下步骤：1.打开VC++，点击"Tools",Options2,点击directories选项3.选择"Includefiles"增加一个新的路径。"C:\SDL1.2.5\include"4，现在选择"Libaryfiles“增加"C:\SDL1.2.5\lib"现在你可以开始编写你的第
linux中sdl的使用教程,sdl使用入门 Melissa Corvinus linux中sdl的使用教程
本文通过一个简单示例讲解SDL的基本使用流程。示例中展示一个窗口，窗口里面有个随机颜色快随机移动。当我们鼠标点击关闭按钮时间窗口关闭。基本步骤如下：1.初始化SDL并创建一个窗口。SDL_Init()初始化SDL_CreateWindow()创建窗口2.纹理渲染存储RGB和存储纹理的区别：比如一个从左到右由红色渐变到蓝色的矩形，用存储RGB的话就需要把矩形中每个点的具体颜色值存储下来；而纹理只是一
PHP环境搭建详细教程好看资源平台前端 php
PHP是一个流行的服务器端脚本语言，广泛用于Web开发。为了使PHP能够在本地或服务器上运行，我们需要搭建一个合适的PHP环境。本教程将结合最新资料，介绍在不同操作系统上搭建PHP开发环境的多种方法，包括Windows、macOS和Linux系统的安装步骤，以及本地和Docker环境的配置。1.PHP环境搭建概述PHP环境的搭建主要分为以下几类：集成开发环境：例如XAMPP、WAMP、MAMP，这
使用 FinalShell 进行远程连接（ssh 远程连接 Linux 服务器）编程经验分享开发工具服务器 ssh linux
目录前言基本使用教程新建远程连接连接主机自定义命令路由追踪前言后端开发，必然需要和服务器打交道，部署应用，排查问题，查看运行日志等等。一般服务器都是集中部署在机房中，也有一些直接是云服务器，总而言之，程序员不可能直接和服务器直接操作，一般都是通过ssh连接来登录服务器。刚接触远程连接时，使用的是XSHELL来远程连接服务器，连接上就能够操作远程服务器了，但是仅用XSHELL并没有上传下载文件的功能
libyuv之linux编译 jaronho Linux linux 运维服务器
文章目录一、下载源码二、编译源码三、注意事项1、银河麒麟系统（aarch64）（1）解决armv8-a+dotprod+i8mm指令集支持问题（2）解决armv9-a+sve2指令集支持问题一、下载源码到GitHub网站下载https://github.com/lemenkov/libyuv源码，或者用直接用git克隆到本地，如：gitclonehttps://github.com/lemenko
ARM驱动学习之5 LEDS驱动 JT灬新一嵌入式 C 底层 arm开发学习单片机
ARM驱动学习之5LEDS驱动知识点：•linuxGPIO申请函数和赋值函数–gpio_request–gpio_set_value•三星平台配置GPIO函数–s3c_gpio_cfgpin•GPIO配置输出模式的宏变量–S3C_GPIO_OUTPUT注意点：DRIVER_NAME和DEVICE_NAME匹配。实现步骤：1.加入需要的头文件：//Linux平台的gpio头文件#include//三
【华为OD技术面试真题精选 - 非技术题】 -HR面，综合面_华为od hr面一个射手座的程序媛程序员华为od 面试职场和发展
最后的话最近很多小伙伴找我要Linux学习资料，于是我翻箱倒柜，整理了一些优质资源，涵盖视频、电子书、PPT等共享给大家！资料预览给大家整理的视频资料：给大家整理的电子书资料：如果本文对你有帮助，欢迎点赞、收藏、转发给朋友，让我有持续创作的动力！网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。需要这份系统化的资料的朋友，可以点击这里获
nosql数据库技术与应用知识点皆过客，揽星河 NoSQL nosql 数据库大数据数据分析数据结构非关系型数据库
Nosql知识回顾大数据处理流程数据采集(flume、爬虫、传感器)数据存储(本门课程NoSQL所处的阶段)Hdfs、MongoDB、HBase等数据清洗(入仓)Hive等数据处理、分析(Spark、Flink等)数据可视化数据挖掘、机器学习应用(Python、SparkMLlib等)大数据时代存储的挑战(三高)高并发(同一时间很多人访问)高扩展(要求随时根据需求扩展存储)高效率(要求读写速度快)
简介Shell、zsh、bash zhaosuningsn Shell zsh bash shell linux bash
Shell是Linux和Unix的外壳，类似衣服，负责外界与Linux和Unix内核的交互联系。例如接收终端用户及各种应用程序的命令，把接收的命令翻译成内核能理解的语言，传递给内核，并把内核处理接收的命令的结果返回给外界，即Shell是外界和内核沟通的桥梁或大门。Linux和Unix提供了多种Shell，其中有种bash，当然还有其他好多种。Mac电脑中不但有bash，还有一个zsh，预装的，据说
Linux MariaDB使用OpenSSL安装SSL证书 Meta39 MySQL Oracle MariaDB Linux Windows ssl linux mariadb
进入到证书存放目录，批量删除.pem证书警告：确保已经进入到证书存放目录find.-typef-iname\*.pem-delete查看是否安装OpenSSLopensslversion没有则安装yuminstallopensslopenssl-devel开启SSL编辑/etc/my.cnf文件（没有的话就创建，但是要注意，在/etc/my.cnf.d/server.cnf配置了datadir的，
ES聚合分析原理与代码实例讲解光剑书架上的书大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
ES聚合分析原理与代码实例讲解1.背景介绍1.1问题的由来在大规模数据分析场景中，特别是在使用Elasticsearch（ES）进行数据存储和检索时，聚合分析成为了一个至关重要的功能。聚合分析允许用户对数据集进行细分和分组，以便深入探索数据的结构和模式。这在诸如实时监控、日志分析、业务洞察等领域具有广泛的应用。1.2研究现状目前，ES聚合分析已经成为现代大数据平台的核心组件之一。它支持多种类型的聚
【从浅识到熟知Linux】Linux发展史 Jammingpro 从浅学到熟知Linux linux 运维服务器
归属专栏：从浅学到熟知Linux个人主页：Jammingpro每日努力一点点，技术变化看得见文章前言：本篇文章记录Linux发展的历史，因在介绍Linux过程中涉及的其他操作系统及人物，本文对相关内容也有所介绍。文章目录Unix发展史Linux发展史开源Linux官网企业应用情况发行版本在学习Linux前，我们可能都会问Linux从哪里来？它是如何发展的。但在介绍Linux之前，需要先介绍一下Un
linux 发展史种树的猴子内核 java 操作系统 linux 大数据
linux发展史说明此前对linux认识模糊一知半解，近期通过学习将自己对于linux的发展总结一下方便大家日后的学习。那Linux是目前一款非常火热的开源操作系统，可是linux是什么时候出现的，又是因为什么样的原因被开发出来的呢。以下将对linux的发展历程进行详细的讲解。目录一、Linux发展背景二、UINIX的诞生三、UNIX的重要分支-BSD的诞生四、Minix的诞生五、GNU与Free
Linux sh命令 fengyehongWorld Linux linux
目录一.基本语法二.选项2.1-c字符串中读取内容，并执行2.1.1基本用法2.1.2获取当前目录下失效的超链接2.2-x每个命令执行之前，将其打印出来2.3结合Here文档使用一.基本语法⏹Linux和Unix系统中用于执行shell脚本或运行命令的命令。sh[选项][脚本文件][参数...]⏹选项-c：从字符串中读取内容，并执行。-x：在每个命令执行之前，将其打印出来。-s：从标准流中读取内容
Linux vi常用命令 fengyehongWorld Linux linux
参考资料viコマンド（vimコマンド）リファレンス目录一.保存系命令二.删除系命令三.移动系命令四.复制粘贴系命令一.保存系命令⏹保存并退出:wq⏹强制保存并退出:wq!⏹退出(文件未编辑):q⏹强制退出(忽略已编辑内容):q!⏹另存为:w新文件名二.删除系命令⏹删除当前行dd⏹清空整个文档gg：移动到文档顶部dG：删除到最后一行ggdG三.移动系命令⏹移动到文档顶部gg⏹移动到文档底部#方式1G
Linux查看服务器日志 TPBoreas 运维 linux 运维
一、tail这个是我最常用的一种查看方式用法如下：tail-n10test.log查询日志尾部最后10行的日志;tail-n+10test.log查询10行之后的所有日志;tail-fn10test.log循环实时查看最后1000行记录(最常用的)一般还会配合着grep用，(实时抓包)例如:tail-fn1000test.log|grep'关键字'（动态抓包）tail-fn1000test.log
笋丁网页自动回复机器人V3.0.0免授权版源码希希分享软希网58soho_cn 源码资源笋丁网页自动回复机器人
笋丁网页机器人一款可设置自动回复，默认消息，调用自定义api接口的网页机器人。此程序后端语言使用Golang，内存占用最高不超过30MB，1H1G服务器流畅运行。仅支持Linux服务器部署，不支持虚拟主机，请悉知！使用自定义api功能需要有一定的建站基础。源码下载：https://download.csdn.net/download/m0_66047725/89754250更多资源下载：关注我。安
Vue( ElementUI入门、vue-cli安装) m0_l5z elementui vue.js
一.ElementUI入门目录：1.ElementUI入门1.1ElementUI简介1.2Vue+ElementUI安装1.3开发示例2.搭建nodejs环境2.1nodejs介绍2.2npm是什么2.3nodejs环境搭建2.3.1下载2.3.2解压2.3.3配置环境变量2.3.4配置npm全局模块路径和cache默认安装位置2.3.5修改npm镜像提高下载速度2.3.6验证安装结果3.运行n
WebMagic：强大的Java爬虫框架解析与实战 Aaron_945 Java java 爬虫开发语言
文章目录引言官网链接WebMagic原理概述基础使用1.添加依赖2.编写PageProcessor高级使用1.自定义Pipeline2.分布式抓取优点结论引言在大数据时代，网络爬虫作为数据收集的重要工具，扮演着不可或缺的角色。Java作为一门广泛使用的编程语言，在爬虫开发领域也有其独特的优势。WebMagic是一个开源的Java爬虫框架，它提供了简单灵活的API，支持多线程、分布式抓取，以及丰富的
【Python搞定车载自动化测试】——Python实现车载以太网DoIP刷写（含Python源码）疯狂的机器人 Python搞定车载自动化 python DoIP UDS ISO 14229 1SO 13400 Bootloader tcp/ip
系列文章目录【Python搞定车载自动化测试】系列文章目录汇总文章目录系列文章目录前言一、环境搭建1.软件环境2.硬件环境二、目录结构三、源码展示1.DoIP诊断基础函数方法2.DoIP诊断业务函数方法3.27服务安全解锁4.DoIP自动化刷写四、测试日志1.测试日志五、完整源码链接前言随着智能电动汽车行业的发展，汽车=智能终端+四个轮子，各家车企都推出了各自的OTA升级方案，本章节主要介绍如何使
免费的GPT可在线直接使用（一键收藏） kkai人工智能 gpt
1、LuminAI（https://kk.zlrxjh.top）LuminAI标志着一款融合了星辰大数据模型与文脉深度模型的先进知识增强型语言处理系统，旨在自然语言处理（NLP）的技术开发领域发光发热。此系统展现了卓越的语义把握与内容生成能力，轻松驾驭多样化的自然语言处理任务。VisionAI在NLP界的应用领域广泛，能够胜任从机器翻译、文本概要撰写、情绪分析到问答等众多任务。通过对大量文本数据的
如何利用大数据与AI技术革新相亲交友体验 h17711347205 回归算法安全系统架构交友小程序
在数字化时代，大数据和人工智能（AI）技术正逐渐革新相亲交友体验，为寻找爱情的过程带来前所未有的变革（编辑h17711347205）。通过精准分析和智能匹配，这些技术能够极大地提高相亲交友系统的效率和用户体验。大数据的力量大数据技术能够收集和分析用户的行为模式、偏好和互动数据，为相亲交友系统提供丰富的信息资源。通过分析用户的搜索历史、浏览记录和点击行为，系统能够深入了解用户的兴趣和需求，从而提供更
Linux CTF逆向入门蚁景网络安全 linux 运维 CTF
1.ELF格式我们先来看看ELF文件头，如果想详细了解，可以查看ELF的manpage文档。关于ELF更详细的说明：e_shoff：节头表的文件偏移量（字节）。如果文件没有节头表，则此成员值为零。sh_offset：表示了该section（节）离开文件头部位置的距离+-------------------+|ELFheader|---++--------->+-------------------
NPM私库搭建-verdaccio（Linux） Beam007 npm linux 前端
1、安装nodelinux服务器安装nodea)、官网下载所需的node版本https://nodejs.org/dist/v14.21.0/b)、解压安装包若下载的是xxx.tar.xz文件，解压命令为tar-xvfxxx.tar.xzc)、修改环境变量修改：/etc/profile文件#SETPATHFORNODEJSexportNODE_HOME=NODEJS解压安装的路径exportPAT
C++常见知识掌握 nfgo c++开发语言
1.Linux软件开发、调试与维护内核与系统结构Linux内核是操作系统的核心，负责管理硬件资源，提供系统服务，它是系统软件与硬件之间的桥梁。主要组成部分包括：进程管理：内核通过调度器分配CPU时间给各个进程，实现进程的创建、调度、终止等操作。使用进程描述符（task_struct）来存储进程信息，包括状态（就绪、运行、阻塞等）、优先级、内存映射等。内存管理：包括物理内存和虚拟内存管理。通过页表映
linux脚本sed替换变量,sed 命令中替换值为shell变量诺坎普之约 linux脚本sed替换变量
文章目录sed命令中替换值为shell变量替换基本语法sed中替换使用shell变量总结参考文档sed命令中替换值为shell变量替换基本语法大家都是sed有很多用法，最多就应该是替换一些值了。让我们先回忆sed的替换语法。在sed进行替换的时候sed-i's/old/new/g'1.txtecho"hellooldfrank"|sed's/old/new/g'结果如下：hellonewfrank
RK3229_Android9.0_Box 4G模块EC200A调试 suifen_ 网络
0、kernel修改这部分完全可以参考Linux的移植：RK3588EC200A-CN【4G模块】调试_rkec200a-cn-CSDN博客1、修改device/rockchip/rk322xdiff--gita/device.mkb/device.mkindexec6bfaa..e7c32d1100755---a/device.mk+++b/device.mk@@-105,6+105,8@@en
linux 安装Sublime Text 3 hhyiyuanyu Python学习 linux sublime text
方法/步骤打开官网http://www.sublimetext.com/3，选择64位进行下载执行命令wgethttps://download.sublimetext.com/sublime_text_3_build_3126_x64.tar.bz2进行下载3、下载完成进行解压,执行tar-xvvfsublime_text_3_build_3126_x64.tar.bz解压4、解压完成以后，移动到
辗转相处求最大公约数沐刃青蛟 C++漏洞
无言面对”江东父老“了，接触编程一年了，今天发现还不会辗转相除法求最大公约数。惭愧惭愧！为此，总结一下以方便日后忘了好查找。 1.输入要比较的两个数a,b 忽略：2.比较大小（因为后面要的是大的数对小的数做%操作） 3.辗转相除（用循环不停的取余，如a%b,直至b=0） 4.最后的a为两数的最大公约数 &
F5负载均衡会话保持技术及原理技术白皮书 bijian1013 F5 负载均衡
一.什么是会话保持？在大多数电子商务的应用系统或者需要进行用户身份认证的在线系统中，一个客户与服务器经常经过好几次的交互过程才能完成一笔交易或者是一个请求的完成。由于这几次交互过程是密切相关的，服务器在进行这些交互过程的某一个交互步骤时，往往需要了解上一次交互过程的处理结果，或者上几步的交互过程结果，服务器进行下
Object.equals方法：重载还是覆盖 Cwind java generics override overload
本文译自StackOverflow上对此问题的讨论。原问题链接在阅读Joshua Bloch的《Effective Java（第二版）》第8条“覆盖equals时请遵守通用约定”时对如下论述有疑问： “不要将equals声明中的Object对象替换为其他的类型。程序员编写出下面这样的equals方法并不鲜见，这会使程序员花上数个小时都搞不清它为什么不能正常工作：” pu
初始线程 15700786134
暑假学习的第一课是讲线程，任务是是界面上的一条线运动起来。既然是在界面上，那必定得先有一个界面，所以第一步就是，自己的类继承JAVA中的JFrame，在新建的类中写一个界面，代码如下： public class ShapeFr
Linux的tcpdump 被触发 tcpdump
用简单的话来定义tcpdump，就是：dump the traffic on a network，根据使用者的定义对网络上的数据包进行截获的包分析工具。 tcpdump可以将网络中传送的数据包的“头”完全截获下来提供分析。它支持针对网络层、协议、主机、网络或端口的过滤，并提供and、or、not等逻辑语句来帮助你去掉无用的信息。实用命令实例默认启动 tcpdump 普通情况下，直
安卓程序listview优化后还是卡顿肆无忌惮_ ListView
最近用eclipse开发一个安卓app，listview使用baseadapter，里面有一个ImageView和两个TextView。使用了Holder内部类进行优化了还是很卡顿。后来发现是图片资源的问题。把一张分辨率高的图片放在了drawable-mdpi文件夹下，当我在每个item中显示，他都要进行缩放，导致很卡顿。解决办法是把这个高分辨率图片放到drawable-xxhdpi下。 &nb
扩展easyUI tab控件，添加加载遮罩效果知了ing jquery
(function () { $.extend($.fn.tabs.methods, { //显示遮罩 loading: function (jq, msg) { return jq.each(function () { var panel = $(this).tabs(&
gradle上传jar到nexus 矮蛋蛋 gradle
原文地址： https://docs.gradle.org/current/userguide/maven_plugin.html configurations { deployerJars } dependencies { deployerJars "org.apache.maven.wagon
千万条数据外网导入数据库的解决方案。 alleni123 sql mysql
从某网上爬了数千万的数据，存在文本中。然后要导入mysql数据库。悲剧的是数据库和我存数据的服务器不在一个内网里面。。 ping了一下， 19ms的延迟。于是下面的代码是没用的。 ps = con.prepareStatement(sql); ps.setString(1, info.getYear())............; ps.exec
JAVA IO InputStreamReader和OutputStreamReader 百合不是茶 JAVA.io操作字符流
这是第三篇关于java.io的文章了，从开始对io的不了解-->熟悉--->模糊，是这几天来对文件操作中最大的感受，本来自己认为的熟悉了的，刚刚在回想起前面学的好像又不是很清晰了，模糊对我现在或许是最好的鼓励我会更加的去学加油！： JAVA的API提供了另外一种数据保存途径，使用字符流来保存的，字符流只能保存字符形式的流字节流和字符的难点：a,怎么将读到的数据
MO、MT解读 bijian1013 GSM
MO= Mobile originate，上行，即用户上发给SP的信息。MT= Mobile Terminate，下行，即SP端下发给用户的信息；上行:mo提交短信到短信中心下行:mt短信中心向特定的用户转发短信，你的短信是这样的，你所提交的短信，投递的地址是短信中心。短信中心收到你的短信后，存储转发，转发的时候就会根据你填写的接收方号码寻找路由，下发。在彩信领域是一样的道理。下行业务：由SP
五个JavaScript基础问题 bijian1013 JavaScript call apply this Hoisting
下面是五个关于前端相关的基础问题，但却很能体现JavaScript的基本功底。问题1：Scope作用范围考虑下面的代码： (function() { var a = b = 5; })(); console.log(b); 什么会被打印在控制台上？回答：上面的代码会打印 5。 &nbs
【Thrift二】Thrift Hello World bit1129 Hello world
本篇，不考虑细节问题和为什么，先照葫芦画瓢写一个Thrift版本的Hello World，了解Thrift RPC服务开发的基本流程 1. 在Intellij中创建一个Maven模块，加入对Thrift的依赖，同时还要加上slf4j依赖，如果不加slf4j依赖，在后面启动Thrift Server时会报错 <dependency>
【Avro一】Avro入门 bit1129 入门
本文的目的主要是总结下基于Avro Schema代码生成，然后进行序列化和反序列化开发的基本流程。需要指出的是，Avro并不要求一定得根据Schema文件生成代码，这对于动态类型语言很有用。 1. 添加Maven依赖 <?xml version="1.0" encoding="UTF-8"?> <proj
安装nginx+ngx_lua支持WAF防护功能 ronin47
需要的软件:LuaJIT-2.0.0.tar.gz nginx-1.4.4.tar.gz &nb
java-5.查找最小的K个元素-使用最大堆 bylijinnan java
import java.util.Arrays; import java.util.Random; public class MinKElement { /** * 5.最小的K个元素 * I would like to use MaxHeap. * using QuickSort is also OK */ public static void
TCP的TIME-WAIT bylijinnan socket
原文连接： http://vincent.bernat.im/en/blog/2014-tcp-time-wait-state-linux.html 以下为对原文的阅读笔记说明：主动关闭的一方称为local end，被动关闭的一方称为remote end 本地IP、本地端口、远端IP、远端端口这一“四元组”称为quadruplet，也称为socket 1、TIME_WA
jquery ajax 序列化表单 coder_xpf Jquery ajax 序列化
checkbox 如果不设定值，默认选中值为on；设定值之后，选中则为设定的值 <input type="checkbox" name="favor" id="favor" checked="checked"/> $("#favor&quo
Apache集群乱码和最高并发控制 cuisuqiang apache tomcat 并发集群乱码
都知道如果使用Http访问，那么在Connector中增加URIEncoding即可，其实使用AJP时也一样，增加useBodyEncodingForURI和URIEncoding即可。最大连接数也是一样的，增加maxThreads属性即可，如下，配置如下： <Connector maxThreads="300" port="8019" prot
websocket dalan_123 websocket
一、低延迟的客户端-服务器和服务器-客户端的连接很多时候所谓的http的请求、响应的模式，都是客户端加载一个网页，直到用户在进行下一次点击的时候，什么都不会发生。并且所有的http的通信都是客户端控制的，这时候就需要用户的互动或定期轮训的，以便从服务器端加载新的数据。通常采用的技术比如推送和comet（使用http长连接、无需安装浏览器安装插件的两种方式：基于ajax的长
菜鸟分析网络执法官 dcj3sjt126com 网络
最近在论坛上看到很多贴子在讨论网络执法官的问题。菜鸟我正好知道这回事情.人道"人之患好为人师" 手里忍不住,就写点东西吧. 我也很忙.又没有MM,又没有MONEY....晕倒有点跑题. OK,闲话少说,切如正题. 要了解网络执法官的原理. 就要先了解局域网的通信的原理. 前面我们看到了.在以太网上传输的都是具有以太网头的数据包.
Android相对布局属性全集 dcj3sjt126com android
RelativeLayout布局android:layout_marginTop="25dip" //顶部距离android:gravity="left" //空间布局位置android:layout_marginLeft="15dip //距离左边距 // 相对于给定ID控件android:layout_above 将该控件的底部置于给定ID的
Tomcat内存设置详解 eksliang jvm tomcat tomcat内存设置
Java内存溢出详解一、常见的Java内存溢出有以下三种： 1. java.lang.OutOfMemoryError: Java heap space ----JVM Heap（堆）溢出JVM在启动的时候会自动设置JVM Heap的值，其初始空间(即-Xms)是物理内存的1/64，最大空间(-Xmx)不可超过物理内存。可以利用JVM提
Java6 JVM参数选项 greatwqs java HotSpot jvm jvm参数 JVM Options
Java 6 JVM参数选项大全（中文版）作者：Ken Wu Email: [email protected] 转载本文档请注明原文链接 http://kenwublog.com/docs/java6-jvm-options-chinese-edition.htm！本文是基于最新的SUN官方文档Java SE 6 Hotspot VM Opt
weblogic创建JMC i5land weblogic jms
进入 weblogic控制太 1.创建持久化存储 --Services--Persistant Stores--new--Create FileStores--name随便起--target默认--Directory写入在本机建立的文件夹的路径--ok 2.创建JMS服务器 --Services--Messaging--JMS Servers--new--name随便起--Pers
基于 DHT 网络的磁力链接和BT种子的搜索引擎架构 justjavac DHT
上周开发了一个磁力链接和 BT 种子的搜索引擎 {Magnet & Torrent}，本文简单介绍一下主要的系统功能和用到的技术。系统包括几个独立的部分：使用 Python 的 Scrapy 框架开发的网络爬虫，用来爬取磁力链接和种子；使用 PHP CI 框架开发的简易网站；搜索引擎目前直接使用的 MySQL，将来可以考虑使
sql添加、删除表中的列 macroli sql
添加没有默认值：alter table Test add BazaarType char(1) 有默认值的添加列：alter table Test add BazaarType char(1) default(0) 删除没有默认值的列：alter table Test drop COLUMN BazaarType 删除有默认值的列：先删除约束（默认值）alter table Test DRO
PHP中二维数组的排序方法 abc123456789cba 排序二维数组 PHP
<?php/*** @package BugFree* @version $Id: FunctionsMain.inc.php,v 1.32 2005/09/24 11:38:37 wwccss Exp $*** Sort an two-dimension array by some level
hive优化之------控制hive任务中的map数和reduce数 superlxw1234 hive hive优化
一、控制hive任务中的map数: 1. 通常情况下，作业会通过input的目录产生一个或者多个map任务。主要的决定因素有： input的文件总个数，input的文件大小，集群设置的文件块大小(目前为128M, 可在hive中通过set dfs.block.size;命令查看到，该参数不能自定义修改)；2.
Spring Boot 1.2.4 发布 wiselyman spring boot
Spring Boot 1.2.4已于6.4日发布，repo.spring.io and Maven Central可以下载(推荐使用maven或者gradle构建下载)。这是一个维护版本，包含了一些修复small number of fixes,建议所有的用户升级。 Spring Boot 1.3的第一个里程碑版本将在几天后发布，包含许多

Linux环境Hive安装配置及使用

Linux环境Hive安装配置及使用

一、Hive

Hive环境前提

二、Hive架构原理解析

三、Hive-1.2.2单机安装流程

(1) 解压apache-hive-1.2.2-bin.tar.gz安装包到目标目录下：

(2) 为后续方便，重命名Hive文件夹：

(3) 修改配置文件：

(4) 配置环境变量：

(5) 启动

(6) 退出

(7) 配置MySQL元数据库

四、Hive数据类型

五、Hive-DDL(Data Definition Language)

(1) 查看数据库

(2) 创建库

(3) 创建库(标准写法)

(4) 创建库指定hdfs路径

(5) 创建表

(6) 查看表类型：

(7) 查询表

(8) 分区表操作

(9) 分桶表操作

(10) 查看数据库结构

(11) 添加数据库额外描述信息

(12) 查询数据库额外信息

(13) 查看指定的数据库(使用通配符)

(14) 删除空库

(15) 删除非空库标准写法

(16) 删除非空库

(17) 删除非空库标准写法

六、Hive-DML(Data Manipulation Language)

(1) 导入数据

(2) 向表中插入数据

(3) 向表中插入sql查询结果数据

(4) 创建表直接加载数据

(5) 把操作结果导出到本地linux

(6) 把hive中表数据导出到hdfs中(拷贝操作)

(7) 把hdfs数据导入到hive中(拷贝操作)

(8) 清空表数据

七、Hive命令

(1) 不登录Hive客户端直接输入命令操作：

(2) 直接把sql写入到文件中：

(3) 在Hive中可以直接执行hdfs命令操作：

(4) 查看历史操作

八、UDF自定义函数

(1) 相关概念：

(2) 查看系统自带函数：

(3) 查看系统自带函数示范用法：

(4) UDF自定义函数使用：

九、Hive压缩——大量数据节省时间

(1) Map输出阶段压缩方式：

(2) Reduce输出阶段压缩方式：

十、Hive进阶

(1) Hive集群搭建

你可能感兴趣的:(▷Linux,大数据,➹➹➹环境搭建)