weixin_30470857

Hive学习笔记

Hive 学习笔记

1、Hive安装（只在主节点上安装）
（1）下载安装包到/usr/app/目录下
（2）解压
（3）修改配置文件/etc/profile（添加
export HIVE_HOME=/usr/local/hive-0.9.0-bin
export HADOOP_HOME=/usr/local/hadoop-0.20.2-cdh3u5）
hive-config.sh（添加
export JAVA_HOME=/usr/jdk1.7.0_25
export HIVE_HOME=/usr/local/hive-0.9.0-bin
export HADOOP_HOME=/usr/local/hadoop-0.20.2-cdh3u5）
cd hive-0.9.0-bin/conf/
cp hive-default.xml.template hive-default.xml
cp hive-default.xml.template hive-site.xml
（4）启动Hive
./Hive

2、数据导入
（1）从本地文件系统中导入数据到Hive表；
hive> load data local inpath '/home/hadoop/a.txt' overwrite into table test1;
hive>select * from test1；
（2）从HDFS上导入数据到Hive表；
hive> load data inpath '/user/hadoop/abc/b.txt' overwrite into table test2;
（3）从别的表中查询出相应的数据并导入到Hive表中；
hive> create table test3(id int,name string)
> row format delimited
> fields terminated by '\t'--声明分隔符为制表符；
> stored as textfile;

hive> insert into test3 as select * from test2;
（4）在创建表的时候通过从别的表中查询出相应的记录并插入到所创建的表中
hive> create table test4 as select * from test2;

3、数据导出
(1)导出到本地
hive> insert overwrite local directory '/home/hadoop/data' select * from test;
(2)导出到HDFS
hive> insert overwrite directory '/user/hadoop/abc' select * from he;
（/user/hadoop/abc 为hdfs下目录）
(3)导出到Hive的另一个表中
hive> insert ovewrite into table test5 select * from test3;

4、Hive中的表
（1）内部表
LOCATION '/MYSQL/HIVE/TTD2'--指定表存放的地址

ROW FORMAT DELIMITED
FIELDS TERMINATED BY'\t'
stored as textfile;

alter table test add columns(sex,string); --增加一列(列名sex,数据类型为string)

（2）分区表
--创建分区表
create table partition_table_01
(
sid string,
zid string,
name string,
age int,
sex string)
partitioned by (sex string)
row format delimited
fields terminated by ','
stored as textfile;

--向分区表中插入数据
insert into table partition_table partition (sex='女')
select id,name from test4
WHERE sex='女';

insert into table partition_table partition (sex='男')
select id,name from test4
WHERE sex='n男';

--添加分区
alter table test.test4 add partition(sex='不男不女');
--删除分区
alter 他变了test.test4 drop partition(sex='不男不女');

（3）外部表
--创建外部表
create external table test2(name string,age int)
row format delimited
fields terminated by ','
stored as textfile
location '/user/hadoop/input/';
--特殊说明（外部表的创建和数据的插入同步完成）；

--创建外部分区表

（4）桶
--创建桶表
create table bucket_table3(id int,name string,sex string)
clustered by(name) into 3 buckets --按姓名分为3桶
ROW FORMAT DELIMITED
fields terminated by ','
stored as textfile;
-----------------------------------------------------

5、修改表结构
（1）增加列，添加注释
alter table test add columns(sex,string);
（2）删除列
（3）修改表名
alter table test rename test5;
（4）修改字段类型
select cast(sale as double) from test1;

6、join
（1）等连接
（2）多表连接
hive> select a1.name,a2.city,a3.level from test1 a1 join test2 a2 on(a1.id=a2.id) join test3 a3 on(a3.city=a2.city);

zs bj 99999
ls sh 11111
Time taken: 30.679 seconds
（3）多表外连接

a.先连接，再过滤
hive>select a1.name,a2.city from test1 a1 join test2 a2 on(a1.id=a2.id) where a1.id>101 and a2.id<105;
ls sh
Time taken: 15.155 seconds

b.先过滤，后连接
hive> select a1.name,a2.city from test1 a1 join test2 a2 on(a1.id=a2.id and a1.id>101 and a2.id<105);

ls sh
Time taken: 15.114 seconds
（5）map join
select /*+ mapjoin(A)*/ f.a,f.b from A t join B f on ( f.a=t.a and f.ftime=20110802)

7、数据倾斜
倾斜的原因：
使map的输出数据更均匀的分布到reduce中去，是我们的最终目标。由于Hash算法的局限性，按key Hash会或多或少的造成数据倾斜。
大量经验表明数据倾斜的原因是人为的建表疏忽或业务逻辑可以规避的。

解决思路:
　　Hive的执行是分阶段的，map处理数据量的差异取决于上一个stage的reduce输出，所以如何将数据均匀的分配到各个reduce中，
就是解决数据倾斜的根本所在

具体办法：
内存优化和I/O优化:
　　驱动表：使用大表做驱动表，以防止内存溢出；Join最右边的表是驱动表；Mapjoin无视join顺序，用大表做驱动表；StreamTable。

1. Mapjoin是一种避免数据倾斜的手段
　　允许在map阶段进行join操作，MapJoin把小表全部读入内存中，在map阶段直接拿另外一个表的数据和内存中表数据做匹配，由于在map是进行了join操作，省去了reduce运行的效率也会高很多
在《hive：join遇到问题》有具体操作
　　在对多个表join连接操作时，将小表放在join的左边，大表放在Jion的右边，
　　在执行这样的join连接时小表中的数据会被缓存到内存当中,这样可以有效减少发生内存溢出错误的几率

2. 设置参数
　　hive.map.aggr = true
　　hive.groupby.skewindata=true 还有其他参数

3.SQL语言调节
　　比如： group by维度过小时：采用sum() group by的方式来替换count(distinct)完成计算

4.StreamTable
　　将在reducer中进行join操作时的小table放入内存，而大table通过stream方式读取

5.索引
　　Hive从0.80开始才有，提供了一个Bitmap位图索引，索引可以加快GROUP BY查询语句的执行速度，用的较少。

8、Hive优化
（1）小文件合并
（2）增加map数，提高Hive的运行效率
（3）尽量原子化操作，避免复杂的SQL
（4）尽量尽早过滤，减少每个阶段的数据量；
（5）创建索引；
（6）JOIN操作时，小表要放在JOIN的左边
（7）使用MAPJOIN，把小表放在内存中，

9、Hive作为历史数据库和关系型数据库的区别？
两者的区别可从以下几个方面比较：
（1）数据存储
（2）表的区别
（3）语法区别
（4）计算模型

10、order by和sort by
（1）order by 会对查询结果集执行一个全局排序，会有一个所有数据都通过一个reducer进行处理的过程。
对于大数据集，该过程会消耗大量时间来执行。
（2）sort by只会在每个reducer中对数据进行排序，也就是执行一个局部排序，可以保证数据是局部有序的，
但不是全局有序的，这样可以提高后面进行的全局排序的效率。

11、sort by和distribute by
alter table test0 change name dt string;

create table test5(id string,name string,ds string)
row format delimited
fields terminated by ','

12、union和union all
合并多个SELECT语句的结果集，需要去重时用union，保留所有值时用union all。
SELECT * FROM table1_name
UNION
SELECT * FROM table2_name;

SELECT * FROM table1_name
UNION ALL
SELECT * FROM table2_name;

--创建一个文本文件
echo 'hadoop' >/home/hadoop/text.txt

--创建一张Hive表
hive -e "create table test(name string)";

--加载数据
load data local inpath '/home/hadoop/test.txt' overwrite into table test;

--查询表
hive -e 'select * from test';

Hive中常用的函数
--取整函数: round
hive> select round(3.1415926) from lxw1234;
3

hive> select round(3.5) from lxw1234;
4

--指定精度取整函数: round
hive> select round(3.1415926,4) from lxw1234;
3.1416

--向下取整函数: floor
hive> select floor(3.1415926) from lxw1234;
3

hive> select floor(25) from lxw1234;
25

--向上取整函数: ceil
hive> select ceil(3.1415926) from lxw1234;
4

hive> select ceil(46) from lxw1234;
46

--向上取整函数: ceiling
hive> select ceiling(3.1415926) from lxw1234;
4

hive> select ceiling(46) from lxw1234;
46

--取随机数函数: rand
hive> select rand() from lxw1234;
0.5577432776034763

hive> select rand() from lxw1234;
0.6638336467363424

hive> select rand(100) from lxw1234;
0.7220096548596434

--自然指数函数: exp
hive> select exp(2) from lxw1234;
7.38905609893065

hive> select ln(7.38905609893065) from lxw1234;
2.0

--以10为底对数函数: log10
hive> select log10(100) from lxw1234;
2.0

--以2为底对数函数: log2
hive> select log2(8) from lxw1234;
3.0

hive> select log(4,256) from lxw1234;
4.0

--幂运算函数: pow
hive> select pow(2,4) from lxw1234;
16.0

--幂运算函数: power
hive> select power(2,4) from lxw1234;
16.0

--开平方函数: sqrt
hive> select sqrt(16) from lxw1234;
4.0

--二进制函数: bin
hive> select bin(7) from lxw1234;
111

--十六进制函数: hex
hive> select hex(17) from lxw1234;
11

hive> select hex(‘abc’) from lxw1234;
616263

--反转十六进制函数: unhex
hive> select unhex(‘616263’) from lxw1234;
abc

--进制转换函数: conv
hive> select conv(17,10,16) from lxw1234;
11

hive> select conv(17,10,2) from lxw1234;
10001

--绝对值函数: abs
hive> select abs(-3.9) from lxw1234;
3.9

hive> select abs(10.9) from lxw1234;
10.9

--正取余函数: pmod
hive> select pmod(9,4) from lxw1234;
1

hive> select pmod(-9,4) from lxw1234;
3

--正弦函数: sin
hive> select sin(0.8) from lxw1234;
0.7173560908995228

--反正弦函数: asin
hive> select asin(0.7173560908995228) from lxw1234;
0.8

hive> select cos(0.9) from lxw1234;
0.6216099682706644

--反余弦函数: acos
hive> select acos(0.6216099682706644) from lxw1234;
0.9

--positive 函数: positive
hive> select positive(-10) from lxw1234;
-10

hive> select positive(12) from lxw1234;
12

--negative 函数: negative
hive> select negative(-5) from lxw1234;
5

hive> select negative(8) from lxw1234;
-8

--字符串拼接:concat
hive> select concat('abc','def') from test;
abcdef

--带分隔符字符串连接函数：concat_ws
hive> select concat_ws(',','abc','def','gh') from test;
abc,def,gh

--数组转换成字符串的函数:concat_ws
hive> select concat_ws('|',array('a','b','c')) from test;
a|b|c

--小数位格式化成字符串函数:format_number
hive> select format_number(5.23456,3) from test;
5.235

--字符串截取函数：substr,substring
hive> select substr('abcde',3) from test;
cde

hive> select substring('abcde',3) from test;
cde

hive> select substr('abcde',-1) from test; （和 ORACLE 相同）
e

--字符串截取函数：substr,substring
hive> select substr('abcde',3,2) from test;
cd

hive> select substring('abcde',3,2) from test;
cd

hive>select substring('abcde',-2,2) from test;
de

--字符串查找函数： instr
hive> select instr('abcdf','df') from test;
4--(abcdef中df首次出现的位置)

--字符串长度函数： length
hive> select length('abc') from test;
3

--字符串查找函数：locate
hive> select locate('a','abcda',1) from test;
1

hive> select locate('a','abcda',2) from test;
5

--字符串转换成 map 函数： str_to_map
hive> select str_to_map('k1:v1,k2:v2') from test;
{"k2":"v2","k1":"v1"}

hive> select str_to_map('k1=v1,k2=v2',',','=') from test;
{"k2":"v2","k1":"v1"}

--字符串转大写函数：upper,ucase
hive> select upper('abSEd') from test;
ABSED

--字符串转小写函数：lower,lcase
hive> select lower('abSEd') from test;
absed

--去空格函数：trim
hive> select trim(' abc ') from test;
abc

--左边去空格函数：ltrim
hive> select ltrim(' abc ') from test;
abc

--右边去空格函数：rtrim
hive> select rtrim(' abc ') from test;
abc

--重复字符串函数：repeat
hive> select repeat('abc',5) from test;
abcabcabcabcabc

--左补足函数：lpad
hive> select lpad('abc',10,'td') from test;
tdtdtdtabc

-- 右补足函数：rpad
hive> select rpad('abc',10,'td') from test;
abctdtdtdt

--分割字符串函数: split
hive> select split('abtcdtef','t') from test;
["ab","cd","ef"]

--集合查找函数: find_in_set
hive> select find_in_set('ab','ef,ab,de') from test;
2

hive> select find_in_set('at','ef,ab,de') from test;
0

日期函数

类型转换
cast(date as date)
返回值：date

cast(date as string)
返回值：date所代表的年月日将以string形式返回；

cast(string as date)
返回值：如果string的格式为yyyy-MM-dd,则返回date类型的数据，反之为null.

cast(date as timestamp)
返回值：基于当地的时区，生成时间戳

cast(timestamp as date)
返回值：date

--UNIX时间戳转日期函数: from_unixtime
hive> select from_unixtime(1323308943,'yyyyMMdd') from lxw1234;
20111208

--获取当前 UNIX 时间戳函数: unix_timestamp
hive> select unix_timestamp() from lxw1234;
1323309615

--日期转 UNIX 时间戳函数: unix_timestamp
hive> select unix_timestamp('2011-12-07 13:01:03') from lxw1234;
1323234063

--指定格式日期转 UNIX 时间戳函数: unix_timestamp
hive> select unix_timestamp('20111207 13:01:03','yyyyMMdd HH:mm:ss') from lxw1234;
1323234063

--日期时间转日期函数: to_date
Hive 函数大全 http://lxw1234.com
27

hive> select to_date('2011-12-08 10:03:01') from lxw1234;
2011-12-08

--日期转年函数: year
hive> select year('2011-12-08 10:03:01') from lxw1234;
2011

hive> select year('2012-12-08') from lxw1234;
2012

--日期转月函数: month
hive> select month('2011-12-08 10:03:01') from lxw1234;
12

hive> select month('2011-08-08') from lxw1234;
8

--日期转天函数: day
hive> select day('2011-12-08 10:03:01') from lxw1234;
8

hive> select day('2011-12-24') from lxw1234;
24

-日期转小时函数: hour
hive> select hour('2011-12-08 10:03:01') from lxw1234;

--日期转分钟函数: minute
hive> select minute('2011-12-08 10:03:01') from lxw1234;
3

--日期转秒函数: second
hive> select second('2011-12-08 10:03:01') from lxw1234;
1

--日期转周函数: weekofyear
hive> select weekofyear('2011-12-08 10:03:01') from lxw1234;
49

--日期比较函数: datediff
hive> select datediff('2012-12-08','2012-05-09') from lxw1234;
213

--日期增加函数: date_add
hive> select date_add('2012-12-08',10) from lxw1234;
2012-12-18

--日期减少函数: date_sub
hive> select date_sub('2012-12-08',10) from lxw1234;
2012-11-28

条件函数
--If 函数: if
hive> select if(1=2,100,200) from lxw1234;
200
hive> select if(1=1,100,200) from lxw1234;
100

--非空查找函数: COALESCE
hive> select COALESCE(null,'100','50′) from lxw1234;
100

--条件判断函数：CASE
hive> Select case 100 when 50 then 'tom' when 100 then 'mary' else 'tim' end from lxw1234;
mary

hive> Select case 200 when 50 then 'tom' when 100 then 'mary' else 'tim' end from lxw1234;
tim

--条件判断函数：CASE
hive> select case when 1=2 then 'tom' when 2=2 then 'mary' else 'tim' end from lxw1234;
mary

--分词函数：sentences
hive> select sentences('hello word!hello hive,hi hive,hello hive') from test;
[["hello","word"],["hello","hive","hi","hive","hello","hive"]]

--分词后统计一起出现频次最高的的 TOP-K
hive> SELECT ngrams(sentences('hello word!hello hive,hi hive,hello hive'),2,2) FROM test;
[{"ngram":["hello","hive"],"estfrequency":2.0},{"ngram":["hive","hello"],"estfrequency":1.0}]

--分词后统计与指定单词一起出现频次最高的的 TOP-K
hive> SELECT context_ngrams(sentences('hello word!hello hive,hi hive,hello hive'),array('hello',null),3) FROM test;
[{"ngram":["hive"],"estfrequency":2.0},{"ngram":["word"],"estfrequency":1.0}]

hive> SELECT context_ngrams(sentences('hello word!hello hive,hi hive,hello hive'),array(null,'hive'),3) FROM test;
[{"ngram":["hello"],"estfrequency":2.0},{"ngram":["hi"],"estfrequency":1.0}]
该查询中，统计的是与’hive’一起出现，并且在 hive 之前的频次最高的 TOP-3

转载于:https://www.cnblogs.com/RHadoop-Hive/p/6681499.html

【网络协议详解】——DHCP技术（学习笔记）网络工程小王笔记网络协议学习笔记网络华为
目录DHCP简介定义受益DHCP组网DHCP租期和地址池DHCP报文类型DHCP报文中的Options字段DHCP原理描述DHCP服务器给首次接入网络的客户端分配网络参数的工作原理无中继场景时DHCP客户端首次接入网络的工作原理有中继场景时DHCP客户端首次接入网络的工作原理DHCP客户端更新租期的工作原理实验步骤：组网需求配置思路验证配置结果DHCP简介定义动态主机配置协议DHCP（Dynami
LINUX 安装mysql5.6.50 RPM a21768541 数据库 mysql
今天要做一个MySql数据库的主从备份，由于现有的数据库，是使用宝塔安装的5.6.50版本，因此需要在新购买的服务器上安装MySql5.6.50版本，记录一下安装过程的碰见的各种问题1.下载安装包抖店云上的系统是CentOS7.964位，因此下载Redhat7系统下面的安装包下载地址：https://downloads.mysql.com/archives/community/只需要下载这两个安装
人工神经网络ANN入门学习笔记 cs_ning ANN学习笔记学习笔记机器学习
研究生写论文需要，先快速学习了机器学习的内容，现在需要继续深入学习人工神经网络ANN的内容，以下是个人的学习笔记，欢迎交流、请多多指正！以下是参考的学习资料/网站/笔记来源（侵权删）：【ANN回归预测】基于ANN实现多变量预测附Matlab代码_ann实现回归-CSDN博客ANN人工神经网络：从基础认知到现实理解-CSDN博客常用神经网络-ANN/CNN/RNN/GAN/Transformer_a
python 单例模式内存泄露_Python 学习笔记 - 面向对象（单例模式和异常处理）小红姐产房故事 python 单例模式内存泄露
单例模式，也叫单子模式，是一种常用的软件设计模式。在应用这个模式时，单例对象的类必须保证只有一个实例存在。许多时候整个系统只需要拥有一个全局对象，这样有利于我们协调系统整体的行为。－－以上来自维基百科一个简单的方式是通过一个静态字段进行判断。classFoo:instance=Nonedef__init__(self,name):self.name=name@classmethoddefget_i
python 学习笔记之单例模式 qq_26566749 Python 学习笔记 python 学习笔记
Listitem单例模式保证类只有一个实例对象，并且提供全局访问点，控制共享资源的冰箱访问实现单例模式的方法：构造函数私有化，创建一个静态方法来完成对象的初始化。classSingleton(object):def__new__(cls):ifnothasattr(cls,'instance'):#cls.instance=super(Singleton,cls).__new__(cls)#cls
Spring 框架学习笔记：从零到精通的 21 个关键点剑走偏锋o.O 开发语言 spring 学习笔记 java
目录1.Spring概念介绍2.SpringIOC概念引入3.SpringIOC原理分析4.SpringXML方式实现DI5.SpringBean的生命周期6.SpringBean的自动装配7.Spring使用外部属性配置文件8.Spring注解方式管理Bean9.SpringJDK动态代理10.SpringCGLIB动态代理11.SpringAOP概念和原理12.SpringAOP注解方式实现1
JavaScript学习笔记丢内楼道笔记 javascript html5 java
JavaScriptJavaScript1.JavaScript简介1.1历史1.2快速入门2.基本语法2.1定义变量2.2基本条件控制2.3浏览器必备调试js2.4数据类型2.5严格检查模式3.数据类型3.1字符串及方法3.2数组3.3对象3.4流程控制3.5Map和Set4.函数及面向对象4.1定义函数4.2变量的作用域4.3方法5.内部对象5.1Date5.2Json对象5.3Ajax(自己
学习笔记 20240801 Rust语言-类型转换 zhangfan-辰祎学习笔记 rust
文章目录20240801类型转换as转换TryInto转换通用类型转换强制类型转换点操作符Transmute变形参考文献20240801类型转换本节学习会涉及简单的类型转换，也会涉及基于语言底层的运行过程得到的类型分析，最后是前沿但是不安全的Transmute介绍。as转换先来看一段代码：fnmain(){leta:i32=10;letb:u16=100;ifa()，i32类型占用4个字节，因此将
Hive排序函数源码解密：字节跳动面试官的底层三连问数据大包哥 #Hive #大厂SQL面试指南 hive hadoop 数据仓库
Hive排序函数源码解密：字节跳动面试官的底层三连问作为数据工程师，理解Hive排序函数的源码就像掌握汽车的发动机原理。本文通过字节跳动内部技术文档，为你揭示三大排序函数的源码级实现差异。一、分布式执行框架Hive中ROW_NUMBER、RANK和DENSE_RANK的底层实现差异主要体现在相同排序键值的处理逻辑上，其核心流程可分为两个阶段：数据分区（Shuffle阶段）根据PARTITIONBY
机器学习学习笔记（十七）—— 优化算法概述 lancetop-stardrms 机器学习机器学习
一、概观scipy中的optimize子包中提供了常用的最优化算法函数实现。我们可以直接调用这些函数完成我们的优化问题。optimize中函数最典型的特点就是能够从函数名称上看出是使用了什么算法。下面optimize包中函数的概览：1.非线性最优化fmin--简单Nelder-Mead算法fmin_powell--改进型Powell法fmin_bfgs--拟Newton法fmin_cg--非线性共
文献阅读(part2)--Towards K-means-friendly spaces Simultaneous deep learning and clustering GUI Research Group 机器学习 python 深度聚类
学习笔记，仅供参考文章目录AbstractIntroductionBackgroundandRelatedWorksProposedFormulationOptimizationProcedureInitializationviaLayer-wisePre-Training(通过分层预训练进行初始化)AlternatingStochasticOptimizationExperiments合成数据演
笔记-Ubuntu本地镜像源配置丶花落谁家笔记 ubuntu apt
背景需要内网部署JitsiMeet，不用docker，用离线包进行安装，由于安装包需要的依赖比较多，因此需要在本地进行镜像源配置，保证依赖的正确安装。操作1、先在外网拿到安装包cd/var/cache/apt/archives2、复制至内网将所有deb复制至内网根目录下mkdir/ak/downloadchmod777-R/ak/download/3、依赖打包dpkg-scanpackages/a
Vue 2.0-＞3.0学习笔记（Vue 3 （六）- 其他）普宁Max vue.js 学习笔记前端
Vue2.0-＞3.0学习笔记（Vue3（六）-其他）其他1.全局API的转移2.其他改变其他1.全局API的转移笔记Vue2.x有许多全局API和配置。例如：注册全局组件、注册全局指令等。//注册全局组件Vue.component('MyButton',{data:()=>({count:0}),template:'Clicked{{count}}times.'})//注册全局指令Vue.dir
设计模式学习笔记花王江不语设计模式学习笔记
说了一万遍！学习要做笔记！时间一长，就会忘了，后面再来学，又要从头学起关键是重难点！！！当初学的时候就是因为攻克难点、寻找重点花费时间不做笔记每次复习都要浪费时间在重难点上每一次放弃的对自己的约定，都会蚕食你积攒下来的意志力！！！1.简单工厂就一个单独的工厂2.工厂和简单工厂的区别就是会出现多个工厂3.抽象工厂为了解决多个工厂生产出来的产品可能会出现不适配的问题建造一些大厂。对于一座大厂，它将生产
大数据MaxCompute教程（阿里云离线数仓项目）学习笔记20231127 多刷亿点题⑧ 云原生数据仓库
1数据仓库概念数据仓库定义（DataWarehouse），是为企业所有决策制定过程，提供所有系统数据支持的战略集合。AI：数据仓库是一个大型、集中、主题导向的数据库系统，用于支持企业决策制定、分析和报告的需要。它统一了来自不同数据源的数据，并将其在一个可查询的数据模型中进行了整合和转换，以便于分析和报告。数据仓库还包括数据清洗、抽取、转换和加载（ETL）的过程，以保证数据的准确性、一致性和完整性。
大数据-257 离线数仓 - 数据质量监控监控方法 Griffin架构 m0_74823705 面试学习路线阿里巴巴大数据架构
点一下关注吧！！！非常感谢！！持续更新！！！Java篇开始了！目前开始更新MyBatis，一起深入浅出！目前已经更新到了：Hadoop（已更完）HDFS（已更完）MapReduce（已更完）Hive（已更完）Flume（已更完）Sqoop（已更完）Zookeeper（已更完）HBase（已更完）Redis（已更完）Kafka（已更完）Spark（已更完）Flink（已更完）ClickHouse（已
spark sql随记 cxy1991xm spark
1、sparksql访问hive将hive-site.xml放入到${SPARK_HOME}/conf下如果是sparkonyarn的cluster模式，由于driver是运行于哪个executor未知，因此在spark-defaults.conf中指定参数spark.yarn.dist.filesxxx/hive-site.xml
十月学习笔记木子不多余学习日志学习笔记
知识点什么是预训练模型预训练模型是一个通过大量数据上进行训练并被保存下来的网络。可以将其通俗的理解为前人为了解决类似问题所创造出来的一个模型，有了前人的模型，当我们遇到新的问题时，便不再需要从零开始训练新模型，而可以直接用这个模型入手，进行简单的学习便可解决该新问题。transformer的架构：基于encoder-only或decoder-only架构Transformer模型由编码器（enco
RPC服务和HTTP服务对比 oo77771 程序员 rpc http 网络协议
《一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码》，点击传送门，即可获取！在说RPC和HTTP的区别之前，我觉的有必要了解一下OSI的七层网络结构模型（虽然实际应用中基本上都是五层），它可以分为以下几层：（从上到下）第一层：应用层。定义了用于在网络中进行通信和传输数据的接口；第二层：表示层。定义不同的系统中数据的传输格式，编码和解码规范等；第三层：会话层。管理用户的会话，
apk文件放到Linux服务器 nginx不支持apk ipa文件下载设置云上上云服务器 linux nginx
修改/usr/local/nginx/conf目录下的mime.types增加如下配置，重启nginx生效application/vnd.android.package-archiveapk;//安卓application/iphonepxlipa;//ios
S32DS 调用脚本实现Post-build处理斯蒂芬杜 S32DS S32DS 脚本找不到文件
作者：StephenDu免责声明：本文为个人学习笔记及总结，仅代表个人观点，尽可能保证内容准确性。所有文字均是自己码出来的，所有图片均为自己勾画（除部分来源于原始标准）。复制/转发请注明来源/作者。欢迎添加微信交流学习。文章目录1.前言2.方案2.1方案一2.2方案二2.3方案三本文是否适合你看？如果你有以下疑问，可以继续浏览：如何在S32DS里面调用自己的脚本？S32DS如何生成*.hex，*.
Redis学习笔记--Redis安装 Etaon Redis redis 数据库 database
下载安装地址：https://redis.io/download在该页面也给出了安装方法：Download,extractandcompileRediswith:$wgethttps://download.redis.io/releases/redis-6.2.6.tar.gz$tarxzfredis-6.2.6.tar.gz$cdredis-6.2.6$makeThebinariesthatar
在虚拟机上安装MySQL和Hive 酒城译痴无心剑数据库编程世界 hive mysql 数据库
文章目录零、学习目标一、Hive概述（一）Hive的SQL-HQL（二）数据库与数据仓库（三）Hive的适用场景二、下载、安装和配置MySQL（一）下载MySQL组件压缩包（二）将MySQL组件压缩包上传到虚拟机（三）删除系统自带的MariaDB1、查询mariadb2、删除mariadb（四）安装MySQL组件1、安装MySQL公用组件2、安装MySQL库组件3、安装MySQL客户端组件4、安装
SD模型微调之LoRA 好评笔记补档深度学习计算机视觉人工智能面试 AIGC SD stable diffusion
大家好，这里是Goodnote（好评笔记），关注公主号Goodnote，专栏文章私信限时Free。本文是SD模型微调方法LoRA的详细介绍，包括数据集准备，模型微调过程，推理过程，优缺点等。热门专栏机器学习机器学习笔记合集深度学习深度学习笔记合集文章目录热门专栏机器学习深度学习论文概念核心原理优点训练过程预训练模型加载选择微调的层LoRA优化的层Cross-Attention（跨注意力）层Self
docker学习笔记（5）：docker搭建DNMP环境 submarineas Linux 虚拟化
DNMP介绍环境介绍：├──mysql├──nginx│└──nginx.conf└──php└──php.ini本篇文章将介绍一个更加方面的相当于LNMP（linux+NGINX+MySQL+PHP）环境的部署方式，效率更加高效，而对于lnmp或者lamp的介绍，可以看我去年写的那篇文章：Ubuntu16.04安装Apache,Mysql,PHP7,phpMyAdmin过程解析和错误总结生成my
Python 的 WebSocket 实现详解王子良. 经验分享 python websocket 网络协议网络
欢迎来到我的博客！非常高兴能在这里与您相遇。在这里，您不仅能获得有趣的技术分享，还能感受到轻松愉快的氛围。无论您是编程新手，还是资深开发者，都能在这里找到属于您的知识宝藏，学习和成长。博客内容包括：Java核心技术与微服务：涵盖Java基础、JVM、并发编程、Redis、Kafka、Spring等，帮助您全面掌握企业级开发技术。大数据技术：涵盖Hadoop（HDFS）、Hive、Spark、Fli
深度学习笔记之自然语言处理(NLP) 电棍233 深度学习笔记自然语言处理
深度学习笔记之自然语言处理(NLP)在行将开学之时，我将开始我的深度学习笔记的自然语言处理部分，这部分内容是在前面基础上开展学习的，且目前我的学习更加倾向于通识。自然语言处理部分将包含《动手学深度学习》这本书的第十四章，自然语言处理预训练和第十五章，自然语言处理应用。并且参考原书提供的jupyternotebook资源。自然语言处理，预训练自然语言处理（NaturalLanguageProcess
python 高级特性之迭代网罗开发 python集 Python 技术汇总 python 高级特性迭代
python学习笔记，特做记录，分享给大家，希望对大家有所帮助。迭代如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。在Python中，迭代是通过for…in来完成的，而很多语言比如C语言，迭代list是通过下标完成的，比如Java代码：for(i=0;i
Vite 学习笔记 a鲸前端
优势vite是vue团队官方出品,vue-cli会在下面两个版本中将vite作为预设构建工具未来适用vue-cli构建vue项目时要写的vue.config.js不再是webpack的配置而是vite的配置(目前只基于浏览器项目)vite也支持构建react项目,也支持构建angular项目,svelte项目也支持构建内容1.什么是构建工具构建工具是运行在服务器的企业级项目里都可能会具备哪些功能t
Linux命令终极指南：从入门到精通掌握150+核心指令放氮气的蜗牛深度博客 linux 运维服务器
一、文件与目录管理1.基础导航pwd#显示当前工作目录(PrintWorkingDirectory)ls-lah#列出所有文件包括隐藏文件，人性化大小显示#-l长格式-a所有文件-h易读大小cd~#切换到用户家目录(ChangeDirectory)cd-#返回上一个工作目录2.文件操作touchfile.txt#创建空文件或更新时间戳cp-arvsrcdest#递归复制保留属性(Archive+V
log4j对象改变日志级别 3213213333332132 java log4j level log4j对象名称日志级别
log4j对象改变日志级别可批量的改变所有级别，或是根据条件改变日志级别。 log4j配置文件： log4j.rootLogger=ERROR,FILE,CONSOLE,EXECPTION #log4j.appender.FILE=org.apache.log4j.RollingFileAppender log4j.appender.FILE=org.apache.l
elk+redis 搭建nginx日志分析平台 ronin47 elasticsearch kibana logstash
elk+redis 搭建nginx日志分析平台 logstash,elasticsearch,kibana 怎么进行nginx的日志分析呢？首先，架构方面，nginx是有日志文件的，它的每个请求的状态等都有日志文件进行记录。其次，需要有个队列，redis的l
Yii2设置时区 dcj3sjt126com PHP timezone yii2
时区这东西，在开发的时候，你说重要吧，也还好，毕竟没它也能正常运行，你说不重要吧，那就纠结了。特别是linux系统，都TMD差上几小时，你能不痛苦吗？win还好一点。有一些常规方法，是大家目前都在采用的1、php.ini中的设置，这个就不谈了，2、程序中公用文件里设置，date_default_timezone_set一下时区3、或者。。。自己写时间处理函数，在遇到时间的时候，用这个函数处理（比较
js实现前台动态添加文本框，后台获取文本框内容 171815164 文本框
<%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://w
持续集成工具 g21121 持续集成
持续集成是什么？我们为什么需要持续集成？持续集成带来的好处是什么？什么样的项目需要持续集成？... 持续集成(Continuous integration ,简称CI)，所谓集成可以理解为将互相依赖的工程或模块合并成一个能单独运行
数据结构哈希表(hash)总结永夜-极光数据结构
1.什么是hash 来源于百度百科: Hash，一般翻译做“散列”，也有直接音译为“哈希”的，就是把任意长度的输入，通过散列算法，变换成固定长度的输出，该输出就是散列值。这种转换是一种压缩映射，也就是，散列值的空间通常远小于输入的空间，不同的输入可能会散列成相同的输出，所以不可能从散列值来唯一的确定输入值。简单的说就是一种将任意长度的消息压缩到某一固定长度的消息摘要的函数。
乱七八糟程序员是怎么炼成的
eclipse中的jvm字节码查看插件地址： http://andrei.gmxhome.de/eclipse/ 安装该地址的outline 插件后重启，打开window下的view下的bytecode视图 http://andrei.gmxhome.de/eclipse/ jvm博客： http://yunshen0909.iteye.com/blog/2
职场人伤害了“上司” 怎样弥补 aijuans 职场
由于工作中的失误，或者平时不注意自己的言行“伤害”、“得罪”了自己的上司，怎么办呢？　　在职业生涯中这种问题尽量不要发生。下面提供了一些解决问题的建议：　　一、利用一些轻松的场合表示对他的尊重　　即使是开明的上司也很注重自己的权威，都希望得到下属的尊重，所以当你与上司冲突后，最好让不愉快成为过去，你不妨在一些轻松的场合，比如会餐、联谊活动等，向上司问个好，敬下酒，表示你对对方的尊重，
深入浅出url编码 antonyup_2006 应用服务器浏览器 servlet weblogic IE
出处：http://blog.csdn.net/yzhz 杨争 http://blog.csdn.net/yzhz/archive/2007/07/03/1676796.aspx 一、问题：编码问题是JAVA初学者在web开发过程中经常会遇到问题，网上也有大量相关的
建表后创建表的约束关系和增加表的字段百合不是茶标的约束关系增加表的字段
下面所有的操作都是在表建立后操作的,主要目的就是熟悉sql的约束,约束语句的万能公式 1,增加字段(student表中增加姓名字段) alter table 增加字段的表名 add 增加的字段名增加字段的数据类型 alter table student add name varchar2(10); &nb
Uploadify 3.2 参数属性、事件、方法函数详解 bijian1013 JavaScript uploadify
一.属性属性名称默认值说明 auto true 设置为true当选择文件后就直接上传了，为false需要点击上传按钮才上传。 buttonClass ” 按钮样式 buttonCursor ‘hand’ 鼠标指针悬停在按钮上的样子 buttonImage null 浏览按钮的图片的路
精通Oracle10编程SQL(16)使用LOB对象 bijian1013 oracle 数据库 plsql
/* *使用LOB对象 */ --LOB(Large Object)是专门用于处理大对象的一种数据类型，其所存放的数据长度可以达到4G字节 --CLOB/NCLOB用于存储大批量字符数据，BLOB用于存储大批量二进制数据，而BFILE则存储着指向OS文件的指针 /* *综合实例 */ --建立表空间 --#指定区尺寸为128k,如不指定，区尺寸默认为64k CR
【Resin一】Resin服务器部署web应用 bit1129 resin
工作中，在Resin服务器上部署web应用，通常有如下三种方式：配置多个web-app 配置多个http id 为每个应用配置一个propeties、xml以及sh脚本文件配置多个web-app 在resin.xml中,可以为一个host配置多个web-app <cluster id="app&q
red5简介及基础知识白糖_ 基础
简介 Red5的主要功能和Macromedia公司的FMS类似，提供基于Flash的流媒体服务的一款基于Java的开源流媒体服务器。它由Java语言编写，使用RTMP作为流媒体传输协议，这与FMS完全兼容。它具有流化FLV、MP3文件，实时录制客户端流为FLV文件，共享对象，实时视频播放、Remoting等功能。用Red5替换FMS后,客户端不用更改可正
angular.fromJson boyitech AngularJS AngularJS 官方API AngularJS API
angular.fromJson 描述: 把Json字符串转为对象使用方法: angular.fromJson(json); 参数详解: Param Type Details json string JSON 字符串返回值: 对象, 数组, 字符串或者是一个数字示例: <!DOCTYPE HTML> <h
java-颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I bylijinnan java
public class ReverseWords { /** * 题目：颠倒一个句子中的词的顺序。比如： I am a student颠倒后变成：student a am I.词以空格分隔。 * 要求： * 1.实现速度最快,移动最少 * 2.不能使用String的方法如split,indexOf等等。 * 解答：两次翻转。 */ publ
web实时通讯 Chen.H Web 浏览器 socket 脚本
关于web实时通讯，做一些监控软件。由web服务器组件从消息服务器订阅实时数据，并建立消息服务器到所述web服务器之间的连接，web浏览器利用从所述web服务器下载到web页面的客户端代理与web服务器组件之间的socket连接，建立web浏览器与web服务器之间的持久连接；利用所述客户端代理与web浏览器页面之间的信息交互实现页面本地更新，建立一条从消息服务器到web浏览器页面之间的消息通路
[基因与生物]远古生物的基因可以嫁接到现代生物基因组中吗? comsci 生物
大家仅仅把我说的事情当作一个IT行业的笑话来听吧..没有其它更多的意思如果我们把大自然看成是一位伟大的程序员,专门为地球上的生态系统编制基因代码,并创造出各种不同的生物来,那么6500万年前的程序员开发的代码,是否兼容现代派的程序员的代码和架构呢?
oracle 外部表 daizj oracle 外部表 external tables
oracle外部表是只允许只读访问，不能进行DML操作，不能创建索引，可以对外部表进行的查询，连接，排序，创建视图和创建同义词操作。 you can select, join, or sort external table data. You can also create views and synonyms for external tables. Ho
aop相关的概念及配置 daysinsun AOP
切面(Aspect): 通常在目标方法执行前后需要执行的方法（如事务、日志、权限），这些方法我们封装到一个类里面，这个类就叫切面。连接点（joinpoint） spring里面的连接点指需要切入的方法，通常这个joinpoint可以作为一个参数传入到切面的方法里面（非常有用的一个东西）。通知（Advice）通知就是切面里面方法的具体实现，分为前置、后置、最终、异常环
初一上学期难记忆单词背诵第二课 dcj3sjt126com english word
middle 中间的，中级的 well 喔，那么；好吧 phone 电话，电话机 policeman 警察 ask 问 take 拿到；带到 address 地址 glad 高兴的，乐意的 why 为什么 China 中国 family 家庭 grandmother (外)祖母 grandfather (外)祖父 wife 妻子 husband 丈夫 da
Linux日志分析常用命令 dcj3sjt126com linux log
1.查看文件内容 cat -n 显示行号 2.分页显示 more Enter 显示下一行空格显示下一页 F 显示下一屏 B 显示上一屏 less /get 查询"get"字符串并高亮显示 3.显示文件尾 tail -f 不退出持续显示 -n 显示文件最后n行 4.显示头文件 head -n 显示文件开始n行 5.内容排序 sort -n 按照
JSONP 原理分析 fantasy2005 JavaScript jsonp jsonp 跨域
转自 http://www.nowamagic.net/librarys/veda/detail/224 JavaScript是一种在Web开发中经常使用的前端动态脚本技术。在JavaScript中，有一个很重要的安全性限制，被称为“Same-Origin Policy”（同源策略）。这一策略对于JavaScript代码能够访问的页面内容做了很重要的限制，即JavaScript只能访问与包含它的
使用connect by进行级联查询 234390216 oracle 查询父子 Connect by 级联
使用connect by进行级联查询 connect by可以用于级联查询，常用于对具有树状结构的记录查询某一节点的所有子孙节点或所有祖辈节点。来看一个示例，现假设我们拥有一个菜单表t_menu，其中只有三个字段：
一个不错的能将HTML表格导出为excel,pdf等的jquery插件 jackyrong jquery插件
发现一个老外写的不错的jquery插件，可以实现将HTML 表格导出为excel,pdf等格式，地址在： https://github.com/kayalshri/ 下面看个例子，实现导出表格到excel,pdf <html> <head> <title>Export html table to excel an
UI设计中我们为什么需要设计动效 lampcy UI UI设计
关于Unity3D中的Shader的知识首先先解释下Unity3D的Shader，Unity里面的Shaders是使用一种叫ShaderLab的语言编写的，它同微软的FX文件或者NVIDIA的CgFX有些类似。传统意义上的vertex shader和pixel shader还是使用标准的Cg/HLSL 编程语言编写的。因此Unity文档里面的Shader，都是指用ShaderLab编写的代码，
如何禁止页面缓存 nannan408 html jsp cache
禁止页面使用缓存~ ------------------------------------------------ jsp:页面no cache： response.setHeader("Pragma","No-cache"); response.setHeader("Cache-Control","no-cach
以代码的方式管理quartz定时任务的暂停、重启、删除、添加等 Everyday都不同定时任务管理 spring-quartz
【前言】在项目的管理功能中，对定时任务的管理有时会很常见。因为我们不能指望只在配置文件中配置好定时任务就行了，因为如果要控制定时任务的 “暂停” 呢？暂停之后又要在某个时间点 “重启” 该定时任务呢？或者说直接 “删除” 该定时任务呢？要改变某定时任务的触发时间呢？ “添加” 一个定时任务对于系统的使用者而言，是不太现实的，因为一个定时任务的处理逻辑他是不
EXT实例 tntxia ext
（1）增加一个按钮 JSP: <%@ page language="java" import="java.util.*" pageEncoding="UTF-8"%> <% String path = request.getContextPath(); Stri
数学学习在计算机研究领域的作用和重要性 xjnine Math
最近一直有师弟师妹和朋友问我数学和研究的关系，研一要去学什么数学课。毕竟在清华，衡量一个研究生最重要的指标之一就是paper,而没有数学，是肯定上不了世界顶级的期刊和会议的，这在计算机学界尤其重要！你会发现，不论哪个领域有价值的东西，都一定离不开数学！在这样一个信息时代，当google已经让世界没有秘密的时候，一种卓越的数学思维，绝对可以成为你的核心竞争力. 无奈本人实在见地

Hive学习笔记

你可能感兴趣的:(Hive学习笔记)