十里清歡

hive sql常用函数

1. MONTHS_BETWEEN函数

MONTHS_BETWEEN (x, y)用于计算x和y之间有几个月。如果x在日历中比y早，那么MONTHS_BETWEEN()就返回一个负数
SELECT MONTHS_BETWEEN('2008-05-05', '2008-04-05') FROM dual-----------------------------------------1

2. CASE WHEN THEN ELSE函数

Case具有两种格式。简单Case函数和Case搜索函数。 
简单Case函数 
--CASE sex 
     WHEN '1' THEN '男' 
     WHEN '2' THEN '女' 
ELSE '其他' END 
--Case搜索函数 
CASE WHEN sex = '1' THEN '男' 
     WHEN sex = '2' THEN '女' 
ELSE '其他' END 
这两种方式，可以实现相同的功能。简单Case函数的写法相对比较简洁，但是和Case搜索	函数相比，功能方面会有些限制，比如写判断式。 
还有一个需要注意的问题，Case函数只返回第一个符合条件的值，剩下的Case部分将会被	自动忽略。

3. CAST 函数

CAST函数语法规则是：Cast(字段名 as 转换的类型 )，其中类型可以为：

CHAR[(N)] 字符型
DATE 日期型
DATETIME 日期和时间型
DECIMAL float型
SIGNED int
TIME 时间型

4. NVL()函数

1.NVL函数的格式如下：NVL(expr1,expr2)
含义是：如果oracle第一个参数为空那么显示第二个参数的值，如果第一个参数的值不为	空，则显示第一个参数本来的值。

2.NVL2函数的格式如下：NVL2(expr1,expr2, expr3)
含义是：如果该函数的第一个参数为空那么显示第二个参数的值，如果第一个参数的值不为空，则显示第三个参数的值。SQL> select ename,NVL2(comm,-1,1) from emp;

3.NULLIF(exp1,expr2)函数的作用是如果exp1和exp2相等则返回空(NULL)，否则返回第一个值。

4.Coalesce(expr1, expr2, expr3….. exprn)
表示可以指定多个表达式的占位符。所有表达式必须是相同类型，或者可以隐性转换为相同的类型。
返回表达式中第一个非空表达式，如有以下语句： 　　SELECT 	COALESCE(NULL,NULL,3,4,5) FROM dual 　　其返回结果为：3
如果所有自变量均为 NULL，则 COALESCE 返回 NULL 值。 　　COALESCE(expression1,...n) 与此 CASE 函数等价：

5. UNION函数

说明：union函数是行级连接，增加行数

例如：(不包括重复的)

select * from student_drb where bno=1
union
select * from student_drb where bno=4

此结果是将select * from student_drb where bno=4查出的结果合并到
select * from student_drb where bno=1结果下面

6. UNION ALL

insert overwrite table TABLE_NAME

select X from ...

union all

select X from ...;

-- 表示：将多个查询的结果合并，表中的数据都罗列出来（包括重复的）
-- 注："X"的位置必须相同

7. 时间戳转化

在sql查询时将日期转为时间戳

NOW()：当前日期时间
SELECT UNIX_TIMESTAMP(NOW());
将日期格式转成时间戳 1493016522

SELECT UNIX_TIMESTAMP(create_time);
在sql查询时将时间戳转为日期

SELECT FROM_UNIXTIME(1493016148);
将时间戳转成日期格式 2017-04-24 14:42:28

8. TIMESTAMP

	1、current_date
-- 表示：当前日期,yyyy-MM-dd

2、current_time
-- 表示：当前时间,HH:mm:ss

3、current_timestamp
-- 表示：返回当前UTC时间(GMT+0)的时间戳，小于北京时间8小时，就是日期时间yyyy-MM-dd HH:mm:ss

4、unix_timestamp()
4.1、unix_timestamp() 
    -- 得到当前时间戳. 
4.2、unix_timestamp(string date)
    -- 如果参数date满足yyyy-MM-dd HH:mm:ss形式，则可以直接 得到参数对应的时间戳.
    -- 如果参数date不满足yyyy-MM-dd HH:mm:ss形式，则我们需要指定date的形式，再进行转换 
        如：unix_timestamp(‘2009-03-20’, ‘yyyy-MM-dd’)=1237532400

5、from_unixtime(unix_timestamp,format)
-- 表示：返回表示 Unix 时间标记的一个字符串，根据format字符串格式化。 

语法：from_unixtime(t1,’yyyy-MM-dd HH:mm:ss’) 
其中t1是10位的时间戳值，即1970-1-1至今的秒，而13位的所谓毫秒的是不可以的。 
对于13位时间戳，需要截取，然后转换成bigint类型，因为from_unixtime类第一个参数只接受bigint类型。 例如： 
from_unixtime(cast(substring(tistmp,1,10) as bigint),’yyyy-MM-dd HH’)

9. IN函数

 in 操作符： 
 
SELECT * FROM table1 WHERE age1 IN(11,1);

查询来自表哥table1的数据，条件为age1 在(11,1)这两个数之中，其中in的意思就是说查询的数据在什么之中。那么我们这样使用in就可以查询age1为11和1的数据了。

注意:
(1）在使用IN 和 NOT IN 时要注意 IN范围中有NULL和空值的情况
（2）尽量不要用IN和NOT IN的方式而是转换为LEFT JOIN的形式
（3）在where语句中考虑NULL的同时要考虑空字符串的情况

10. SUBSTR和SUBSTRING区别

两者都是截取字符串。

1.相同点：如果只是写一个参数，两者的作用都一样：都是是截取字符串从当前下标以后直到	字符串最后的字符串片段

var str = '123456789';
console.log(str.substr(2));    //  "3456789"
console.log(str.substring(2)) ;//  "3456789"


2.不同点：第二个参数
substr（startIndex,lenth）： 第二个参数是截取字符串的长度（从起始点截取某个长度的字符串）；
substring（startIndex, endIndex）： 第二个参数是截取字符串最终的下标 （截取2个位置之间的字符串,‘含头不含尾’）。
例子1:
console.log("123456789".substr(2,5));    //  "34567"
console.log("123456789".substring(2,5)) ;//  "345"

例子2:
var a="abcdefghiklmnopqrstuvwxyz";
var b=a.substr(3,5);
var c=a.substring(3,5);
打印输出的结果是：
defgh
de

注意最后5下标是不会取到的意思是只能截取a字符串的3,4下标
截取的时候是不会截取到最后一个[3,5）
String.substr(startIndex,lenth) 这个是我们常用的从指定的位置(startIndex)截取指定长度(lenth)的字符串; String.substring(startIndex, endIndex) 这个是startIndex,endIndex里找出一个较小的值,然后从字符串的开始位置算起,截取较小值位置和较大值位置之间的字符串,截取出来的字符串的长度为较大值与较小值之间的差。

11. WITH 连接词

with TABLE_NAME AS (
SELECT ... FROM ... WHERE ...
)

-- 首个连接需要with，后续不要with：

TABLE_NAME AS (
SELECT ... FROM ... WHERE ...

12. ROW_NUMBER() over(partition by A order by B asc/desc)

row_number() over(partition by A order by B asc/desc)

-- 将查询结果按照A字段分组（partition），
-- 然后组内按照B字段排序，至于asc还是desc，可自行选择，
-- 然后为每行记录返回一个row_number用于标记顺序(编号)

特色功能：给 已有hive表(dm.official_accounts_funscount_w) 添加一列序号(sample_key)，例：
select 
  row_number() over(
    partition by case when t.source is not null then 1 end
order by t.source asc,t.funCounts desc
) as sample_key,
  t.source,
  t.cityName,
  t.weight,
  t.strArea,
  t.end_date,
  t.funCounts
from dm.official_accounts_funscount_w t;

13. Row number 和RANK 和DENSE区别

RANK() 排序相同时会重复，总数不会变
DENSE_RANK() 排序相同时会重复，总数会减少
ROW_NUMBER() 会根据顺序计算

14. CONCAT(a,b) 和concat_ws

1.concat('hello_','world')
-- 将a字符串与b字符串拼接 ==>('hello_world')
concat函数在连接字符串的时候，只要其中一个是NULL，那么将返回NULL

hive> select concat('a','b');
OK
ab
Time taken: 0.477 seconds, Fetched: 1 row(s)
hive> select concat('a','b',null);
OK
NULL
Time taken: 0.181 seconds, Fetched: 1 row(s)


2.concat_ws函数在连接字符串的时候，只要有一个字符串不是NULL，就不会返回NULL。concat_ws函数需要指定分隔符。

hive> select concat_ws('-','a','b');
OK
a-b
Time taken: 0.245 seconds, Fetched: 1 row(s)
hive> select concat_ws('-','a','b',null);
OK
a-b
Time taken: 0.177 seconds, Fetched: 1 row(s)
hive> select concat_ws('','a','b',null);
OK
ab
Time taken: 0.184 seconds, Fetched: 1 row(s)

15. Collect_set和Collect_list函数

16. OVERWRITE与INTO

insert overwrite table TABLE_NAME;
-- 表示：删除原有数据然后在新增数据，如果有分区那么只会删除指定分区数据，其他分区数据不受影响。

insert into table TABLE_NAME;
-- 表示：在原有数据的基础上增加数据

17. DECIMAL

decimal(38,2)
-- 表示：计算结果保留有效位38位，小数位2位

18. IF()

if("表达式",true,null)
-- 如果表达式成立，取参数true，否则取参数null

19. COALESCE

Coalesce(expr1, expr2, expr3….. exprn)
-- 表示：返回第一个非空参数(所有参数必须是相同类型，或可隐性转换为相同的类型)。

20. LEFT REGHT INNER join

 sql的left join 、right join 、inner join之间的区别

	-left join(左联接) 返回包括左表中的所有记录和右表中联结字段相等的记录 
　	-right join(右联接) 返回包括右表中的所有记录和左表中联结字段相等的记录
　	-inner join(等值连接) 只返回两个表中联结字段相等的行
　	
　左连接:
　	select u.UserID,u.UserName,c.id,c.name
	from t_user u left join t_class c   on  c.id  = u.UserID
  三表关联:
select table a left join table b(left join table c on b.id = c.tb_id) on a.id = b_ta.id

21. GROUP_CONCAT

使用GROUP_CONCAT合并列，使用distinct会去掉列里面重复的数据

SELECT GROUP_CONCAT(distinct main.relator_name SEPARATOR '；') AS relator_name,
GROUP_CONCAT(distinct main.law_investigation_situ SEPARATOR '；') AS law_investigation_situ,main.relator_type,
main.asset_id
from amc.

22. GROUP BY

group by语法可以根据给定数据列的每个成员对查询结果进行分组统计，最终得到一个分组汇总表。
SELECT子句中的列名必须为分组列或列函数。列函数对于GROUP BY子句定义的每个组各返回一个结果。

Group by 一般和聚合函数一起使用才有意义,比如 count sum avg等,使用group by的两个要素: 
 (1) 出现在select后面的字段 要么是聚合函数中的,要么是group by 中的. 
 (2) 要筛选结果 可以先使用where 再用group by 或者先用group by 再用having(having对group by进行条件帅选分组)

23. DISTINCT 去重

如何用distinct消除重复记录的同时又能选取多个字段值？

需求是：我要消除name字段值重复的记录，同时又要得到id字段的值，其中id是自增字段。 
select distinct name from t1 能消除重复记录，但只能取一个字段，现在要同时			取id,name这2个字段的值。 
select distinct id,name from t1 可以取多个字段，但只能消除这2个字段值全部相同的记录 
最后解决方法： 
SELECT id,name FROM t1 WHERE id IN(SELECT MAX(id) FROM t1 GROUP BY name) order by id desc

注意开头的 id 的 一定要，后面的order by 里有的字段一定要加进select 结果，要不然排序无效

注意:

1 .Distinct 位置 
单独的distinct只能放在开头，否则报错，语法错误 

2.与其他函数使用时候，没有位置限制如下 
Select player_id,count(distinct(task_id))from task; 
这种情况下是正确的，可以使用

24. WMSYS.WM_CONCAT()

函数可以实现行转列的效果

25. default SYS_GUID()

不重复字符设置函数

26. unpivot（透视，行专列）

值的数来自于id的字段，将id和zhi的行转化为id和“zhi”的两列；

27. nvl 和decode 函数

Quartus II SDC文件建立流程 cattao1989 verilog
QuartusIISDC文件编写教程第一步：打开TimeQuestTimingAnalyzer，也可以点击图中1所示图标。第二步：点击Netlist,点击CreateTimingNetlist第三步：按照下图所示选择。
【Python】已解决：WARNING: pip is configured with locations that require TLS/SSL, however the ssl module i 屿小夏 python pip ssl
文章目录一、分析问题背景二、可能出错的原因三、错误代码示例四、正确代码示例五、注意事项已解决：pipSSL模块不可用导致无法连接的错误一、分析问题背景在使用pip安装Python包时，用户可能会遇到如下错误信息：WARNING:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailab
pip is configured with locations that require TLS/SSL, however the ssl module in Python is notable _Johnny_ Python pip ssl python
现象执行pipinstall时报错：WARNING:pipisconfiguredwithlocationsthatrequireTLS/SSL,howeverthesslmoduleinPythonisnotavailable.Hint:Itlookslikeapath.Thepathdoesexist.WARNING:pipisconfiguredwithlocationsthatrequir
使用 Python 和 Aria2 异步下载和解析磁力链接元数据教程日入百万 python
磁力链接（MagnetLinks）是一种流行的用于共享文件的链接格式。与传统的种子文件不同，磁力链接直接包含文件的哈希值，使得用户无需下载种子文件就能开始下载文件。在这篇教程中，我们将介绍如何使用Python和Aria2异步下载和解析磁力链接的元数据，并提取出文件的详细信息。步骤一：准备工作在开始之前，请确保你已经安装了以下工具和库：1.**Aria2**：一个轻量级多协议和多源命令行下载工具。你
基于鸿蒙API10的RTSP播放器(二：视频切换实现) PlumCarefree 鸿蒙实战：RTSP播放器音视频华为 harmonyos
目标：设置一个播放下一个视频的按钮，通过改变url地址实现✔设置一个视频播放底部轨道，轨道左侧固定为00:00，右侧为当前已经播放的时长差✖设置音量调节按钮，再实现滑动增减音量发✖//这里为ArkTS代码，标记为ts只是为了上色好看。注意代码放置位置//1.播放位置状态变量，在结构体之外letlocationIndex:number=0;//2.设置url组，苹果测试地址，最快@Statepriv
LSP协议被劫持导致不能上网 tgl182 LSP协议
故障现象：最近有同事电脑浏览器打不开网页，DNS没问题，外网地址可以PING通，本地连接显示正常，登陆QQ显示网络连接超时，打开浏览器不能显示网页，网络丢包率达到了100%，本地连接数据包收到为0，查杀木马、病毒也不能解决问题。原因分析：WinsockLSP全称WindowsSocketLayeredServiceProvider(分层服务提供商)，它是Windows底层网络Socker通信需要经
（力扣）删除链表的倒数第N个节点———链表爱干饭的boy 数据结构与算法题目 leetcode 链表算法
方法一：暴力破解***Definitionforsingly-linkedlist.*structListNode{*intval;*structListNode*next;*};*intgetLength(structListNode*head){intlength=0;while(head){++length;head=head->next;}returnlength;}structListN
数仓开发之DWD层完整使用 (第五章) 小坏讲微服务数据仓库 hadoop scala kafka
数仓开发之DWD层完整使用一、流量域未精加工的事务事实表1、主要任务1）数据清洗（ETL）2）新老访客状态标记修复3）分流2、思路1）数据清洗（ETL）2）新老访客状态标记修复（1）前端埋点新老访客状态标记设置规则（2）新老访客状态标记修复思路3）利用侧输出流实现数据拆分（1）埋点日志结构分析（2）分流日志分类（3）分流思路3、图解4、代码1）在KafkaUtil工具类中补充getKafkaPro
centos8 dnf/yum报错 10095b238670
locale命令结果：[root@0d77323f6fb2~]#locale-alocale:CannotsetLC_CTYPEtodefaultlocale:Nosuchfileordirectorylocale:CannotsetLC_MESSAGEStodefaultlocale:Nosuchfileordirectorylocale:CannotsetLC_COLLATEtodefault
离线数仓VS实时数仓 james二次元数据仓库数据仓库大数据
离线数据仓库（OfflineDataWarehouse）和实时数据仓库（Real-timeDataWarehouse）的实施有一些相似之处，但也存在显著的差异。以下是两者在几个关键方面的对比：相同点：数据集成：都需要从多个数据源提取、转换和加载数据（ETL/ELT）。都需要处理数据清洗、去重和规范化，以保证数据的一致性和准确性。数据建模：都需要进行数据建模，设计数据仓库的星型或雪花模型，定义事实表
TCP/IP模型成功与OSI模型失败的深层原因：技术、理念与市场化路径的比较 kaixin_啊啊 tcp/ip php 服务器
目录TCP/IP体系结构模型1.网络接口层（NetworkInterfaceLayer）2.互联网层（InternetLayer）3.传输层（TransportLayer）4.应用层（ApplicationLayer）TCP/IP模型与OSI模型的比较：OSI模型OSI模型的七层结构：OSI模型的优点：OSI模型与TCP/IP模型的区别：TCP/IP模型成功与OSI模型失败的深层原因1.技术适用性
【机器人工具箱Robotics Toolbox开发笔记（十三）】三自由度机器人圆弧轨迹规划仿真实例 DRobot 机器人工具箱Robotics Toolbox开发笔记机器人笔记
在实际应用场景中，我们通常预先明确了目标末端的运动轨迹，随后引导机器人进行相应的动作。本实例具体展示了如何基于给定的两个点，计算出末端的精确位姿，并以此为基础，进一步规划出一条平滑的圆弧轨迹供机器人执行。这样的流程确保了机器人能够沿着预定的路径，精准且高效地完成任务。matlab代码如下：clear;clc;%建立机器人模型%定义连杆的D-H参数%thetadaalphaoffsetL1=Link
leetCode进阶算法题+解析（八十五）唯有努力不欺人丶
子数组按位或操作题目：我们有一个非负整数数组A。对于每个（连续的）子数组B=[A[i],A[i+1],...,A[j]]（iset=newHashSet();Setlast=newHashSet();for(inti:arr){Settemp=newHashSet();temp.add(i);for(intc:last){temp.add(c|i);}last=temp;set.addAll(te
string字符串进行分割梦想患者每天学一点字符串操作小技巧算法
c++标准库中，对string字符串并没有提供分割操作，需要自己手动实现此功能。方式1：采用std::stringstream输入字符串，通过getline()函数，来对字符串进行分割。#includevoidgetSplit(std::strings,charcDelims,std::vector&res){std::stringstreamss;ssstrDest3;getSplit(Test
C# GDI+发生一般性错误（A generic error occurred in GDI+)）黄同学real C#c#microsoft 服务器
C#GDI+发生一般性错误（AgenericerroroccurredinGDI+)）C#GDI+发生一般性错误（AgenericerroroccurredinGDI+)）解决思路：因为.netGDI+是对底层的封装。所以可以尝试用Marshal.GetLastWin32Error();函数获得底层错误代码。try{image.Save(filename,System.Drawing.Imagin
Qt-布局管理 You can do more qt
布局管理Qt布局系统提供了一种简单而强大的方式，可以自动在窗口组件中排列子窗口组件，以确保它们充分利用可用空间。介绍Qt包含了一组布局管理类，用于描述窗口组件在应用程序用户界面中的布局方式。当可用空间发生变化时，这些布局会自动定位和调整窗口组件的大小，确保它们的排列一致，并且用户界面作为一个整体保持可用。所有QWidget子类都可以使用布局来管理它们的子组件。函数QWidget::setLayou
linux查看具体进程占用的网络流量寰宇001 Ubuntu
监控网络宽带（网速）的18个命令下面是按功能划分的命令名称。监控总体带宽使用――nload、bmon、slurm、bwm-ng、cbm、speedometer和netload监控总体带宽使用（批量式输出）――vnstat、ifstat、dstat和collectl每个套接字连接的带宽使用――iftop、iptraf、tcptrack、pktstat、netwatch和trafshow每个进程的带宽
2024年大数据最新实时数仓之实时数仓架构(Hudi) 2401_84185556 程序员大数据架构
技术框架Kafka：用于接入数据源；FlinkCDC：如果直接接入业务数据源可以考虑CDC方式，如果通过Kafka缓冲接入业务数据可以忽略;Flink：用于数据ETL，包括接入数据、处理数据及输出数据全链路数据计算任务；Spark：用于数据ETL，包括处理数据及输出数据全链路数据计算任务；Hudi：湖仓一体数据管理框架，用来管理模型数据，包括ODS/DWD/DWS/DIM/ADS等；Doris：O
实时数仓之实时数仓架构(Hudi)(1)，2024年最新熬夜整理华为最新大数据开发笔试题 2401_84181221 程序员架构大数据
+Hudi：湖仓一体数据管理框架，用来管理模型数据，包括ODS/DWD/DWS/DIM/ADS等；+Doris：OLAP引擎，同步数仓结果模型，对外提供数据服务支持；+Hbase：用来存储维表信息，维表数据来源一部分有Flink加工实时写入，另一部分是从Spark任务生产，其主要作用用来支持FlinkETL处理过程中的LookupJoin功能。这里选用Hbase原因主要因为Table的HbaseC
python报错AttributeError:'module' object has no attribute 'xxxxx' weixin_33857230 python java
为什么80%的码农都做不了架构师？>>>一、问题背景使用了两套环境：开发环境和测试环境。开发环境上运行没有问题，测试环境运行就报错。AttributeError:'module'objecthasnoattribute'getListOfTable'二、问题分析仔细看代码：1、模块之间是有引用的，但都已经import了，没问题！2、模块mcommon.py中已经有方法getListOfTabled
Detecting Memory Management and Threading Bugs with Valgrind Chia-Te Kuan 分析工具交叉編譯經驗談 elasticsearch 大数据搜索引擎 git
contentAboutValgrindInstallingValgrindFromSourceFromPre-compiledBinaryPrepareFWandstandardlibrarywithsymbolPrepareFWPreparesysrootonNFSSetLD_LIBRARY_PATHandcreatesymboliclinksPrepareself-implementlibr
前端处理后端传的10w条数据孟儿前端
1.这道题在考什么？对于性能优化的处理方案对于前端渲染机制的了解极端情况下的处理及知识领域的广度常规处理constrenderList=async()=>{console.time('列表时间')constlist=awaitgetList();list.forEach(item=>{constdiv=document.createElement('div')div.className='flex
微信小程序uniappvue3版本-控制tabbar某一个的显示与隐藏牛奶皮子微信小程序 uni-app 小程序
1.首先在pages.json中配置tabbar信息2.在代码根目录下添加tabBar代码文件直接把微信小程序文档里面的四个文件复制到自己项目中就可以了3.根据自己的需求更改index.js文件首先我这里需要判断什么时候隐藏某一个元素，需要引入接口然后在切换tabbar时，改变tabbar当前点击的元素importgetListfrom'../api/kdh'Component({data:{}.
Oracle rman 没有0级时1级备份和0级大小一样，可以用来做恢复 resetlogs后也可以 jnrjian oracle dba
[oracle@rac3rman_backup]$du-sk/nfs24708/nfs[oracle@rac3rman_backup]$sh-x/home/oracle/rman_backup/rman_backup_fradb3_pdb.shcdbdaily+exportORACLE_HOME=/u01/app/oracle/product/19.0.0/db_1+ORACLE_HOME=/u0
【lua实战】数组和数组长度经云 lua lua 开发语言
大多数编程语言中，一个数组很容易计算数组长度，一般都是使用现成的函数或者通过计算得到，比如：Pythonarray=[1,2,3,4,5]length=len(array)JavaScriptletarray=[1,2,3,4,5];letlength=array.length;Javaint[]array={1,2,3,4,5};intlength=array.length;C#int[]arr
MVVM架构：LiveData + ViewModel + Repository搭配的三种解决方案 2401_84132589 程序员架构
publicclassType1ViewModelextendsBaseViewModel{publicType1ViewModel(@NonNullApplicationapplication){super(application);}publicLiveDatagetLiveData1(){returnrepository.getLiveData1();}publicLiveDatagetLi
QT基本控件详解及实例2（布局类）羊百万~ qt 开发语言
二、布局类从上到下依次为垂直布局（VerticalLayout）头文件（QVBoxLayout）将控件垂直分布的方式布局，具体实现为以下步骤：1、new出一个垂直布局管理器；2、将需要布局的控件，放入垂直布局管理器；3、将垂直布局管理器的指针传入基类；（setLayout）代码如下：//ui->setupUi(this);tool=newQToolButton;tool->setText("工具按
前端算法面试题3--排序、搜索、分治临夏_ 算法
排序：冒泡排序、快速排序、插入排序...搜索：二分搜索、顺序搜索...工具理解：https://visualgo.net/zh排序冒泡排序--交换冒泡排序是一种简单的排序算法，它重复地遍历要排序的列表，比较每对相邻的项，然后交换它们的顺序（如果需要）。遍历列表的工作是重复地进行直到没有更多需要交换的元素，也就是说列表已经排序完成了。functionbubbleSort(arr){letlen=ar
【论文简介】Circle Loss: A Unified Perspective of Pair Similarity Optimization 萝莉狼 machine learning circle loss deep feature learning
CircleLoss:AUnifiedPerspectiveofPairSimilarityOptimization旷世cvpr2020的一篇文章，站在更高的视角，统一了deepfeaturelearning的两大基础loss：基于class-levellabel的loss（如softmax+crossentropy）和基于pair-wiselabel的loss（如tripletloss），指出了
getLocation:fail 频繁调用会增加电量损耗的解决办法情绪乱了思绪小程序微信
在微信小程序中，我们使用wx.getLocationapi来获取经纬度的时候，会进行报错提示：getLocation:fail频繁调用会增加电量损耗，可考虑使用wx.onLocationChange监听地理位置变化在这里，官方文档已经给出了提示：从基础库2.17.0版本开始，将会对getLocation接口进行频率限制，包括在开发版本和体验版本中，30s内调用除第一次后，剩余返回fail。但是在正
Java实现的基于模板的网页结构化信息精准抽取组件：HtmlExtractor yangshangchuan 信息抽取 HtmlExtractor 精准抽取信息采集
HtmlExtractor是一个Java实现的基于模板的网页结构化信息精准抽取组件，本身并不包含爬虫功能，但可被爬虫或其他程序调用以便更精准地对网页结构化信息进行抽取。 HtmlExtractor是为大规模分布式环境设计的，采用主从架构，主节点负责维护抽取规则，从节点向主节点请求抽取规则，当抽取规则发生变化，主节点主动通知从节点，从而能实现抽取规则变化之后的实时动态生效。如
java编程思想 -- 多态百合不是茶 java 多态详解
一: 向上转型和向下转型面向对象中的转型只会发生在有继承关系的子类和父类中（接口的实现也包括在这里）。父类：人子类：男人向上转型： Person p = new Man() ; //向上转型不需要强制类型转化向下转型： Man man =
[自动数据处理]稳扎稳打,逐步形成自有ADP系统体系 comsci dp
对于国内的IT行业来讲,虽然我们已经有了"两弹一星",在局部领域形成了自己独有的技术特征,并初步摆脱了国外的控制...但是前面的路还很长.... 首先是我们的自动数据处理系统还无法处理很多高级工程...中等规模的拓扑分析系统也没有完成,更加复杂的
storm 自定义日志文件商人shang storm cluster logback
Storm中的日志级级别默认为INFO，并且，日志文件是根据worker号来进行区分的，这样，同一个log文件中的信息不一定是一个业务的，这样就会有以下两个需求出现： 1. 想要进行一些调试信息的输出 2. 调试信息或者业务日志信息想要输出到一些固定的文件中不要怕，不要烦恼，其实Storm已经提供了这样的支持，可以通过自定义logback 下的 cluster.xml 来输
Extjs3 SpringMVC使用 @RequestBody 标签问题记录 21jhf
springMVC使用 @RequestBody(required = false) UserVO userInfo 传递json对象数据，往往会出现http 415，400,500等错误，总结一下需要使用ajax提交json数据才行，ajax提交使用proxy，参数为jsonData，不能为params；另外，需要设置Content-type属性为json，代码如下：（由于使用了父类aaa
一些排错方法文强chu 方法
1、java.lang.IllegalStateException: Class invariant violation at org.apache.log4j.LogManager.getLoggerRepository(LogManager.java:199)at org.apache.log4j.LogManager.getLogger(LogManager.java:228) at o
Swing中文件恢复我觉得很难小桔子 swing
我那个草了！老大怎么回事，怎么做项目评估的？只会说相信你可以做的，试一下，有的是时间！用java开发一个图文处理工具，类似word，任意位置插入、拖动、删除图片以及文本等。文本框、流程图等，数据保存数据库，其余可保存pdf格式。ok,姐姐千辛万苦，
php 文件操作 aichenglong PHP 读取文件写入文件
1 写入文件 @$fp=fopen("$DOCUMENT_ROOT/order.txt", "ab"); if(!$fp){ echo "open file error" ; exit; } $outputstring="date:"." \t tire:".$tire."
MySQL的btree索引和hash索引的区别 AILIKES 数据结构 mysql 算法
Hash 索引结构的特殊性，其检索效率非常高，索引的检索可以一次定位，不像B-Tree 索引需要从根节点到枝节点，最后才能访问到页节点这样多次的IO访问，所以 Hash 索引的查询效率要远高于 B-Tree 索引。可能很多人又有疑问了，既然 Hash 索引的效率要比 B-Tree 高很多，为什么大家不都用 Hash 索引而还要使用 B-Tree 索引呢
JAVA的抽象--- 接口 --实现百合不是茶
抽象接口实现接口 //抽象类 ,方法 //定义一个公共抽象的类 ,并在类中定义一个抽象的方法体抽象的定义使用abstract abstract class A 定义一个抽象类例如： //定义一个基类 public abstract class A{ //抽象类不能用来实例化，只能用来继承 //
JS变量作用域实例 bijian1013 作用域
<script> var scope='hello'; function a(){ console.log(scope); //undefined var scope='world'; console.log(scope); //world console.log(b);
TDD实践（二） bijian1013 java TDD
实践题目：分解质因数 Step1：单元测试： package com.bijian.study.factor.test; import java.util.Arrays; import junit.framework.Assert; import org.junit.Before; import org.junit.Test; import com.bijian.
[MongoDB学习笔记一]MongoDB主从复制 bit1129 mongodb
MongoDB称为分布式数据库，主要原因是1.基于副本集的数据备份， 2.基于切片的数据扩容。副本集解决数据的读写性能问题，切片解决了MongoDB的数据扩容问题。事实上，MongoDB提供了主从复制和副本复制两种备份方式，在MongoDB的主从复制和副本复制集群环境中，只有一台作为主服务器，另外一台或者多台服务器作为从服务器。本文介绍MongoDB的主从复制模式，需要指明
【HBase五】Java API操作HBase bit1129 hbase
import java.io.IOException; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.hbase.HBaseConfiguration; import org.apache.hadoop.hbase.HColumnDescriptor; import org.apache.ha
python调用zabbix api接口实时展示数据 ronin47
zabbix api接口来进行展示。经过思考之后，计划获取如下内容： 1、获得认证密钥 2、获取zabbix所有的主机组 3、获取单个组下的所有主机 4、获取某个主机下的所有监控项
jsp取得绝对路径 byalias 绝对路径
在JavaWeb开发中，常使用绝对路径的方式来引入JavaScript和CSS文件，这样可以避免因为目录变动导致引入文件找不到的情况，常用的做法如下：一、使用${pageContext.request.contextPath} 　　代码” ${pageContext.request.contextPath}”的作用是取出部署的应用程序名，这样不管如何部署，所用路径都是正确的。
Java定时任务调度：用ExecutorService取代Timer bylijinnan java
《Java并发编程实战》一书提到的用ExecutorService取代Java Timer有几个理由，我认为其中最重要的理由是：如果TimerTask抛出未检查的异常，Timer将会产生无法预料的行为。Timer线程并不捕获异常，所以 TimerTask抛出的未检查的异常会终止timer线程。这种情况下，Timer也不会再重新恢复线程的执行了;它错误的认为整个Timer都被取消了。此时，已经被
SQL 优化原则 chicony sql
一、问题的提出　在应用系统开发初期，由于开发数据库数据比较少，对于查询SQL语句，复杂视图的的编写等体会不出SQL语句各种写法的性能优劣，但是如果将应用系统提交实际应用后，随着数据库中数据的增加，系统的响应速度就成为目前系统需要解决的最主要的问题之一。系统优化中一个很重要的方面就是SQL语句的优化。对于海量数据，劣质SQL语句和优质SQL语句之间的速度差别可以达到上百倍，可见对于一个系统
java 线程弹球小游戏 CrazyMizzz java 游戏
最近java学到线程，于是做了一个线程弹球的小游戏，不过还没完善这里是提纲 1.线程弹球游戏实现 1.实现界面需要使用哪些API类 JFrame JPanel JButton FlowLayout Graphics2D Thread Color ActionListener ActionEvent MouseListener Mouse
hadoop jps出现process information unavailable提示解决办法 daizj hadoop jps
hadoop jps出现process information unavailable提示解决办法 jps时出现如下信息： 3019 -- process information unavailable3053 -- process information unavailable2985 -- process information unavailable2917 --
PHP图片水印缩放类实现 dcj3sjt126com PHP
<?php class Image{ private $path; function __construct($path='./'){ $this->path=rtrim($path,'/').'/'; } //水印函数，参数：背景图，水印图，位置，前缀,TMD透明度 public function water($b,$l,$pos
IOS控件学习：UILabel常用属性与用法 dcj3sjt126com ios UILabel
参考网站： http://shijue.me/show_text/521c396a8ddf876566000007 http://www.tuicool.com/articles/zquENb http://blog.csdn.net/a451493485/article/details/9454695 http://wiki.eoe.cn/page/iOS_pptl_artile_281
完全手动建立maven骨架 eksliang java eclipse Web
建一个 JAVA 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=App [-Dversion=0.0.1-SNAPSHOT] [-Dpackaging=jar] 建一个 web 项目： mvn archetype:create -DgroupId=com.demo -DartifactId=web-a
配置清单 gengzg 配置
1、修改grub启动的内核版本 vi /boot/grub/grub.conf 将default 0改为1 拷贝mt7601Usta.ko到/lib文件夹拷贝RT2870STA.dat到 /etc/Wireless/RT2870STA/文件夹拷贝wifiscan到bin文件夹，chmod 775 /bin/wifiscan 拷贝wifiget.sh到bin文件夹，chm
Windows端口被占用处理方法 huqiji windows
以下文章主要以80端口号为例，如果想知道其他的端口号也可以使用该方法..........................1、在windows下如何查看80端口占用情况?是被哪个进程占用?如何终止等. 这里主要是用到windows下的DOS工具,点击"开始"--"运行",输入&
开源ckplayer 网页播放器，跨平台(html5, mobile)，flv, f4v, mp4, rtmp协议. webm, ogg, m3u8 ！天梯梦 mobile
CKplayer，其全称为超酷flv播放器，它是一款用于网页上播放视频的软件，支持的格式有：http协议上的flv,f4v,mp4格式，同时支持rtmp视频流格式播放，此播放器的特点在于用户可以自己定义播放器的风格，诸如播放/暂停按钮，静音按钮，全屏按钮都是以外部图片接口形式调用，用户根据自己的需要制作出播放器风格所需要使用的各个按钮图片然后替换掉原始风格里相应的图片就可以制作出自己的风格了，
简单工厂设计模式 hm4123660 java 工厂设计模式简单工厂模式
简单工厂模式（Simple Factory Pattern）属于类的创新型模式，又叫静态工厂方法模式。是通过专门定义一个类来负责创建其他类的实例，被创建的实例通常都具有共同的父类。简单工厂模式是由一个工厂对象决定创建出哪一种产品类的实例。简单工厂模式是工厂模式家族中最简单实用的模式，可以理解为是不同工厂模式的一个特殊实现。
maven笔记 zhb8015 maven
跳过测试阶段： mvn package -DskipTests 临时性跳过测试代码的编译： mvn package -Dmaven.test.skip=true maven.test.skip同时控制maven-compiler-plugin和maven-surefire-plugin两个插件的行为，即跳过编译，又跳过测试。指定测试类 mvn test
非mapreduce生成Hfile，然后导入hbase当中 Stark_Summer map hbase reduce Hfile path实例
最近一个群友的boss让研究hbase，让hbase的入库速度达到5w+/s，这可愁死了，4台个人电脑组成的集群，多线程入库调了好久，速度也才1w左右，都没有达到理想的那种速度，然后就想到了这种方式，但是网上多是用mapreduce来实现入库，而现在的需求是实时入库，不生成文件了，所以就只能自己用代码实现了，但是网上查了很多资料都没有查到，最后在一个网友的指引下，看了源码，最后找到了生成Hfile
jsp web tomcat 编码问题王新春 tomcat jsp pageEncode
今天配置jsp项目在tomcat上，windows上正常，而linux上显示乱码，最后定位原因为tomcat 的server.xml 文件的配置，添加 URIEncoding 属性： <Connector port="8080" protocol="HTTP/1.1" connectionTi

hive sql常用函数

1. MONTHS_BETWEEN函数

2. CASE WHEN THEN ELSE函数

3. CAST 函数

4. NVL()函数

5. UNION函数

6. UNION ALL

7. 时间戳转化

8. TIMESTAMP

9. IN函数

10. SUBSTR和SUBSTRING区别

11. WITH 连接词

12. ROW_NUMBER() over(partition by A order by B asc/desc)

13. Row number 和RANK 和DENSE区别

14. CONCAT(a,b) 和concat_ws

15. Collect_set和Collect_list函数

16. OVERWRITE与INTO

17. DECIMAL

18. IF()

19. COALESCE

20. LEFT REGHT INNER join

21. GROUP_CONCAT

22. GROUP BY

23. DISTINCT 去重

24. WMSYS.WM_CONCAT()

25. default SYS_GUID()

26. unpivot（透视，行专列）

27. nvl 和decode 函数

你可能感兴趣的:(etl)