Joanna.Zhang

Clickhouse 基础知识 - 函数

部分基本函数SQL脚本示例：

-------------------------------------------------------------------------------------------------------------------
Clickhouse基础知识：函数学习
---------------
官址学习文档：https://clickhouse.yandex/docs/zh/
---------------------------------------------------------------------------------------------------- ------------------------------------------------------------------------------ DBeaver6.1.2操作快捷键：
-- 常用快捷键须知：（Ctrl + Shift + L 显示快捷键列表）
-- 1.删除光标所在行：Ctrl + D-- 
2.复制光标所在行：Ctrl + Alt + ↓-- 
3.移动光标所在行：Ctrl + Shift + ↑/↓-- 
4.缩小SQL编辑器的文本字体大小：Ctrl + -/+-- 
5.查找：Ctrl + F-- 
6.选中上或下的SQL执行语句：Alt + ↑/↓-- 
7.执行当前光标所在SQL语句（无论是否格式化过，前提是此SQL语句和上一条有空行或者上一条SQL语句有分号“;”隔开）
------------------------------------------------------------------------------ 
零、检测函数类型（clickhouse中数据的类型）SELECT toTypeName(0);
-- UInt8(三位数为8)SELECT toTypeName(-0);
-- Int8SELECT toTypeName(-343);
-- Int16SELECT toTypeName(12.43); 
-- Float64(默认浮点型的数据为64)，所以一般在处理浮点型的数据的时候尽量转成toFloat32(12.43)SELECT toTypeName(12.34343); 
-- Float64SELECT toTypeName(toDateTime(1502396027)); 
-- DateTime--
 一、算数函数-->>>>>> 算数函数(数学上的计算)
--求和SELECT plus(12, 21), plus(10, -10), plus(-10, -10);
--差值SELECT minus(10, 5), minus(10, -10),minus(-10, -10);
--积SELECT multiply(12, 2), multiply(12, -2), multiply(-12, -2);--平均值SELECT divide(12, 4), divide(10, 3), divide(2, 4), divide(-4, -2), divide(-4, 2), divide(-4.5, 3);SELECT intDiv(10, 3), divide(10, 3); -- 3, 3.333(保留四位有效数字)SELECT divide(10, 0), divide(-10, 0); -- 出现无穷大字符“ ∞ ”或“ -∞ ”SELECT divide(0, 0); -- 特殊字符（类似乱码）SELECT intDivOrZero(10, 0); -- 0--求余数SELECT modulo(10, 3); --1SELECT modulo(10.5, 3); --1--取反SELECT negate(10), negate(-10); -- -10	10--绝对值SELECT abs(-10), abs(10);--最大公约数SELECT gcd(12, 24), gcd(-12, -24), gcd(-12, 24);--最小公倍数SELECT lcm(12, 24), lcm(-12, -24), lcm(-3, 4);-- 二、比较函数-->>>>>> 比较函数(始终返回0表示false 或   1表示true)SELECT 12 == 12, 12 != 10, 12 == 132, 12 != 12, 12 <> 12;SELECT equals(12, 12), notEquals(12, 10), equals(12, 10), notEquals(12,123);SELECT greater(12, 10), greater(10, 12), greater(12, 12);-- 前者是否大于后者SELECT greaterOrEquals(12,10), greaterOrEquals(12,12);-- 前者是否大于或等于后者SELECT less(12, 21), less(12, 10), less(120, 120);-- 前者是否小于后者SELECT lessOrEquals(12, 120), lessOrEquals(12, 12);-- 前世是否小于或等于或者-- 三、逻辑函数-->>>>>> 逻辑操作符（返回0表示false 或 1表示true）SELECT 12==12 or 12!=10;SELECT 12==12 and 12!=10;SELECT not 12, not 0;SELECT or(equals(12, 12), notEquals(12, 10)); --函数表示法：或SELECT and(equals(12, 12), notEquals(12, 10));--函数表示法：且SELECT not(12), not(0);-- 四、类型转换函数-->>>>>> 类型转换函数部分示例：SELECT toInt8(12.3334343), toFloat32(10.001), toFloat64(1.000040);SELECT toString(now());SELECT now() AS now_local, toString(now(), 'Asia/Yekaterinburg') AS now_yekat;SELECT now() AS now_local, toDate(now()), toDateTime(now()), toUnixTimestamp(now());SELECT'2016-06-15 23:00:00' AS timestamp,CAST(timestamp AS DateTime) AS datetime,CAST(timestamp AS Date) AS date,CAST(timestamp, 'String') AS string,CAST(timestamp, 'FixedString(22)') AS fixed_string;WITH   toDate('2019-01-01') AS date,   INTERVAL 1 WEEK AS interval_week,   toIntervalWeek(1) AS interval_to_week,   toIntervalMonth(1) AS interval_to_monthSELECT   date + interval_week,   date + interval_to_week,   date + interval_to_month;WITH	toDateTime('2019-01-01 12:10:10') as datetime,	INTERVAL 1 HOUR AS interval_hour,	toIntervalHour(1) as invterval_to_hourSELECT	plus(datetime, interval_hour),	plus(datetime, invterval_to_hour);-- 五、时间日期函数--->>>>>> 时间日期函数SELECT	toDateTime('2019-07-30 10:10:10') AS time,	-- 将DateTime转换成Unix时间戳	toUnixTimestamp(time) as unixTimestamp,	-- 保留  时-分-秒	toDate(time) as date_local,	toTime(time) as date_time,-- 将DateTime中的日期转换为一个固定的日期，同时保留时间部分。	-- 获取年份，月份，季度，小时，分钟，秒钟	toYear(time) as get_year,	toMonth(time) as get_month,	-- 一年分为四个季度。1（一季度:1-3）,2（二季度:4-6）,3（三季度:7-9）,4（四季度:10-12）	toQuarter(time) as get_quarter,	toHour(time) as get_hour,	toMinute(time) as get_minute,	toSecond(time) as get_second,	-- 获取 DateTime中的当前日期是当前年份的第几天，当前月份的第几日，当前星期的周几	toDayOfYear(time) as "当前年份中的第几天",	toDayOfMonth(time) as "当前月份的第几天",	toDayOfWeek(time) as "星期",	toDate(time, 'Asia/Shanghai') AS date_shanghai,	toDateTime(time, 'Asia/Shanghai') AS time_shanghai,	-- 得到当前年份的第一天,当前月份的第一天，当前季度的第一天，当前日期的开始时刻	toStartOfYear(time),	toStartOfMonth(time),	toStartOfQuarter(time),	toStartOfDay(time) AS cur_start_daytime,	toStartOfHour(time) as cur_start_hour,	toStartOfMinute(time) AS cur_start_minute,	-- 从过去的某个固定的时间开始，以此得到当前指定的日期的编号	toRelativeYearNum(time),	toRelativeQuarterNum(time);	SELECT	toDateTime('2019-07-30 14:27:30') as time,	toISOYear(time) AS iso_year,	toISOWeek(time) AS iso_week,	now() AS cur_dateTime1, -- 返回当前时间yyyy-MM-dd HH:mm:ss	today() AS cur_dateTime2, -- 其功能与'toDate(now())'相同	yesterday() AS yesterday, -- 当前日期的上一天	-- timeSlot(1) AS timeSlot_1, -- 出现异常！！将时间向前取整半小时	toDate(time) as getY_M_d;-- 目前只有这三种格式，没有什么toYYYY(),toYYYddmm()之类的函数，不要想当然。SELECT	now() as nowTime,	-- 将Date或DateTime转换为包含年份和月份编号的UInt32类型的数字（YYYY * 100 + MM）	toYYYYMMDDhhmmss(nowTime),	toYYYYMMDD(nowTime),	toYYYYMM(nowTime);-- formatDateTime(Time, Format[,Timezone])函数引用SELECT	now() as now_time,	toDateTime('2019-07-31 18:20:30') AS def_datetime,	formatDateTime(now_time, '%D') AS now_time_day_month_year,-- 07/30/19--	toDateTime('2019-07-31 18:20:30', 'Asia/Shanghai') AS def_datetime1, -- 指定时区	formatDateTime(def_datetime, '%Y') AS def_datetime_year, -- 2019（指定日期为2019年）	formatDateTime(def_datetime, '%y') AS def_datetime_year_litter, -- 19（指定日期为19年,Year, last two digits (00-99),本世纪的第19年）	formatDateTime(def_datetime, '%H') AS hour24, -- 18 下午六点	formatDateTime(def_datetime, '%I') AS hour12, -- 06下午六点	formatDateTime(def_datetime, '%p') AS PMorAM, -- 指定时间是上午还是下午	formatDateTime(def_datetime, '%w') AS def_datetime_get_curWeek,-- 3(指定日期为星期三)	formatDateTime(def_datetime, '%F') AS def_datetime_get_date,-- 2019-07-31 	formatDateTime(def_datetime, '%T') AS def_datetime_get_time,-- 18:20:30	formatDateTime(def_datetime, '%M') AS def_datetime_get_minute,-- 20(得到指定事件的“分”，minute (00-59))	formatDateTime(def_datetime, '%S') AS def_datetime_get_second;-- 30(得到指定事件的“秒”，second (00-59))	 -- 1.跳转到之后的日期函数-- 第一种，日期格式（指定日期，需注意时区的问题）WITH	toDate('2019-09-09') AS date,	toDateTime('2019-09-09 00:00:00') AS date_timeSELECT	addYears(date, 1) AS add_years_with_date,	addYears(date_time, 0) AS add_years_with_date_time;-- 第二种，日期格式（当前，本地时间）WITH	toDate(now()) as date,	toDateTime(now()) as date_timeSELECT	now() as now_time,-- 当前时间	addYears(date, 1) AS add_years_with_date,-- 之后1年	addYears(date_time, 1) AS add_years_with_date_time,	addMonths(date, 1) AS add_months_with_date,-- 之后1月	addMonths(date_time, 1) AS add_months_with_date_time,	addWeeks(date, 1) AS add_weeks_with_date,--之后1周	addWeeks(date_time, 1) AS add_weeks_with_date_time,	addDays(date, 1) AS add_days_with_date,-- 之后1天	addDays(date_time, 1) AS add_days_with_date_time,	addHours(date_time, 1) AS add_hours_with_date_time,--之后1小时	addMinutes(date_time, 1) AS add_minutes_with_date_time,--之后1分中	addSeconds(date_time, 10) AS add_seconds_with_date_time,-- 之后10秒钟	addQuarters(date, 1) AS add_quarters_with_date, -- 之后1个季度	addQuarters(date_time, 1) AS add_quarters_with_date_time;	-- 2.跳转到当前日期之前的函数(函数将Date/DateTime减去一段时间间隔，然后返回Date/DateTime)WITH	toDate(now()) as date,	toDateTime(now()) as date_timeSELECT	subtractYears(date, 1) AS subtract_years_with_date,    subtractYears(date_time, 1) AS subtract_years_with_date_time,	subtractQuarters(date, 1) AS subtract_Quarters_with_date,    subtractQuarters(date_time, 1) AS subtract_Quarters_with_date_time,	subtractMonths(date, 1) AS subtract_Months_with_date,    subtractMonths(date_time, 1) AS subtract_Months_with_date_time,	subtractWeeks(date, 1) AS subtract_Weeks_with_date,    subtractWeeks(date_time, 1) AS subtract_Weeks_with_date_time,	subtractDays(date, 1) AS subtract_Days_with_date,    subtractDays(date_time, 1) AS subtract_Days_with_date_time,    subtractHours(date_time, 1) AS subtract_Hours_with_date_time,    subtractMinutes(date_time, 1) AS subtract_Minutes_with_date_time,    subtractSeconds(date_time, 1) AS subtract_Seconds_with_date_time;SELECT toDate('2019-07-31', 'Asia/GuangZhou') as date_guangzhou;SELECT toDate('2019-07-31'), toDate('2019-07-31', 'Asia/Beijing') as date_beijing;-- 亚洲只能加载上海的timezone？？？SELECT toDateTime('2019-07-31 10:10:10', 'Asia/Shanghai') as date_shanghai;-- 计算连个时刻在不同时间单位下的差值-- 第一种：指定时间计算差值示例WITH	toDateTime('2019-07-30 10:10:10', 'Asia/Shanghai') as date_shanghai_one,	toDateTime('2020-10-31 11:20:30', 'Asia/Shanghai') as date_shanghai_twoSELECT	dateDiff('year', date_shanghai_one, date_shanghai_two) as diff_years,	dateDiff('month', date_shanghai_one, date_shanghai_two) as diff_months,	dateDiff('week', date_shanghai_one, date_shanghai_two) as diff_week,	dateDiff('day', date_shanghai_one, date_shanghai_two) as diff_days,	dateDiff('hour', date_shanghai_one, date_shanghai_two) as diff_hours,	dateDiff('minute', date_shanghai_one, date_shanghai_two) as diff_minutes,	dateDiff('second', date_shanghai_one, date_shanghai_two) as diff_seconds;-- 第二种：本地当前时间示例WITH	now() as date_timeSELECT	dateDiff('year', date_time, addYears(date_time, 1)) as diff_years,	dateDiff('month', date_time, addMonths(date_time, 2)) as diff_months,	dateDiff('week', date_time, addWeeks(date_time, 3)) as diff_week,	dateDiff('day', date_time, addDays(date_time, 3)) as diff_days,	dateDiff('hour', date_time, addHours(date_time, 3)) as diff_hours,	dateDiff('minute', date_time, addMinutes(date_time, 30)) as diff_minutes,	dateDiff('second', date_time, addSeconds(date_time, 35)) as diff_seconds;	-- timeSlot(StartTime, Duration, [,Size])-- 它返回一个时间数组，其中包括从从“StartTime”开始到“StartTime + Duration 秒”内的所有符合“size”（以秒为单位）步长的时间点-- 作用:搜索在相应会话中综合浏览量是非常有用的。SELECT 	timeSlots(toDateTime('2012-01-01 12:20:00'), toUInt32(600)) as dateTimeArray,	dateTimeArray[0] as arr_index_0, -- no result.	dateTimeArray[1] as arr_index_1, -- 2012-01-01 20:00:00	dateTimeArray[2] as arr_index_2, -- 2012-01-01 20:30:00	dateTimeArray[3] as arr_index_3, -- no result.	dateTimeArray[4] as arr_index_4; -- no result.-- toUInt32(600) 表示之后间距20秒的时刻SELECT 	timeSlots(now(), toUInt32(600), 20) as dateTimeArray, -- 类似于：引用地址	dateTimeArray[0] as arr_index_0, -- no result.为什么？	dateTimeArray[1] as arr_index_1,	dateTimeArray[2] as arr_index_2,	dateTimeArray[3] as arr_index_3,	dateTimeArray[4] as arr_index_4,	dateTimeArray[5] as arr_index_5;-- 指定时间为基准，之后每个元素增加20秒SELECT	timeSlots(toDateTime('2012-01-01 12:20:00'), toUInt32(600), 20) as cur_dateTimeArray, -- 类似于：引用地址	cur_dateTimeArray[0] as arr_index_0, -- no result.为什么？	cur_dateTimeArray[1] as arr_index_1, -- 2012-01-01 20:20:00	cur_dateTimeArray[2] as arr_index_2, -- 2012-01-01 20:20:20	cur_dateTimeArray[3] as arr_index_3, -- 2012-01-01 20:20:40	cur_dateTimeArray[4] as arr_index_4, -- 2012-01-01 20:21:00	cur_dateTimeArray[5] as arr_index_5; -- 2012-01-01 20:21:20-- 六、字符串函数--->>>>>> 字符串函数：SELECT	length('hello world') as str_length, -- 按照Unicode编码计算长度“你好”的长度为6	empty('hello world'),-- 判断字符串是否为空，空为1，非空为0	notEmpty('hello world'),	lengthUTF8('hello world'), -- 按照实际字符计算长度“你好”为2	char_length('hello world'), -- 同 lengthUTF8()	character_length('hello world'), -- 同 lengthUTF8(),	lower('abcd123--'),--字母全部小写（将字符串中的ASCII转换为小写。）	upper('abcd123--'),--字母全部大写（将字符串中的ASCII转换为大写。）	lowerUTF8('abcd123-/*\8asd-\\'), -- abcd123-/*8asd-\	upperUTF8('abcd123--'), -- ABCD123--	isValidUTF8('abcd123--/*\*'); --检查字符串是否为有效的UTF-8编码，是则返回1，否则返回0。SELECT notEmpty(''), notEmpty(NULL), notEmpty('he'); -- 0,空,1SELECT toValidUTF8('\x61\xF0\x80\x80\x80b');-- reverseUTF8():以Unicode字符为单位反转UTF-8编码的字符串。如果字符串不是UTF-8编码，则可能获取到一个非预期的结果（不会抛出异常）SELECT reverse('abcdefg'), reverseUTF8('abcdefg');-- 2.字符串维度自定义安排SELECT format('{1} {0} {1}', 'World', 'Hello'); -- 输出：Hello World HelloSELECT format('{0} {0} {1} {1}', 'one', 'two'); -- 输出：one one two twoSELECT format('{} {}', 'Hello', 'World'); -- 输出：Hello World-- 3.字符串拼接 concat(s1,s2,s3,...)SELECT concat('Hello',' ','World', '!');-- Hello World!-- 与concat相同，区别在于，你需要保证concat(s1, s2, s3) -> s4是单射的，它将用于GROUP BY的优化。SELECT concatAssumeInjective('Hello',' ','World', '!');-- Hello World!-- 4.字符串截取：substring(s, offset, length), mid(s, offset, length), substr(s, offset, length)-- 以字节为单位截取指定位置字符串，返回以‘offset’位置为开头，长度为‘length’的子串。‘offset’从1开始（与标准SQL相同）。‘offset’和‘length’参数必须是常量。SELECT 	substring('abcdefg', 1, 3),-- abc	substring('你好，世界', 1, 3),-- 你	substringUTF8('你好，世界', 1, 3); -- 你好，-- 5.字符串拼接：appendTrailingCharIfAbsent(s, c)-- 如果‘s’字符串非空并且末尾不包含‘c’字符，则将‘c’字符附加到末尾。SELECT 	appendTrailingCharIfAbsent('good','c'), -- goodc	appendTrailingCharIfAbsent('goodccc','c'); -- goodccc-- 6.字符串编码转换：convertCharset(s, from, to) 返回从‘from’中的编码转换为‘to’中的编码的字符串‘s’。SELECT 	convertCharset('hello', 'UTF8','Unicode'),-- ��h	convertCharset('hello', 'Unicode', 'UTF8'),-- 桥汬�	convertCharset('hello', 'Unicode', 'ASCII'),-- 	convertCharset('hello', 'ascii', 'ascii'),--hello	convertCharset('hello', 'UTF8','UTF8');-- helloSELECT 	base64Encode('username+password'),-- dXNlcm5hbWUrcGFzc3dvcmQ=	base64Decode('dXNlcm5hbWUrcGFzc3dvcmQ='), -- username+password	-- 使用base64将字符串解码成原始字符串。但如果出现错误，将返回空字符串。	tryBase64Decode('dXNlcm5hbWUrcGFzc3dvcmQ=');-- 7.判断字符串是否已什么结尾或结束，返回1：true，0：flase-- endsWith(s, suffix)  返回是否以指定的后缀结尾。如果字符串以指定的后缀结束，则返回1，否则返回0-- startWith(s, prefix) 返回是否以指定的前缀开头。如果字符串以指定的前缀开头，则返回1，否则返回0。SELECT	endsWith('string','g'),	startsWith('string', 'str'); -- 1  true-- 8.删除左侧空白字符-- trimLeft(s)  返回一个字符串，用于删除左侧的空白字符-- trimRight(s) 返回一个字符串，用于删除右侧的空白字符-- trimBoth(s)  返回一个字符串，用于删除左侧和右侧的空白字符SELECT	trimLeft('  sdfdgs'), -- sdfdgs	trimRight('abcd   '), -- abcd	trimBoth('  abcd  '); -- abcd-- 七、字符串搜索函数--->>>>>> 字符串搜索函数-- pasition(haystack, needle), 显示needle在haystack的第一个出现的位置。SELECT 	POSITION('2121stringstrstrstrstr','str') AS positionSearch, -- 5	POSITION('你好，hello,12323-你好，你，好sdfd*dg', '你，好'),-- 31	positionUTF8('n12你好','你好') AS positionUTF8,-- 4	positionCaseInsensitive('ABCDCDEFABCD','bc') AS positionCaseInsensitive, --2	locate('hellohellohellohello','ello'); -- 2-- multiSearchAllPositions(haystack, [needle1, needle2, ..., needlen])-- 注意：在所有multiSearch*函数中，由于实现规范，needles的数量应小于2^8。-- 函数返回一个数组，其中包含所有匹配needlei的位置SELECT	multiSearchAllPositions('goodnamegoodnamegoodhellohihihi', ['dn', 'good']) as multiSearch,-- [4,1]	multiSearchAllPositionsCaseInsensitive('nameSsdfagpSSDFDFetgfderef', ['SS','fa']) as multiCaseInsensitive,	multiSearchAllPositionsUTF8('nameSsdfazz轴功率gpSSDFDFetgfderef', ['Ss','fa', 'zz轴']) AS multiSearchUTF8,	multiSearchAllPositionsCaseInsensitiveUTF8('nameSsdfazz轴功率gpSSDFDFetgfderef', ['Ss','fa', 'zz轴']) AS multiCaseInsensitiveUTF8;-- 检查字符串是否与pattern正则表达式匹配。pattern可以是一个任意的re2正则表达式。 re2正则表达式的语法比Perl正则表达式的语法存在更多限制。-- match(haystack, pattern) 匹配到了则返回1，否则返回0SELECT	match('1232434sadgaDDFSrefds', '[0-9a-zA-Z]'), -- 存在匹配的字符，返回1	match('1232321', '[a-z]'); -- 不存在匹配的字符，返回0-- 与match相同，但如果所有正则表达式都不匹配，则返回0；如果任何模式匹配，则返回1。它使用hyperscan库。对于在字符串中搜索子字符串的模式，最好使用“multisearchany”，因为它更高效。-- multiMatchAny(haystack, [pattern1, pattern2, ..., patternn]) -- 注意：任何haystack字符串的长度必须小于232字节，否则抛出异常。这种限制是因为hyperscan API而产生的。-- 多个正则表达式对原始字符进行匹配，如若只有一个正则表达式匹配上了则返回1，否则返回0SELECT 	multiMatchAny('abcABC',['[0-9]','[a-zA-Z]']) AS multiMatchAnyOne, -- 1	multiMatchAny('123abcABC',['[0-9]','[a-zA-Z]']) AS multiMatchAnyTwo, --1	-- 与multiMatchAny相同，但返回与haystack匹配的任何内容的索引位置。	multiMatchAnyIndex('123abcABC', ['[0-9]','[a-zA-Z]']) as multiMatchAnyIndex; --2-- 模糊匹配：like()函数，注意大写敏感。-- % 表示任何字节数（包括零字符）-- _ 表示任何一个字节SELECT	'hello' LIKE '%h%' as LIKE_UP, -- 1	'hello' like 'he' AS like_low, -- 0	'hello' not like 'he' AS not_like, -- 1	'hello' like '%he%' AS like_litter, -- 1	like('adgadgadfa1232', '_12_') AS like_func,	like('sdfasdfasd', '[a-z]') AS like_func2, -- 0	notLike('1232423', '[a-zA-Z]') AS not_like_func; -- 1-- 使用字符串截取字符串：extract(haystack, pattern)-- 使用正则表达式截取字符串。如果‘haystack’与‘pattern’不匹配，则返回空字符串。如果正则表达式中不包含子模式，它将获取与整个正则表达式匹配的子串。否则，它将获取与第一个子模式匹配的子串。SELECT	extractAll('hellogoodaimantIdeaIDEAfasd123232', '[0-9]'), -- ['1','2','3','2','3','2']	extractAll('12323dSDFRE', '[A-Z]'),-- ['S','D','F','R','E']	extract('helloclickhouse', '[a-z]');-- h-- ngramSearch(haystack, needle)-- 基于4-gram计算haystack和needle之间的距离：计算两个4-gram集合之间的对称差异，并用它们的基数和对其进行归一化。-- 返回0到1之间的任何浮点数 -- 越接近0则表示越多的字符串彼此相似。-- 如果常量的needle或haystack超过32KB，函数将抛出异常。如果非常量的haystack或needle字符串超过32Kb，则距离始终为1。SELECT 	ngramDistance('hello123456789','123') AS ngramDistance, 	ngramDistanceCaseInsensitive('hello123456789','123') AS ngramDistanceCaseInsensitive,	ngramDistanceUTF8('hello123456789','123') AS ngramDistanceUTF8,	ngramDistanceCaseInsensitiveUTF8('hello123456789','123') AS ngramDistanceCaseInsensitiveUTF8;-- 注意：对于UTF-8，我们使用3-gram。所有这些都不是完全公平的n-gram距离。-- 我们使用2字节哈希来散列n-gram，然后计算这些哈希表之间的（非）对称差异 - 可能会发生冲突。-- 对于UTF-8不区分大小写的格式，我们不使用公平的tolower函数 -- 我们将每个Unicode字符字节的第5位（从零开始）和字节的第一位归零 -- 这适用于拉丁语，主要用于所有西里尔字母。--八、字符串替换函数--->>>>>> 字符串替换函数-- 替换匹配到的字符串-- replaceOne(haystack, pattern, replacement)-- 用‘replacement’子串替换‘haystack’中与‘pattern’子串第一个匹配的匹配项（如果存在）。 ‘pattern’和‘replacement’必须是常量。-- replaceAll(haystack, pattern, replacement), replace(haystack, pattern, replacement)-- 用‘replacement’子串替换‘haystack’中出现的所有‘pattern’子串。SELECT 	replaceOne('hed1234544', '4', '*') AS replaceOne,-- hed123*544	replaceRegexpOne('hed1234544', '4', '*') AS replaceRegexpOne,-- hed123*544	replace('hed1234544', '4', '*') AS replace, -- hed123*5**	replaceAll('hed1234544', '4', '*') AS replaceAll;-- hed123*5**-- 实例：2019-07-31 改变成  07/31/2019SELECT	toDate(now()) AS now_date,	replaceRegexpOne(toString(now_date), '(\\d{4})-(\\d{2})-(\\d{2})', '\\2/\\3/\\1') AS format_date;-- 示例：赋值字符串10次SELECT replaceRegexpOne('Hello, World!', '.*', '\\0\\0\\0\\0\\0\\0\\0\\0\\0\\0') AS res;-- replaceRegexpAll(haystack, pattern, replacement)-- 与replaceRegexpOne相同，但会替换所有出现的匹配项。例如：SELECT replaceRegexpAll('hello,world!', '.', '\\0\\0') as res; -- hheelllloo,,wwoorrlldd!!SELECT replaceRegexpAll('hello o o, world.', ' ', '*') as res; -- hello*o*o,*world.-- 函数：regexpQuoteMeta(s)   该函数用于在字符串中的某些预定义字符之前添加反斜杠。-- 预定义字符：'0'，'\'，'|'，'('，')'，'^'，'$'，'。'，'['，']'，'？'，'* '，'+'，'{'，'：'，' - '。 -- 这个实现与re2 :: RE2 :: QuoteMeta略有不同。它以\0而不是\x00转义零字节，它只转义所需的字符---- 简言之，就是不处理转义字符，一般如果没有用的这个函数，都会有转义的情况出现。SELECT regexpQuoteMeta('\\\\|[]{}+_-=@!~`&^*%$#'); -- \\\\\|\[\]\{}\+_\-=@!~`&\^\*%\$#SELECT toString('\\\\'); -- \\--九、条件函数--->>>>>> 条件函数-- 1. if(cond, then, else)函数：类似于三元操作符。-- 中文字符使用双引号，英文字符可不使用引号也可使用当引号或双引号，根据具体情况而定。-- 如果cond ！= 0则返回then，如果cond = 0则返回else。 cond必须是UInt8类型，then和else必须存在最低的共同类型。-- 注意：then和else可以是NULLSELECT 	12 > 10 ? 'desc' : 'asc' AS "三元操作符",	if(12 > 10, 'desc' , 'asc') AS "if()函数",	if(12 > 10, NULL, NULL);-- 2. multiIf(cond_1, then_1, cond_2, then_2...else)-- 允许您在查询中更紧凑地编写CASE运算符。类似于java中的switch语法（可以接受2n+1个参数）SELECT multiIf(1,'one',2,'two',3,'three','not this index');-- 关联case条件表达式--十、数学函数--->>>>>> 数学函数SELECT	1 * e() AS E,	1 * pi() AS PI,	sqrt(25) AS sqrt_25, --接受一个数值类型的参数并返回它的平方根。	cbrt(27) AS cbrt_27, --接受一个数值类型的参数并返回它的立方根。	exp(10), --接受一个数值类型的参数并返回它的指数	exp10(10), --接受一个数值类型的参数并返回它的10的x次幂。	log(10) AS LOG,	log2(10) AS LOG2, --接受一个数值类型的参数并返回它的底2对数。	ln(e()) AS LOG10; --接受一个数值类型的参数并返回它的自然对数-- 示例：三西格玛准则SELECT erf(3 / sqrt(2)); -- 0.997SELECT 	sin(90), -- 返回x的三角正弦值。	cos(90), -- 返回x的三角余弦值。	tan(90), -- 返回x的三角正切值	acos(0), -- 返回x的反三角余弦值。	asin(1), -- 返回x的反三角正弦值。	atan(45); -- 返回x的反三角正切值。-- pow(x, y), power(x, y) 接受x和y两个参数。返回x的y次方。SELECT	pow(2, 3), -- 2的三次方	pow(3, 2); -- 3的平方SELECT	intExp2(4), --2^4 	接受一个数值类型的参数并返回它的2的x次幂（UInt64）。	intExp10(2);--10^2	接受一个数值类型的参数并返回它的10的x次幂（UInt64）。	-- 十一、取整函数--->>>>>> 取整函数-- 1.向下取整：floor(x[,N])SELECT 	floor(toFloat32(12.08098), 2), -- 12.08	floor(toFloat32(12.2323), 2), -- 12.23	floor(toFloat32(12.89788), -1), -- 10	floor(toFloat32(12.09590), 3), -- 12.095 (注意：如果按照正常的四舍五入，则应该是12.096，为什么呢？)	floor(toFloat32(12.0987), 3),-- 12.098	floor(10, 2); -- 10-- 2.四舍五入：round(expression [, decimal_places])--	如果decimal_places=0,则取整数；--	如果>0,则将值舍入小数点右侧；--	如果<0,则将小数点左侧的值四舍五入。SELECT	round(toFloat32(12.1234), 3),	round(toFloat32(12.0025), 3), -- 12.002(注意：为什么不是12.003呢？)	-- round函数只会最多保留三位有效数字	round(toFloat32(12.0025), 4), -- 12.002	round(toFloat32(12.0025002323), 100); -- 12.003-- 示例：SELECT 	round(toFloat32(10 / 3)), -- 3  	round(toFloat32(10 / 3), 2), -- 3.33	round(toFloat32(10.000/3), 3), -- 3.333	round(toFloat32(10.000/3), 6); -- 3.333-- roundToExp2() 接受一个数字。如果数字小于1，则返回0。否则，它将数字向下舍入到最接近的（整个非负）2的x次幂。SELECT	roundToExp2(12.0129), -- 8 = 2^3	roundToExp2(toFloat32(0.01)); -- 0.008-- 3.向上取整：ceil(x[, N]) 或者 ceiling(x[, N])SELECT	ceil(12.34343, 3), -- 12.344	ceil(toFloat64(12.34343), 3), -- 12.344	ceil(toFloat32(12.34343), 3), -- 12.344	ceil(12.0011, 3); -- 12.002		---十二、数组函数--->>>>>> 数组函数-- 1.数组非空判断相关函数（真为1，假为0）SELECT empty([]), empty([1,2,3]), notEmpty([1,2,3]), notEmpty([]);-- 2.数组长度 length()  返回数组中的元素个数。 结果类型是UInt64。 该函数也适用于字符串。SELECT--	length(), -- 出现异常--	length([true, false]), -- 异常--	length([1,2,,4]), --出现异常！	length([]), -- 0	length(['a','b','c']), -- 3	length([1,2,3]); -- 3-- 3.扩展判断非空的部分函数如下：不接受任何参数并返回适当类型的空数组SELECT	emptyArrayUInt8(), -- UInt8的空数组	emptyArrayUInt16(),	emptyArrayUInt32(),	emptyArrayUInt64(),	emptyArrayDate(),	emptyArrayDateTime(),	emptyArrayInt8(),	emptyArrayInt16(),	emptyArrayInt32(),	emptyArrayInt64();--	接受一个空数组并返回一个仅包含一个默认值元素的数组。(以下是部分示例)SELECT 	emptyArrayToSingle(emptyArrayInt32()), -- 0	emptyArrayToSingle(emptyArrayUInt32()), -- 0	emptyArrayToSingle(emptyArrayDate()), -- 0002-11-30	emptyArrayToSingle(emptyArrayDateTime()); --0002-11-30 08:00:00-- 4.生成一个含有N个元素的数组,元素从0开始增长，步长尾1.-- range(N)  返回从0到N-1的数字数组。 以防万一，如果在数据块中创建总长度超过100,000,000个元素的数组，则抛出异常SELECT	range(10), -- [0,1,2,3,4,5,6,7,8,9]	range(2), -- [0,1]--	range(5.5), -- 出现异常，N为Int8的数据类型，正整数--	range(-10), -- 出现异常，DB::Exception: Illegal type Int8 of argument of function range	range(1); -- 0-- 5.新建一个数组的函数：array(x1,……) 类似于 直接[x1,……]-- 注意：新建数组的每个元素的数据类型需保持一致性。SELECT	array(1,2,2,3,4) AS "array()函数",--	[1,'hello',3], -- 出现异常，DB::Exception: There is no supertype for types UInt8, String, UInt8 because some of them are String/FixedString and some of them are not (version 19.10.1.5 (official build))	[1,2,3,4] AS "[ ]";-- 6.合并N个数组  arrayConcat(arrays) 合并参数中传递的所有数组。跟java的数组差不多的合并，不会自动去重，不会自动排序SELECT	arrayConcat(array(1,2),array(2,3),array(4,5)), -- [1,2,2,3,4,5]（第一种情况）	arrayConcat(array(1,1),array(2,2),array(3,3)), -- [1,1,2,2,3,3]--	arrayConcat(array(1,2),['a','c'],array(3,3)), -- 出现异常，不能将不同类型的数组进行合并	arrayConcat(array(1,1),[2,3],array(4,5)); -- [1,1,2,3,4,5]-- 7.从数组arr中获取索引为“n”的元素。--  n必须是任何整数类型。 数组中的索引从一开始。 支持负索引。在这种情况下，它选择从末尾开始编号的相应元素。例如，arr [-1]是数组中的最后一项。--  如果索引超出数组的边界，则返回默认值（数字为0，字符串为空字符串等）.SELECT	arrayElement(array(10,20,3), 1), -- 10	arrayElement(array(1,20,3), 2), -- 20	arrayElement(array(1,2,30), 3), -- 30	arrayElement(array(10,20,3), 0), -- 0	arrayElement(array(10,20,3), -3), -- 10	arrayElement(array(10,20,3), -2), -- 20	arrayElement(array(10,20,3), -1);-- 3-- 8.检查在数组中是否含有此元素。has(arr, elem)  包含此元素则返回1，否则返回0-- has()  检查'arr'数组是否具有'elem'元素。 如果元素不在数组中，则返回0;如果在，则返回1。-- hasAny(arr1, arr2) 返回1表示arr1和arr2存在交集。否则返回0. --注意：特殊的定义：--		① “NULL”作为数组中的元素值进行处理。--		② 忽略两个数组中的元素值的顺序-- hasAll(set, subset)  检查一个数组是否是另一个数组的子集。返回1，表示set包含subset中所有的元素--    set – 具有一组元素的任何类型的数组。--    subset – 任何类型的数组，其元素应该被测试为set的子集。-- 注意：特殊的定义：--		① 空数组是任何数组的子集。--		② “NULL”作为数组中的元素值进行处理。--		③ 忽略两个数组中的元素值的顺序。SELECT	has([1,2,3], 2), -- 1	has(array(1,2,3),2), -- 1	has([1,2,NULL], NULL), -- 1 (注意：null值的处理)--	has([], 2), -- 出现异常，DB::Exception: Types of array and 2nd argument of function has must be identical up to nullability or numeric types or Enum and numeric type. Passed: Array(Nothing) and UInt8	has([1,2], 3); -- 0SELECT	hasAll([], []), -- 1	hasAll([1,NULL,NULL], [NULL]), -- 1	hasAll([1,2,3], [1,2]), -- 1	hasAll([1,2,2,3], [2]), -- 1	hasAll(array(1,2,2,3), [2]), -- 1	hasAll([1,2,3], [4,5]); -- 0-- 多重数组（如下的二维数组）。SELECT hasAll([[1, 2], [3, 4]], [[1, 2], [3, 5]]); -- 0SELECT	hasAny(array(1,2,3), array(1)), -- 1	hasAny(array(1,2,3), array(1,4,56,80)), -- 1	-- []与array()是一样的含义，本质上是一直的。只不过[]更加简便而已。	hasAny(array(), array()), -- 0	hasAny([],[]), -- 0	hasAny([1],[]), -- 0	-- 空数组跟null不是一样的对象	hasAny([1,NULL],[]), -- 0	hasAny([1,NULL],[NULL,2]); -- 1	-- 9.返回数组指定元素的索引-- indexOf(arr, x) 返回数组中第一个‘x’元素的索引（从1开始），如果‘x’元素不存在在数组中，则返回0。SELECT indexOf(['one','two','three'], 'one'); -- 1SELECT indexOf([1, 2, 4], 4); -- 3SELECT 	indexOf(['one','two','three'], 'one'), -- 1	indexOf(['one',NULL,NULL], NULL),-- 1返回第一个找到的元素的索引位置	indexOf([1, 2, 4], 4); -- 3-- 数组元素的以第一个和最后一个元素。SELECT length([12,3,4,4,4]);SELECT array(12,22,31)[1];WITH	[23,43,565,2,32,34] AS arrSELECT	arr[1], -- 去除数组中的第一个元素	arr[length(arr)]; -- 提取元素中的最后一个元素	-- 10.计算数组中包含指定元素的个数-- countEqual(arr, x) 返回数组中等于x的元素的个数。相当于arrayCount（elem - > elem = x，arr）。-- 注意：null值将作为单独的元素值处理。SELECT	countEqual([1, 2, 2, 2, 3, 4], 2), -- 3	countEqual([1, 2, NULL, NULL], NULL); -- 2	-- 11.arrayEnumerate(arr)  返回 Array [1, 2, 3, ..., length (arr) ] 此功能通常与ARRAY JOIN一起使用。它允许在应用ARRAY JOIN后为每个数组计算一次。SELECT arrayEnumerate([1,20,20,3]); -- [1,2,3,4]SELECT arrayEnumerate(array(11,20,13)); -- [1,2,3]SELECT arrayEnumerate(array(11,20,13,NULL)); -- [1,2,3,4] 注意：null也算是一个元素。--arrayEnumerateUniq(arr)  返回与源数组大小相同的数组，其中每个元素表示与其下标对应的源数组元素在源数组中出现的次数SELECT arrayEnumerateUniq([1,1,2,2]); -- [1,2]-- 12.删除数组的元素-- arrayPopBack(array) 删除数组array的最后一项SELECT arrayPopBack(array(1,2,3,0)) AS res; -- [1,2,3]-- arrayPopFront(array) 从数组中删除第一项SELECT arrayPopFront(array(0,1,2,3)) AS res; -- [1,2,3]-- 13.添加数组的元素 arrayPushFront(array, single_value) single_value是单个值SELECT arrayPushBack([1,2,3], 0) AS res; --  [1,2,3,0]SELECT arrayPushFront([1,2,3], 0) AS res; --  [0,1,2,3]-- 14.更改数组的长度  arrayResize(arr, size[, extender])-- 如果arr的长度 > size,则会对arr截取size的长度；-- 如果arr的长度 < size，则其余位置用对应数据类型的默认值填充。-- 注意：extender含义是扩展元素的值。如果没有指定extender，则默认按照对应的数据类型的默认值进行赋值。否则按照extender进行填充。SELECT arrayResize([1,2,3], 5); -- [1,2,3,0,0]SELECT arrayResize([1,2,3], 2); -- [1,2]SELECT arrayResize([1,2,3], 3); -- [1,2,3]--↓↓↓ RuntimeException: Parse exception: ByteFragment{[[[1,2],[3,4],[5,6],[],[]]], start=0, len=25}SELECT arrayResize([array(1,2),array(3,4),array(5,6)], 5);SELECT arrayResize([1,2,3], 5, 12); -- [1,2,3,12,12]SELECT arrayResize(['one','two','three'], 5); -- ['one','two','three','','']SELECT arrayResize(['one','two','three'], 5, 'default'); -- ['one','two','three','default','default']-- 15.截取数组的部分元素，得到一个新的子数组-- arraySlice(array, offset[, length])--	解释：--	array: 数组，--	offset – 数组的偏移。正值表示左侧的偏移量，负值表示右侧的缩进值。数组下标从1开始。--	length - 子数组的长度。如果指定负值，则该函数返回[offset，array_length - length。如果省略该值，则该函数返回[offset，the_end_of_array]。SELECT 	arraySlice([1,2,3,4,5,6], 0, 3), -- 无返回值	arraySlice([1,2,NULL,5,6], 1, 3), -- [1,2,0]	arraySlice(['one','two',NULL], 1, 3), -- ['one','two',''] 	arraySlice([1,2,3,4,5,6], 1, 3); -- [1,2,3] 	 	-- 16.数组排序：arraySort([func,] arr, ……)-- 注意：如果在字符串数组中，''和NULL是需要特别对待的，''需要放在最前面，而NULL则是按顺序存放到最后的。-- arraySort是高阶函数。您可以将lambda函数作为第一个参数传递给它。在这种情况下，排序顺序由lambda函数的调用结果决定。SELECT 	arraySort(['a','',NULL,'c','b']) AS hasNullempty1, --['','a','b','c','']  (第一个是'',最后一个''起始是NULL)	arraySort(array('ac','ab','bc','ad',NULL)) AS hasNull, -- ['ab','ac','ad','bc','']	arraySort(array('ac','','ab',NULL,'bc','ad',NULL)) AS hasNullempty2, -- ['','ab','ac','ad','bc','','']	arraySort([5,4,3,2,1]) AS numSorted,-- [1,2,3,4,5] (数字排序)	arraySort(['ca','bb','ac']) AS strSorted;-- ['ac','bb','ca'] (字符串排序)SELECT 	arraySort([NULL, 1, 3, NULL, 2]) AS sortedArr, -- [1,2,3,0,0]	arrayReverse(sortedArr) AS reverseSortdArr;-- [0,0,3,2,1]-- 下面这种排序的实质，正数转成负数，再在数学上比较升序排序。SELECT arraySort(x -> -x, [1,2,3]) as res; -- [3,2,1] 降序：（高阶函数用法）SELECT arraySort((x) -> -x, [1,2,3]) as res; -- [3,2,1] 降序：（高阶函数用法）SELECT arraySort(x -> x, [5,4,3,1,2,3]) as res; -- [1,2,3,3,4,5] 升序：（高阶函数用法）SELECT arraySort((x) -> x, [5,4,3,1,2,3]) as res; -- [1,2,3,3,4,5] 升序：（高阶函数用法）-- arraySort(lambda, arr1, arr2) SELECT arraySort((x, y) -> y, ['hello', 'world'], [2, 1]) as res; -- ['world','hello']SELECT arraySort((x, y) -> -y, [0, 1, 2], [1, 2, 3]) as res; -- [2,1,0]-- 再次提醒：NULL, NaN, Inf的排序顺序：--	含义：--	    -Inf 是数组中的第一个。--	    NULL 是数组中的最后一个。--	    NaN  在NULL的前面。--	    Inf  在NaN的前面。-- 出现异常：RuntimeException: Parse exception: -- 	ByteFragment{[[-inf,-4,1,2,3,inf,nan,nan,NULL,NULL]], start=0, len=37}SELECT arraySort([1, nan, 2, NULL, 3, nan, -4, NULL, inf, -inf]);-- 17.数组翻转：arrayReverse([func,] arr, ……)-- 如果是NULL的话在排序的过程中，根据数组的数据类型进行默认值填充。SELECT	arrayReverse(array('a','b','c',NULL)) AS hasOneNull, -- ['','c','b','a']	arrayReverse(array('ac','ab','bc','ad',NULL)) AS hasNull, -- ['','ad','bc','ab','ac']	--网格视图： ['[NULL]','ad','bc','','ab','[NULL]','','ac']；文本视图 ：['','ad','bc','','ab','','','ac']	arrayReverse(array('ac','',NULL,'ab','','bc','ad',NULL)) AS hasNullEmpty, 	arrayReverse(array(NULL, 3, NULL, 2, 1)),-- [1,2,0,3,0]	arrayReverse([1,2,3,4]);-- [4,3,2,1]-- 18.数组排序并翻转：arraySort([func,] arr, ...)SELECT arrayReverseSort([1, 3, 3, 0]); -- [3,3,1,0]SELECT arrayReverseSort(['hello', 'world', '!']); -- ['world','hello','!']--RuntimeException: Parse exception: ByteFragment{[[inf,3,2,1,-4,-inf,nan,nan,NULL,NULL]], start=0, len=37}SELECT arrayReverseSort([1, nan, 2, NULL, 3, nan, -4, NULL, inf, -inf]) as res;-- [inf,3,2,1,-4,-inf,nan,nan,NULL,NULL]-- 下面的执行顺序为：--    1.首先，根据lambda函数的调用结果对源数组（[1, 2, 3]）进行排序。 结果是[3, 2, 1]。--    2.反转上一步获得的数组。 所以，最终的结果是[1, 2, 3]。SELECT arrayReverseSort((x) -> -x, [1, 2, 3]) as res; -- [1,2,3]SELECT arrayReverseSort((x) -> x, [1, 2, 3]) as res; -- [1,2,3]-- 下面的执行顺序为：--    1.首先，根据lambda函数的调用结果对源数组（['hello'，'world']）进行排序。 其中，在第二个数组（[2,1]）中定义了源数组中相应元素的排序键。 所以，排序结果['world'，'hello']。--    2.反转上一步骤中获得的排序数组。 所以，最终的结果是['hello'，'world']。SELECT arrayReverseSort((x, y) -> y, ['hello', 'world'], [2, 1]) as res;-- ['hello','world']SELECT arrayReverseSort((x, y) -> -y, ['hello', 'world'], [2, 1]) as res;-- ['world','hello']SELECT arrayReverseSort((x, y) -> x, ['hello', 'world'], [2, 1]) as res;-- ['world','hello']--出现异常：Illegal type String of argument --SELECT arrayReverseSort((x, y) -> -x, ['hello', 'world'], [2, 1]) as res;SELECT arrayReverseSort((x, y) -> x, ['hello', 'world'], [1, 2]) as res;-- ['world','hello']-- 19.统计数组中不重复元素的个数。arrayUniq(arr,……)-- ① 如果传递一个参数，则计算数组中不同元素的数量。-- ② 如果传递了多个参数，则它计算多个数组中相应位置的不同元素元组的数量SELECT	arrayUniq([1,2,3]), -- 3	arrayUniq([1,2,2,2,3]); -- 3SELECT	arrayUniq([1,2,3],[2,3,4]),	arrayUniq([1,2,2],[1,3,3]);-- 20.数组的特殊功能：arrayJoin(arr)  这是一个非常有用的函数。-- 解释：此函数将数组作为参数，并将该行在结果集中复制数组元素个数SELECT arrayJoin([1, 2, 3] AS src) AS dst, 'Hello', src; -- 每个元素扩大两倍；SELECT arrayJoin([1,2,3]) * 2;SELECT arrayJoin([-1,-2,0,1,2]) * 2;--出现异常： Illegal types Array(UInt8) and Array(UInt8) of arguments of function multiply--SELECT multiply(array(1,2,3), 2); SELECT multiply(arrayJoin([-1,-2,0,1,2]), 2); -- 每个元素缩小两倍SELECT arrayJoin([-4,-2,0,2,4]) / 2;SELECT divide(arrayJoin([-4,-2,0,2,4]) , 2);-- 21.arrayDifference(arr)-- 返回一个数组，其中包含所有相邻元素对之间的差值SELECT arrayDifference([1,2,3,4]);-- [0,1,1,1]SELECT arrayDifference([1,3,10,50]);-- [0,2,7,40]-- 22. arrayDistinct(arr)返回一个包含所有数组中不同元素的数组.-- 类似于java的Set集合，对list集合进行去重。SELECT arrayDistinct(array(1,2,3,4,4,4)); -- [1,2,3,4]SELECT arrayDistinct([1,2,2,3,4,2,2,5,4,5]); -- [1,2,3,4,5]SELECT arrayDistinct(array(0,1,NULL,3,4,4,4)); -- [0,1,3,4]-- 数组去重统计元素个数SELECT uniq(arrayJoin([1,2,3,6,3])); -- 4 表示数组去重后元素的个数SELECT uniqArray([1,2,3,4,1,2,3,4]); -- 4 表示数组去重后元素的个数-- 数组元素累计SELECT sumArray([1,2,3,4,5]);-- 15SELECT sum(arraySum([1,2,3,4,5])); -- 15-- 23. arrayEnumerateDense(arr) 返回与源数组大小相同的数组，指示每个元素首次出现在源数组中的位置SELECT 	arrayEnumerateDense([10,20,20,10,30]) AS numArrEnumDense,-- [1,2,2,1,3]	-- [1,1,2,3,4,1,3,5,5]	arrayEnumerateDense([10,10,2,12,3,10,12,NULL,NULL]) as arrEnumDenseHasNull,	-- [1,2,1,1,2,3]	arrayEnumerateDense([10,20,10,10,20,30]) AS arrEnumDese2;-- 24. arrayIntersect(arr,……) 返回所有数组元素的交集。-- 如果arr的数目只有一个，则返回它本身；如果有多个数组,则返回所有数组中元素的交集。SELECT	-- 注意：最后得到的数组元素的顺序。（有什么影响吗？）	arrayIntersect(['one','two'],['one','two','three']) as uniStrArr1, -- ['two','one']	arrayIntersect(['aaa','bbb'],['bbb','aaa','three']) as uniStrArr2, -- ['bbb','aaa']	arrayIntersect([1,2],[1,2,3]) as uniArr1, -- [1,2]	arrayIntersect([1,2],[1,2,3],[2,3,4],[2,3,4]) as uniArr2; -- 2SELECT 	arrayIntersect([1,2], [3,4]), -- []	arrayIntersect([1,2]);-- [1,2]-- 25.arrayReduce(agg_func, arr1, ...)-- agg_func 为聚合函数，传入到数组当中。-- 将聚合函数应用于数组并返回其结果.如果聚合函数具有多个参数，则此函数可应用于相同大小的多个数组。SELECT	arrayReduce('max', [1,2,3]) AS minNum,--最大值 3	arrayReduce('min', [1,2,3]) AS maxNum,--最小值 1	arrayReduce('sum', [1,2,3]) AS sumNum;--求和 6-- 十三、 字符串查分合并函数--->>>>>> 字符串拆分合并函数-- 1.splitByChar(separator, s) 将字符串以‘separator’拆分成多个子串。-- ‘separator’必须为仅包含一个字符的字符串常量。 返回拆分后的子串的数组。--  如果分隔符出现在字符串的开头或结尾，或者如果有多个连续的分隔符，则将在对应位置填充空的子串。SELECT splitByChar(',', 'hello,world!'); -- ['hello','world!']--下面异常：Illegal separator for function splitByChar. Must be exactly one byte.--SELECT splitByChar('or', 'hello,world!');-- 2.splitByString(separator, s)-- 与上面相同，但它使用多个字符的字符串作为分隔符。 该字符串必须为非空SELECT splitByString('or','goodorniceorgreat'); -- ['good','nice','great']-- 3.alphaTokens(s)  从范围a-z和A-Z中选择连续字节的子字符串。返回子字符串数组SELECT alphaTokens('abca1abc'); -- ['abca','abc']SELECT alphaTokens('abc1232abc2wer3rtty'); -- ['abc','abc','wer','rtty']-- 4.数组元素合并函数：arrayStringConcat(arr[, sparator])-- 使用separator将数组中列出的字符串拼接起来。-- ‘separator’是一个可选参数：一个常量字符串，默认情况下设置为空字符串。 返回拼接后的字符串SELECT arrayStringConcat([1,2,3], '-'); -- 出现异常，要求数组必须是字符串string类型的元素SELECT arrayStringConcat(['one','two','three']); -- onetwothreeSELECT arrayStringConcat(['one','two','three'], '-'); -- one-two-threeSELECT arrayStringConcat(['one','two','three',''], '-');--  one-two-three- 注意：NULL不能存在arr中--十四、位操作符--->>>>>> 位操作符--位操作函数适用于UInt8，UInt16，UInt32，UInt64，Int8，Int16，Int32，Int64，Float32或Float64中的任何类型。--结果类型是一个整数，其位数等于其参数的最大位。--如果至少有一个参数为有符数字，则结果为有符数字。如果参数是浮点数，则将其强制转换为Int64。SELECT	bitAnd(1,0), -- 0	bitAnd(1,1), -- 1	bitAnd(1,2), -- 0	bitAnd(-1,0), -- 0	bitAnd(-1,-2), -- -2	bitAnd(-10,-1), -- -10	bitOr(1,2), -- 3	bitOr(1,0), -- 1	bitOr(2,0), -- 2	bitOr(0,2); -- 2SELECT bitXor(1, 2), bitXor(20, 15), bitNot(2);-- 3 27 253--十五、Hash函数：可以用于将元素不可逆的伪随机打乱。-- 注意：伪随机！SELECT 	-- 计算字符串的MD5值。（ 如果您不需要一定使用MD5，请使用‘sipHash64’函数。）	halfMD5('HELLO WORLD!'),	halfMD5(12);SELECT 	MD5('drew-zero,78967');SELECT 	-- 为任何类型的整数计算32位的哈希。 这是相对高效的非加密Hash函数	intHash32(1221232132132) AS intHash32,	-- 推荐：从任何类型的整数计算64位哈希码。 它的工作速度比intHash32函数快。	intHash64(1221232132132) AS intHash64,	-- 计算任意数量字符串的CityHash64或使用特定实现的Hash函数计算任意数量其他类型的Hash。	cityHash64('username') AS cityHash64,	-- 1.使用sha1或者sha224加密的话，只能用于字符串	-- 2.字符串 需使用单引号。	SHA1('1232131') AS sha1,	SHA224('1232131') AS sha224,	SHA256('DREW-ZERO') AS sha256;-- URLHash(url[, N]) 一种快速的非加密哈希函数，用于规范化的从URL获得的字符串--  从一个字符串计算一个哈希，如果结尾存在尾随符号/，？或#则忽略。 URLHash（s，N） -- 计算URL层次结构中字符串到N级别的哈希值，如果末尾存在尾随符号/，？或#则忽略。 URL的层级与URLHierarchy中的层级相同-- 用处：此函数被用于Yandex.Metrica。SELECT	URLHash('www.baidu.com'), 	 -- 11390370829909720855	URLHash('www.baidu.com', 0), -- 11390370829909720855	-- 	URLHash('www.baidu.com', 1); -- 11160318154034397263-- farmHash64(s)  计算字符串的FarmHash64。 接受一个String类型的参数。返回UInt64。SELECT farmHash64('www.runoob.com'); -- 6668483584160323388-- javaHash(s) 计算字符串的JavaHash。 接受一个String类型的参数。返回Int32。SELECT javaHash('www.baidu.com'); -- 270263191-- hiveHash(s) 计算字符串的HiveHash。 接受一个String类型的参数。返回Int32。 与JavaHash相同，但不会返回负数SELECT hiveHash('www.baidu.com'); -- 270263191--十六、随机函数--->>>>>> 随机函数-- 解释：随机函数使用非加密方式生成【伪随机】数字。-- ① 所有随机函数都只接受一个参数或不接受任何参数。-- ② 您可以向它传递任何类型的参数，但传递的参数将不会使用在任何随机数生成过程中。-- ③  此参数的唯一目的是防止公共子表达式消除，以便在相同的查询中使用相同的随机函数生成不同的随机数-- rand() 函数：返回一个UInt32类型的随机数字，所有UInt32类型的数字被生成的概率均相等。-- rand64() 函数：返回一个UInt64类型的随机数字，所有UInt64类型的数字被生成的概率均相等。-- randConstant() 函数：返回一个UInt32类型的随机数字，该函数不同之处在于仅为每个数据块参数一个随机数。SELECT 	rand(), -- 1751687411	rand(10), -- 1124981728	rand64(),	rand64(10),	randConstant(),	randConstant();-- 十七、编码函数：-- hex(), unhex(), UUIDStringToNum(str), UUIDNumToString(str),bitmaskToList(num) ...-- 1.hex函数编码SELECT	-- 68656C6C6F20776F726C64212C68656C6C6F20636C69636B686F757365	hex('hello world!,hello clickhouse') AS hexStr,	hex(now()) AS hexDatetime, -- 5D414BA2	hex(toDate(now())) AS hexDate; --46BC	-- 2.接受包含36个字符的字符串，格式为“123e4567-e89b-12d3-a456-426655440000”，并将其转化为FixedString（16）返回SELECT UUIDStringToNum('123e4567-e89b-12d3-a456-426655440000');-- 3. 接受一个整数。返回一个UInt64类型数组，其中包含一组2的幂列表，其列表中的所有值相加等于这个整数。数组中的数字按升序排列。-- bitmaskToArray(num)SELECT bitmaskToArray(10); -- [2,8]SELECT bitmaskToArray(100); -- [4,32,64]-- 4.接受一个整数。返回一个字符串，其中包含一组2的幂列表，其列表中的所有值相加等于这个整数。列表使用逗号分割，按升序排列。-- bitmaskToList(num) SELECT bitmaskToList(10); -- 2,8SELECT bitmaskToList(100); -- 4,32,64SELECT bitmaskToList(0); -- '' 空字符串--十八、UUID函数--->>>>>> UUID函数-- 1.generateUUIDv4()  返回 UUID类型的值。SELECT generateUUIDv4() as randomUUID; -- 随机生成一个UUIDv4的字符串（b6940dfe-0dc9-4788-bac7-319d13235a2e）SELECT replaceAll(toString(generateUUIDv4()), '-', '') AS replaceUUID; -- 9d1947ea4fcf450da5391feb6142cab6-- 2.toUUID(s) 将string类型的值 转换成UUID类型的值SELECT toUUID('61f0c404-5cb3-11e7-907b-a6006ad3dba0') AS uuid;-- 3.接受一个String类型的值，其中包含36个字符且格式为xxxxxxxx-xxxx-xxxx-xxxx-xxxxxxxxxxxx，--   将其转换为UUID的数值并以FixedString(16)将其返回。SELECT    '612f3c40-5d3b-217e-707b-6a546a3d7b29' AS uuid, -- 612f3c40-5d3b-217e-707b-6a546a3d7b29    UUIDStringToNum(uuid) AS bytes; --a/<@];!~p{jTj={)    -- 4. UUIDNumToString() 接受一个FixedString(16)类型的值，返回其对应的String表现形式。SELECT 'a/<@];!~p{jTj={)' AS bytes,    UUIDNumToString(toFixedString(bytes, 16)) AS uuid;--- 二十、 URL函数：所有这些功能都不遵循RFC。它们被最大程度简化以提高性能。--- 什么事RFC？----  Request For Comments（RFC），是一系列以编号排定的文件。文件收集了有关互联网相关信息，以及UNIX和互联网社区的软件文件。-- 1. 截取函数：如果URL中没有要截取的内容则返回空字符串。SELECT protocol('http://www.baidu.com');-- httpSELECT protocol('https://www.baidu.com');-- httpsSELECT protocol('www.baidu.com');-- ''-- 获取域名。SELECT domain('http://www.baidu.com'); -- www.baidu.comSELECT domain('https://www.google.com.cn'); -- www.google.com.cn-- 返回域名并删除第一个‘www.’SELECT domainWithoutWWW('http://www.baidu.com');-- baidu.comSELECT domainWithoutWWW('www.baidu.com');-- ''-- 返回顶级域名。例如：.ruSELECT topLevelDomain('http://www.runoob.com.cn'); -- cnSELECT topLevelDomain('https://www.huse.edn'); -- edu-- 返回“第一个有效子域名”--	如果顶级域名为‘com’，‘net’，‘org’或者‘co’则第一个有效子域名为二级域名。否则则返回三级域名SELECT firstSignificantSubdomain('https://news.yandex.com.tr/'); -- yandex-- 返回包含顶级域名与第一个有效子域名之间的内容(参阅上面内容)SELECT cutToFirstSignificantSubdomain('https://news.yandex.com.tr/'); -- yandex.com.tr-- 返回URL路径SELECT path('https://blog.csdn.net/u012111465/article/details/85250030');-- /u012111465/article/details/85250030-- 与上面相同，但包括请求参数和fragment。SELECT pathFull('https://clickhouse.yandex/#quick-start'); -- /#quick-start-- 返回请求参数。例如：page=1&lr=213。请求参数不包含问号已经# 以及# 之后所有的内容。SELECT queryString('http://www.baidu.com/?page=1&lr=234'); -- page=1&lr=234 (根据？确定)SELECT queryString('http://www.baidu.com/page=1&lr=234'); -- ''-- 返回URL的fragment标识。fragment不包含#。SELECT fragment('https://clickhouse.yandex/#quick-start'); -- quick-start-- 返回请求参数和fragment标识。例如：page=1#29390。SELECT queryStringAndFragment('https://www.baidu.com/s?ie=utf-8&rsv_sug7=100#ei-ai'); -- ie=utf-8&rsv_sug7=100#ei-ai-- 2. 删除URL中的部分内容 (如果URL中不包含指定的部分，则URL不变。)SELECT cutWWW('www.baidu.com');-- www.baidu.comSELECT cutWWW('https://www.baidu.com');-- www.baidu.comSELECT cutWWW('https://www.baidu.com');-- www.baidu.com-- 删除请求参数SELECT cutQueryString('http://www.baidu.com/1?page=1'); -- http://www.baidu.com/1-- 删除fragment标识。#同样也会被删除。SELECT cutFragment('http://www.baidu.com/#quick-demo'); -- http://www.baidu.com/-- 删除请求参数以及fragment标识。问号以及#也会被删除。SELECT cutQueryStringAndFragment('http://www.baidu.com/1?page=23#we'); -- http://www.baidu.com/1-- cutURLParameter(URL, name) 删除URL中名称为‘name’的参数。下面例子中的参数是：&之后，resv,nameSELECT cutURLParameter('http://www.baidu.com/1?page=1#erre&resv=23&name=user','resv');--二十一、IP函数 --二十二、条件函数SELECT IF(12 > 10 , 12, 20);SELECT 12 > 10 ? 12 : 10;SELECT if(greater(12, 10), 12, 10); --二十三、操作符函数替换-- clickhouse自带的计算操作符函数（对接mybatis的时候不用将“<”之类的符号转换成 “age1 ”）-- 1.等于(注意函数名称的大小，严格区分大小写)SELECT	equals('hello','hello'), -- 1	equals('ab','ba'); -- 0-- 2.不等于SELECT 	notEquals('a','b'), -- 1	notEquals('a','a'), -- 0	notEquals(12, 12), -- 1	notEquals(12, 1010); -- 0-- 3.大于( 如果前者大于后者，则返回1；否则返回0)SELECT	greater(12, 10), -- 1 	greater(10, 12), -- 0	greater(12, 12), -- 0	greater('b','a'), -- 1	greater('a','b'); -- 0-- 3.1 扩展：提取两者中最大的值SELECT greatest(12,11); -- 12-- 4.小于（如果前者小于后者，则返回1；否则返回0）SELECT less(12,23); -- 1SELECT less(120,23); -- 0-- 5.大于或等于SELECT greaterOrEquals(12,12); -- 1SELECT greaterOrEquals(120,12); -- 1-- 6.小于或等于SELECT lessOrEquals(12,12); -- 1SELECT lessOrEquals(12,129); -- 1-- ===== String操作-- *. a LIKE sSELECT like('a', 'abcd'); -- 0SELECT like('a', 'a'); -- 1

你可能感兴趣的:(笔记)

C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
基于链家网的二手房数据采集清洗与可视化分析 Mint_Datazzh 项目 selenium 网络爬虫
个人学习内容笔记，仅供参考。项目链接：https://gitee.com/rongwu651/lianjia原文链接：基于链家网的二手房数据采集清洗与可视化分析–笔墨云烟研究内容该课题的主要目的是通过将二手房网站上的存量与已销售房源，构建一个二手房市场行情情况与房源特点的可视化平台。该平台通过HTML架构和Echarts完成可视化的搭建。因此，该课题的主要研究内容就是如何利用相关技术设计并实现这样
算法学习笔记：17.蒙特卡洛算法 ——从原理到实战，涵盖 LeetCode 与考研 408 例题
在计算机科学和数学领域，蒙特卡洛算法（MonteCarloAlgorithm）以其独特的随机抽样思想，成为解决复杂问题的有力工具。从圆周率的计算到金融风险评估，从物理模拟到人工智能，蒙特卡洛算法都发挥着不可替代的作用。本文将深入剖析蒙特卡洛算法的思想、解题思路，结合实际应用场景与Java代码实现，并融入考研408的相关考点，穿插图片辅助理解，帮助你全面掌握这一重要算法。蒙特卡洛算法的基本概念蒙特卡
分布式学习笔记_04_复制模型 NzuCRAS 分布式学习笔记架构后端
常见复制模型使用复制的目的在分布式系统中，数据通常需要被分布在多台机器上，主要为了达到：拓展性：数据量因读写负载巨大，一台机器无法承载，数据分散在多台机器上仍然可以有效地进行负载均衡，达到灵活的横向拓展高容错&高可用：在分布式系统中单机故障是常态，在单机故障的情况下希望整体系统仍然能够正常工作，这时候就需要数据在多台机器上做冗余，在遇到单机故障时能够让其他机器接管统一的用户体验：如果系统客户端分布
算法学习笔记：15.二分查找 ——从原理到实战，涵盖 LeetCode 与考研 408 例题呆呆企鹅仔算法学习算法学习笔记考研二分查找
在计算机科学的查找算法中，二分查找以其高效性占据着重要地位。它利用数据的有序性，通过不断缩小查找范围，将原本需要线性时间的查找过程优化为对数时间，成为处理大规模有序数据查找问题的首选算法。二分查找的基本概念二分查找（BinarySearch），又称折半查找，是一种在有序数据集合中查找特定元素的高效算法。其核心原理是：通过不断将查找范围减半，快速定位目标元素。与线性查找逐个遍历元素不同，二分查找依赖
入门html这篇文章就够了 ξ流ぁ星ぷ132 html 前端
HTML笔记文章目录HTML笔记html介绍什么是htmlhtml的作用HTML标签介绍常用标签标签and标签and标签u标签del删除线br标签用于换行pre标签，预处理标签span标签div标签sub标签andsup标签hr标签h1,h2...h6标签：HTML5中的语义标签：特殊字符img标签a标签第一种用法：超链接第二种用法：锚点video标签表格标签：form标签input标签selec
OKHttp3源码分析——学习笔记 Sincerity_ 源码相关 Okhttp 源码解析读书笔记 httpclient cache
文章目录1.HttpClient与HttpUrlConnection的区别2.OKHttp源码分析使用步骤:dispatcher任务调度器,（后面有详细说明）Request请求RealCallAsyncCall3.OKHttp架构分析1.异步请求线程池,Dispather2.连接池清理线程池-ConnectionPool3.缓存整理线程池DisLruCache4.Http2异步事务线程池,http
vue3面试题(个人笔记) 武昌库里写JAVA 面试题汇总与解析课程设计 spring boot vue.js java 学习
vue3比vue2有什么优势？性能更好，打包体积更小，更好的ts支持，更好的代码组织，更好的逻辑抽离，更多的新功能。描述Vue3生命周期CompositionAPI的生命周期：onMounted()onUpdated()onUnmounted()onBeforeMount()onBeforeUpdate()onBeforeUnmount()onErrorCaptured()onRenderTrac
Python学习笔记5|条件语句和循环语句 iamecho9 Python从0到1学习笔记 python 学习笔记
一、条件语句条件语句用于根据不同的条件执行不同的代码块。1、if语句基本语法：if布尔型语句1:代码块#语句1为True时执行的代码示例：age=int(input("请输入你的年龄:"))ifage>=18:print("你已成年")2、if-else语句如果if条件不成立，则执行else代码块：if布尔型语句1:代码块#语句1为True时执行的代码else:代码块#语句1为False时执行的代
swagger【个人笔记】撰卢笔记 java
文章目录swagger导入mave坐标在配置类(WebMvcConfiguration)中加入knife4j相关配置设置静态资源映射，主要是让拦截器放行swagger常用注解@Api(tags="\[描述这个类的作用]")@ApiModel(description="\[描述这个类的作用]")@ApiModelProPerty("描述这个类的作用")@ApiOperation("\[描述方法的作用
【个人笔记】负载均衡撰卢笔记负载均衡运维
文章目录nginx反向代理的好处负载均衡负载均很的配置方式均衡负载的方式nginx反向代理的好处提高访问速度进行负载均衡保证后端服务安全负载均衡负载均衡，就是把大量的请求按照我们指定的方式均衡的分配给集群中的每台服务器负载均很的配置方式upstreamwebservers{server192.168.100.128:8080server192.168.100.129:8080}server{lis
在 Obsidian 中本地使用 DeepSeek — 无需互联网！知识大胖 NVIDIA GPU和大语言模型开发教程人工智能 deepseek
简介您是否想在Obsidian内免费使用类似于ChatGPT的本地LLM？如果是，那么本指南适合您！我将引导您完成在Obsidian中安装和使用DeepSeek-R1模型的确切步骤，这样您就可以在笔记中拥有一个由AI驱动的第二大脑。推荐文章《24GBGPU中的DeepSeekR1：UnslothAI针对671B参数模型进行动态量化》权重1，DeepSeek类《在RaspberryPi上运行语音识别
5G标准学习笔记14 - CSI--RS概述刘孬孬沉迷学习 5G 学习笔记信息与通信
5G标准学习笔记14-CSI–RS概述大家好~，这里是刘孬孬，今天带着大家一起学习一下5GNR中一个非常非常重要的参考信号------------------CSI-RS信号，CSI-RS不是持续发送，UE只能在网络明确配置了CSI-RS的情况下才能使用其进行信道测量。前言对于CSI-RS，肯定还离不开前面所说的CSI（channelstateinformation），前面也讲过CSI对于MIMO
5G标准学习笔记06-基于AI/ML波束管理刘孬孬沉迷学习 5G 学习笔记
5G标准学习笔记06-基于AI/ML波束管理前言前面对于孬孬学习了波束管理的概述，下面要进一步来看一下传统波束管理和现在3GPP中推动的AL/ML波束管理之前的区别联系。一、传统波束管理方法流程传统BM流程主要包括以下步骤：波束扫描（BeamSweeping）：gNB通过顺序发送多个窄波束（SSB或CSI-RS），覆盖整个服务区域，UE测量每个波束的信号质量（如L1-RSRP或L1-SINR）。波
5G标准学习笔记03- CSI 反馈增强概述刘孬孬沉迷学习 5G 笔记学习
5G标准学习笔记03-CSI反馈增强概述大家好，最近在研究AI/ML3gpp标准NR空口的有关内容，后面可能会给大家介绍一下对应的有关内容AI/ML在3GPP标准中的研究进展在AI/ML在NR空口的应用中，对应标准主要聚焦了3个case进行讨论研究分别是：CSI反馈增强；波束管理；定位精度增强；这三个内容可能比较涉及RAN1/2的具体内容，后面会基于这个进行一定的介绍。今天主要是主要介绍CSI反馈
运维笔记＜4＞ xxl-job打通 GeminiJM 运维 java xxl-job
新的一天，来点新的运维业务，今天是xxl-job的打通其实在非集群中，xxl-job的使用相对是比较简单的，相信很多人都有使用的经验这次我们的业务场景是在k8s集群中，用xxl-job来做定时调度加上第一次倒腾，也是遇到了不少问题，在这里做一些记录1.xxl-job的集群安装首先是xxl-job的集群安装先贴上xxl-jobsql初始化文件的地址：xxl-job/doc/db/tables_xxl
两台pc如何高速度传输大文件费城之鹰其他两台电脑高速传输文件局域网不适用U盘传输资料网线直连两台电脑传资料
今天笔记本跑一个大一点的项目，8G的内存直接100%，i5的CPU直接75%并且在超频工作了，原本1.6Ghz的频率直接飙到了3.8Ghz，由于项目性质原因，采用的是公司配的笔记本，但是年初采购的联想E480，还在三包时间段内，公司不允许拆机增加内存，只能换一台新的台式机，听起来挺爽，有新设备，但是办公区域不准使用U盘这一类的存储设备，这就蛋疼了，大半年了项目代码，资料全在这个不够用的笔记本里，问
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图宁儿数据安全 #机器学习学习笔记 matplotlib
学习笔记(33):matplotlib绘制简单图表-绘制混淆矩阵热图一、绘制混淆矩阵热图代码解析1.1、导入必要的库importmatplotlib.pyplotaspltfromsklearn.metricsimportconfusion_matriximportseabornassnsmatplotlib.pyplot：Python中最常用的绘图库，用于创建各种图表confusion_matr
玩转Docker | 使用Docker部署NotepadMX笔记应用程序心随_风动玩转Docker docker 笔记 eureka
玩转Docker|使用Docker部署NotepadMX笔记应用程序前言一、NotepadMX介绍工具简介主要特点二、系统要求环境要求环境检查Docker版本检查检查操作系统版本三、部署NotepadMX服务下载NotepadMX镜像编辑部署文件创建容器检查容器状态检查服务端口安全设置四、访问NotepadMX服务访问NotepadMX首页设置访问验证编辑笔记总结前言在如今快节奏的工作与学习中，一
【前端】异步任务风控验证与轮询机制技术方案（通用笔记版）
一、背景场景在某类生成任务中，例如用户点击“执行任务”按钮后触发一个较耗时的后端操作（如生成报告、渲染图像、转码视频等），由于其调用了模型、渲染服务或需要较长处理时间，为了防止接口被频繁恶意调用，系统需要加入风控验证机制。此外，因任务处理为异步，前端无法立即获得最终结果，因此需通过轮询方式定期查询任务状态，等待任务完成后展示结果。二、整体流程说明1.用户点击“执行任务”按钮：前端调用风控接口/ap
数据分析案例-电脑笔记本价格数据可视化分析3 艾派森数据分析信息可视化 python 数据分析数据挖掘电脑
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+目录1.项目背景2.数据集介绍3.技术工具
LLaMA 学习笔记 AI算法网奇深度学习基础人工智能深度学习
目录LLaMA模型结构：模型微调手册：推理示例：指定位置加载模型测试ok：模型下载：llama-stack下载modelscope下载LLaMA优化技术RMSNormSwiGLU激活函数旋转位置编码（RoPE）LLaMA模型结构：llama3结构详解-CSDN博客模型微调手册：大模型微调LLaMA详细指南（准备环境、数据、配置微调参数+微调过程）_llama微调-CSDN博客显存占用：FP16/B
BOOT_KEY按键（学习笔记）小高Baby@ 学习笔记
先来让我们了解一下GPIO是什么吧，它在单片机中也有很重要的作用，接下来我们来看看吧。esp32C3是QFN32封装（一种集成电路（IC）封装类型），GPIO引脚一共有22个，从GPIO-0到GPIO-21。从理论上来说，所有的IO引脚都可以复用为任何外设功能，但有些引脚用作连接芯片内部FLASH或者外部FLASH功能时，官方不建议用作其它用途。esp32c3的GPIO，可以用作输入、输出，可以配
多线程在Java项目中的使用案例(笔记) 车车不吃香菇 java基础 java
多线程在Java项目中的使用案例(笔记)实现runnable接口@OverridepublicBooleanaddMeetingExpertIds(MeetAddExpertDtomeetAddExpertDto,LonguserId){//会议关联到专家//如果需要发给专家newThread(newRunnable(){@Overridepublicvoidrun(){try{if(meetAd
【机器学习笔记Ⅰ】9 特征缩放巴伦是只猫机器学习机器学习笔记人工智能
特征缩放（FeatureScaling）详解特征缩放是机器学习数据预处理的关键步骤，旨在将不同特征的数值范围统一到相近的尺度，从而加速模型训练、提升性能并避免某些特征主导模型。1.为什么需要特征缩放？(1)问题背景量纲不一致：例如：特征1：年龄（范围0-100）特征2：收入（范围0-1,000,000）梯度下降的困境：量纲大的特征（如收入）会导致梯度更新方向偏离最优路径，收敛缓慢。量纲小的特征（如
Kotlin学习笔记 qq_26907861
1.Val和Varval:用于声明不可变量,不可变是指引用不可变;var:用于声明可变的变量;packagehello//可选的包头funmain(args:Array){//包级可见的函数，接受一个字符串数组作为参数vala="不可变的变量"//不可变的变量varn=2//可变println(a)println(n)}2.fun函数Kotlin中的函数可以这样声明:fun函数名(参数列表):返回
扔物线--Kotlin协程训练营2期-2
笔记仅做自己学习用，方便自己复习知识。若正好可以帮助到Viewer，万分欣喜~若博客侵权，扔物线大大不允许放上面，麻烦告知本文是扔物线Kotlin第二期协程训练营的第二篇文章没看过第一篇文章的可以先看第一篇：https://blog.csdn.net/bluerheaven/article/details/106969835目录一、Retrofit对协程的支持二、Retrofit和RxJava的结
20250707-3-Kubernetes 核心概念-有了Docker，为什么还用K8s_笔记 Andy杨 CKA-专栏 kubernetes docker 笔记
一、Kubernetes核心概念1.有了Docker，为什么还用Kubernetes1）企业需求独立性问题：Docker容器本质上是独立存在的，多个容器跨主机提供服务时缺乏统一管理机制负载均衡需求：为提高业务并发和高可用，企业会使用多台服务器部署多个容器实例，但Docker本身不具备负载均衡能力管理复杂度：随着Docker主机和容器数量增加，面临部署、升级、监控等统一管理难题运维效率：单机升
20250707-4-Kubernetes 集群部署、配置和验证-K8s基本资源概念初_笔记
一、kubeconfig配置文件文件作用:kubectl使用kubeconfig认证文件连接K8s集群生成方式:使用kubectlconfig指令生成核心字段:clusters:定义集群信息，包括证书和服务端地址contexts:定义上下文，关联集群和用户users:定义客户端认证信息current-context:指定当前使用的上下文二、Kubernetes弃用Docker1.弃用背景原因:
麒麟系统离线安装docker
随着CentOS全面停服，国产操作系统会慢慢代替centos系统，在后续的项目中，项目部署的环境都必将是国产操作系统，本文就国产操作系统下如何离线安装docker,做下笔记分享一、材料准备1、国产操作系统麒麟10，arm64v82、dokcer部署包（版本：docker-18.09.tgz）3、部署docker脚本（docker.service），已经启动命令脚本（install.sh）二、编写d
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc