赵延东的一亩三分地

【SQL开发实战技巧】系列（十）：从拆分字符串、替换字符串以及统计字符串出现次数说起

系列文章目录

【SQL开发实战技巧】系列（一）:关于SQL不得不说的那些事
【SQL开发实战技巧】系列（二）：简单单表查询
【SQL开发实战技巧】系列（三）：SQL排序的那些事
【SQL开发实战技巧】系列（四）：从执行计划讨论UNION ALL与空字符串&UNION与OR的使用注意事项
【SQL开发实战技巧】系列（五）：从执行计划看IN、EXISTS 和 INNER JOIN效率，我们要分场景不要死记网上结论
【SQL开发实战技巧】系列（六）：从执行计划看NOT IN、NOT EXISTS 和 LEFT JOIN效率，记住内外关联条件不要乱放
【SQL开发实战技巧】系列（七）：从有重复数据前提下如何比较出两个表中的差异数据及对应条数聊起
【SQL开发实战技巧】系列（八）：聊聊如何插入数据时比约束更灵活的限制数据插入以及怎么一个insert语句同时插入多张表
【SQL开发实战技巧】系列（九）：一个update误把其他列数据更新成空了？Merge改写update！给你五种删除重复数据的写法！
【SQL开发实战技巧】系列（十）：从拆分字符串、替换字符串以及统计字符串出现次数说起
【SQL开发实战技巧】系列（十一）：拿几个案例讲讲translate|regexp_replace|listagg|wmsys.wm_concat|substr|regexp_substr常用函数
【SQL开发实战技巧】系列（十二）：三问(如何对字符串字母去重后按字母顺序排列字符串？如何识别哪些字符串中包含数字？如何将分隔数据转换为多值IN列表?)
【SQL开发实战技巧】系列（十三）：讨论一下常用聚集函数&通过执行计划看sum()over()对员工工资进行累加
【SQL开发实战技巧】系列（十四）：计算消费后的余额&计算银行流水累计和&计算各部门工资排名前三位的员工
【SQL开发实战技巧】系列（十五）：查找最值所在行数据信息及快速计算总和百之max/min() keep() over()、fisrt_value、last_value、ratio_to_report
【SQL开发实战技巧】系列（十六）：数据仓库中时间类型操作（初级）日、月、年、时、分、秒之差及时间间隔计算
【SQL开发实战技巧】系列（十七）：数据仓库中时间类型操作（初级）确定两个日期之间的工作天数、计算—年中周内各日期出现次数、确定当前记录和下一条记录之间相差的天数
【SQL开发实战技巧】系列（十八）：数据仓库中时间类型操作（进阶）INTERVAL、EXTRACT以及如何确定一年是否为闰年及周的计算
【SQL开发实战技巧】系列（十九）：数据仓库中时间类型操作（进阶）如何一个SQL打印当月或一年的日历？如何确定某月内第一个和最后—个周内某天的日期？
【SQL开发实战技巧】系列（二十）：数据仓库中时间类型操作（进阶）获取季度开始结束时间以及如何统计非连续性时间的数据
【SQL开发实战技巧】系列（二十一）：数据仓库中时间类型操作（进阶）识别重叠的日期范围，按指定10分钟时间间隔汇总数据
【SQL开发实战技巧】系列（二十二）：数仓报表场景☞ 从分析函数效率一定快吗聊一聊结果集分页和隔行抽样实现方式
【SQL开发实战技巧】系列（二十三）：数仓报表场景☞ 如何对数据排列组合去重以及通过如何找到包含最大值和最小值的记录这个问题再次用执行计划给你证明分析函数性能不一定高

文章目录

系列文章目录
前言
- 一、遍历拆分字符串为单个字符
- 二、字符串中包含引号如何转译
- 三、计算字符在字符串中出现的次数
- 四、使用translate从字符串中快速删除替换不需要字符的巧妙写法
- 五、使用正则表达式regexp_replace将字符和数字数据分离
- 六、使用正则表达式regexp_like查询只包含数字或字母型的数据
总结

前言

本篇文章讲解的主要内容是：遍历拆分字符串为单个字符、字符串中包含引号如何转译(q-quote特性)、计算字符在字符串中出现的次数、使用translate从字符串中快速删除替换不需要字符的巧妙写法、使用正则表达式regexp_replace将字符和数字数据分离、使用正则表达式regexp_like查询只包含数字或字母型的数据
【SQL开发实战技巧】这一系列博主当作复习旧知识来进行写作，毕竟SQL开发在数据分析场景非常重要且基础，面试也会经常问SQL开发和调优经验，相信当我写完这一系列文章，也能再有所收获，未来面对SQL面试也能游刃有余~。

一、遍历拆分字符串为单个字符

有下面一个临时表，aa列是字符串，bb列是字符串中每个中文的首拼：

with t as (
select '我有一个做大牛的梦' as aa,'wyygzdndm'as bb from dual 
)

有时我们会有这么一个需求：要求把字符串拆分为单个字符，核对表中保存的“首拼”是否正确。
如果要实现这个需求，需要把两个字段的字符串拆分一个个核对！！！那么怎么通过SQL来实现这个需求？
在实现这个需求前先看一个CONNECT BY子句：

SQL> SELECT LEVEL FROM dual CONNECT  BY  LEVEL<= 4 ; 

     LEVEL
----------
         1
         2
         3
         4

其中，CONNECT BY是树形查询中的一个子句，后面的LEVEL是一个“伪列“，表示树形中的级别层次，通过LEVEL<=4循环4次，就生成了4行上面所示的数据。
那么我们就可以通过CONNECTBY子句把T表数据循环显示4行，并给出定位标识LEVEL:

SQL> with t as (
  2  select '我有一个做大牛的梦' as aa,'wyygzdndm'as bb from dual
  3  )
  4  select t.aa,t.bb,level from t connect by  level<=4;

AA                               BB                                    LEVEL
-------------------------------- -------------------------------- ----------
我有一个做大牛的梦               wyygzdndm                                 1
我有一个做大牛的梦               wyygzdndm                                 2
我有一个做大牛的梦               wyygzdndm                                 3
我有一个做大牛的梦               wyygzdndm                                 4

根据上面的数据，就可以通过函数substr(汉字，level,？)得到需要的结果：

SQL> with t as (
  2  select '我有一个做大牛的梦' as aa,'wyygzdndm'as bb from dual
  3  )
  4  select t.aa,t.bb,level,substr(t.aa,level,1) as 汉字拆分,substr(t.bb,level,1) as 字母拆分 from t connect by  level<=length(t.aa);

AA                               BB                                    LEVEL 汉字拆分                                                         字母拆分
-------------------------------- -------------------------------- ---------- ---------------------------------------------------------------- ----------------------------------------------------------------
我有一个做大牛的梦               wyygzdndm                                 1 我                                                               w
我有一个做大牛的梦               wyygzdndm                                 2 有                                                               y
我有一个做大牛的梦               wyygzdndm                                 3 一                                                               y
我有一个做大牛的梦               wyygzdndm                                 4 个                                                               g
我有一个做大牛的梦               wyygzdndm                                 5 做                                                               z
我有一个做大牛的梦               wyygzdndm                                 6 大                                                               d
我有一个做大牛的梦               wyygzdndm                                 7 牛                                                               n
我有一个做大牛的梦               wyygzdndm                                 8 的                                                               d
我有一个做大牛的梦               wyygzdndm                                 9 梦                                                               m

9 rows selected

为了方便理解，我们同时显示了LEVEL的值及每一行实际执行的substr语句。

二、字符串中包含引号如何转译

平时写SQL时我们经常会遇到一个字符串中含有很多个引号这种情况，那么如何转译呢？其实只要把一个单引号换成两个单引号表示就可以。

SQL> select 'zyd''zhaoyd' from dual;

'ZYD''ZHAOYD'
--------------------------------
zyd'zhaoyd

另外，Oracle10g开始引入了q-quote特性，允许按照指定的规则，也就是Q或q开头
（如果是national character literals,则是N或n放在Q或q之前），字符串前后使用界定符"'"'使用规则很简单：
q-quote界定符可以是除了TAB、空格、回车外的任何单字节或多字节字符。
界定符可以是[]、{}、<>、()而且必须成对出现。
q-quote的写法就比较明确了。

SQL>  select q'[zyd'z'h''ao'yd]' from dual;

'ZYD''Z''H''''AO''YD'
--------------------------------
zyd'z'h''ao'yd

三、计算字符在字符串中出现的次数

现在有这么一个临时表：

with t as (
select 'zyd,zhaoyd,zhao,yan,dong' as aa from dual 
)

字符串'zyd,zhaoyd,zhao,yan,dong'内部每个词汇被逗号分隔开来。
现在有这么一个要求：计算其中单词个数！
对这种问题，我们一般计算其中的逗号个数后加1就可以。
Oracle11g给出了新函数REGEXP_COUNT,我们可以直接用来计算逗号的个数。

with t as (
select 'zyd,zhaoyd,zhao,yan,dong' as aa from dual 
)
select regexp_count(aa,',')+1 from t;

REGEXP_COUNT(AA,',')+1
----------------------
                     5

若没有REGEXP_COUNT的版本怎么办？我们用REGEXP_REPLACE迂回求值即可：

with t as (
select 'zyd,zhaoyd,zhao,yan,dong' as aa from dual 
)
select length(regexp_replace(aa,'[^,]+'))+1 as cnt from t;
       CNT
----------
         5

如果你不会用正则的话，还可以用前面介绍的translate:

with t as (
select 'zyd,zhaoyd,zhao,yan,dong' as aa from dual 
)
select translate(aa,','||aa,',') as tran,length(translate(aa,','||aa,','))+1 as cnt from t;
TRAN                                                                    CNT
---------------------------------------------------------------- ----------
,,,,                                                                      5

如果分隔符有一个以上，而且是成对出现的，那就要把计算出来的长度再除以分隔符长度，比如下面这个测试数据统计。

with t as (
select 'zyd$#zhaoyd$#zhao$#yan$#dong' as aa from dual 
)
select translate(aa,'$#'||aa,'$#') as tran,(length(translate(aa,'$#'||aa,'$#'))/length('$#'))+1 as cnt from t;
TRAN                                                                    CNT
---------------------------------------------------------------- ----------
$#$#$#$#                                                                  5

切记，一定不要写成下面这样，因为字符成对出现的，最后还要除一下再+1

with t as (
select 'zyd$#zhaoyd$#zhao$#yan$#dong' as aa from dual 
)
select translate(aa,'$#'||aa,'$#') as tran,length(translate(aa,'$#'||aa,'$#'))/length('$#')+1 as cnt from t;

当然了，用REGEXP_COUNT就可以不用考虑长度：

with t as (
select 'zyd$#zhaoyd$#zhao$#yan$#dong' as aa from dual 
)
select regexp_count(aa,'\$#') +1as cnt from t;
       CNT
----------
         5

第二个参数里多了一个"\"。这是因为"$"是通配符，代表以..字符结尾的意思，需要用\转义。

四、使用translate从字符串中快速删除替换不需要字符的巧妙写法

如果我们想快速替换掉dept表中dname列所有原因字母，很多人会使用REPLACE(translate(dname,'AEIOU','aaaaa'),'a','')这种方式：

SQL> select dname,REPLACE(translate(dname,'AEIOU','aaaaa'),'a','') as str from dept;

DNAME          STR
-------------- --------------------------------------------------------------------------------
ACCOUNTING     CCNTNG
RESEARCH       RSRCH
SALES          SLS
OPERATIONS     PRTNS

其实不用这么麻烦去嵌套，我们可以这么写：

SQL> select dname,translate(dname,'1AEIOU','1') as str from dept;

DNAME          STR
-------------- ----------------------------
ACCOUNTING     CCNTNG
RESEARCH       RSRCH
SALES          SLS
OPERATIONS     PRTNS

这种方式是不是很方便？

五、使用正则表达式regexp_replace将字符和数字数据分离

有这么一个测试表：

with t as (
select ename||empno from emp
)
select * from t;

现在有一个需求：将字母全都删掉还原出empno为新的字段
那么我们可以这么写

with t as (
select ename||empno aa from emp
)
select regexp_replace(aa,'[^[:digit:]]+') a,regexp_replace(aa,'[^0-9]+') b from t;
A                                                                                B
-------------------------------------------------------------------------------- --------------------------------------------------------------------------------
7369                                                                             7369
7499                                                                             7499
7521                                                                             7521
7566                                                                             7566
7654                                                                             7654
7698                                                                             7698
7782                                                                             7782
7788                                                                             7788
7839                                                                             7839
7844                                                                             7844
7876                                                                             7876
7900                                                                             7900
7902                                                                             7902
7934                                                                             7934
1001                                                                             1001

15 rows selected

上面[^[:digit:]]、[^0-9]两种写法是等价的，如果你不会用正则表达式，那么还是可以使用translate来实现！

with t as (
select ename||empno aa from emp
)
select regexp_replace(aa,'[^[:digit:]]+') a,regexp_replace(aa,'[^0-9]+') b,translate(aa,'0123456789'||aa,'0123456789')cc from t
A                                                                                B                                                                                CC
-------------------------------------------------------------------------------- -------------------------------------------------------------------------------- --------------------------------------------------------------------------------
7369                                                                             7369                                                                             7369
7499                                                                             7499                                                                             7499
7521                                                                             7521                                                                             7521
7566                                                                             7566                                                                             7566
7654                                                                             7654                                                                             7654
7698                                                                             7698                                                                             7698
7782                                                                             7782                                                                             7782
7788                                                                             7788                                                                             7788
7839                                                                             7839                                                                             7839
7844                                                                             7844                                                                             7844
7876                                                                             7876                                                                             7876
7900                                                                             7900                                                                             7900
7902                                                                             7902                                                                             7902
7934                                                                             7934                                                                             7934
1001                                                                             1001                                                                             1001

15 rows selected

可以看到，cc列也是一样的结果~我这里是推荐大家学习一下常用的正则表达式！因为真的太方便了，博主工作中已经习惯使用正则来实现translate、repalce、count、like等等操作了，正则表达式后续实验案例中博主还会继续使用。

六、使用正则表达式regexp_like查询只包含数字或字母型的数据

有如下临时表：

with t as (
select '123'     as aa from dual union all
select 'abc'     as aa from dual union all
select '123abc'  as aa from dual union all
select 'abcl23'  as aa from dual union all
select 'a1b2c3'  as aa from dual union all
select 'alb2c3#' as aa from dual union all
select '3$'      as aa from dual union all
select 'a 2'     as aa from dual
)

上面表中，有些数据行包含了空格、逗号、$等字符。
现在有一个需求：返回只有字母及数据的行（像3$这种不要）。
直接按需求字面意思来写，可以用正则表达式。

with t as (
select '123'     as aa from dual union all
select 'abc'     as aa from dual union all
select '123abc'  as aa from dual union all
select 'abcl23'  as aa from dual union all
select 'a1b2c3'  as aa from dual union all
select 'alb2c3#' as aa from dual union all
select '3$'      as aa from dual union all
select 'a 2'     as aa from dual
)
select * from t where regexp_like(aa,'^[0-9a-zA-Z]+$');
AA
-------
123
abc
123abc
abcl23
a1b2c3

首先和前面的对应方式一样，regexp_like对应普通的like。
regexp_like(data,'[ABC]')就相当于(like'%A%'or like'%B%'or like'%C%')，而regexp_like(data,'[0-9a-zA-Z]+')就相当于(like'%数字%'or like'%小写字母%'or like'%大写字母％'）。
其中’^‘不在方括号里时表示字符串开始，’$'该符号在方括号外面，表示字符串的结束。
我们通过具体查询来对比说明：

用regexp_like对应普通的like来对比就是：

用regexp_like(data,'A')对应普通的like '%A%'：

with t as (
select 'A'  as aa from dual union all
select 'AB' as aa from dual union all
select 'BA' as aa from dual union all
select 'BAC'as aa from dual 
)
select * from t where regexp_like(aa,'A');
AA
---
A
AB
BA
BAC

前面加’^'的regexp_like(aa,'^A')对应普通的like 'A%',没有了前模糊查询：

SQL> with t as (
  2  select 'A'  as aa from dual union all
  3  select 'AB' as aa from dual union all
  4  select 'BA' as aa from dual union all
  5  select 'BAC'as aa from dual
  6  )
  7  select * from t where regexp_like(aa,'^A');

AA
---
A
AB

后面加'$'的regexp_like(aa,'A$')对应普通的like '%A',没有了后模糊查询：

SQL> with t as (
  2  select 'A'  as aa from dual union all
  3  select 'AB' as aa from dual union all
  4  select 'BA' as aa from dual union all
  5  select 'BAC'as aa from dual
  6  )
  7  select * from t where regexp_like(aa,'A$');

AA
---
A
BA

前后各加上'^A$'的regexp_like(aa,'^A$')对应普通的like'A',变成了精确查询。

SQL> with t as (
  2  select 'A'  as aa from dual union all
  3  select 'AB' as aa from dual union all
  4  select 'BA' as aa from dual union all
  5  select 'BAC'as aa from dual
  6  )
  7  select * from t where regexp_like(aa,'^A$');

AA
---
A

另一个概念是'+'与'*'。'+'表示匹配前面的子表达式一次或多次：'*'表示匹配前面的子表达式零次或多次。
我们用另一个例子来理清这几个关系。

SQL> with t as (
  2  select '167'  as aa from dual union all
  3  select '1667'  as aa from dual union all
  4  select '17'  as aa from dual union all
  5  select '1234567' as aa from dual
  6  )
  7  select * from t where regexp_like(aa,'6+')
  8  ;

AA
-------
167
1667
1234567
SQL> with t as (
  2  select '167'  as aa from dual union all
  3  select '1667'  as aa from dual union all
  4  select '17'  as aa from dual union all
  5  select '1234567' as aa from dual
  6  )
  7  select * from t where regexp_like(aa,'6*');

AA
-------
167
1667
17
1234567

regexp_like(str,'6+')子表达式是’6+'至少匹配6一次，也就相当于(like'6%'or like'66%' or..),等价于like'6%'.
regexp_like(str,'6*')子表达式是’6*‘,至少匹配6零次，也就相当于(like'*'or like'6%' or..),等价于like'*'。

那么当'+*^$'组合之后呢？先整一个临时表：

with t as (
select 1    as aa from dual union all
select 12   as aa from dual union all
select 13   as aa from dual union all
select 2    as aa from dual union all
select 21   as aa from dual union all
select 23   as aa from dual union all
select 3    as aa from dual union all
select 31   as aa from dual union all
select 32   as aa from dual union all
select null as aa from dual 
)

来看一下这俩查询有啥区别？

select * from t where regexp_like(aa,'^[12]+$');
select * from t where regexp_like(aa,'^[12]*$');

可能很多人都认为这两句的结果应该不一样，我们来运行一下：

SQL> with t as (
  2  select 1    as aa from dual union all
  3  select 12   as aa from dual union all
  4  select 13   as aa from dual union all
  5  select 2    as aa from dual union all
  6  select 21   as aa from dual union all
  7  select 23   as aa from dual union all
  8  select 3    as aa from dual union all
  9  select 31   as aa from dual union all
 10  select 32   as aa from dual union all
 11  select null as aa from dual
 12  )
 13  select * from t where regexp_like(aa,'^[12]+$');

        AA
----------
         1
        12
         2
        21

SQL> with t as (
  2  select 1    as aa from dual union all
  3  select 12   as aa from dual union all
  4  select 13   as aa from dual union all
  5  select 2    as aa from dual union all
  6  select 21   as aa from dual union all
  7  select 23   as aa from dual union all
  8  select 3    as aa from dual union all
  9  select 31   as aa from dual union all
 10  select 32   as aa from dual union all
 11  select null as aa from dual
 12  )
 13  select * from t where regexp_like(aa,'^[12]*$');

        AA
----------
         1
        12
         2
        21

呕吼，是否有些意外？
我们来看两个表达式对应的like应该是什么。
regexp_like(aa,'^[12]+$')对应的是1,2,11,22,21,12
而regexp_like(aa,'^[12]*$')对应的是1,2,11,22,21,12,‘’

因为*可以匹配零次，所以多了一个条件OR aa LIKE"但我们在前面讲过，在这种条件里，空字符串等价NULL。而NULL是不能用LIKE来比较的，所以这个条件不会返回值。

 SQL> with t as (
  2  select 1    as aa from dual union all
  3  select 12   as aa from dual union all
  4  select 13   as aa from dual union all
  5  select 2    as aa from dual union all
  6  select 21   as aa from dual union all
  7  select 23   as aa from dual union all
  8  select 3    as aa from dual union all
  9  select 31   as aa from dual union all
 10  select 32   as aa from dual union all
 11  select null as aa from dual
 12  )
 13  select count(*) from t where aa like '';

  COUNT(*)
----------
         0

那么最终结果就是这两个语句返回的结果一样。

总结

这篇文章主要讲解的是常用的字符处理方法，不过还好，讲的内容都挺基础，后面还会有几篇文章继续讲这块，因为对数据的处理在工作中非常常见。

你可能感兴趣的:(Oracle开发运维实战,正则,regexp_replace,拆分字符串,替换字符串,统计出现次数)

银行从业资格证的作用但眉上风止i
当前银行业求职竞争不断之大，持证应聘成功率增1倍。在近年来的银行招聘中，通过银行从业资格考试的人员的应聘成功率与其他求职者相比也高出近1倍。根据统计，历年成功拿到银行offer的学员中，71%的人持有银行从业、会计从业、证券从业等金融行业相关资格证书。证书在求职大军中是绝对的加分项，对刚毕业没什么专项技能的大学生而言，这是一个非常好的机会。业内人士称，大学毕业生的专业知识和实践能力并不能完全满足银
神经网络：从模式组合到多层神经网络的进化 MoonlitHan 人工智能
这两张图展示了神经网络如何从“简单判断”进化到“复杂识别”：1.模式组合：让神经网络“拆分任务”第一张图的核心是“模式组合”：比如识别数字3时，网络会把任务拆成“识别左半部分”和“识别右半部分”；中间的神经元专门负责提取局部特征（比如左半部分的曲线、右半部分的直线）；最终输出层的y₃和y₈会综合这些局部特征，判断图片是不是数字3或8。2.多层神经网络：让AI学会“分层思考”第二张图展示了多层神经网
转载：十年驾车经验总结：活着，才是硬道理 weixin_30920853
一个优秀的驾驶员，应该对自己负责、对家人负责、对他人负责，对生命心存敬畏！现实生活中，违章又无处不在，为什么呢？原因一、侥幸心理。平时不系安全带，偶尔酒后驾驶，平时闯闯红灯，晚上出来飚飚车，从来没出过事故，安全意识越来越淡薄，总感觉车技好无所谓，其实，靠侥幸是不可能幸运一辈子的，据统计：驾龄5~6年属于事故高发期。原因二、环境因素。我在都江堰生活过3个月，在那里，闯红灯属于普遍现象，后来我去西宁，
最后一个单词的长度 AWEN_33 算法
给你一个字符串s，由若干单词组成，单词前后用一些空格字符隔开。返回字符串中最后一个单词的长度。单词是指仅由字母组成、不包含任何空格字符的最大子字符串。（s仅有英文字母和空格''组成；s中至少存在一个单词）classSolution{public:intlengthOfLastWord(strings){//初始化索引i为字符串最后一个字符的位置（s.size()-1）//a用于记录最后一个单词的长
c语言学习15四则运算
四则运算练习需求：进入一个界面选择+-*/printf选择运算法则（如果选择错误，提示重新选择）switchcasedefult显示100以内两个随机数，输入运算结果rand系统显示正确答案，并且判断正确错误要求：封装函数分析：intmain(void){//界面程序-----界面函数//输入和识别程序-----按键识别函数//随机数程序----产生随机数函数//系统计算并且对比答案----对比答
安装python后如何安装numpy_如何简单安装NumPy与SciPy
2015-12-27回答numpy是一个定义了数值数组和矩阵类型和它们的基本运算的语言扩展。scipy是一种使用numpy来做高等数学、信号处理、优化、统计和许多其它科学任务的语言扩展。学习这两个工具的话，官方有很详细的文档和教程来帮助入门：我是传送门另外，还有一本书《numpyandscipy》，很薄，才67页：我是传送门如何安装numpy和scipy之所以写这篇文章主要是因为scipy官网貌似
C++ 程序设计考量表君鼎 C++c++开发语言
C++程序设计考量表1.类设计主要考量具体问题设计决策影响职责类的职责是否单一？是否有违反单一职责原则的可能性？决定是否需要拆分类或合并相关职责继承关系是否需要继承？是公有继承（is-a关系）还是组合（has-a关系）？影响是否使用基类、抽象类或多态封装性哪些成员需要暴露？哪些需要隐藏？决定public/private/protected访问权限对象生命周期是否需要自定义构造函数/析构函数？是否需
二分查找进阶：查找最靠左和最靠右的索引（Java实现）算法第二深情算法学习算法 java intellij-idea
一、引言在实际开发中，二分查找（BinarySearch）是一种高效的查找算法，尤其在处理有序数组时表现出色。然而，标准的二分查找只能返回目标值的任意一个位置（例如中间位置）。如果需要找到目标值的最左索引或最右索引（例如统计重复元素的出现次数），或者只需要单纯知道最左或最有二、普通二分查找vs.边界查找1.普通二分查找publicstaticintbinarySearch(int[]arr,int
多表代替密码与维吉尼亚密码：古典密码学的“动态魔法” 算法第二深情密码学密码学
一、多表代替密码：从“固定规则”到“动态变化”的密码革命1.定义与核心思想多表代替密码（PolyalphabeticSubstitutionCipher）是古典密码学的巅峰之作，其核心思想是“用多个替换表轮换加密”，彻底打破单表代替密码（如凯撒密码）的频率分析漏洞。单表代替密码的弱点：单表密码（如凯撒密码）的替换规则固定，导致明文字母的频率特征在密文中保留（例如英语中E最常见）。攻击者只需统计字母
flink sql读hive catalog数据，将string类型的时间戳数据排序后写入kafka，如何保障写入kafka的数据是有序的 fzip Flink flink sql hive
在FlinkSQL中，要确保从Hive读取的STRING类型时间戳数据排序后有序写入Kafka，需要结合批处理模式、时间类型转换、单分区写入和Kafka生产者配置。以下是完整解决方案：一、核心解决方案1.批处理模式+全局排序将作业设置为批处理模式，并对字符串时间戳进行类型转换后排序：--设置为批处理模式（关键！）SET'execution.runtime-mode'='batch';--从Hive
【web-攻击用户】（9.1.6）查找并利用XSS漏洞--基于DOM 黑色地带（崛起） 0X02【web渗透】web安全
目录查找并利用基于DOM的XSS漏洞1.1、简介：1.2、过程：查找并利用基于DOM的XSS漏洞1.1、简介：1、提交一个特殊的字符串作为每个参数，然后监控响应中是否出现该字符串，无法确定基于DOM的XSS漏洞2、确定基于DOM的XSS漏洞的基本方法是，用浏览器手动浏览应用程序，并修改每一个URL参数，在其中插入一个标准测试字符串（如alert(1)和;alert(1)//等）3、通过在浏览器中显
PostgreSQL常用命令与工具指南 Mr.小海 Linux 服务器 postgresql 数据库算法架构网络协议 linux 运维开发
文章目录PostgreSQL常用命令与工具指南简介1.连接与基本操作连接数据库环境变量设置（避免密码输入）常用元命令2.数据库与表管理数据库操作创建数据库删除数据库修改数据库属性表操作创建表修改表结构删除表索引管理创建索引删除索引3.数据操作(CRUD)插入数据查询数据更新数据删除数据事务控制4.账号与权限管理角色/用户操作创建角色修改角色删除角色权限控制授予权限撤销权限查看权限5.常用函数字符串
爬虫实战案例（两个） AI 嗯啦爬虫
该博客展示两个简单的爬虫实战案例，一个是从人民邮电出版社上爬取其中一个分类的全部图书信息，另一个是在苏宁易购上爬取某个商品的好评和差评，用两个简单的案例讲解爬虫在实际情况下的运作流程一、获取图书信息需求：统计人民邯电出版社官网中与关键词“python”有关的全部图书，包含图书名、价格、作者名等信息，并将获取的信息写入“Excel图书汇总，txt”文件中。流程：配置浏览器并打开目标网站搜索"Pyth
flink sql如何对hive string类型的时间戳进行排序
在FlinkSQL中对Hive表的STRING类型时间戳进行排序，需要先将字符串转换为时间类型，再基于时间类型排序。以下是具体方法和示例：一、核心解决方案1.字符串转TIMESTAMP后排序若Hive中的时间戳格式为'yyyy-MM-ddHH:mm:ss'（如'2024-01-0112:00:00'），可直接转为TIMESTAMP排序：SELECT*FROMhive_tableORDERBYTO_
js数据类型运算符九妄_b2a1
数据类型：单引号，双引号可互包'表示一个'\n换行\t制表符\表示一个varstr='haha';console.log(str)六种数据类型:基本数据类型：string字符串number数值Boolean布尔值nullundefinedtypeof变量检查数据类型Number.MAX_VALUE;最大值Infinity无穷大(超过最大值)Number类型字符串相乘得NaN(NotaNumber)
day---python变量的概念小白进阶中 python
变量的概念python是面向对象的，解释型和弱类型。变量：里面盛放的值随时可以发生变化，声明变量实际上是给内存要空间。给你赋什么值就是什么类型*字母数字下划线不能用下划线开头。多个变量需要打印时候用–逗号value表示一个值，sep=“”表示之间用空格分隔，可以自己改成别的。end=“\n”就是转义字符，默认是\n在字符串里面有\n就可以换行。默认的追加。name='小白'age=18gender
Java 正则表达式之应用技巧 jianaio java 正则表达式 mysql
Java正则表达式之应用技巧基本语法与匹配规则Java正则表达式通过java.util.regex包实现，核心类为Pattern和Matcher。以下为基本匹配示例：Patternpattern=Pattern.compile("a.b");//匹配任意单个字符between'a'and'b'Matchermatcher=pattern.matcher("a2b");System.out.prin
Java 字符串 jianaio java python 开发语言
Java字符串基础Java字符串是java.lang.String类的对象，用于存储和操作文本数据。字符串在Java中是不可变的，任何修改操作都会生成新的字符串对象。Stringstr1="Hello";Stringstr2=newString("World");System.out.println(str1+""+str2);//输出:HelloWorld字符串创建方式直接赋值：使用双引号创建字
Java大视界：Java大数据在智能医疗电子健康档案数据挖掘与健康服务创新＞ Loving_enjoy 计算机学科论文创新点人工智能深度学习迁移学习经验分享
>本文通过完整代码示例，揭秘如何用Java大数据技术挖掘电子健康档案价值，实现疾病预测、个性化健康管理等创新服务。###一、智能医疗时代的数据金矿电子健康档案（EHR）作为医疗数字化的核心载体，包含海量患者全生命周期健康数据。据统计，全球医疗数据量正以每年**48%的速度增长**，单个三甲医院年数据量可达**PB级**。这些数据蕴藏着疾病规律、治疗效能的宝贵知识，但传统技术难以有效挖掘。**Jav
五大编程竞赛平台终极对比 2401_86601498 c++
LeetCodeLeetCode是一个流行的在线编程平台，提供大量算法和数据结构题目。题目分为简单、中等和困难三个难度级别。LeetCode的题目涵盖各种主题，包括数组、字符串、树、动态规划等。LeetCode支持多种编程语言，包括C++，并提供在线代码编辑器和即时反馈。LeetCode还提供竞赛和面试模拟功能，适合准备技术面试的用户。CodeforcesCodeforces是一个以竞赛为主的在线
笔试——Day7 nuyoahc 笔试强训 c++笔试数据结构算法
文章目录第一题题目思路代码第二题题目：思路代码第三题题目：思路代码第一题题目字符串中找出连续最长的数字串思路逐个字符检查如果当前字符是数字，将其加入临时字符串tmp如果当前字符不是数字检查tmp是否比当前最长的res更长，如果是，更新res否则清空tmp代码第二题题目：岛屿数量思路深度优先搜索：双重循环遍历每个网格点(i,j)如果当前点是陆地(grid[i][j]=='1')且未被访问过(!vis
文本字符串处理合集by批处理（不定期更新）
觉得有帮助麻烦您动动发财的小手点赞、收藏、加关注，感谢！1.字符串文本排序：https://blog.csdn.net/humors221/article/details/1494124492.替换记事本字符：https://blog.csdn.net/humors221/article/details/1205834753.文本乱序：https://blog.csdn.net/humors221
【NO.4】LeetCode经典150题-80. 删除有序数组中的重复项 II
【NO.4】LeetCode经典150题-80.删除有序数组中的重复项II80.删除有序数组中的重复项II【中等】给你一个有序数组nums，请你原地删除重复出现的元素，使得出现次数超过两次的元素只出现两次，返回删除后数组的新长度。不要使用额外的数组空间，你必须在原地修改输入数组并在使用O(1)额外空间的条件下完成。说明：为什么返回数值是整数，但输出的答案是数组呢？请注意，输入数组是以**「引用」*
Python装饰器与闭包：实战应用与深入理解
背景简介本章深入探讨了Python装饰器与闭包的核心概念，展示了它们在实际编程中的灵活应用和强大功能。装饰器的魔力：保持元数据与链式应用在Python中，装饰器是一种修改或增强函数行为的强大工具，它能够让我们在不改变原始函数代码的情况下，为其添加新功能。保持函数的元数据是装饰器的一个重要特性，它确保了装饰后的函数保持其身份和文档字符串信息。这对于代码的可读性和维护性至关重要。当需要将多个装饰器应用
917. 仅仅反转字母 Abeants
给你一个字符串s，根据下述规则反转字符串：所有非英文字母保留在原有位置。所有英文字母（小写或大写）位置反转。返回反转后的s。示例1：输入：s="ab-cd"输出："dc-ba"示例2：输入：s="a-bC-dEf-ghIj"输出："j-Ih-gfE-dCba"示例3：输入：s="Test1ng-Leet=code-Q!"输出："Qedo1ct-eeLg=ntse-T!"提示1<=s.length<
免费开源 PDFsam Basic 一键搞定合并拆分旋转等 8 大 PDF 基础操作阿文软件园开源软件 windows 电脑
各位办公小能手们！今天给大家介绍一款超厉害的免费开源多功能PDF处理工具——PDFsamBasic，它主要就是为咱这些有基础PDF文档编辑需求的人准备的。先说说它的核心功能哈。第一个是PDF合并，能把好几个PDF文件合成一个，你还能选合并全部或者指定页面范围，像“1-10,14,25-”这种都没问题，书签、表单合并这些细节它也能处理得明明白白。第二个是PDF拆分，可以按页码、文件大小、书签级别来拆
PDF 拆分合并PDFSam：开源免费多文件合并 + 按页码拆分本地处理文哥工具箱1 电脑开源软件软件构建
各位打工人和学生党们，你知道吗，处理PDF文件简直是咱们的日常噩梦啊，尤其是遇到要合并好几个文件，或者从中抠几页出来的时候，简直头大如斗！今天给你们安利一个神仙工具，PDFSam，听我的，不好用你回来打我（开玩笑的啦）！这家伙可是开源免费的，完全不用你掏一分钱，软件下载地址安装包它能干嘛呢，可太多了！你想把好几个PDF拧成一股绳？没问题，合并功能分分钟搞定。想把一个大PDF拆成小的？也行！按页码拆
前端埋坑之js console.log字符换行后 html没换行问题处理做个有准备的人前端埋坑之路-前端技术前端十年之路前端 javascript html
方法：//命令字符处理（字符串超过N字之后换行处理）wrapText(text,n){n=n||70;//默认每70个字符换行if(text.length>n){letresult=text.slice(0,n);leti;for(i=n;i<text.length;i+=n){result+='\n'+text.slice(i,i+n);}re
DAY2——Python 基础变量类型之字符串和数字类型 .venn PYTHON学习 python 开发语言算法
字符串类型（str）字符串是Python中最常用的数据类型之一，用于表示文本信息。字符串可以用单引号（''）、双引号（""）或三引号（''''''或""""""）定义。三引号通常用于多行字符串。字符串是不可变序列，支持索引和切片操作。以下是一些常见操作：#定义字符串s1='hello's2="world"s3='''Thisisamulti-linestring'''#字符串拼接combined=
BPE（字节对编码）和WordPiece 是什么 ZhangJiQun&MXP 教学 2024大模型以及算力 2021 AI python 机器学习算法人工智能 transformer 深度学习
BPE（字节对编码）和WordPiece是什么BPE（字节对编码）和WordPiece是自然语言处理中常用的子词分词算法，它们通过将文本拆分为更小的语义单元来平衡词汇表大小和表达能力。BPE（BytePairEncoding，字节对编码）原理初始化：将文本按字符（或Unicode字节）拆分为最小单元，形成初始词汇表。统计合并：迭代合并最频繁出现的相邻字符对，形成新的子词单元，直到达到预设的词汇表大
[星球大战]阿纳金的背叛 comsci
本来杰迪圣殿的长老是不同意让阿纳金接受训练的......... 但是由于政治原因,长老会妥协了...这给邪恶的力量带来了机会所以......现代的地球联邦接受了这个教训...绝对不让某些年轻人进入学院
看懂它，你就可以任性的玩耍了！ aijuans JavaScript
javascript作为前端开发的标配技能，如果不掌握好它的三大特点：1.原型 2.作用域 3. 闭包 ,又怎么可以说你学好了这门语言呢？如果标配的技能都没有撑握好，怎么可以任性的玩耍呢？怎么验证自己学好了以上三个基本点呢，我找到一段不错的代码，稍加改动，如果能够读懂它，那么你就可以任性了。 function jClass(b
Java常用工具包 Jodd Kai_Ge java jodd
Jodd 是一个开源的 Java 工具集，包含一些实用的工具类和小型框架。简单，却很强大！写道 Jodd = Tools + IoC + MVC + DB + AOP + TX + JSON + HTML < 1.5 Mb Jodd 被分成众多模块，按需选择，其中工具类模块有： jodd-core &nb
SpringMvc下载 120153216 springMVC
@RequestMapping(value = WebUrlConstant.DOWNLOAD) public void download(HttpServletRequest request,HttpServletResponse response,String fileName) { OutputStream os = null; InputStream is = null;
Python 标准异常总结 2002wmj python
Python标准异常总结 AssertionError 断言语句（assert）失败 AttributeError 尝试访问未知的对象属性 EOFError 用户输入文件末尾标志EOF（Ctrl+d） FloatingPointError 浮点计算错误 GeneratorExit generator.close()方法被调用的时候 ImportError 导入模块失
SQL函数返回临时表结构的数据用于查询 357029540 SQL Server
这两天在做一个查询的SQL，这个SQL的一个条件是通过游标实现另外两张表查询出一个多条数据，这些数据都是INT类型，然后用IN条件进行查询，并且查询这两张表需要通过外部传入参数才能查询出所需数据，于是想到了用SQL函数返回值，并且也这样做了，由于是返回多条数据，所以把查询出来的INT类型值都拼接为了字符串，这时就遇到问题了，在查询SQL中因为条件是INT值，SQL函数的CAST和CONVERST都
java 时间格式化 | 比较大小| 时区个人笔记 7454103 java eclipse tomcat c MyEclipse
个人总结！不当之处多多包含！引用 1.0 如何设置 tomcat 的时区：位置：(catalina.bat---JAVA_OPTS 下面加上) set JAVA_OPT
时间获取Clander的用法 adminjun Clander 时间
/** * 得到几天前的时间 * @param d * @param day * @return */ public static Date getDateBefore(Date d,int day){ Calend
JVM初探与设置 aijuans java
JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一种用于计算设备的规范，它是一个虚构出来的计算机，是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机包括一套字节码指令集、一组寄存器、一个栈、一个垃圾回收堆和一个存储方法域。 JVM屏蔽了与具体操作系统平台相关的信息，使Java程序只需生成在Java虚拟机上运行的目标代码（字节码）,就可以在多种平台
SQL中ON和WHERE的区别 avords
SQL中ON和WHERE的区别数据库在通过连接两张或多张表来返回记录时，都会生成一张中间的临时表，然后再将这张临时表返回给用户。 www.2cto.com 在使用left jion时，on和where条件的区别如下： 1、 on条件是在生成临时表时使用的条件，它不管on中的条件是否为真，都会返回左边表中的记录。
说说自信 houxinyou 工作生活
自信的来源分为两种,一种是源于实力,一种源于头脑.实力是一个综合的评定,有自身的能力,能利用的资源等.比如我想去月亮上,要身体素质过硬,还要有飞船等等一系列的东西.这些都属于实力的一部分.而头脑不同,只要你头脑够简单就可以了!同样要上月亮上,你想,我一跳,1米,我多跳几下,跳个几年,应该就到了!什么?你说我会往下掉?你笨呀你!找个东西踩一下不就行了吗? 无论工作还
WEBLOGIC事务超时设置 bijian1013 weblogic jta 事务超时
系统中统计数据，由于调用统计过程，执行时间超过了weblogic设置的时间，提示如下错误：统计数据出错! 原因：The transaction is no longer active - status: 'Rolling Back. [Reason=weblogic.transaction.internal
两年已过去，再看该如何快速融入新团队 bingyingao java 互联网融入架构新团队
偶得的空闲，翻到了两年前的帖子该如何快速融入一个新团队，有所感触，就记下来，为下一个两年后的今天做参考。时隔两年半之后的今天，再来看当初的这个博客，别有一番滋味。而我已经于今年三月份离开了当初所在的团队，加入另外的一个项目组，2011年的这篇博客之后的时光，我很好的融入了那个团队，而直到现在和同事们关系都特别好。大家在短短一年半的时间离一起经历了一
【Spark七十七】Spark分析Nginx和Apache的access.log bit1129 apache
Spark分析Nginx和Apache的access.log，第一个问题是要对Nginx和Apache的access.log文件进行按行解析，按行解析就的方法是正则表达式： Nginx的access.log解析正则表达式 val PATTERN = """([^ ]*) ([^ ]*) ([^ ]*) (\\[.*\\]) (\&q
Erlang patch bookjovi erlang
Totally five patchs committed to erlang otp, just small patchs. IMO, erlang really is a interesting programming language, I really like its concurrency feature. but the functional programming style
log4j日志路径中加入日期 bro_feng java log4j
要用log4j使用记录日志，日志路径有每日的日期，文件大小5M新增文件。实现方式 log4j: <appender name="serviceLog" class="org.apache.log4j.RollingFileAppender"> <param name="Encoding" v
读《研磨设计模式》-代码笔记-桥接模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /** * 个人觉得关于桥接模式的例子，蜡笔和毛笔这个例子是最贴切的：http://www.cnblogs.com/zhenyulu/articles/67016.html * 笔和颜色是可分离的，蜡笔把两者耦合在一起了：一支蜡笔只有一种
windows7下SVN和Eclipse插件安装 chenyu19891124 eclipse插件
今天花了一天时间弄SVN和Eclipse插件的安装，今天弄好了。svn插件和Eclipse整合有两种方式，一种是直接下载插件包，二种是通过Eclipse在线更新。由于之前Eclipse版本和svn插件版本有差别，始终是没装上。最后在网上找到了适合的版本。所用的环境系统：windows7JDK：1.7svn插件包版本：1.8.16Eclipse：3.7.2工具下载地址：Eclipse下在地址：htt
[转帖]工作流引擎设计思路 comsci 设计模式工作应用服务器 workflow 企业应用
作为国内的同行，我非常希望在流程设计方面和大家交流，刚发现篇好文(那么好的文章，现在才发现，可惜)，关于流程设计的一些原理，个人觉得本文站得高，看得远，比俺的文章有深度，转载如下 ================================================================================= 自开博以来不断有朋友来探讨工作流引擎该如何
Linux 查看内存，CPU及硬盘大小的方法 daizj linux cpu 内存硬盘大小
一、查看CPU信息的命令 [root@R4 ~]# cat /proc/cpuinfo |grep "model name" && cat /proc/cpuinfo |grep "physical id" model name : Intel(R) Xeon(R) CPU X5450 @ 3.00GHz model name :
linux 踢出在线用户 dongwei_6688 linux
两个步骤： 1.用w命令找到要踢出的用户，比如下面： [root@localhost ~]# w 18:16:55 up 39 days, 8:27, 3 users, load average: 0.03, 0.03, 0.00 USER TTY FROM LOGIN@ IDLE JCPU PCPU WHAT
放手吧,就像不曾拥有过一样 dcj3sjt126com
内容提要：静悠悠编著的《放手吧就像不曾拥有过一样》集结“全球华语世界最舒缓心灵”的精华故事，触碰生命最深层次的感动，献给全世界亿万读者。《放手吧就像不曾拥有过一样》的作者衷心地祝愿每一位读者都给自己一个重新出发的理由，将那些令你痛苦的、扛起的、背负的，一并都放下吧！把憔悴的面容换做一种清淡的微笑，把沉重的步伐调节成春天五线谱上的音符，让自己踏着轻快的节奏，在人生的海面上悠然漂荡，享受宁静与
php二进制安全的含义 dcj3sjt126com PHP
PHP里，有string的概念。 string里，每个字符的大小为byte（与PHP相比，Java的每个字符为Character，是UTF8字符，C语言的每个字符可以在编译时选择）。 byte里，有ASCII代码的字符，例如ABC，123，abc，也有一些特殊字符，例如回车，退格之类的。特殊字符很多是不能显示的。或者说，他们的显示方式没有标准，例如编码65到哪儿都是字母A，编码97到哪儿都是字符
Linux下禁用T440s，X240的一体化触摸板(touchpad) gashero linux ThinkPad 触摸板
自打1月买了Thinkpad T440s就一直很火大，其中最让人恼火的莫过于触摸板。 Thinkpad的经典就包括用了小红点(TrackPoint)。但是小红点只能定位，还是需要鼠标的左右键的。但是自打T440s等开始启用了一体化触摸板，不再有实体的按键了。问题是要是好用也行。实际使用中，触摸板一堆问题，比如定位有抖动，以及按键时会有飘逸。这就导致了单击经常就
graph_dfs hcx2013 Graph
package edu.xidian.graph; class MyStack { private final int SIZE = 20; private int[] st; private int top; public MyStack() { st = new int[SIZE]; top = -1; } public void push(i
Spring4.1新特性——Spring核心部分及其他 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
配置HiveServer2的安全策略之自定义用户名密码验证 liyonghui160com
具体从网上看 http://doc.mapr.com/display/MapR/Using+HiveServer2#UsingHiveServer2-ConfiguringCustomAuthentication LDAP Authentication using OpenLDAP Setting
一位30多的程序员生涯经验总结 pda158 编程工作生活咨询
1.客户在接触到产品之后，才会真正明白自己的需求。　　这是我在我的第一份工作上面学来的。只有当我们给客户展示产品的时候，他们才会意识到哪些是必须的。给出一个功能性原型设计远远比一张长长的文字表格要好。 2.只要有充足的时间，所有安全防御系统都将失败。　　安全防御现如今是全世界都在关注的大课题、大挑战。我们必须时时刻刻积极完善它，因为黑客只要有一次成功，就可以彻底打败你。 3.
分布式web服务架构的演变自由的奴隶 linux Web 应用服务器互联网
最开始，由于某些想法，于是在互联网上搭建了一个网站，这个时候甚至有可能主机都是租借的，但由于这篇文章我们只关注架构的演变历程，因此就假设这个时候已经是托管了一台主机，并且有一定的带宽了，这个时候由于网站具备了一定的特色，吸引了部分人访问，逐渐你发现系统的压力越来越高，响应速度越来越慢，而这个时候比较明显的是数据库和应用互相影响，应用出问题了，数据库也很容易出现问题，而数据库出问题的时候，应用也容易
初探Druid连接池之二——慢SQL日志记录 xingsan_zhang 日志连接池 druid 慢SQL
由于工作原因，这里先不说连接数据库部分的配置，后面会补上，直接进入慢SQL日志记录。 1.applicationContext.xml中增加如下配置： <bean abstract="true" id="mysql_database" class="com.alibaba.druid.pool.DruidDataSourc