老男孩oldboy

awk多维数组案例多角度解决实战

版本：V1.1
问题提出者：python群友
问题是否解决：已解决
文档作者：悠久之翼(老男孩老师支持)
修改记录：2015-04-06
系统环境：Centos 6.6 （适合32bit and 64bit）
内核版本：2.6.32-504.el6.x86_64

问题描述：

以下是原文：来自网友的。

老男孩老师，你好：我要取如下数据：

1.单独第一列去重后的结果，这个我已做出来

awk '{count[$1]++}; END{for(name in count) print name,count[name]}' testfile.txt

2.取第一列和第二列同时去重后的wc�Cl 　，麻烦老师帮忙看下，谢谢！

统计后的结果格式如：000 2227 60

这是网友第一次提交给老男孩老师的问题。由于这些问题就是刚刚讲过的awk数组问题，正好交给学生练手！

下面是学生的完整分析，加上太多次的和老男孩的不断沟通，到底问题者想问什么问题

####蒙了吗？看下面分析吧。

数据文件如下：见本文附件

AYST002 010121012003771
AYST002 010121012003771
001 012345678912345
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012003771
AYST002 010121012002696
AYST002 010121012003771
一共2万多行测试数据数据文件如下：见本文附件

分析这位网友最终想要的结果：

0       2227    60
1       3880    4
4       53      2
014B002 6       2
014B004 202     2
014B010 1414    52
014B050 10      1
014B062 1276    36
014B090 53      6
014BA00 1367    13
20      34      7
40      6       4
600     1669    50
A0001   3245    18
ATM001  815     2
AYST001 254     7
AYST002 5451    156

继续问题分析

1．上面问题实在让人费解，两天后终于想明白，他是什么问题è沟通代价太大，引以为戒。

2．问题分析如下

3．取得$1去重之后的计数

4． $0去重之后，$1相同$2不同的个数（最后花了2天理解问题，哎~~，提问的人没说明白，我也没理解）

举例说明：

如果没有理解看看下面的例子：

[wxr@C66-test oldboy]$ awk '{array[$0]++}END{for(nin array) print n,array[n]}' 11.txt|sort
##先进行$0去重，截取
 
000 c78f62db913017ea 18
000 e15cdefdc82edf20 25
000 e78dff28765d30fd 14
000 f636438c74685fcb 4
001 010121012002346 1
001 012345678912345 3646
001 015159014078175 1
001 1152 232
004 010121011079336 48
004 012345678912345 5
014B002 010121009019316 3
014B002 010121009201084 3
014B004 57e22bae43dfeafa 36
014B004 9e0647d809f4e31f 166
014B010 1c6bf2d598b3d9b5 69
014B010 2b6d303654a64ef3 6
014B010 2b742e4ee5aef95d 14
 
##获得的结果：
   一共出现的次数 $0去重后，以000开头$2不同的个数
000     18+25+14+4      4
001     1+3646          4
004     48+5            2
014B002 3+5             2
014B004 36+166          2
014B010 69+6+14         3
难理解的是最后一列：他是对$0去重后的$1相同 $2不同的，总共的可能性。配合我的例子，和结果理解就好了。

确定需求用了太久的时间，比解决问题时间长了很多！

解决方法：

方法一

简单粗暴：

[wxr@C66-test oldboy]$sort testfile.txt|uniq -c|awk -f sort_old.awk|sort
000     2227   60
001     3880   4
004     53     2
014B002 6       2
014B004 202     2
014B010 1414    52
014B050 10      1
014B062 1276    36
014B090 53      6
014BA00 1367    13
020     34     7
040     6      4
600     1669   50
A0001   3245   18
aim     total  singal_total
ATM001  815    2
AYST001 254     7
AYST002 5451    156
Z0001   3      1
[wxr@C66-test oldboy]$cat sort_old.awk
BEGIN{
print"aim""\t" "total" "\t""singal_total"
}
{
array_count[$2]+=$1
if(array[$2] != $3)
{
count[$2]++
array[$2]=$3
}
 
}
END{
for(n in count)
printn"\t"array_count[n]"\t"count[n]
}

方法二

只用awk
[wxr@C66-test awk]$ awk '{array[$0]++}END{for(keyin array)print key,array[key]}' 11.txt|awk '{array_count[$1]+=$3;if(array[$1]!= $2) { count[$1]++;array[$1]=$2 }} END {for(n in count) printn"\t"array_count[n]"\t"count[n]}'
Z0001  3       1
000    2227    60
ATM001 815     2
001    3880    4
014B062 1276   36
014B090 53     6
020    34      7
040    6       4
004    53      2
600    1669    50
014B010 1414   52
014B002 6      2
AYST001 254    7
AYST002 5451   156
014B004 202    2
014BA00 1367   13
A0001  3245    18
014B050 10     1

方法三：感谢老男孩老师给予高级AWK数组示例指导

[wxr@C66-test awk]$ catsort_paste.awk
{
split($0,xarry,FS)
one=xarry[1]
two=xarry[2]
 
array_count[one]++
 
if(!((one,two) intree)){
   tree[one,two]=1
   count[one]++
 }
}
END{
for(k in count){
printf("%16s %16s%16s \n",k,count[k],array_count[k])|"sort"
 }
}
[wxr@C66-test awk]$ awk-f sort_paste.awk 11.txt
             000               60             2227
             001                4             3880
             004                2               53
         014B002                2                6
         014B004                2              202
         014B010               52             1414
         014B050                1               10
         014B062               36             1276
         014B090                6               53
         014BA00               13             1367
             020                7               34
             040                4                6
             600               50             1669
           A0001               18            3245
          ATM001                2              815
         AYST001                7              254
         AYST002              156             5451
           Z0001                1                3

方法四：（同学穷酸书生）

[wxr@C66-test awk]$ awk'!array_check[$0]++{array[$1]++}{count[$1]++}END{for (n in array)printf("%16s %16s %16s\n",n,array[n],count[n])|"sort"}'11.txt
            000               60             2227
            001                4             3880
             004                2               53
        014B002                2                6
        014B004                2              202
        014B010               52             1414
        014B050                1               10
        014B062               36             1276
        014B090                6               53
        014BA00               13             1367
            020                7               34
            040                4                6
            600               50             1669
          A0001               18             3245
         ATM001                2              815
        AYST001                7              254
        AYST002              156             5451
          Z0001                1                3

小结：

1．上面的还可以继续改进加上标题，BEGIN{}自由发挥吧。

2．练习使用awk数组，理解数组下标就是个字符串。

解决后的答案很光鲜，看看背后的花絮吧。

老男孩 2015/4/6 17:24:16
不太好理解这位网友的意思
沟通成本太大了
你好好理解下 说明给我吧，然后老师指导你搞定，
你们学了awk数组了，这是练兵的最好机会，呵呵！

21期学员-悠久之翼 2015/4/6 17:24:34
嗯是的。  我花了2天才理解。
[wxr@C66-test oldboy]$ awk '{array[$0]++}END{for(n in array) print n,array[n]}' 11.txt|sort |grep ^000
000 010121008040030 13
000 010121009642993 84
000 010121009794788 1
000 010121011000030 1
000 010121011079336 56
000 010121011153649 14
000 010121012000089 8
000 010121012002325 159
000 010121012002400 7
000 010121012002687 14
000 010121012002692 2
000 010121012002722 43
000 010121012003231 15
000 010121012003452 1
000 010121012003516 9
000 010121012003711 24
000 010121012003875 8
000 010121012003986 6
000 012345678912345 62
000 014421001000002 1
000 014444000015121 10
000 101211489913522 30
000 106552913112164 36
000 108112812133281 3
000 1151 1
000 117128150151313 13
000 121460828135981 33
000 157135111231073 33
000 1bad6941cfcd81a7 89
000 201213741313151 2
这是第一步
然后对他 wc -l  
[wxr@C66-test oldboy]$ awk '{array[$0]++}END{for(n in array) print n,array[n]}' 11.txt|sort |grep ^000|wc -l
60

21期学员-悠久之翼 2015/4/6 17:26:31
是在$0 基础之上在统计数目。   

21期学员-悠久之翼 2015/4/6 17:28:16
60是在对 $0 作为key 之后，再次进行统计。

老男孩 2015/4/6 17:31:24
你使用少量数据给出要的效果
不然 难以理解，几条数据说明问题，表达能力比技术更重要

21期学员-悠久之翼 2015/4/6 17:32:55
好的 

21期学员-悠久之翼 2015/4/6 17:38:15
[wxr@C66-test oldboy]$ awk '{array[$0]++}END{for(n in array) print n,array[n]}' 11.txt|sort
先进行$0去重，截取
000 c78f62db913017ea 18
000 e15cdefdc82edf20 25
000 e78dff28765d30fd 14
000 f636438c74685fcb 4
001 010121012002346 1
001 012345678912345 3646
001 015159014078175 1
001 1152 232
004 010121011079336 48
004 012345678912345 5
014B002 010121009019316 3
014B002 010121009201084 3
014B004 57e22bae43dfeafa 36
014B004 9e0647d809f4e31f 166
014B010 1c6bf2d598b3d9b5 69
014B010 2b6d303654a64ef3 6
014B010 2b742e4ee5aef95d 14
获得的结果：
000 	一共出现的次数 $0去重后，以000开头$2不同的个数
000 	18+25+14+4      4
001 	1+3646    		4
004 	48+5 			2
014B002 3+5 			2 
014B004 36+166 			2 
014B010 69+6+14 		3 

老男孩 2015/4/6 17:42:53
以000开头$2不同的个数 $2是c78f62db913017ea 列？还是$3

21期学员-悠久之翼 2015/4/6 17:43:19
$2 

老男孩 2015/4/6 17:43:20
你这个结果的第三列哪来的

老男孩 2015/4/6 17:44:15
明白了

21期学员-悠久之翼 2015/4/6 17:44:19
000 c78f62db913017ea 18
000 e15cdefdc82edf20 25
000 e78dff28765d30fd 14
000 f636438c74685fcb 4
000开头 $2 不同的个数 就是 $2

老男孩 2015/4/6 17:44:25
这是你理解的 还是人家真是这个意思

21期学员-悠久之翼 2015/4/6 17:44:35
这题不说明白很难理解。

老男孩 2015/4/6 17:44:46
是的

21期学员-悠久之翼 2015/4/6 17:44:49
我的理解 然后 我对比了 他的结果 看样子是对的。

21期学员-悠久之翼 2015/4/6 17:45:51
从结果看是这样的意思。

老男孩 2015/4/6 17:46:16
呵呵，聊天记录都保留，你说这理解别人的思想多难
自己不说清楚 就更难

21期学员-悠久之翼 2015/4/6 17:46:41
用数据说话才是王道。

老男孩 2015/4/6 17:46:43
我这时间有限啊，不喜欢猜别人的想法。这就是表达能力

21期学员-悠久之翼 2015/4/6 17:48:52
我会下次整理的更好 再问的。  

老男孩 2015/4/6 17:50:19
你没搞定么，不难啊，可以两条awk，也可以多维数组，不过要awk编程了

21期学员-悠久之翼 2015/4/6 17:51:11
2条就简单了。我就想着一条。

老男孩 2015/4/6 17:51:46
别啊!

21期学员-悠久之翼 2015/4/6 17:51:46
sort uniq 换成awk|awk 就行了。

老男孩 2015/4/6 17:51:59
先来两条给个答案看看,事情都是一步步解决的。
一条就要多个数组，甚至多为数组了

21期学员-悠久之翼 2015/4/6 17:53:06
我就是纠结那个多维数组。 蒙了。。

老男孩 2015/4/6 17:53:14
你先分两条搞定，回头老师帮你实现一条的方法
一步步来，等你结果！

21期学员-悠久之翼 2015/4/6 17:53:45
好的

老男孩 2015/4/6 17:54:28
2条搞定后 你自然可以多条搞定，我给你一个我以前写的awk多数组加函数的例子
接文件仔细看

21期学员-悠久之翼 2015/4/6 17:58:37
[wxr@C66-test oldboy]$ awk '{array[$0]++}END{for(n in array) print n,array[n]}' 11.txt|awk '{array_count[$1]+=$3;if(array[$1] != $2){count[$1]++;array[$1]=$3}}END{for (n in count)print n"\t"array_count[n]"\t"count[n]|"sort -n"}'
000     2227    60
A0001   3245    18
ATM001  815     2
AYST001 254     7
AYST002 5451    156
Z0001   3       1
001     3880    4
004     53      2
014B002 6       2
014B004 202     2
014B010 1414    52
014B050 10      1
014B062 1276    36
014B090 53      6
014BA00 1367    13
020     34      7
040     6       4
600     1669    50

21期学员-悠久之翼 2015/4/6 17:59:44
自己看着都晕。

老男孩 2015/4/6 18:01:48
哇，搞定了？
对方已成功接收了您发送的离线文件“parse-awk例子老男孩教育案例.rar”(29.84KB)。

21期学员-悠久之翼 2015/4/6 18:02:52
是的 因为 两个awk 就是拼积木了。  
第一个$0  第二个 $1 $2 计数 我之前做好的 改一下就能用。

21期学员-悠久之翼 2015/4/6 18:06:08
好东西。谢谢老师。

老男孩 2015/4/6 18:07:21
先2条搞定这个就可以了，接下来要AWK编程了
处理完不输出，继续处理。用我给你的例子 就可以了

21期学员-悠久之翼 2015/4/6 18:07:53
明白 那些函数的使用 很头痛。

老男孩 2015/4/6 18:08:58
思路清晰了 就简单了啊
接下来要AWK编程，处理完不输出，继续处理，直到得到最终结果再输出
这个搞定了 你AWK能力就 再运维层次里NO1了

21期学员-悠久之翼 2015/4/6 18:10:13
谢谢老师指点。

老男孩 2015/4/6 18:10:49
有思路没？现在

21期学员-悠久之翼 2015/4/6 18:13:19
有一点点  
使用split把数据分块。 
A   B   
然后 A,B in array 查询 
不存在就 count++
理解到这里。 


21期学员-悠久之翼 2015/4/6 18:15:22
之前我也这样想过 可是没办法实现。
现在可以尝试一下了。
谢谢老师。

21期学员-悠久之翼 2015/4/7 7:25:53
[wxr@C66-test awk]$ cat sort_paste.awk 
{
split($0,xarry,FS)
one=xarry[1]
two=xarry[2]

array_count[one]++

if(!((one,two) in tree)){ 
   tree[one,two]=1
   count[one]++
 }
}
END{
for(k in count){
printf("%16s %16s %16s \n",k,count[k],array_count[k])|"sort"
 }
}
[wxr@C66-test awk]$ awk -f sort_paste.awk 11.txt 
             000               60             2227 
             001                4             3880 
             004                2               53 
         014B002                2                6 
         014B004                2              202 
         014B010               52             1414 
         014B050                1               10 
         014B062               36             1276 
         014B090                6               53 
         014BA00               13             1367 
             020                7               34 
             040                4                6 
             600               50             1669 
           A0001               18             3245 
          ATM001                2              815 
         AYST001                7              254 
         AYST002              156             5451 
           Z0001                1                3 

21期学员-悠久之翼 2015/4/7 22:58:46
问题已经解决，四种方法。 
请老师指点一下，哪里需要 改进。

数组去重好奇的猫猫猫
整理自js中基础数据结构数组去重问题思考？如何去除数组中重复的项例如数组：[1,3,4,3,5]我们在做去重的时候，一开始想到的肯定是，逐个比较，外面一层循环，内层后一个与前一个一比较，如果是久不将当前这一项放进新的数组，挨个比较完之后返回一个新的去过重复的数组不好的实践方式上述方法效率极低，代码量还多，思考？有没有更好的方法这时候不禁一想当然有了！！！hashtable啊，通过对象的hash办法
121. 买卖股票的最佳时机薄荷糖的味道_fb40
给定一个数组，它的第i个元素是一支给定股票第i天的价格。如果你最多只允许完成一笔交易（即买入和卖出一支股票），设计一个算法来计算你所能获取的最大利润。注意你不能在买入股票前卖出股票。示例1:输入:[7,1,5,3,6,4]输出:5解释:在第2天（股票价格=1）的时候买入，在第5天（股票价格=6）的时候卖出，最大利润=6-1=5。注意利润不能是7-1=6,因为卖出价格需要大于买入价格。示例2:输入:
【JS】执行时长(100分) |思路参考+代码解析（C++） l939035548 JS 算法数据结构 c++
题目为了充分发挥GPU算力，需要尽可能多的将任务交给GPU执行，现在有一个任务数组，数组元素表示在这1秒内新增的任务个数且每秒都有新增任务。假设GPU最多一次执行n个任务，一次执行耗时1秒，在保证GPU不空闲情况下，最少需要多长时间执行完成。题目输入第一个参数为GPU一次最多执行的任务个数，取值范围[1,10000]第二个参数为任务数组长度，取值范围[1,10000]第三个参数为任务数组，数字范围
209. 长度最小的子数组（滑动窗口）追光者2020 leetcode 双指针/滑动窗口
题目描述给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,…,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。示例1：输入：target=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。示例2：输入：target=4,nums
209. 长度最小的子数组（中等数组滑动窗口）风雨中de宁静 leetcode 算法排序算法
209.长度最小的子数组给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,…,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。示例1：输入：target=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。示例2：输入：targe
209. 长度最小的子数组（滑动窗口法）清榎 leetcode刷题 c++leetcode 算法
209.长度最小的子数组题目描述：给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,...,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。解答：法一：直接使用暴力法。两重循环，对每一个元素向后进行寻找，若找到一个子数组≥target，比较其长度和result的大小，如果其长度
C语言判断回文数 Y雨何时停T c语言学习
一，回文数概念“回文”是指正读反读都能读通的句子，它是古今中外都有的一种修辞方式和文字游戏，如“我为人人，人人为我”等。在数学中也有这样一类数字有这样的特征，成为回文数。设n是一任意自然数。若将n的各位数字反向排列所得自然数n1与n相等，则称n为一回文数。例如，若n=1234321，则称n为一回文数；但若n=1234567，则n不是回文数。二，判断回文数实现思路一：数组与字符串将数字每一位按顺序放
209. 长度最小的子数组-滑动窗口 hequnwang10 Java LeetCode 算法
一、题目描述给定一个含有n个正整数的数组和一个正整数target。找出该数组中满足其和≥target的长度最小的连续子数组[numsl,numsl+1,…,numsr-1,numsr]，并返回其长度。如果不存在符合条件的子数组，返回0。示例1：输入：target=7,nums=[2,3,1,2,4,3]输出：2解释：子数组[4,3]是该条件下的长度最小的子数组。示例2：输入：target=4,nu
2024.9.14 Python，差分法解决区间加法，消除游戏，压缩字符串 RaidenQ python 游戏开发语言算法力扣
1.区间加法假设你有一个长度为n的数组，初始情况下所有的数字均为0，你将会被给出k个更新的操作。其中，每个操作会被表示为一个三元组：[startIndex,endIndex,inc]，你需要将子数组A[startIndex…endIndex]（包括startIndex和endIndex）增加inc。请你返回k次操作后的数组。示例:输入:length=5,updates=[[1,3,2],[2,4,
C语言代码练习（第十九天）小小框架 C语言 C语言重点练习 c语言
今日练习：52、有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中53、输出"魔方阵"。所谓魔方阵是指它的每一行，每一列和对角线之和均相等。54、找出一个二维数组中的鞍点，即该位置上的元素在该行上最大、在该列上最小。也可能没有鞍点。有一个已经排好序的数组，要求输入一个数后，按原来排序的规律将它插入数组中运行代码intmain(){intarr[11]={1,3,9,12,15
ArrayList 源码解析程序猿进阶 Java基础 ArrayList List java 面试性能优化架构设计 idea
ArrayList是Java集合框架中的一个动态数组实现，提供了可变大小的数组功能。它继承自AbstractList并实现了List接口，是顺序容器，即元素存放的数据与放进去的顺序相同，允许放入null元素，底层通过数组实现。除该类未实现同步外，其余跟Vector大致相同。每个ArrayList都有一个容量capacity，表示底层数组的实际大小，容器内存储元素的个数不能多于当前容量。当向容器中添
4.C_数据结构_队列荣世蓥数据结构数据结构
概述什么是队列：队列是限定在两端进行插入操作和删除操作的线性表。具有先入先出(FIFO)的特点相关名词：队尾：写入数据的一段队头：读取数据的一段空队：队列中没有数据，队头指针=队尾指针满队：队列中存满了数据，队尾指针+1=队头指针循环队列1、基本内容循环队列是以数组形式构成的队列数据结构。循环队列的结构体如下：typedefintdata_t;//队列数据类型#defineN64//队列容量typ
JavaScript 中，深拷贝（Deep Copy）和浅拷贝（Shallow Copy）跳房子的前端前端面试 javascript 开发语言 ecmascript
在JavaScript中，深拷贝（DeepCopy）和浅拷贝（ShallowCopy）是用于复制对象或数组的两种不同方法。了解它们的区别和应用场景对于避免潜在的bugs和高效地处理数据非常重要。以下是对深拷贝和浅拷贝的详细解释，包括它们的概念、用途、优缺点以及实现方式。1.浅拷贝（ShallowCopy）概念定义：浅拷贝是指创建一个新的对象或数组，其中包含了原对象或数组的基本数据类型的值和对引用数
【数据结构-一维差分】力扣2848. 与车相交的点 hlc@ 数据结构数据结构 leetcode 算法
给你一个下标从0开始的二维整数数组nums表示汽车停放在数轴上的坐标。对于任意下标i，nums[i]=[starti,endi]，其中starti是第i辆车的起点，endi是第i辆车的终点。返回数轴上被车任意部分覆盖的整数点的数目。示例1：输入：nums=[[3,6],[1,5],[4,7]]输出：7解释：从1到7的所有点都至少与一辆车相交，因此答案为7。示例2：输入：nums=[[1,3],[5
《 C++ 修炼全景指南：四》揭秘 C++ List 容器背后的实现原理，带你构建自己的双向链表 Lenyiin 技术指南 C++修炼全景指南 c++list 链表 stl
本篇博客，我们将详细讲解如何从头实现一个功能齐全且强大的C++List容器，并深入到各个细节。这篇博客将包括每一步的代码实现、解释以及扩展功能的探讨，目标是让初学者也能轻松理解。一、简介1.1、背景介绍在C++中，std::list是一个基于双向链表的容器，允许高效的插入和删除操作，适用于频繁插入和删除操作的场景。与动态数组不同，list允许常数时间内的插入和删除操作，支持双向遍历。这篇文章将详细
wandb一直上传解决方案行业边缘的摸鱼怪 bug解决方案服务器 linux 服务器
问题描述运行带有wandb的代码时，虽然可以实现及时同步非常方便，但当设置错参数或其他原因不得不使用ctrl+C停止运行时，总会出现wandb一直上传个不停的现象，给在同一终端重新运行新的代码造成困难。解决方案运行以下代码把wandb的进程直接杀死。psaux|grepwandb|grep-vgrep|awk'{print$2}'|xargskill-9参考链接[CLI]:Ctrl+Ctokill
Golang语言基础知识点总结最帅猪猪侠 golang 开发语言后端
Golang语言基础知识点小总结1.go语言有两大类型：值类型：数值类型，bool，string，数组，struct结构体变量直接存储值，内存通常在栈中分配,修改值,不会对源对象产生影响引用类型：指针，slice切片，管道chan，map，interface变量存储的是一个地址，这个地址对应的空间才真正存储数据值，内存通常在堆上分配，当没有任何变量引用这个地址时，该地址对应的数据空间就成为一个垃圾
leetcode中等.数组(21-40)python 九日火 python leetcode
80.RemoveDuplicatesfromSortedArrayII(m-21)Givenasortedarraynums,removetheduplicatesin-placesuchthatduplicatesappearedatmosttwiceandreturnthenewlength.Donotallocateextraspaceforanotherarray,youmustdoth
高性能javascript--算法和流程控制海淀萌狗
-for,while和do-while性能相当-避免使用for-in循环，==除非遍历一个属性量未知的对象==es5:for-in遍历的对象便不局限于数组，还可以遍历对象。原因：for-in每次迭代操作会同时搜索实例或者原型属性，for-in循环的每次迭代都会产生更多开销，因此要比其他循环类型慢，一般速度为其他类型循环的1/7。因此，除非明确需要迭代一个属性数量未知的对象，否则应避免使用for-i
leetcode刷题day13|二叉树Part01（递归遍历、迭代遍历、统一迭代、层序遍历）小冉在学习 leetcode 算法职场和发展
递归遍历思路：使用递归的方式比较简单。1、递归函数的传参：因为最后输出一个数组，所以需要传入根节点和一个容器，本来想写数组，但发现长度不能确定，所以选择list。2、终止条件：当访问的节点为空时，return3、递归函数的逻辑：先访问一个节点，递归访问其他节点144.二叉树的前序遍历代码如下：classSolution{publicListpreorderTraversal(TreeNoderoo
排序路小白同学
1.冒泡排序冒泡算法是一种基础的排序算法，这种算法会重复的比较数组中相邻的两个元素。如果一个元素比另一个元素大（小），那么就交换这两个元素的位置。重复这一比较直至最后一个元素。这一比较会重复n-1趟，每一趟比较n-j次，j是已经排序好的元素个数。每一趟比较都能找出未排序元素中最大或者最小的那个数字。这就如同水泡从水底逐个飘到水面一样。冒泡排序是一种时间复杂度较高，效率较低的排序方法。其空间复杂度是
滑动窗口+动态规划 wniuniu_ 算法动态规划算法
前言：分析这个题目的时候，就知道要这两个线段要分开，但是要保证得到最优解，那么我们在选取第二根线段的时候，要保证我们第一根线段是左边最优解并且我们选的两根线段的右端点一定是我们的数组的点（贪心思想）classSolution{public:intmaximizeWin(vector&prizePositions,intk){intn=prizePositions.size();vectormx(n
python中zeros用法_Python中的numpy.zeros()用法江平舟 python中zeros用法
numpy.zeros()函数是最重要的函数之一,广泛用于机器学习程序中。此函数用于生成包含零的数组。numpy.zeros()函数提供给定形状和类型的新数组,并用零填充。句法numpy.zeros(shape,dtype=float,order='C'参数形状：整数或整数元组此参数用于定义数组的尺寸。此参数用于我们要在其中创建数组的形状,例如(3,2)或2。dtype：数据类型(可选)此参数用于
算法刷题：300. 最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组、1143. 最长公共子序列哆来咪咪咪算法
300.最长递增子序列1.dp定义：dp[i]表示i之前包括i的以nums[i]结尾的最长递增子序列的长度2.递推公式：if(nums[i]>nums[j])dp[i]=max(dp[i],dp[j]+1);注意这里不是要dp[i]与dp[j]+1进行比较，而是我们要取dp[j]+1的最大值。3.初始化：每一个i，对应的dp[i]（即最长递增子序列）起始大小至少都是1.classSolution{
1013. 将数组分成和相等的三个部分软饭王
题目：将数组分成和相等的三个部分给你一个整数数组A，只有可以将其划分为三个和相等的非空部分时才返回true，否则返回false。形式上，如果可以找出索引i+1
第三周第二天2019-11-12 曲超king
今天学习字符串1、chars[5]={'A','S'},数组里面是单个的字符，由‘’chars[5]={"aasd"},数组里面是字符串，由“”chars[5]={"a"}也是一个字符串。其中的5代表字符串的长度每个字符串在结束位置都有\0,\0占一个元素。{\0}表示空的字符串。在输出时，%c代表字符输出，%s代表字符串输出。2、字符的长度一定要比总长度少一位，因为隐藏一个\0，系统自己默认规定
Numpy 学习沐辰老爹
创建指定数值的数组a=np.full((3,5),np.pi)高级通用函数的特性#1.指定输出x=np.arange(10)y=np.empty(10)np.multiply(x,10,out=y)#2.聚合x=np.arange(10)x_sum=np.add.reduce(x)#类似的可用于logical_and等np.logical_and([condition1,condition2,co
数组模拟单链表 Star_. 蓝桥杯 java 数据结构链表
实现一个单链表，链表初始为空，支持三种操作：向链表头插入一个数；删除第k个插入的数后面的数；在第k个插入的数后插入一个数。现在要对该链表进行M次操作，进行完所有操作后，从头到尾输出整个链表。注意:题目中第k个插入的数并不是指当前链表的第k个数。例如操作过程中一共插入了n个数，则按照插入的时间顺序，这n个数依次为：第1个插入的数，第2个插入的数，…第n个插入的数。输入格式第一行包含整数M，表示操作次
opencv学习：图像旋转的两种方法，旋转后的图片进行模板匹配代码实现夜清寒风学习 opencv 机器学习人工智能计算机视觉
图像旋转在图像处理中，rotate和rot90是两种常见的图像旋转方法，它们在功能和使用上有一些区别。下面我将分别介绍这两种方法，并解释它们的主要区别rot90方法rot90方法是NumPy提供的一种数组旋转函数，它主要用于对二维数组（如图像）进行90度的旋转。这个方法比较简单，只支持90度的倍数旋转，不支持任意角度旋转。使用NumPy进行旋转使用NumPy的rot90函数对模板图像进行旋转操作。
18068 选择排序蠢蠢的打码高级应用程序设计算法数据结构
###思路1.**初始化**：定义变量`i`,`j`,`k`和临时变量`tmp`。2.**外层循环**：遍历数组的每个元素，`i`从0到`n-2`。3.**内层循环**：从`i+1`到`n-1`，找到最小元素的索引`k`。4.**交换**：将最小元素与当前元素交换。###伪代码1.初始化`i`,`j`,`k`和`tmp`。2.外层循环从`i=0`到`n-2`：-设置`k=i`。-内层循环从`j=i
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在