求逆序数的题-实现(归并排序和树状数组)

 

PKU2299-求逆序数的题-实现(归并排序和树状数组)

分类: 算法和数据结构学习   1936人阅读  评论(5)  收藏  举报
input merge 存储 算法 数据结构 struct

通过这个题,复习了归并排序的实现,同时了解了归并排序在求数组逆序数方面的一个应用,同时也第一次学习了树状数组

 

题目大意:

很直接的题目描述,题目输入一个数组,数组元素的大小在0->999.999.999的范围内,元素个数为0-500000范围。

题目要求通过相邻的元素的交换,使得输入的数组变为有序,要求输出交换的次数?

例如:输入9 1 0 5 4 ,把他变成0 1 4 5 9 , 要经过多少次交换。


 

思路1:

题目要求求出总的交换的次数,这个问题和“求出数组的总的逆序数是一样的?”

例如输入数组9 1 0 5 4它的逆序数是6,那么交换的总次数呢?

第1次冒泡结果,0 9 1 5 4 交换了2次, 就等于0的逆序数。

第2次冒泡结果,0 1 9 5 4 交换了1次,就等于1的逆序数。

第3次冒泡结果,0 1 4 9 5 交换了2次,就等于4的逆序数。

第4次冒泡结果,0 1 4 5 9 交换了1次,就等于5的逆序数。

第5次冒泡结果,0 1 4 5 9交换了0次,就等于9的逆序数。

2+1+2+1+0 = 6

所以问题转化为求数组的逆序数的问题?

于是只要遍历每一位,计算出每一位的逆序数,求和即可,实现略,时间复杂度也是O(N^2).

 

下面思路2和思路3将会讲到两个时间复杂度为O(NlogN)的算法的实现。

思路2:

归并排序实现求数组的逆序数,这个是归并排序的一个应用,但是以前一直不知道,太弱了。

思路在前一篇日志(排序-归并排序与求逆序数的算法)里讲到过,主要就是在归并排序的基础上加上了一句语句。

具体思路就不讲了。贴一下实现代码:

[cpp]  view plain copy
  1. /* 
  2. 求一个数组的逆序数,用归并排序实现时间复杂度为O(NlogN),提高了单纯使用冒泡排序的速度。 
  3. 只是在归并排序的基础上加了句 result += middle - i + 1; 
  4. 如果后一个数组中的数比前一个数组中的数小,既input[j] < input[i]时,, 
  5. 我们的计数器result就需要增加,而增加的量应该是前一个数组的剩余数据的个数middle-i+1, 
  6. 归并排序的目的是通过把两个前后已经排好序的数组合并排成一个有序的数组。  
  7. 既后面那个数组的第一个数input[j],如果要通过使其有序,那么它得和前面middle-i+1个数字交换位置。 
  8. 需要注意的是result是个很大的值,得用longlong 型类型。  
  9. */  
  10. #include <iostream>  
  11. #include <stdio.h>  
  12. #include <stdlib.h>  
  13. #define MAXN 500005  
  14. using namespace std;  
  15. int N;  
  16. int input[MAXN] = {0};  
  17. int tmp[MAXN];  
  18. long long result;  
  19. void merge(int left, int middle, int right)  
  20. {  
  21.      int i, j, k;  
  22.      i = left, j= middle+1, k = 1;  
  23.      while(i<= middle && j <= right)  
  24.      {  
  25.                if(input[j] < input[i])  
  26.                {  
  27.                     tmp[k++] = input[j++];  
  28.                     result += middle - i + 1;        //增加的语句。   
  29.                }  
  30.                else  
  31.                     tmp[k++] = input[i++];  
  32.      }  
  33.        
  34.      while(i <= middle)  tmp[k++] = input[i++];  
  35.      while(j <= right) tmp[k++] = input[j++];  
  36.        
  37.      for(i = left, k = 1; i<= right; i++, k++)  
  38.             input[i] = tmp[k];  
  39. }  
  40. void merge_sort(int left, int right)  
  41. {  
  42.      if(left < right)  
  43.      {  
  44.              int middle = (left + right)/2;  
  45.              merge_sort(left, middle);  
  46.              merge_sort(middle+1, right);  
  47.              merge(left, middle, right);  
  48.      }  
  49. }  
  50. int main()  
  51. {  
  52.     int i, j, k;  
  53.     while(true)  
  54.     {  
  55.           cin >> N;  
  56.           if(N == 0) break;  
  57.             
  58.           for(i = 1; i<= N; i++)  
  59.               scanf("%d", &input[i]);  
  60.             
  61.           result = 0;  
  62.           merge_sort(1, N);  
  63.             
  64.           cout << result << endl;  
  65.     }  
  66.     return 0;  
  67. }  
 

 

思路3:

树状数组,具体的说是 离散化+树状数组。这也是学习树状数组的第一题.

 

算法的大体流程就是:

1.先对输入的数组离散化,使得各个元素比较接近,而不是离散的,

2.接着,运用树状数组的标准操作来累计数组的逆序数。

 

算法详细解释: 

1.解释为什么要有离散的这么一个过程?

    刚开始以为999.999.999这么一个数字,对于int存储类型来说是足够了。

    还有只有500000个数字,何必要离散化呢?

    刚开始一直想不通,后来明白了,后面在运用树状数组操作的时候,

    用到的树状数组C[i]是建立在一个有点像位存储的数组的基础之上的,

    不是单纯的建立在输入数组之上。

    比如输入一个9 1 0 5 4,那么C[i]树状数组的建立是在,

    下标 0 1 2 3 4 5 6 7 8 9 

    数组 1 1 0 0 1 1 0 0 0 1

    现在由于999999999这个数字相对于500000这个数字来说是很大的,

    所以如果用数组位存储的话,那么需要999999999的空间来存储输入的数据。

    这样是很浪费空间的,题目也是不允许的,所以这里想通过离散化操作,

    使得离散化的结果可以更加的密集。 

 

2. 怎么对这个输入的数组进行离散操作?

   离散化是一种常用的技巧,有时数据范围太大,可以用来放缩到我们能处理的范围;

   因为其中需排序的数的范围0---999 999 999;显然数组不肯能这么大;

   而N的最大范围是500 000;故给出的数一定可以与1.。。。N建立一个一一映射;

   ①当然用map可以建立,效率可能低点;

   ②这里用一个结构体

   struct Node

   {

      int v,ord;

   }p[510000];和一个数组a[510000];

   其中v就是原输入的值,ord是下标;然后对结构体按v从小到大排序;

   此时,v和结构体的下标就是一个一一对应关系,而且满足原来的大小关系;

   for(i=1;i<=N;i++) a[p[i].ord]=i;

   然后a数组就存储了原来所有的大小信息;

   比如 9 1 0 5 4 ------- 离散后aa数组就是 5 2 1 4 3;

   具体的过程可以自己用笔写写就好了。 

 

3. 离散之后,怎么使用离散后的结果数组来进行树状数组操作,计算出逆序数? 

    如果数据不是很大, 可以一个个插入到树状数组中, 

    每插入一个数, 统计比他小的数的个数,

    对应的逆序为 i- getsum( aa[i] ),

    其中 i 为当前已经插入的数的个数, 

    getsum( aa[i] )为比 aa[i] 小的数的个数, 

    i- sum( aa[i] ) 即比 aa[i] 大的个数, 即逆序的个数

    但如果数据比较大,就必须采用离散化方法

    假设输入的数组是9 1 0 5 4, 离散后的结果aa[] = {5,2,1,4,3}; 

在离散结果中间结果的基础上,那么其计算逆序数的过程是这么一个过程。

1,输入5,   调用upDate(5, 1),把第5位设置为1 

1 2 3 4 5 

0 0 0 0 1

计算1-5上比5小的数字存在么? 这里用到了树状数组的getSum(5) = 1操作, 

现在用输入的下标1 - getSum(5) = 0 就可以得到对于5的逆序数为0。

2. 输入2, 调用upDate(2, 1),把第2位设置为1 

1 2 3 4 5 

0 1 0 0 1

计算1-2上比2小的数字存在么? 这里用到了树状数组的getSum(2) = 1操作, 

现在用输入的下标2 - getSum(2) = 1 就可以得到对于2的逆序数为1。

3. 输入1, 调用upDate(1, 1),把第1位设置为1 

1 2 3 4 5

1 1 0 0 1

计算1-1上比1小的数字存在么? 这里用到了树状数组的getSum(1) = 1操作, 

现在用输入的下标 3 - getSum(1) = 2 就可以得到对于1的逆序数为2。

4. 输入4, 调用upDate(4, 1),把第5位设置为1 

1 2 3 4 5

1 1 0 1 1

计算1-4上比4小的数字存在么? 这里用到了树状数组的getSum(4) = 3操作, 

现在用输入的下标4 - getSum(4) = 1 就可以得到对于4的逆序数为1。

5. 输入3, 调用upDate(3, 1),把第3位设置为1 

1 2 3 4 5

1 1 1 1 1

计算1-3上比3小的数字存在么? 这里用到了树状数组的getSum(3) = 3操作, 

现在用输入的下标5 - getSum(3) = 2 就可以得到对于3的逆序数为2。

6. 0+1+2+1+2 = 6 这就是最后的逆序数 

 

分析一下时间复杂度,首先用到快速排序,时间复杂度为O(NlogN),

后面是循环插入每一个数字,每次插入一个数字,分别调用一次upData()和getSum()

外循环N, upData()和getSum()时间O(logN) => 时间复杂度还是O(NlogN).

最后总的还是O(NlogN). 

代码实现如下:

[cpp]  view plain copy
  1. #include <iostream>  
  2. #include <stdio.h>  
  3. #include <stdlib.h>  
  4. #define MAXN 500005  
  5. using namespace std;  
  6. int N;  
  7. struct node  
  8. {  
  9.        int value;  
  10.        int num;  
  11. }input[MAXN];       //存储输入的数组   
  12. int aa[MAXN];       //存储离散化操作后的结果   
  13. int cmp(const void* a, const void* b)                     //离散化操作时排序用   
  14. {  
  15.     return (*(node*)a).value - (*(node*)b).value;  
  16. }  
  17. ////////////////////////////////////////////////////////////   
  18. //标准的树状数组的操作   
  19. ///////////////////////////////////////////////////////////  
  20. int C[MAXN];        //这个就是树状数组, 每次开始时都清零   
  21. int lowbit(int x)  
  22. {  
  23.     return x&(-x);  
  24. }  
  25. void upDate(int n, int delta)  
  26. {  
  27.      while(n <= N)  
  28.      {  
  29.              C[n] += delta;  
  30.              n += lowbit(n);  
  31.      }  
  32. }  
  33. int getSum(int n)  
  34. {  
  35.     int result = 0;  
  36.     while(n >= 1)  
  37.     {  
  38.             result += C[n];  
  39.             n -= lowbit(n);  
  40.     }  
  41.     return result;  
  42. }  
  43. int main()  
  44. {  
  45.     int i, j, k;  
  46.     while(true)  
  47.     {  
  48.          cin >> N;  
  49.          if(N == 0) break;  
  50.          //输入处理和离散化操作   
  51.          for(i = 1; i<= N; i++)  
  52.          {  
  53.                scanf("%d", &input[i].value);  
  54.                input[i].num = i;  
  55.          }    
  56.          qsort(&input[1], N, sizeof(node), cmp);  
  57.          for(i = 1; i<= N; i++) aa[input[i].num] = i;  
  58.            
  59.          //运用树状数组这个数据结构的操作来计算逆序数   
  60.          for(i = 1; i<= N; i++)  
  61.               C[i] = 0;      
  62.          long long result = 0;  
  63.          for(i = 1; i<= N; i++)  
  64.          {  
  65.                upDate(aa[i], 1);  
  66.                result += (i-getSum(aa[i]));  
  67.          }  
  68.            
  69.          cout << result << endl;  
  70.     }  
  71.     return 0;  
  72. }   

总结下求逆序数的集中方法:另外还有balanced size tree ,顺序统计树,线段树;

你可能感兴趣的:(算法和数据结构学习)