大数据算法学习笔记(六):数组有序性判定

问题:N个数的数组,x1,x2,……,xn,判定该数组是否有序。

定义ε远离:必须删除大于εn个元素才能保证剩下的元素有序。


亚线性算法:

for k=1 to 2/ε do

     选择数组中第i个元素xi

     用xi在数组中做二分查找

     if i<j and xi>xj then return false

return true

时间复杂度:O(1/ε*logn)


精确性:

显然,当输入序列有序时,总返回true。

下面证明,当输入数列ε远离有序时,算法以大于2/3的概率返回false


首先证明:如果输入是ε远离有序的,那么存在大于εn个"坏"索引。

只需证明其逆否命题:坏索引个数小于εn,则存在一个长度大于εn的单调递增子序列


证明:当ε远离有序时,返回true的概率小于1/3

当数组中坏索引的概率大于ε时,选择的索引都是好的概率小于(1-ε)^(2/ε)<e^(-2)<1/3


你可能感兴趣的:(大数据算法学习笔记(六):数组有序性判定)