数据结构自学 第一章 向量

第一章 vector
ADT是抽象数据类型,为一组数据模型,加上一组操作,不涉及具体的储存方式,就像是用户使用的产品(黑箱),只考虑抽象层面

DS是数据接收,是根据特定语言实现ADT的算法,设计复杂度和各种具体机制。

(计算幂次方的方法:
pow(a,b)
we can devide b into binary type and pow(a,2^n) = pow(a,2^(n-1))
so we can do it in O(log2 n), each time rotate 1 time.

vector 向量数据结构,可以对不同数据类型操作,并且封装了许多操作,比如remove(r),sort(),search(e)无序去重,deduplicate(),uniquify()有序去重,traverse()遍历

search(n) 返回不大于n的元素的最后的rank
put(a,b) 将rank为a的数改为b

平均复杂度:根据数据结构个操作出现概率分布进行加权平均,每个操作作为独立事件,割裂了相关性与连贯性

分摊复杂度:将数据结构连续地实施足够多的操作,所需总体成本分摊至单次操作。对一系列操作整体考量,更加精确。

vector 插入算法:
从固定插入位置开始,先扩容,然后从rank = n downto 固定位置k
vector[n] = vector[n-1]逐个后移
最后执行插入。

vector 删除:
区间删除:
删除从lo 到 hi 的区间

则执行如下:
_elem[lo++] = _elem[hi++]
即从前向后逐次移位
不能更改次序,因为如果要删除的区间与想向前移动的区间有重复区间,从后向前的话会覆盖掉重复区间的部分。

有序相向量的唯一化
低效版:
有序向量,重复的元素构成一个区间,因此每个区间保留一个即可。
于是可以从前向后依次检查来逐个删除相同元素
O(N^2)

高效版:
成批删除雷同元素,将他们视为一个整体。
i = j = 0
如果二者不相等,则_elem[++i] = _elem[++j],相当于忽略了所有重复元素(没有直接显示调用删除)。


Fabonacci查找法:
由于二分查找在大于、小于和等于的情况下比较次数不同,所以造成内部比较次数的不平均,因此为了平衡比较和查找次数,可以构建一个看起来不平衡的数列来平衡比较次数。这就是Fabonacci查找法

while(lo < hi)
{
while (hi - ol < fib.get()) fib.previous();
rank mi = lo + fib.get() - 1;
if (e < A[mi]) hi = mi;
else if (A[mi] < e) lo = mi + 1;
else return mi;
}
return -1;

证明:运用递推*

————————————————————————
二分查找的改进版:
为了隐藏比较次数,只比较一次:
while(1 < hi - lo)
{
rank mi = (lo + hi) >>1;
( e < A[mi] ) ? hi = mi : lo = mi; (不再是 mi + 1)
}出口时 hi = lo + 1
return (e == A[lo]) ? lo : -1;
只是平均情况减少,但最好情况增加。

最优化版:如果不在其中,还可返回最近的小于此元素的坐标

冒泡排序改进:可以记录前面是否有逆序对,如果没有就证明不用再排序了
再改进:可以增加一个last,也就是最后一个逆序对的位置,然后以后就只用排开始到last位置的元素了。

你可能感兴趣的:(自学,mooc,数据结构)