学习《算法图解》

1.大O表示法是一种特殊的表示法,指出了算法的速度有多快。O(n)

小结:

二分查找的速度比简单查找快得多。

O (log n )比O (n )快。需要搜索的元素越多,前者比后者就快得越多。

算法运行时间并不以秒为单位。

算法运行时间是从其增速的角度度量的。

算法运行时间用大O表示法表示。

2.链表和数组

链表中的元素可存储在内存的任何地方。

数组和链表哪个用得更多呢?显然要看情况。但数组用得很多,因为它

支持随机访问。有两种访问方式:随机访问 和顺序访问 。顺序访问意

味着从第一个元素开始逐个地读取元素。链表只能顺序访问:要读取链

表的第十个元素,得先读取前九个元素,并沿链接找到第十个元素。随

机访问意味着可直接跳到第十个元素。本书经常说数组的读取速度更

快,这是因为它们支持随机访问。很多情况都要求能够随机访问,因此

数组用得很多。

小结:

计算机内存犹如一大堆抽屉。

需要存储多个元素时,可使用数组或链表。

数组的元素都在一起。

链表的元素是分开的,其中每个元素都存储了下一个元素的地址。

数组的读取速度很快。

链表的插入和删除速度很快。

在同一个数组中,所有元素的类型都必须相同(都为int、double等)。

def binary_search(list,item):
'''二分查找'''
    low=0
    high=len(list)-1
    while low <=high:
        mid=(low+high)//2
        guess=list[mid]
        if guess==item:
            return mid
        if guess >item:
            high=mid-1
        else:
            low=mid+1
    return None
my_list=[1,3,5,7,9]
print(binary_search(my_list,3))
    
def findsmallest(arr):
    '''排序算法'''
    smallest=arr[0] #存储最小的值
    smallest_index=0 #存储最小元素的索引
    for i in range(1,len(arr)):
        if arr[i]

3.递归指的是调用自己的函数。
每个递归函数都有两个条件:基线条件和递归条件。
栈有两种操作:压入和弹出。
所有函数调用都进入调用栈。
调用栈可能很长,这将占用大量的内存。
4.排序
D&C将问题逐步分解。使用D&C处理列表时,基线条件很可能是空数组或只包含一个元素的数组。
实现快速排序时,请随机地选择用作基准值的元素。快速排序的平均运行时间为O (n log n )。
大O表示法中的常量有时候事关重大,这就是快速排序比合并排序快的原因所在。
比较简单查找和二分查找时,常量几乎无关紧要,因为列表很长
时,O (log n )的速度比O (n )快得多。

def quicksort(array):
    '''快速排序'''
    if len(array)<2: #基线条件
        return array
    else:#递归条件
        pivot=array[0]
        less=[i for i in array[1:] if i<=pivot]
        greater=[i for i in array[1:] if i>pivot]
        return quicksort(less)+[pivot]+quicksort(greater)
print(quicksort([10,5,2,3]))

5.散列表在python中就是字典
无论你访问哪个网站,其网址都必须转换为IP地址。这不是将网址映射到IP地址吗?好像非常适合使用散列表啰!这个过程被称为DNS解析 (DNS resolution),散列表是提供这种功能的方式之一。(google.com-74.123.139.3)
散列表适合用于:
仿真映射关系;
防止重复;
缓存/记住数据,以免服务器再通过处理来生成它们。
如果两个键映射到了同一个位置,就在这个位置存储一个链表。
散列函数很重要 。前面的散列函数将所有的键都映射到一个位置,而最理想的情况是,散列函数将键均匀地映射到散列表的不同位置。
如果散列表存储的链表很长,散列表的速度将急剧下降。然而,如果使用的散列函数很好 ,这些链表就不会很长!
你可以结合散列函数和数组来创建散列表。
冲突很糟糕,你应使用可以最大限度减少冲突的散列函数。
散列表的查找、插入和删除速度都非常快。
散列表适合用于仿真映射关系。
一旦填装因子超过0.7,就该调整散列表的长度。
散列表可用于缓存数据(例如,在Web服务器上)。
散列表非常适合用于防止重复。
6.广度优先搜索指出是否有从A到B的路径。
如果有,广度优先搜索将找出最短路径。
面临类似于寻找最短路径的问题时,可尝试使用图来创建模型,再使用广度优先搜索来解决问题。
有向图中的边为箭头,箭头的方向指定了关系的方向,例如,rama→adit表示rama欠adit钱。
无向图中的边不带箭头,其中的关系是双向的,例如,ross - rachel表示“ross与rachel约会,而rachel也与ross约会”。
队列是先进先出(FIFO)的。
栈是后进先出(LIFO)的。
你需要按加入顺序检查搜索列表中的人,否则找到的就不是最短路径,因此搜索列表必须是队列。
对于检查过的人,务必不要再去检查,否则可能导致无限循环。

from collections import deque 
graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["thom", "jonny"]
graph["anuj"] = []
graph["peggy"] = []
graph["thom"] = []
graph["jonny"] = []
def search(name):
    '''广度优先搜索算法'''
    search_queue=deque()
    search_queue += graph[name]
    searched=[]
    while search_queue:
        person=search_queue.popleft()
        if person not in searched:
            if person_is_seller(person):
                print(person+"id a mango seller!")
                return True
            else:
                search_queue += graph[person]
                searched.append(person)
    return False
def person_is_seller(name):
    return name[-1] == 'm'

print(search("bob"))
graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["start"] = {}#权重
graph["start"]["a"] = 6
graph["start"]["b"] = 2
graph["a"] = {}
graph["a"]["fin"] = 1
graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["fin"] = 5
graph["fin"] = {} #终点没有任何邻居
infinity = float("inf")#无穷大
costs = {}#创建开销列表
costs["a"] = 6
costs["b"] = 2
costs["fin"] = infinity
parents = {}#父点散列表
parents["a"] = "start"
parents["b"] = "start"
parents["fin"] = None
processed = []#记录处理过的节点

def find_lowest_cost_node(costs):
    '''迪杰斯特拉算法'''
    lowest_cost = float("inf")
    lowest_cost_node = None
    for node in costs:#遍历所有的节点
        cost = costs[node]
        if cost < lowest_cost and node not in processed: #如果当前节点的开销更低且未处理过,
            lowest_cost = cost#就将其视为开销最低的节点
            lowest_cost_node = node
    return lowest_cost_node
node = find_lowest_cost_node(costs) #在未处理的节点中找出开销最小的节点
while node is not None:#这个while循环在所有节点都被处理过后结束
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys():#遍历当前节点的所有邻居
        new_cost = cost + neighbors[n]
        if costs[n] > new_cost: #如果经当前节点前往该邻居更近,
            costs[n] = new_cost #就更新该邻居的开销
            parents[n] = node #同时将该邻居的父节点设置为当前节点
    processed.append(node) #将当前节点标记为处理过
    node = find_lowest_cost_node(costs)#找出接下来要处理的节点,并循环

print(find_lowest_cost_node[6])

广度优先搜索用于在非加权图中查找最短路径。
狄克斯特拉算法用于在加权图中查找最短路径。
仅当权重为正时狄克斯特拉算法才管用。
如果图中包含负权边,请使用贝尔曼-福德算法。

states_needed = set(["mt", "wa", "or", "id", "nv", "ut","ca", "az"]) #你传入一个数组,它被转换为集合
stations = {}
stations["kone"] = set(["id", "nv", "ut"])
stations["ktwo"] = set(["wa", "id", "mt"])
stations["kthree"] = set(["or", "nv", "ca"])
stations["kfour"] = set(["nv", "ut"])
stations["kfive"] = set(["ca", "az"])
final_stations = set()
best_station = None
states_covered = set()
for station, states_for_station in stations.items():
    covered = states_needed & states_for_station #它计算交集
    if len(covered) > len(states_covered):
        best_station = station
        states_covered = covered
        
    states_needed -= states_covered
    final_stations.add(best_station)
    print(final_stations)

贪婪算法寻找局部最优解,企图以这种方式获得全局最优解。
对于NP完全问题,还没有找到快速解决方案。
面临NP完全问题时,最佳的做法是使用近似算法。
贪婪算法易于实现、运行速度快,是不错的近似算法。

你可能感兴趣的:(学习《算法图解》)