学习《算法图解》

1.大O表示法是一种特殊的表示法，指出了算法的速度有多快。O（n）

小结：

二分查找的速度比简单查找快得多。

O (log n )比O (n )快。需要搜索的元素越多，前者比后者就快得越多。

算法运行时间并不以秒为单位。

算法运行时间是从其增速的角度度量的。

算法运行时间用大O表示法表示。

2.链表和数组

链表中的元素可存储在内存的任何地方。

数组和链表哪个用得更多呢？显然要看情况。但数组用得很多，因为它

支持随机访问。有两种访问方式：随机访问和顺序访问。顺序访问意

味着从第一个元素开始逐个地读取元素。链表只能顺序访问：要读取链

表的第十个元素，得先读取前九个元素，并沿链接找到第十个元素。随

机访问意味着可直接跳到第十个元素。本书经常说数组的读取速度更

快，这是因为它们支持随机访问。很多情况都要求能够随机访问，因此

数组用得很多。

小结：

计算机内存犹如一大堆抽屉。

需要存储多个元素时，可使用数组或链表。

数组的元素都在一起。

链表的元素是分开的，其中每个元素都存储了下一个元素的地址。

数组的读取速度很快。

链表的插入和删除速度很快。

在同一个数组中，所有元素的类型都必须相同（都为int、double等）。

def binary_search(list,item):
'''二分查找'''
    low=0
    high=len(list)-1
    while low <=high:
        mid=(low+high)//2
        guess=list[mid]
        if guess==item:
            return mid
        if guess >item:
            high=mid-1
        else:
            low=mid+1
    return None
my_list=[1,3,5,7,9]
print(binary_search(my_list,3))
    
def findsmallest(arr):
    '''排序算法'''
    smallest=arr[0] #存储最小的值
    smallest_index=0 #存储最小元素的索引
    for i in range(1,len(arr)):
        if arr[i]

 
 3.递归指的是调用自己的函数。
 每个递归函数都有两个条件：基线条件和递归条件。
 栈有两种操作：压入和弹出。
 所有函数调用都进入调用栈。
 调用栈可能很长，这将占用大量的内存。
 4.排序
 D&C将问题逐步分解。使用D&C处理列表时，基线条件很可能是空数组或只包含一个元素的数组。
 实现快速排序时，请随机地选择用作基准值的元素。快速排序的平均运行时间为O (n log n )。
 大O表示法中的常量有时候事关重大，这就是快速排序比合并排序快的原因所在。
 比较简单查找和二分查找时，常量几乎无关紧要，因为列表很长
 时，O (log n )的速度比O (n )快得多。 
 def quicksort(array):
    '''快速排序'''
    if len(array)<2: #基线条件
        return array
    else:#递归条件
        pivot=array[0]
        less=[i for i in array[1:] if i<=pivot]
        greater=[i for i in array[1:] if i>pivot]
        return quicksort(less)+[pivot]+quicksort(greater)
print(quicksort([10,5,2,3]))
 
 5.散列表在python中就是字典
 无论你访问哪个网站，其网址都必须转换为IP地址。这不是将网址映射到IP地址吗？好像非常适合使用散列表啰！这个过程被称为DNS解析 （DNS resolution），散列表是提供这种功能的方式之一。（google.com-74.123.139.3）
 散列表适合用于：
 仿真映射关系；
 防止重复；
 缓存/记住数据，以免服务器再通过处理来生成它们。
 如果两个键映射到了同一个位置，就在这个位置存储一个链表。
 散列函数很重要 。前面的散列函数将所有的键都映射到一个位置，而最理想的情况是，散列函数将键均匀地映射到散列表的不同位置。
 如果散列表存储的链表很长，散列表的速度将急剧下降。然而，如果使用的散列函数很好 ，这些链表就不会很长！
 你可以结合散列函数和数组来创建散列表。
 冲突很糟糕，你应使用可以最大限度减少冲突的散列函数。
 散列表的查找、插入和删除速度都非常快。
 散列表适合用于仿真映射关系。
 一旦填装因子超过0.7，就该调整散列表的长度。
 散列表可用于缓存数据（例如，在Web服务器上）。
 散列表非常适合用于防止重复。
 6.广度优先搜索指出是否有从A到B的路径。
 如果有，广度优先搜索将找出最短路径。
 面临类似于寻找最短路径的问题时，可尝试使用图来创建模型，再使用广度优先搜索来解决问题。
 有向图中的边为箭头，箭头的方向指定了关系的方向，例如，rama→adit表示rama欠adit钱。
 无向图中的边不带箭头，其中的关系是双向的，例如，ross - rachel表示“ross与rachel约会，而rachel也与ross约会”。
 队列是先进先出（FIFO）的。
 栈是后进先出（LIFO）的。
 你需要按加入顺序检查搜索列表中的人，否则找到的就不是最短路径，因此搜索列表必须是队列。
 对于检查过的人，务必不要再去检查，否则可能导致无限循环。 
 from collections import deque 
graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["bob"] = ["anuj", "peggy"]
graph["alice"] = ["peggy"]
graph["claire"] = ["thom", "jonny"]
graph["anuj"] = []
graph["peggy"] = []
graph["thom"] = []
graph["jonny"] = []
def search(name):
    '''广度优先搜索算法'''
    search_queue=deque()
    search_queue += graph[name]
    searched=[]
    while search_queue:
        person=search_queue.popleft()
        if person not in searched:
            if person_is_seller(person):
                print(person+"id a mango seller!")
                return True
            else:
                search_queue += graph[person]
                searched.append(person)
    return False
def person_is_seller(name):
    return name[-1] == 'm'

print(search("bob"))
 
  
    
  
 graph = {}
graph["you"] = ["alice", "bob", "claire"]
graph["start"] = {}#权重
graph["start"]["a"] = 6
graph["start"]["b"] = 2
graph["a"] = {}
graph["a"]["fin"] = 1
graph["b"] = {}
graph["b"]["a"] = 3
graph["b"]["fin"] = 5
graph["fin"] = {} #终点没有任何邻居
infinity = float("inf")#无穷大
costs = {}#创建开销列表
costs["a"] = 6
costs["b"] = 2
costs["fin"] = infinity
parents = {}#父点散列表
parents["a"] = "start"
parents["b"] = "start"
parents["fin"] = None
processed = []#记录处理过的节点

def find_lowest_cost_node(costs):
    '''迪杰斯特拉算法'''
    lowest_cost = float("inf")
    lowest_cost_node = None
    for node in costs:#遍历所有的节点
        cost = costs[node]
        if cost < lowest_cost and node not in processed: #如果当前节点的开销更低且未处理过，
            lowest_cost = cost#就将其视为开销最低的节点
            lowest_cost_node = node
    return lowest_cost_node
node = find_lowest_cost_node(costs) #在未处理的节点中找出开销最小的节点
while node is not None:#这个while循环在所有节点都被处理过后结束
    cost = costs[node]
    neighbors = graph[node]
    for n in neighbors.keys():#遍历当前节点的所有邻居
        new_cost = cost + neighbors[n]
        if costs[n] > new_cost: #如果经当前节点前往该邻居更近，
            costs[n] = new_cost #就更新该邻居的开销
            parents[n] = node #同时将该邻居的父节点设置为当前节点
    processed.append(node) #将当前节点标记为处理过
    node = find_lowest_cost_node(costs)#找出接下来要处理的节点，并循环

print(find_lowest_cost_node[6])
 
 广度优先搜索用于在非加权图中查找最短路径。
 狄克斯特拉算法用于在加权图中查找最短路径。
 仅当权重为正时狄克斯特拉算法才管用。
 如果图中包含负权边，请使用贝尔曼-福德算法。 
  
    
  
 states_needed = set(["mt", "wa", "or", "id", "nv", "ut","ca", "az"]) #你传入一个数组，它被转换为集合
stations = {}
stations["kone"] = set(["id", "nv", "ut"])
stations["ktwo"] = set(["wa", "id", "mt"])
stations["kthree"] = set(["or", "nv", "ca"])
stations["kfour"] = set(["nv", "ut"])
stations["kfive"] = set(["ca", "az"])
final_stations = set()
best_station = None
states_covered = set()
for station, states_for_station in stations.items():
    covered = states_needed & states_for_station #它计算交集
    if len(covered) > len(states_covered):
        best_station = station
        states_covered = covered
        
    states_needed -= states_covered
    final_stations.add(best_station)
    print(final_stations)
 
 贪婪算法寻找局部最优解，企图以这种方式获得全局最优解。
 对于NP完全问题，还没有找到快速解决方案。
 面临NP完全问题时，最佳的做法是使用近似算法。
 贪婪算法易于实现、运行速度快，是不错的近似算法。

学习《算法图解》

你可能感兴趣的:(学习《算法图解》)