计算机导论第十一周课后总结

第十一周课后总结

在这次的计算机导论课上,首先呢,老师简单的回顾了一下第一次上课的内容,就是有关计算机领域需要的一些能力,其中数学对我们来很重要,然后还有就是有关上次人工智能和深度学习话题的一个再谈谈看法。

这次上课上的主要内容是第一章-信息。包括信息,计算机信息处理,几个例子,最后还讲了一点点图灵机

信息

首先,就是信息,有维纳的控制论定义,阿希贝的差异论,钟义信从本体论和认识论角度的认识,香农对信息的主观性的高度重视,还有种加属定义。

我个人比较喜欢香农的定义,所以查阅了一些资料,下面这些是一些解释:

1948 年,香农提出了“信息熵” 的概念,所以叫香农熵。 香农不是用钱,而是用 “比特”(bit)这个概念来度量信息量。 一个比特是一位二进制数,计算机中的一个字节是八个比特。在上面的例子中,这条消息的信息量是五比特。 信息量的比特数和所有可能情况的对数函数
log 有关。 (log32=5, log64=6。) 对于任意一个随机变量 X,它的熵定义如下:
变量的不确定性越大,熵也就越大,把它搞清楚所需要的信息量也就越大。
有了“熵”这个概念,我们就可以回答本文开始提出的问题,即一本五十万字的中文书平均有多少信息量。我们知道常用的汉字(一级二级国标)大约有
7000 字。假如每个字等概率,那么我们大约需要 13 个比特(即 13 位二进制数)表示一个汉字。但汉字的使用是不平衡的。实际上,前
10% 的汉字占文本的 95% 以上。因此,即使不考虑上下文的相关性,而只考虑每个汉字的独立的概率,那么,每个汉字的信息熵大约也只有 8-9
个比特。如果我们再考虑上下文相关性,每个汉字的信息熵只有5比特左右。所以,一本五十万字的中文书,信息量大约是 250
万比特。如果用一个好的算法压缩一下,整本书可以存成一个 320KB 的文件。如果我们直接用两字节的国标编码存储这本书,大约需要 1MB
大小,是压缩文件的三倍。这两个数量的差距,在信息论中称作“冗余度”(redundancy)。 需要指出的是我们这里讲的 250
万比特是个平均数,同样长度的书,所含的信息量可以差很多。如果一本书重复的内容很多,它的信息量就小,冗余度就大。

然后呢,关于计算机信息处理方面,老师讲的比较简略,但是,说实话,我数字逻辑没学好,没咋懂!我真的有点憨!。。。

随机生成迷宫地图

我对老师展示的几个例子比较感兴趣,所以在网上看了一下算法, 发现运用我们在数据结构里的知识可以完成,主要是利用最小生成树,下面就贴出来。

绝大多数的编程问题都可以用数学工具解决,当然我们的迷宫生成算法也不例外。 数学中最适合表达迷宫的符号莫过于
图,下面两个算法是迷宫生成中应用最普遍的理论之二。首先我们需要将地图转换为便于数学表达的形式。 之前两个算法在处理地图时都是以 方块
为单位的,即每一个方块不是墙就是路。 而 图 的基本组成是 点 与 边 ,对于一个待处理的迷宫,我们做如下转换。
计算机导论第十一周课后总结_第1张图片
迷宫大小10*10,其中白块代表 点,红块代表 边,而黑块代表 虚无,只是填充物质罢了。如果一个 图 中,任意两 点 都能通过 边 组成的路径联通,称之为 连通图。而如果一个 连通图 上没有回路,则我们可以称之为 树,因为没有回路,所以每对点之间有且仅有一条路径联通。可以看到,树 与我们完美迷宫的概念不谋而合,所以现在我们的任务是找到包含所有点的一棵 树。最小生成树生成树,顾名思义,就是从给定的 点,边 集合中生成一棵符合要求的树。
下面介绍的两种最小生成树算法都可以胜任。虽然写作最小生成树,但这两个算法其实可以做到“按一定条件生成树”。
“最小”是算法的典型描述,即在有权边的集合中找出权值最小的树。原算法使用贪心算法求解。而在这里,我们的条件就是:随机。下面简单介绍一下这两个算法的步骤:两个算法都需要 点 的集合E,与 边 的集合V。对于上图,E代表所有白块,V代表所有红块Kruskal:
一开始每个点将自己作为单独的一棵树。从V中随机选出一条边v判断v两端的e1,e2是否属于一棵生成树 是,无动作否,绘制e1,v,e2并合并树从V中删除v当V不为空,则返回 1. ,V为空则完成ps:判断与合并两点所在树可以使用并查集相关算法,因为最近有点忙(懒),还没研究透,我代码里用了比较笨的全图标记,应该会在近期更新代码到并查集===============Prim:初始V为空,所有e∈E标记为0随机选一个点e将与e相连的边的集合{Ve}并入入V,e标记为1从V中随机选一条边v判断v两端情况 均为1:无动作一个0一个1:将为0的点e标记为1,绘制v,e,将e连接的边并入V均为0:不可能从V中删除v当所有e∈E均被标记为1,结束,否则返回 3. 。ps:可以维护一个包含所有v∈V的标记表,防止被重复并入V,提高效率以上为算法步骤,建议配合代码食用更佳。

然后其他的图灵机只讲了一点点,就是在讲关于可以无限执行这个特点,就不讲了。

以上就是本周的个人总结
______________________________________ blog by 软工zy1801陈宇曦

你可能感兴趣的:(计算机导论第十一周课后总结)