COM9021-2019-S1 ass1

处理流程

1.读取txt内容。

2.句子拆分

3.解析出姓名,以及每人对应说的话

4.输出全部姓名,将文字语言转换成程序逻辑

5.计算出有多少组合可能


详细分析

1.  读取txt内容,去除换行符,拼接成一个字符串

2.将字符串拆分成句子。拆分可以以? ! . 三个符号就行拆分。注意,这三个符号可能会在双引号""里,要特殊逻辑处理下,如果这句中只有一个引号,且下一句开头是引号,那么这个引号是前一句的。

当然最好都加入些异常处理,例如txt读取失败,或者格式不对,那么直接返回no solution。

3.获取所有出现的名字,按照要求里说明的,除了句子开头,和Sir/Sirs 以外首字母大写的都是名字,当然还有I也不是名字。可以将名字用set存储(去重),同时用一个dictionary存储名字和他所对应说的话,这里的话是指双引号内的句子,例如{A:["I am a knight","all

of us are knight"],B:[“I am a knight”]},每个人会对应多句,所以value用list.

处理到这里已经可以获取到全部的名字。记得要排序和输出格式,大于一个用Sirs,等于一个用Sir。

4.将3里处理好的dictionary中的自然语言转换成程序语言,双引号里的情况就是要求的那8种。这里可以用一个dictionary,key为人名,value还是一个dictionary,里面存放我们设计好的key。例如

key:all-knight,里存放全部被描述为knight的名字,对应为”all of us are knight”,  ”I am a knight”,”Conjunction_of_sirs areknights”,”Sir sir_name is a knight”。

同理all-knave把上面的knight替换为knave。

Key:one-least-knight/one-least-knave对应为,“at least …”,“Disjunction_of_Sirs”

Key:one-most-knight/one-most-knave对应为“at most …”

Key:exactly-one-knight/exactly-one-knave,对应为“exactly one”

对应的value存储名字,可以用set,

如何分析文字语言对用到哪个组别里,可以用正则re,或者直接关键词判断,例如:

通过most in ,exactly,in ,least in 其他4种场景处理,

名字的处理与3中一样,注意us 和 I的映射

对于all-knight 直接场景直接加入到set

one-least场景,例如 存在A or Bor C is knight  和 A or B is knight,那么处理的结果为 只要满足 A or B is knight即可,C为什么不影响判断,那么one-least是取交集

one-most场景 A B  最多有一个knight.  A B C最多一个knight,那么需要满足 A B C最多一个knight,即取并集

exactly-one场景 A B C 只有一个knight A B 只有一个knight,那么需要满足A B 只有一个knight C 为knave,即取交集保留到exactly-one,差集加入到all_knave

5. 根据4得到的dictionary进行计算有多少满足条件的组合,每人都有两种可能要那么为knight 要么为knave,如果有n个人,那么就有2^n种可能。获取全部可能然后依次带入到4中的条件限制内,如果A 为knight,那么所有的条件返回的结果都为true,否则都为false,得到满足的情况。

其中全集的获取可以利用二进制,例如 存在3个人,那么有2^3=8种场景,那么对用为0-7,的二进制000 ---- 111 ,可以用0 表示 knight 1 表示knave。

 按照以上处理流程,即完成了ass1.

 三 优化

上面5中,存在优化空间。

1)      存在n个人,那么生成的全量为2^n,同时存在m个限制条件,那么时间复杂度为m*(2^n) 的时间复杂度。考虑test_2.txt的场景,Frank Nina Paul 三个人,存在限制条件的只有Nina,那么就意味着Frank,Paul是什么身份都不影响最后的结果,那么只需要获取Nina的可能性为knight 或knave,得到两种可能,在乘上2^2 = 4 (每人两个可能,两个人Frank,Paul)最后答案为8个solution.

2)       上面只是减少了n的大小,但2^n的数量空间还是没变。这时候考虑用剪枝的方式,例如 存在8种可能 分别为

000 001 010 100 011 101 110 111 三种情况,那么先判断第一个人为0是否满足条件,如果不满足,那么上面所有0开头的场景都可以排除。

3)       让2)中更早的剪枝掉不满足要求的情况,那么先处理容易确认性的判断,在处理不容易判断的场景

4)       2)3)解决了时间复杂度的问题,但空间复杂度仍未2^n,那么可以用栈来解决空间复杂度

 四 考点总结

1.   txt文件的读取

2.  字符串分割

3.   集合 交集 并集 差集

4.   全排序,剪枝,栈的运用

COM9021-2019-S1 ass1_第1张图片

你可能感兴趣的:(COM9021-2019-S1 ass1)