数据分析大作业

关于大作业的一些思路(无代码)

文章结尾有链接,需要自取
首先我们拿到作业应该理清思路,将任务和数据存储看明白再开始做,我对题目的理解是:先从IPIP或者IPlocation中提取出所选城市的ip网段做成一个筛子,然后将data中的IP按一定的规则提取出来,然后倒入已经做好的筛子中,便可以筛出我们所需要的目标网段路由,而对于后续的做图工作,我们应该提前想好接口

1.做筛子

第一步是做出我们的筛子,也就是从IPIP中提取出所选城市的IP网段,对于这一步比较简单,可以敲代码解决,当然我觉得有更简单的方法就是直接用Excel打开csv文件,直接进行筛选工作,然后将筛选的结果CV到新的文件里保存。

2.从data提取所选城市的ip

这一步可以用正则的方式,如果对正则不太熟悉可以采取翻看第五页PPT对数据结构进行仔细分析,然后运用字典和列表的一些基本查找操作取出最里层的跳数:IP:TTL:延迟时间,再进行正则会比较简单一些。
贴一下学习Python比较好用的几个网站
https://www.runoob.com/
https://www.w3school.com.cn/index.html

3.将提取出的ip倒入筛子中

这一步看似比较简单,但是实际上要考虑到后续可视化的问题,所以要提前想好接口。画图所需要的是点集和边集,也就是说我们这一步得到的结果最好就是整理好的点集和边集,而后面第十六页中标黄字段的判断依据,还让我们提取出边界节点,所以这就需要一些列的逻辑规则的建立。
下面我画了一个思维导图来描述这个逻辑
数据分析大作业_第1张图片
而如何判断IP是否在网段内,我的建议是将点分十进制转成整形,然后就可以直接判断大小来判断IP是否在城市内。
做出点集后不要忘记去重,因为我们最后要画的是拓扑图,对于两个节点之间的多条边是无感的。

4.可视化

可视化我用的是Gephi,因为我选的城市是一个大城市,所以用networkx画出来的图结果感人。
数据分析大作业_第2张图片
于是我用了Gephi,画出来还可以,虽然因为数据的问题没法体现很好的拓扑关系
数据分析大作业_第3张图片
顺便贴一下使用Gephi的参考资料
https://blog.csdn.net/qq_42198024/article/details/84965375

5.最后再进行一些节点的权重分析,然后就是实验报告了

最后贴一个验证性的exe用来判断有多少条边和点,记得和ipip以及data放在同一个根目录下哟
https://download.csdn.net/download/liuxingyustar/12427426

你可能感兴趣的:(大作业)