Python Day42&43(周末)

周末实践课。今天是帮助古巴人民把互联网”夹带“进古巴,需要在美国把互联网访问后按  网址url=>内容方式  保存到文件,然后文件被“搬运”到古巴后,能被方便的被反”解“出来访问。

你可能早就看过报道,古巴的互联网基础设施非常落后,全国只有 5% 的人能访问互联网,而且是速度奇慢的拨号网络。Google 董事长(现 Alphabet 董事长)施密特曾在今年 3 月访问古巴,他惊呼,“拨号网络简直让我回到上世纪 90 年代。”

古巴也有速度更快的公共 Wi-Fi,不过,目前全国只有 175 个公共 Wi-Fi 热点,大部分位于公园和高级酒店里,而且上网费很贵,每小时要 2 古巴比索(约13元人民币),要知道,古巴的人均月收入只有 20 美元。

古巴公园内上网的人 来自: John Graham-Cumming

在这种情况下,古巴人民使用了古老的智慧:用移动硬盘传递数字内容。硬盘里的内容每周更新,被称为 El Paquete Semanal(西班牙语,意为“每周包裹”,简称 El Paquete)。一个和常人无异的大妈,很可能每天早上离家,步行很远找到一位“信息贩子”,把一个个 TB 级的移动硬盘拷满电影、电视剧、杂志。然后,她把硬盘带回家,通过口耳相传,卖给朋友、邻居……

El Paquete 的价格也合理得多,如果等着看上周五更新的最新内容,你要付 17 美元,当然,你也可以让别人有偿从你这里拷。而只要多忍两天,你就可以用 2.5 美元买到上周三、四更新的全部内容。

提示下,利用本周文件和网络访问,然后有个小梗。

图片发自App

图片发自App

图片发自App

图片发自App

图片发自App

图片发自App

图片发自App

python大大的解答

Python Day42&43(周末)_第1张图片
图片发自App

大大思路

1.读取那个rss文件,逐条抽取url,访问url内容。

Python Day42&43(周末)_第2张图片
图片发自App

2.按(url =› 内容)方式存放到字典里。序列化字典到文件。

Python Day42&43(周末)_第3张图片
图片发自App

3.再反序列化那文件,就可以按某个url来提取,或是全部按列表提出了。

图片发自App

序列化就是那个梗。

补充rss知识

因为要收集很多的网址,会涉及到专业的爬虫技术,所以,为了简化起见,就从rss里去取网址,比较直接。这种网页就是专门列出网页列表给专门的rss阅读软件看的。就好像互联网里那种“大嘴巴”,就怕人不知道一样。比如你关注了某网站的更新,这种更新以前就用rss来表示。提醒软件就不停的去刷rss,一旦有更新就提醒你呢。

RSS,是Real Simple Syndication的简写,也叫聚合内容,是一种描述和同步网站内容的格式,提供一种更为方便、高效的互联网信息的发布和共享,用更少的时间分享更多的信息。

你可能感兴趣的:(Python Day42&43(周末))