Abstract
如果你觉得每天去看每个网站麻烦,那么这份教程适合于你!
Introduction
RSS(RDF Site Summary简易信息聚合)是一种消息来源格式规范,用以聚合经常发布更新数据的网站,例如博客文章、新闻、音频或视频的网摘。可以说是RSS是博客盛行的时候的产物,但直到现在也没发展大众化应用,因为RSS不走网站流量= =。但是现在RSS虽然小众化但仍然有其作用。本文将会教你使用RSS订阅世界。
不是SSR!!!
Experimental section
工欲善其事,必先利其器。
器:
RSS阅读器:
网页端:InoReader[1],Feedly[2]等;
pc端:irreader[3]等;
移动端:Inoreader[1,4],FeedMe(for Android),Reeder3(for ios)等。
RSS源地址:
集合类:rsshub[5],FeedX[6]等
以及你想订阅的各类网站
其余软件:
如链接扫描软件XENU
Results and discussion
从RSS的定义来看,RSS分为两部分,一部分为RSS阅读器,一部分为RSS源地址。
RSS阅读器
RSS阅读器仅为解析RSS格式的数据,同时支持发现等操作,换句话说,必须要有订阅源才可以。RSS订阅源将在下面介绍。
因为RSS阅读器比较多此处介绍:
一款网页端:InoReader(荐);
一款pc端:irreader;
一款移动端:InoReader。
1.InoReader
InoReader是国外的一款产品,国内访问基本不受影响,且又简体中文语言支持。支持RSS订阅,订阅源发现等操作。新用户注册即送一个月(好像是)的专业版试用。支持跨平台使用。消息同步,RSS订阅的导入及导出等操作。免费版即可满足大部分需求。
订阅
将订阅源的源地址放入左上角的框内,点击添加订阅源即可。免费用户订阅量没有限制。
订阅效果如下:
发现
在https://www.inoreader.com/discovery下可以进行发现,或者在输入网址的地方输入你需要检索词
此还有一些统计数据,偏好设置等。因为网站是中文不再赘述。
杂谈:
更新周期:
一般免费用户的更新周期是够用的。不需要可以加强,而且只要订阅这个源的有一个人加强了,所有人都可以加强。
订阅故障:
由于这个所有内容都由InoReader的服务器进行,所以一些校内的RSS订阅可能出现故障,如图书馆的新书通报订阅,解决此问题就是下一个pc端订阅器irreader了。同时不支持无rss入口网站的订阅,解决这些问题就要适用html匹配,或者是其他接口,以及发现rss接口的操作了,后面将会介绍到。
订阅优点:
由于InoReader的服务器是国外的服务器,所以可以订阅一些国外的网站,啦啦啦(逃~)
2.irreader
irreader是一款国产的RSS订阅软件,无需注册,不支持同步,不支持跨平台。当为什么我还要介绍它呢!因为它有一些别的不具有的优点。irreader其实就是程序,在你启动软件时才开始从你的订阅源内采集,所以此服务器相当于你的电脑,可以轻松采集校内的IP端才能订阅的内容。
订阅
同样需要一个订阅源地址,添加订阅,并发现优秀订阅源。此处发现的优秀订阅源以中文网站为主。
同时,此阅读器正在做微信公众号的订阅(个人认为不是很好)
杂谈
更新周期
这款软件可以自行设置更新周期,但是由于此软件没有后台服务器所以它的获取是由本身电脑的后台程序进行的。
订阅
这可以说是这个阅读器的优处,支持HTML标签订阅,即不需要rss入口即可订阅。同时支持优异的过滤方式,以及微信订阅。
缺点
无法跨平台,没有后台服务器,不支持同步(开发人员正在努力)。
由于是中文且本身有教程,其余方面不在赘述。
3.InoReader移动端
此移动端为InoReader官方出品,其使用与InoReader本身无异。
杂谈
有了这个移动端可以做到在任何地方刷一刷,像刷微博,知乎一样简单。其余方面不在赘述
RSS订阅源
RSS订阅源的标志比较像WIFI信号。同时有些网站没有RSS标志而是直接写字,可以通过“Ctrl” + “F”直接寻找。
网站上通常写有RSS或者Feed。
下面将从不同方面获取RSS订阅源地址。
期刊文献
作为一个理工人,不阅读点英文期刊怎么能行。期刊一般都会提供RSS订阅的入口,所以不用担心。
追踪某一期刊
以Wiley数据库的ADVANCED MATERIALS期刊为例
进入到AM的期刊网页[7]即可在蓝色的框线内发现RSS标志,点击之后在Most recent (RSS)上右击保存链接地址,即可获得一个RSS源地址,添加到上述任何一个阅读器中即可,完成ADVANCED MATERIALS期刊的追踪订阅,在InoReader内更新周期为60min。
以ACS nano 为例
在ACS官网最底部有RSS feed一个选项
选择后即可进入ACS的RSS列表,选择你需要订阅的RSS期刊,右击复制链接地址,即可获得RSS订阅源地址。
追踪某一关键词
在Wiley数据库内追踪FeS2关键词为例
在Wiley数据库内搜索FeS2即可看见RSS标志,同上述操作相同,即可订阅。
博客论坛
对于博客论坛的订阅还是很好使用的,但是有些论坛或者博客没有公开的RSS入口,所以需要自行寻找一下。后面将会简单介绍寻找方式。
博客
对于我来说有些优质博客需要关注。学爬虫,我关注了
崔庆才的个人博客[8],下面将以此为例来介绍。
很开心,很明显就能看到RSS订阅的标志。
可是对于一些,没有将RSS订阅外放的该怎么办呢= =
下来我将介绍如何对付这些博客:
先拉到最底下,看此博客基于什么搭建,如果像静谧一样,基于WordPress构建。那么WordPress框架会预留一个RSS订阅的入口,及在根网页或某一非html结尾的网页后加上"/feed/"即可。
如果,很不幸。该博主坏坏的把这个预留入口关闭了。那么,请只能通过HTML标签,或自制了。往下看。
论坛
我最近在学Julia编程语言,所以关注Julia中文社区论坛有一丢丢的作用,所以后面将从Julia中文社区论坛和小木虫为例。
小木虫[9]
小木虫的订阅在每个非讨论的网页最低端即可发现
Julia中文社区论坛[10]
而Julia中文社区论坛就没这么幸运了,找遍了没有发现rss订阅入口。
那么就要祭出我的第一个必杀技了——域名扫描
这里通过Xenu[11]为域名扫描软件,
将域名放入Xenu扫描。
扫描一会后(不必等完成)按Ctrl+F搜索rss或者是feed,即可找出rss订阅地址
从RSS网站订阅
有一些网站,不支持RSS订阅。但是,依然难不倒聪明的码农们,从而做出了一些RSS订阅的网站,方便人们去订阅订阅不到的网站,如知乎、微博、bilibili等。这里介绍两个比较好用的。
rsshub[5]
rsshub是类似于scihub的一个网站,是一个轻量、易于扩展的 RSS 生成器, 可以给任何奇奇怪怪的内容生成 RSS 订阅源。提出了万物皆可RSS的口号,可见其胃口不小。其支持bilibili、微博、贴吧、、知乎、豆瓣、抖音等主流社交媒体;支持掘金、开源中国、GitHub、Gitlab等编程类;支持斗鱼、熊猫、虎牙直播;支持个别大学信息(此处没有北航= =)的获取等等。反正是门类众多,总有一款适合你。
此处可能需要一些URL的拼接知识,但是极其简单易懂,再次不在赘述。
比如我订阅了知乎上的Nature自然科研[12,13]的信息动态,可谓是非常有用。
此处好好读文档即可。
FeedX[6]
FeedX是某位程序员维护的网站,它最大的亮点在于全文订阅。支持经济学人(The Economist),NASA、CNN等全英文RSS。以及其余的新闻、科技。(可能最大亮点就在于全文订阅,以及全英文)。订阅及其简单,不在赘述。
如果还有什么好的网站,记得告诉我= =
无RSS订阅攻略
可是总有那么些个坏人不喜欢RSS订阅,从而没有RSS订阅地址该怎么办呢。
下面告诉你几个办法来克服。
通过irreader订阅
irreader支持标签订阅,此处以北航的远航网[14]为例
打开远航网进入通告咨询的页面,复制地址。打开irreader
在你想订阅的旁边打勾✔即可完成订阅,更多详情请看irreader的内部教程。此处订阅是通过标签和标签的href属性来完成的
BUT
仍有一些网站就像北航教务处[15]的网站咨询是通过Javascript完成的。就不能通过此方法进行了。
Feed43和FeedEx
Feed43[16]是一种生成rss格式数据的网站,需要一定的HTML代码基础,但是照葫芦画瓢也不难。
FeedEx[17]是一种将rss格式的数据转化为rss全文输出的网站,提供了rss格式数据的全文订阅。
Full-Text RSS[18]和FeedEx类似,个人更喜欢Full-Text RSS
由于过于复杂,所以再次不在描述,提供一个教程[19](位于附录内)照葫芦画瓢吧!!!
终极大杀器
如果上述的方法还是不行的话,只能祭出我的终极大杀器——自己写代码!!!(当个码农挺好)
比如我做了几个公众号的rss订阅源地址[22](由于经常性有今天,没明天所以只放一个)基本可以满足自己的需求。(逃~
而代码的核心就是获取信息,以及输出符合RSS格式的数据类型。
获取数据就爬虫:一份Python3爬虫教程[20](我实现自引了= =!!)
输出符合RSS格式:这个就得学RSS格式以及XML格式了= =,此处不做过多推荐,因为我也没学咂懂,不过给个w3school的教程[21]吧。
如果有好的RSS格式的教程,记得私我。
杂谈
又到了每次结尾的杂谈环节
先来谈谈我的订阅。通过irreader订阅了学校的消息和图书馆新书通报,在第一时间能获得最新资讯;通过InoReader订阅了一些期刊、科技等,发现了更多的小众化但有用的应用。让实时从不同网站获取信息成为可能。
再来说说能订阅什么。就像RssHub所说的”万物皆可 RSS“,万物都可订阅,可以订阅自己喜欢的微博、知乎、哔哩哔哩,可以通过百度订阅检索词,订阅文献等等。可以通过知乎、百度去发现一些优异的订阅源(此处不做推荐)。
说说不能订阅什么。当然先要遵守法律呀!!!其次就是由于某些软件的"自闭性"(Wechat),让订阅及其困难,但是任何难事都难不倒聪明的程序猿= =
Conclusions
接触RSS是也就前两个月,在罗昭锋的MOOC《文献管理与信息分析》[23](一门优质课程)发现,怎么能这么好用!!!就开始学会订阅。
总之,RSS看起来比较小众化,但是却可以在纷纷的HTML中获取自己想知道或不知道的事与观点。同时还略去了网站的广告。
光说不练假把式,只有你真正的开始订阅世界后才可能知道她的好用。
References
[1]InoReader官网:https://www.inoreader.com/
[2]Feedly官网:https://feedly.com/
[3]irreader官网:http://irreader.netqon.com/
[4]InoReader安卓版本:链接:https://pan.baidu.com/s/1EgzySo5-Kr0U6Ru_hdiCuQ密码:5kdk
[5]rsshub官方文档:https://docs.rsshub.app/
[6]FeedX官方网站:https://feedx.net/
[7]ADVANCED MATERIALS官方网页:https://onlinelibrary.wiley.com/journal/15214095
[8]崔庆才的个人博客:https://cuiqingcai.com/
[9]小木虫学术科研互动平台:http://muchong.com/bbs/
[10]Julia中文社区论坛:http://discourse.juliacn.com/
[11]Xenu域名扫描软件:http://home.snafu.de/tilman/xenulink.html/
[12]Nature自然科研知乎:https://www.zhihu.com/org/naturezi-ran-ke-yan/activities/
[13]Nature自然科研订阅源地址:https://rsshub.app/zhihu/people/activities/naturezi-ran-ke-yan/
[14]北航远航网:http://yuanhang.buaa.edu.cn/
[15]北航教务处:http://jiaowu.buaa.edu.cn/
[16]Feed43官网:http://feed43.com/
[17]FeedEx官网:http://feedex.net/
[18]Full-Text RSS官网:http://fivefilters.org/content-only/
[19]Feed43+全文输出的教程:https://zhuanlan.zhihu.com/p/40496324/
[20]一份Python3爬虫教程——幻华:https://mp.weixin.qq.com/s/ENjSI_92C8ge9V8yVNx3Xg/
[21]RSS格式w3school:http://www.w3school.com.cn/rss/rss_syntax.asp/
[22]材料人微信公众号RSS订阅源地址:https://chemistrywechat.zkhweb.top/rss/icailiaoren.xml/
[23]MOOC《文献管理与信息分析》——罗昭锋:https://www.icourse163.org/learn/USTC-9002#/learn/announce/
注释:
1>所有资源来源于网络。
2>所有百度网盘资源有效期7天。
3>更多资源请上网检索,此处不再推荐资源。
4>未收任何人的广告费,纯粹自己学习的。
5>尽量支持正版!
文案:幻华