在不使用 iTunes 的情况下,通过 Apple iTunes Store 找到 Podca...

假如你使用 iTunes,请忽略本篇文章。

----正文分割线----

某些情况下,某些 Podcast 的站长可能会粗心忘记在自己的网站上公布 rss 地址,或者像 itings.com 这样的网站托管的博客,你在我的页面上找来找去也找不到 rss 地址。或者你要使用编程语言写一个批量采集程序,把 iTunes Store 里的 Podcast 直接抓取下来,这时候你就需要通过 iTunes Store 直接获取 rss 地址,而 iTunes Store 本身是不提供的。这篇文章就是讲这个事情。

不废话,直接说原理:通过抓包容易发现iTunes通过访问一个地址来获取真实的rss地址,这个地址是:

"https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/com.apple.jingle.app.finance.DirectAction/subscribePodcast?id={ID}&wasWarnedAboutPodcasts=true"
其中的ID,就是你在 iTunes Store 地址中看到的 ID。我们拿知名的“闲白儿电台”举个例子:

闲白儿电台在 iTunes Store 中的地址是: http://itunes.apple.com/us/podcast/xian-bai-er-dian-tai/ id531733337

那么 iTunes 访问的地址就是: https://buy.itunes.apple.com/WebObjects/MZFinance.woa/wa/com.apple.jingle.app.finance.DirectAction/subscribePodcast? id=531733337&wasWarnedAboutPodcasts=true

但是同样的地址你用浏览器访问,返回的东西却不一样,原因很简单 ----http 头中的 User-Agent 不一样。iTunes 使用一个类似乎“iTunes/版本号”的 User-Agent 记号。你可以随便找一个比较新的版本,比如“iTunes/10.4.1”。只要这样设置,返回的结果中就会包含真正的 rss 地址。

我们使用 Chrome 试一下:

在 Chrome 中按 F12 打开调试工具,然后按右下角的齿轮按钮,就会弹出下面的界面,我们可以修改 User-Agent,如图:

在不使用 iTunes 的情况下,通过 Apple iTunes Store 找到 Podca...

然后我们访问上面的地址,就不会返回一个网页,而是一个 xml 文件,这个文件是一个叫做 NeXTSTEP format 的东西,不用管太多,只要找到下面两行就好:

这里面的url就是rss地址了。OK,到此就明了了,如果你要使用编程语言实现这个过程,只要照方抓药就要。

你可能感兴趣的:(itunes,podcast)