抓取苹果已添加的udid

最近需要统计苹果开发者平台上已经添加的设备udid,打开看了一下,已经有 96 条,如果要手动复制粘贴,很麻烦。作为程序员,不可能这样干的。所以,就用了之前学到的爬虫知识,解析出了这些信息,并转为字典保存到了本地。

代码如下:

from pyquery import PyQuery as pq
import json
doc = pq(filename='Devices - Apple Developer.htm')
a = doc('tbody td')
lis = a.items()
i = 0
j = 0
dic = {}
l = []
t = ''
for li in lis:
	if i % 2 == 1:
		l.append(li.text())
		if j % 2 == 0:
			t = li.text()
		else:
			dic[t] = li.text()
		j = j + 1		
	i = i+ 1

fo = open('udids.json', 'w')
j = json.dumps(dic)
fo.write(j)
fo.close()
print(len(l))
print(len(dic.values()))

注意:我没有设置请求,而是直接将页面保存下来,本地解析的。如果保存不了 htm or html 后缀的文件,请通过 Google Chrome 保存。

ps:苹果存值是以 udid 作为唯一的,所以,如果你添加设备的名字有重复,通过上面代码是拿不到完整数据的,可以将上面的代码改为以 udid 作为字典的 key 值。

你可能感兴趣的:(python)