如何提取淘宝类目

原因: 打算爬淘宝的商品,复刻淘宝的分类结构

我使用的是这个地址

https://www.taobao.com/markets/tbhome/market-list?

也就是提取淘宝前台类目

我比较懒,并不想写正则或者xpath

我的思路是 通过注入js来获取

kissy框架不熟悉,还是用jq吧,我找了一个jquery inject的插件

在控制台执行以下代码

 list ={};
    listdiv = $('.layout-grid-0');
	 
	listdiv.each(function(){
		var a =$(this).find("a.category-name-level1").text();
		list[a]={};
		var big2 = $(this).find("ul.category-list li.category-list-item");
			big2.each(function(){
			var big3 = $(this).children("a.category-name").text();
				list[a][big3]=Array();
				var big4 = $(this).find(".category-items a.category-name");
				big4.each(function(){
					var big5 = $(this).text();
					list[a][big3].push(big5);
				});
			});	
	});

再执行 

JSON.stringify(list);

就出来啦, 结构很清晰哦。

你可能感兴趣的:(如何提取淘宝类目)