通过python封装店铺sid采集1688店铺所有商品数据、1688店铺所有商品数据接口,1688API接口

今天给大家分享一个大体的思路和代码示例。请确保采集过程遵循相关网站的使用规则和政策。

  1. 安装依赖库
  • requests:发送HTTP请求
  • BeautifulSoup4:解析HTML页面
pip install requests
pip install beautifulsoup4
  1. 分析网页结构

在浏览器中打开要采集的店铺页面,按下F12进入开发者模式,进入Network选项卡,刷新页面,在过滤条件中选择XHR,可以看到网页向服务器发送了很多请求。其中我们关心的是一个名为 offerlist_result_data 的请求,点击它可以看到返回的JSON数据,这就是我们要采集的商品信息。

通过python封装店铺sid采集1688店铺所有商品数据、1688店铺所有商品数据接口,1688API接口_第1张图片

 

  1. 编写代码

接下来我们从指定店铺ID采集该店铺所有商品数据:

1688.item_search_shop-获得店铺的所有商品数据

1.请求方式:HTTPS  POST GET

2. 公共参数:

名称 类型 必须 描述
key String 调用key(必须以GET方式拼接在URL中,复制Taobaoapi2014)
secret String 调用密钥
api_name String API接口名称(包括在请求地址中)[item_search,item_get,item_search_shop等]
cache String [yes,no]默认yes,将调用缓存的数据,速度比较快
result_type String [json,jsonu,xml,serialize,var_export]返回数据格式,默认为json,jsonu输出的内容中文可以直接阅读
lang String [cn,en,ru]翻译语言,默认cn简体中文
version String API版本

3.请求参数:

请求参数:seller_nick=********de&start_price=0&end_price=0&q=&page=1&cid=

参数说明:seller_nick:店铺昵称或sid(目前只支持sid))
sort:排序[bid,_bid,_sale,_credit]
  (bid:总价(升序)_bid:总价(降序),sale:销量,默认综合排序,time:新品)
sort=new为店铺上新数据,格式不统一,请注意
page:页数

4.请求示例,支持高并发(CURL、PHP 、PHPsdk 、Java 、C# 、Python...)

# coding:utf-8
"""
Compatible for python2.x and python3.x
requirement: pip install requests
"""
from __future__ import print_function
import requests
# 请求示例 url 默认请求参数已经做URL编码
url = "https://api-vx.Taobaoapi2014.cn/1688/item_search_shop/?key=<您自己的apiKey>&secret=<您自己的apiSecret>&seller_nick=b2b-2200733087881719de&start_price=0&end_price=0&q=&page=1&cid="
headers = {
    "Accept-Encoding": "gzip",
    "Connection": "close"
}
if __name__ == "__main__":
    r = requests.get(url, headers=headers)
    json_obj = r.json()
    print(json_obj)

 5.响应参数

通过python封装店铺sid采集1688店铺所有商品数据、1688店铺所有商品数据接口,1688API接口_第2张图片

 

你可能感兴趣的:(全球电商平台数据采集代码分享,python,大数据,数据挖掘,数据分析,经验分享)