京东自动保价脚本



文 | 某某白米饭

来源:Python 技术「ID: pythonall」

大家在 618 一定买了很多东西,而有些商家喜欢偷偷摸摸降价让我们觉得瞬间亏了一个亿。今天就撸一个京东的自动保价脚本。

获取保价列表

首先需要登录京东,这个在 《618!京东PC版抢卷》上写过了,是使用二维码登录的,大家可以看看。

打开京东保价页面(https://pcsitepp-fm.jd.com/),需要获取到下图红框中的元素,有名称,数量,购买价格。

京东自动保价脚本_第1张图片

按 F12 获取下页面元素

京东自动保价脚本_第2张图片

先把全局的变量放在前面

user_agent = 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_4) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/81.0.4044.138 Safari/537.36'

session = requests.session()

下面的代码获取可以保价的订单列表包含订单号和商品的 sku 号和数量,有 3 个函数,get_pin() 函数获取 PIN 值,get_order_list() 函数循环获取订单列表,skuProResultPC() 函数判断这个订单是否超了保价时间


def get_pin():
    """获取 PIN,用正则表达式从页面中取出"""

    url = "https://pcsitepp-fm.jd.com/"
    r = session.get(url)
    loginPin = re.findall('', r.text)
    pin = loginPin[0] if len(loginPin) > 0 else None
    return pin

def get_order_list(pin, page_num=1):
    """保价列表"""

    # 存放订单信息
    order_info = []
    # 存放数量
    count_dir = {}

    url = "https://pcsitepp-fm.jd.com/rest/pricepro/priceskusPull"
    data = {"page": page_num, "pageSize": 10}
    headers = {
        'User-Agent': user_agent,
        'Referer': 'https://pcsitepp-fm.jd.com/',
    }
    r = session.post(url, headers= headers, data=data)

    # 订单之间的分隔符
    orders = r.text.split('')
    orders.pop(0)

    for item in orders:
        # 订单号
        orderid = re.findall("订单号:(\d+)", item)
        # 数量
        count = re.findall('\n([\sx\d]+)',item)
        # 商品的 sku和序号
        skuidAndSequences = re.findall("queryOrderSkuPriceParam\.skuidAndSequence\.push\(\"(\d+\,\d+)\"\)\;", item)
        newSkuidAndSequences = []

        # 商品的sku和订单商品的序号
        for ss in skuidAndSequences:

            # 判断订单保价是否超时
            if skuProResultPC(orderid[0], ss.split(',')[0], pin):

                newSkuidAndSequences.append(ss)
                if orderid[0] == '117403228624':
                    print(orderid[0])
                count_ss = count_html[int(ss.split(',')[1]) - 1]
                count = count_ss.replace('\t', '').replace('\n', '').replace('x', '')
                # 把 "订单号_sku" 当做 key
                count_dir[orderid[0] + '_' + ss.split(',')[0]] = count

        if newSkuidAndSequences:

            order_info.append({'orderid': orderid[0], 'skuidAndSequence': newSkuidAndSequences})

    if orders:
        """递归的方式获取所有的商品"""
        bill_info_sub, count_dir_sub = get_order_list(pin, page_num + 1)
        order_info.extend(bill_info_sub)
        count_dir.update(count_dir_sub)
    return order_info, count_dir

def skuProResultPC(orderId, skuId, pin):
    """判断订单是否保价超时"""

    url = "https://sitepp-fm.jd.com/rest/webserver/skuProResultPC"
    data = {
        "orderId": orderId,
        "skuId": skuId,
        "pin": pin
    }
    headers = {
        'User-Agent': user_agent,
        'Referer': 'https://pcsitepp-fm.jd.com/',
    }

    r = session.post(url, data=data, headers=headers)
    return 'overTime' not in r.text

示例结果

订单信息:
[{'orderid': '118598307636', 'skuidAndSequence': ['851267,1']}, {'orderid': '118597642910', 'skuidAndSequence': ['4389188,1']}, {'orderid': '123625659522', 'skuidAndSequence': ['69699954984,1']}, {'orderid': '123539553604', 'skuidAndSequence': ['6839875,1']}, {'orderid': '123474129967', 'skuidAndSequence': ['50000970588,1']}]
商品数量
{'118598307636_851267': '10', '118597642910_4389188': '10', '123625659522_69699954984': '1', '123539553604_6839875': '4', '123474129967_50000970588': '1', '122842702447_31295640649': '1', '117403228624_31295640649': '1'}

商品信息

在获取保价列表中,已经取到了商品的 sku 号,在商品 url(如:https://item.jd.com/6839875.html)中最后的数字便是 sku 号,利用 sku 号可以获取到商品信息。

京东自动保价脚本_第3张图片

分析元素可知在页面的 js 中,pageConfig 变量有我们需要的所有数据,用正则表达式取出

京东自动保价脚本_第4张图片

def get_product_info(skuId):
    """获商品信息"""
    info = {}
    url = "http://item.jd.com/%s.html" % skuId
    headers = {
        'User-Agent': user_agent,
        'Referer': 'https://pcsitepp-fm.jd.com/',
    }
    r = requests.get(url, headers=headers)
    pageConfig = re.findall("var pageConfig = \{([\s\S]+)\} catch\(e\) \{\}", r.text)
    cat = re.findall("cat: \[([\d,]+)\]", pageConfig[0])
    venderId = re.findall("venderId:(\d+)", pageConfig[0])
    shopId = re.findall("shopId:'(\d+)'", pageConfig[0])
    name = re.findall("name: '(.+)'", pageConfig[0])
    info['cat'] = cat[0] if len(cat) else ""
    info['venderId'] = venderId[0] if len(venderId) else ""
    info['shopId'] = shopId[0] if len(shopId) else ""
    info['skuId'] = skuId
    # 配送区域默认为北京
    info['area'] = '1_72_55653_0' 
    info['name'] = name[0]
    return info

示例结果

{'cat': '1319,1525,7057', 'venderId': '1000015389', 'shopId': '1000015389', 'skuId': '6839875', 'area': '1_72_55653_0', 'name': '雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气'}
{'cat': '1319,6313,15614', 'venderId': '10109166', 'shopId': '965779', 'skuId': '50000970588', 'area': '1_72_55653_0', 'name': '七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕'}
{'cat': '1319,1527,1559', 'venderId': '107952', 'shopId': '106328', 'skuId': '31295640649', 'area': '1_72_55653_0', 'name': 'babycare婴儿纸巾抽纸新生儿面巾纸云柔巾宝宝纸巾 108抽*6包'}

商品当前价格

获取到商品信息后,把这些数据当做参数提交到 url(https://c0.3.cn/stock)中获取商品当前的价格。

def get_product_price(product_info):

    url = "https://c0.3.cn/stock?skuId={}&area={}&venderId={}&buyNum=1&choseSuitSkuIds=&cat={}&extraParam={{%22originid%22:%221%22}}&fqsp=0&ch=1&callback=jQuery{}"\
        .format(product_info['skuId'], 
                product_info['area'], 
                product_info['venderId'], 
                product_info.get('cat', ''), 
                random.randint(1000000, 9999999))
    headers = {
        'User-Agent': user_agent,
        'Host': 'c0.3.cn',
        'Referer':  'https://item.jd.com/{0}.html'.format(product_info['skuId']),
    }
    r = session.get(url, headers=headers)
    data = parse_json(r.text)

    # 价格
    price = data.get("stock", {}).get("jdPrice", {}).get('p', 0)
    return float(price)

商品可用优惠券

在京东购物经常有满 xx 减 xx 和 满 xx 打 xx 折的优惠券,当购买商品时未使用优惠券,可以联系客服进行价格保护,这里抓取优惠券并打印出来

京东自动保价脚本_第5张图片

def get_product_coupon(product_info, price):
    """优惠券列表"""
    result = []
    headers = {
        'User-Agent': user_agent,
        'Referer':  'https://item.jd.com/{0}.html'.format(product_info['skuId']),
    }
    url = 'https://cd.jd.com/promotion/v2?callback=jQuery{}&skuId={}&area={}&shopId={}&venderId={}&cat={}&isCanUseDQ=1&isCanUseJQ=1&platform=0&orgType=2&jdPrice={}&appid=1&_={}'\
        .format(
                str(random.randint(1000000, 9999999)),
                product_info['skuId'],
                product_info['area'],
                product_info['shopId'],
                product_info['venderId'],
                product_info['cat'].replace(',', '%2C'),
                price,
                str(int(time.time() * 1000)))
    r = session.get(url, headers=headers)
    data = parse_json(r.text)
    pickOneTag = data.get("prom", {}).get("pickOneTag")

    # 满减
    if pickOneTag:
        for tag in pickOneTag:
            result.append(tag.get('content'))

    # 打折
    skuCoupon = data.get('skuCoupon')
    if skuCoupon:
        for coupon in skuCoupon:
            if coupon.get('allDesc'):
                result.append(coupon.get('allDesc'))
            elif coupon.get('quota') and coupon.get('discount'):
                result.append("满" + str(coupon.get('quota')) + '减' + str(coupon.get('discount')))
    return result

示例结果

['每满199元,可减100元现金,最多可减1000元', '满3件,总价打5折', '满105.0减5.0']

下单价格

到这里已经取到了商品的当前价格、优惠券和购买数量,还剩下订单的下单价格需要获取,这个价格就是第一张图中的金额。我们使用订单号和 sku 号作为参数,批量查询下单价格

京东自动保价脚本_第6张图片

def get_price_list(pin):
    '''获取下单价格、商品信息、当前价格、数量'''

    product_list = []

    # 取订单号,sku和商品数量
    queryOrderPriceParam,count_dir = get_order_list(pin)

    # 获取购买时的价格
    params = {"queryOrderPriceParam": json.dumps(queryOrderPriceParam)}
    r = session.post("https://sitepp-fm.jd.com/rest/webserver/getOrderListSkuPrice", data = params)
    orderList = r.json()

    for item in orderList:

        skuid = item.get("skuid")
        buyingjdprice = item.get("buyingjdprice")
        orderid = item.get("orderid")

        # 商品信息
        product_info = get_product_info(skuid)
        # 当前价格
        price = get_product_price(product_info)
        # 优惠券
        coupon = get_product_coupon(product_info, price)

        name = product_info['name']
        count = count_dir[orderid + '_' + skuid]

        product_list.append({'orderid': orderid, 'name': name, 'price': price, 'coupon': coupon, 'count': count, 'buyingjdprice': buyingjdprice})
    return product_list

示例结果

[{'orderid': '123539553604', 'name': '雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气', 'price': 27.9, 'coupon': ['购买1件可优惠换购热销商品', '满105.0减5.0', '满199减50', '满268减60'], 'count': '4', 'buyingjdprice': 27.0}, {'orderid': '123474129967', 'name': '七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕', 'price': 69.0, 'coupon': ['06月16日 00:00 该商品参加跨店铺满折活动  ,满2件,总价打8折;满3件,总价打7折', '满98减5', '满105.0减5.0', '满178减10'], 'count': '1', 'buyingjdprice': 66.0}]

申请价格保护

最后一步比价和申请价格保护,这里分为 2 种情况,一种是当前不能用优惠券可以直接申请价格保护,另一种是当前存在优惠券,可以打印到控制台通知用户。

def protect_protect_apply(product_list):
    """申请价格保护"""

    if len(product_list) == 0:
        return
    else:
        for item in product_list:
            result = '订单号:{},名称:{}, 数量:{}, 购买价格:{}, 当前价格:{}, 当前优惠:{}。'\
                .format(item['orderid'],
                        item['name'],
                        item['count'],
                        item['buyingjdprice'],
                        item['price'],
                        ' | '.join(item['coupon']))

            # 没有优惠券并且购买价格高于当前价格
            if len(item['coupon']) == 0 and item['buyingjdprice'] > item['price']:

                url = 'https://pcsitepp-fm.jd.com//rest/pricepro/skuProtectApply'
                data = {
                    "orderId": item['orderId'],
                    "orderCategory": "Others",
                    "skuId": item['skuId'],
                    "refundtype": 1
                }

                headers = {
                    'User-Agent': user_agent,
                    'Referer': 'https://pcsitepp-fm.jd.com/',
                    'accept': 'application/json, text/javascript, */*; q=0.01'
                }
                session.post(url, data=data, headers=headers)
                print(result + ' 已申请价格保护,请结果查看价格保护页面')

            elif len(item['coupon']) > 0:
                print(result + ' 在优惠券未申请自动价格保护,请联系客服申请')
    return

示例结果

订单号:123539553604,名称:雀氏chiaus薄c引力纸尿裤小号S27片(4-8kg)尿不湿新生儿柔薄透气, 数量:4, 购买价格:27.0, 当前价格:27.9, 当前优惠:购买1件可优惠换购热销商品 | 满105.0减5.0 | 满199减50 | 满268减60。在优惠券未申请自动价格保护,请联系客服申请
订单号:123474129967,名称:七彩博士 婴儿定型枕0-1岁 夏季透气天丝新生儿乳胶枕头宝宝U型枕新生儿用品 绿色天丝枕, 数量:1, 购买价格:66.0, 当前价格:69.0, 当前优惠:06月16日 00:00 该商品参加跨店铺满折活动  ,满2件,总价打8折;满3件,总价打7折 | 满98减5 | 满105.0减5.0 | 满178减10。在优惠券未申请自动价格保护,请联系客服申请

总结

京东自动保价的脚本核心代码已经完成了,大家可以根据自己的需求更改代码。例如增加计划任务,发送邮件而不是打印等等。

近期推荐阅读:
【1】整理了我开始分享学习笔记到现在超过250篇优质文章,涵盖数据分析、爬虫、机器学习等方面,别再说不知道该从哪开始,实战哪里找了【2】【终篇】Pandas中文官方文档:基础用法6(含1-5)


如果你觉得文章不错的话,分享、收藏、在看、留言666是对老表的最大支持。

你可能感兴趣的:(京东自动保价脚本)