爬虫文档

数据页面

店铺首页

  • 链接
    店铺首页(点击打开)☜

  • URL
    http://www.dhgate.com/#dt1501-logo

  • 所需页面截图


    爬虫文档_第1张图片
    网页截图
  • 数据库表设计
    • 使用 deliver_goods 数据库
    • 创建相关表
CREATE TABLE `tp_shop_front` (
  `shop_id` int(11) NOT NULL AUTO_INCREMENT,
  `shop_name` varchar(60) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '店铺所属用户名',
  `shop_disputerate` varchar(10) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '纠纷率',
  `system_message` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '系统消息(整串)',
  `tc_neworder` smallint(5) DEFAULT NULL COMMENT '交易_新订单',
  `tc_ready` smallint(5) DEFAULT NULL COMMENT '交易_代发货',
  `tc_dispute` smallint(5) DEFAULT NULL COMMENT '交易_纠纷中',
  `tc_unpaid` smallint(5) DEFAULT NULL COMMENT '交易_未付款',
  `tc_credited` smallint(5) DEFAULT NULL COMMENT '交易_已入账',
  `tc_cpay` smallint(5) DEFAULT NULL COMMENT '交易_可请款',
  `pd_3dayexp` smallint(5) DEFAULT NULL COMMENT '产品_3天内过期',
  `pd_30dayexp` smallint(5) DEFAULT NULL COMMENT '产品_30天内过期',
  `pd_30dayud` smallint(5) DEFAULT NULL COMMENT '产品_30天内问题或下架',
  `pd_complaint` smallint(5) DEFAULT NULL COMMENT '产品_知识产权被投诉',
  `pd_wtbuy` smallint(5) DEFAULT NULL COMMENT '产品_24小时求购',
  `ev_good` smallint(5) DEFAULT NULL COMMENT '30天好评',
  `ev_neutral` smallint(5) DEFAULT NULL COMMENT '30天中评',
  `ev_bad` smallint(5) DEFAULT NULL COMMENT '30天差评',
  `ev_wait` smallint(5) DEFAULT NULL COMMENT '30天待评价',
  PRIMARY KEY (`shop_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci COMMENT='店铺首页';

90天内取消订单页面

  • 链接
    取消订单页面(点击打开)☜

  • URL
    http://seller.dhgate.com/sellerordmng/orderList/list.do?params.linkType=110¶ms.page=2¶ms.orderDateFilter=-90%3B06¶ms.orderStatusFilter=¶ms.orderSort=06%3B0¶ms.notracking=1¶ms.isSymbol=¶ms.isFlag=

  • 第一级页面截图

    爬虫文档_第2张图片

  • 第二级页面截图

爬虫文档_第3张图片
爬虫文档_第4张图片
  • 数据库表设计

    • 第一级(将详情插入该表)
CREATE TABLE `tp_cabcelorder_info` (
  `order_id` int(11) NOT NULL COMMENT '第一级的订单号',
  `order_date` datetime DEFAULT NULL COMMENT '订单时间',
  `order_canceldate` datetime DEFAULT NULL COMMENT '订单取消时间',
  `order_source` varchar(60) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '订单来源',
  `basicin_buyername` varchar(60) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '订单买家 名称',
  `basicin_country` varchar(60) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '买家所属国家',
  `order_pricetotal` decimal(10,2) DEFAULT NULL COMMENT '订单总计or订单总额',
  `order_freight` decimal(10,2) DEFAULT NULL COMMENT '订单运费',
  `order_commission` decimal(10,2) DEFAULT NULL COMMENT '订单佣金',
  `order_amountpaid` decimal(10,2) DEFAULT NULL COMMENT '订单实付金额 非实收金额',
  `order_servicecharge` decimal(10,2) DEFAULT NULL COMMENT '支付手续费',
  `order_realpaid` decimal(10,2) DEFAULT NULL COMMENT '实收金额 这个为最终实收金额',
  PRIMARY KEY (`order_id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci COMMENT='订单详情表(取消定单类) 跟 订单详情商品列表表联系';
  • 第二级(订单详情中还有商品列表 插入该表中)
CREATE TABLE `tp_cabcelorer_googslist` (
  `id` int(11) NOT NULL AUTO_INCREMENT COMMENT 'id',
  `order_list_id` int(11) DEFAULT NULL COMMENT '订单号(用于和tp_cabcelorder_info 联系)',
  `order_list_commoditynumber` int(11) DEFAULT NULL COMMENT '商品编号',
  `order_list_commoditypicture` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '商品图片url',
  `order_list_commodityname` varchar(255) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '商品名',
  `order_list_commodityspeci` varchar(60) COLLATE utf8_unicode_ci DEFAULT NULL COMMENT '商品规格',
  `order_list_commodityunitprice` decimal(10,2) DEFAULT NULL COMMENT '商品单价',
  `order_list_commodityquantity` smallint(10) DEFAULT NULL COMMENT '单商品总数',
  `order_list_commoditytotal` decimal(10,2) DEFAULT NULL COMMENT '单商品总价',
  PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

你可能感兴趣的:(爬虫文档)