爬虫瑞数5.5案例:某证券

声明:
该文章为学习使用,严禁用于商业用途和非法用途,违者后果自负,由此产生的一切后果均与作者无关

一、瑞数简介

瑞数动态安全 Botgate(机器人防火墙)以“动态安全”技术为核心,通过动态封装、动态验证、动态混淆、动态令牌等技术对服务器网页底层代码持续动态变换,增加服务器行为的“不可预测性”,实现了从用户端到服务器端的全方位“主动防护”,为各类 Web、HTML5 提供强大的安全保护。

二、瑞数特点
  1. 会有多层debugger,可以点击Never pause here过掉debugger
  2. 会有多次请求
  • 瑞数4、瑞数5有两次相同的请求,瑞数4第一个请求状态码202,瑞数5第一个请求状态412,第一次请求响应的html,会有个script标签外链js加载 t s = w i n d o w [ ′ _ts = window[' ts=window[_ts’],外链js代码可以固定,也可以通过对外链js发送请求获取js代码
  • 瑞数5.5有两次相同的请求,第一次请求状态码412,响应的html有外链js,此外链js代码可以固定,也可以通过对外链js发送请求获取js代码
  • 瑞数6和瑞数5.5编译过程差不多
  1. 第一次响应的html,都会包含动态加载的meta标签包含content、两个script标签,
  • 瑞数4、瑞数5用第一个script加载包含_ts = window[‘$_ts’]的js文件,第二个script加载一段自执行的js,用于把之前加载的代码处理成可用的js代码,处理后的js字符串,通过call执行,并生成cookie
  • 瑞数5.5用第一个script加载包含_ts = window[‘$_ts’]代码,第二个script加载自执行js文件,用于把之前加载的代码处理成可用的js代码,处理后的js字符串,通过call执行,并生成cookie
  1. 都会有特有的cookie标识
  • 瑞数4:FSSBBIl1UgzbN7N80T,生成值的第一个字符就是代数
  • 瑞数5:IdlEqTWW2ERnT,生成值的第一个字符就是代数
  • 瑞数5.5:1EzPGwRUoQaWT,生成值的第一个字符就是代数
  1. 瑞数会检测当前执行的文件是哪一个,可以使用delete __filename、delete __dirname
三、瑞数5.5特点
  1. 两层debugger,可以点击Never pause here过掉debugger
  2. 会有两个相同请求,第一次请求(状态码412)和第二次请求(状态码200)是相同的
  3. 第一次请求失败,状态码是412
  • 首先会加载第响应html文件中的js: t s = w i n d o w [ ′ _ts = window[' ts=window[_ts’]
  • 返回响应html文件,里面会有动态加载的meta标签包含content、一个script标签包含 t s = w i n d o w [ ′ _ts = window[' ts=window[_ts’]、一个script标签加载js文件
  • 外链js会把之前的js代码,转换成可用的js代码,并通过call方法执行eval函数生成vm文件,在vm文件生成1EzPGwRUoQaWT,赋值给document.cookie
  • 响应的cookie名字是:1EzPGwRUoQaWS
  1. 第三次请求成功,可以正确拿到数据
四、找出需要加密的参数
  1. js运行atob(‘aHR0cDovL3d3dy5jaGluYXN0b2NrLmNvbS5jbi9uZXdzaXRlL2Nncy1zZXJ2aWNlcy9zdG9ja0ZpbmFuY2UvYnVzaW5lc3NBbm5jLmh0bWw=’) 拿到网址,F12打开调试工具(打开F12会遇到无限debugger,这是个eval执行的debugger,右击左侧代码行点击Never pause here过掉即可),刷新页面,找到 stockFinance/businessAnnc.html 请求(状态200),鼠标右击请求找到Copy>Copy as cUrl(cmd)
    爬虫瑞数5.5案例:某证券_第1张图片
  2. 打开网站:https://spidertools.cn/#/curl2Request,把拷贝好的curl转成python代码,新建 zj.py,把代码复制到该文件
    爬虫瑞数5.5案例:某证券_第2张图片
  3. 多运行几次zj.py,会发现请求失败,状态码是412,仔细分析cookie会发现1EzPGwRUoQaWS、1EzPGwRUoQaWT,而1EzPGwRUoQaWT值得第一个字符是5,这是瑞数特点之一,字符5代表是瑞数5代
    爬虫瑞数5.5案例:某证券_第3张图片
  4. 新建zj.js,用于放扣下的代码
五、瑞数5 cookie 分析
  1. 使用hook定位1EzPGwRUoQaWT,参数生成位置,这里我使用的是油猴
    爬虫瑞数5.5案例:某证券_第4张图片
  2. 编辑好油猴脚本,启动该脚本,切换到Application,清除浏览器的cookie,一定要清除cookie
    爬虫瑞数5.5案例:某证券_第5张图片爬虫瑞数5.5案例:某证券_第6张图片
  3. 清除cookie后,刷新页面后会进入油猴脚本里的debugger,一直点击跳过当前函数执行,就会找到1EzPGwRUoQaWT赋值的地方
    爬虫瑞数5.5案例:某证券_第7张图片
  4. 分析右侧的堆栈,找到不属于该虚拟文件的栈,分别点击查看会发现一个call方法,该方法就是生成虚拟文件的地方,这个文件是第一次请求的响应结果
    爬虫瑞数5.5案例:某证券_第8张图片
  5. 使用无痕窗口打开网站点击sources,找到事件监听勾选script
    爬虫瑞数5.5案例:某证券_第9张图片
  6. 切换到Application,清除浏览器的cookie,一定要先清除cookie,清除cookie后,刷新页面,会看到一个html中的js代码,这是第一次请求响应的,把这个文件代码全部拷贝到zj.js
    爬虫瑞数5.5案例:某证券_第10张图片
  7. 点击跳过断点,会进入一个js文件,这个js文件就是刚才找到call方法的文件,在该行打上断点
    爬虫瑞数5.5案例:某证券_第11张图片
  8. 点击跳过断点,鼠标悬浮到call方法参数上上会发现很多js字符串,这就是经过该自执行方法转换后的js,就是之前油猴分析的虚拟文件执行的js
    爬虫瑞数5.5案例:某证券_第12张图片
  9. 这里要注意虚拟文件是动态生成的,每次获取到的都是不一样的,为了方便调试,把js文件替换成本地文件,这样每次生成的虚拟文件就是一样的,右击该js文件名称,点击Override content,如果替换成功后代码都在一行,可以在本地找到该文件,用编辑器打开,格式化一下,并在call的位置打上断点
    爬虫瑞数5.5案例:某证券_第13张图片
  10. 清除cookie,刷新页面,点击跳过断点执行,会进入之前的替换后的js文件断点,再点击跳过断点执行,会看到一个html文件,里面会有动态加载的meta标签包含content、一个script标签包含刚才的js、一个script标签加载js文件,这个文件也需要本地替换下,再点击跳过断点,会到两层debugger
    爬虫瑞数5.5案例:某证券_第14张图片
  11. 清除cookie,刷新页面,点击跳过断点执行,找到之前的call断点,把该文件的的js,拷贝到zj.js,运行zj.js,会发现报window的错误,window是浏览器环境的,node环境不存在,接下来开始补环境
    爬虫瑞数5.5案例:某证券_第15张图片
六、补环境
  1. 首选在代码顶部补上window环境,并用代理自动把需要补的环境吐出来,新建jsProxy.js把下面代码拷贝过去
// 代理器封装
function getEnv(proxy_array) {
    for(var i=0; i

爬虫瑞数5.5案例:某证券_第16张图片

  1. 运行zj.js,会发现在获取window.top时报错了,在控制台输出window.top得知 window.top = window,在代码顶部补上window.top
    爬虫瑞数5.5案例:某证券_第17张图片爬虫瑞数5.5案例:某证券_第18张图片爬虫瑞数5.5案例:某证券_第19张图片
  2. 运行zj.js,会发现程序卡window.clearInterval在方法,该方法是清除定时器,把window.clearInterval、setTimeout、setInterval方法置空后再运行还是卡在window.clearInterval,这时候就要分析控制台打印出的值,先把常见的值为undefined的补上
    爬虫瑞数5.5案例:某证券_第20张图片爬虫瑞数5.5案例:某证券_第21张图片爬虫瑞数5.5案例:某证券_第22张图片
  3. 运行zj.js,会发现在获取document.createElement时报错了,document.createElement是用来创建标签的,且标签值是div,在代码顶部补上document.createElement
    爬虫瑞数5.5案例:某证券_第23张图片爬虫瑞数5.5案例:某证券_第24张图片
  4. 运行zj.js,会发现在获取document.createElement时又报错了,找到打印信息最后的位置,会看到报错代码
    爬虫瑞数5.5案例:某证券_第25张图片
  5. 在浏览器call断点处,点击进入该方法内部会找到虚拟文件,在虚拟文件内搜索 d d d[_$$i[85]],会找到该方法的位置,在该行打上断点,点击跳过断点,会进入刚才的断点,把代码信息在控制输出,会发现是获取div下的i标签,获取出的结果是 length:0,在代码顶部补上该代码
    爬虫瑞数5.5案例:某证券_第26张图片爬虫瑞数5.5案例:某证券_第27张图片爬虫瑞数5.5案例:某证券_第28张图片
  6. 运行zj.js,document.getElementsByTagName报错,找到打印信息最后的位置,会看到报错代码,在虚拟文件内搜索KaTeX parse error: Expected group after '_' at position 4: av[_̲cL],会发现很多KaTeX parse error: Expected group after '_' at position 4: av[_̲cL],全部打上断点,点击跳过断点,会进入其中的断点,在控制台打印出KaTeX parse error: Expected group after '_' at position 4: av[_̲cL]的值,如果不是getElementsByTagName就点击跳过断点,如果是就停下,找到后悬浮到参数上会发现是script标签
    爬虫瑞数5.5案例:某证券_第29张图片爬虫瑞数5.5案例:某证券_第30张图片爬虫瑞数5.5案例:某证券_第31张图片
  7. 在document中补上getElementsByTagName,点击运行会发现确实是script标签,把返回的值打印在控制台,会发现是两个script和一个length=1,在代码顶部补上该代码,具体script要补什么代码还有根据实际代码往下分析,点击跳过断点,会再次进入该断点,打印出该断点的信息,会发现是第二个script标签中getAttribute传了个r参数,返回了m,getAttribute是获取该标签上的属性,在代码顶部补上该代码,再点击断点,同样会进入该断点,打印出该断点的信息输出和刚才的是获取了第一个script标签上的r属性,并返回了m,在代码顶部补上该代码
    爬虫瑞数5.5案例:某证券_第32张图片爬虫瑞数5.5案例:某证券_第33张图片爬虫瑞数5.5案例:某证券_第34张图片爬虫瑞数5.5案例:某证券_第35张图片
  8. 运行zj.js,到scrtpt-1中获取r属性时报错了,找到打印信息最后的位置,发现是缺少removeChild,清除cookie,刷新页面,找到刚才KaTeX parse error: Expected group after '_' at position 4: av[_̲cL]断点位置,点击跳过断点,因为刚才的报错是在script获取属性之后,所以断点到获取属性的时候停下,在循环顶部打上断点,可以看作用域上的_$ay,来确定断点是否到获取script属性
    爬虫瑞数5.5案例:某证券_第36张图片
  9. 点击跳过断点,观察作用域,会看到 script、parentElement,这是获取script的父级head,再继续点击跳过断点就会看到head、removeChild,继续点击跳过断点会看到script、removeChild,说明刚才的removeChild报错是由script[1].parentElement.removeChild引起的,在代码顶部补上该代码,在调试这个removeChild错误的时候会发现很难下断点,当遇见这种清况看作用域就能看到代码的执行清空,后面会遇到script[0]报removeChild会采用另一种方法
    爬虫瑞数5.5案例:某证券_第37张图片爬虫瑞数5.5案例:某证券_第38张图片爬虫瑞数5.5案例:某证券_第39张图片爬虫瑞数5.5案例:某证券_第40张图片
  10. 运行zj.js,到scrtpt-1中获取r属性时报错了,找到打印信息最后的位置,发现是缺少removeChild,修改代理数组在后面加上script[0],再运行zj.js,就可以看到script[0].parentElement是undefined,在顶部补上代码
    爬虫瑞数5.5案例:某证券_第41张图片在这里插入图片描述爬虫瑞数5.5案例:某证券_第42张图片爬虫瑞数5.5案例:某证券_第43张图片
  11. 运行zj.js,获取window.attachEvent属性时报错,这里需要注意上面的打印信息window.addEventListener,一般这里会环境监测,如果window.addEventListener存在执行window.addEventListener,不存在执行window.attachEvent,node环境不存在addEventListener,所以会报window.attachEven的错误,但是window.addEventListener下是存在的,所以只要补window.addEventListene就行,找到打印信息最后的位置,搜索KaTeX parse error: Expected group after '_' at position 4: h3[_̲il[4]],在判断出打上断点,会进入window.addEventListener,在代码顶部补上代码
    爬虫瑞数5.5案例:某证券_第44张图片
    爬虫瑞数5.5案例:某证券_第45张图片在这里插入图片描述
  12. 运行zj.js,会发现document .getElementsByTagName失败,在浏览器控制台打印document .getElementsByTagName(‘meta’),会发现是两个meta对象和length,在代码顶部补上代码
    爬虫瑞数5.5案例:某证券_第46张图片爬虫瑞数5.5案例:某证券_第47张图片爬虫瑞数5.5案例:某证券_第48张图片
  13. 运行zj.js,会发现获取meta标签时又报错了,找到打印信息最后的位置,在虚拟文件内搜索KaTeX parse error: Expected group after '_' at position 4: do[_̲$i[19]],并在搜索到的位置打上断点,打印断点的信息,会发现获取的是第二个meta的r属性,在顶部补上代码
    爬虫瑞数5.5案例:某证券_第49张图片爬虫瑞数5.5案例:某证券_第50张图片爬虫瑞数5.5案例:某证券_第51张图片爬虫瑞数5.5案例:某证券_第52张图片
  14. 运行zj.js,会发现获取meta-1中的的r属性是报错,找到打印信息最后的位置,发现是缺少removeChild,修改代理数组增加meta[1],再运行zj.js,就可以看到meta[1].parentNode是undefined,在顶部补上代码,
    爬虫瑞数5.5案例:某证券_第53张图片爬虫瑞数5.5案例:某证券_第54张图片爬虫瑞数5.5案例:某证券_第55张图片爬虫瑞数5.5案例:某证券_第56张图片
  15. 运行zj.js,会发现不再报meta错误,不过这里meta[1]标签中的content是一定要补上的
    爬虫瑞数5.5案例:某证券_第57张图片爬虫瑞数5.5案例:某证券_第58张图片
  16. 重复运行zj.js,按照上面的方法补全环境
  17. 补完环境,修改zj.js,再运行,会发现已经拿到1EzPGwRUoQaWT
    爬虫瑞数5.5案例:某证券_第59张图片
七、python代码验证结果
  1. 修改zj.js,因为meta中的content、还有js代码都是动态生成的,所以要用字符暂时占位,分别注释掉之前content的值、 t s = w i n d o w [ ′ _ts = window[' ts=window[_ts’]、js,用meta_content、ts_code、js_code代替
    爬虫瑞数5.5案例:某证券_第60张图片爬虫瑞数5.5案例:某证券_第61张图片
  2. 修改zj.py
    爬虫瑞数5.5案例:某证券_第62张图片爬虫瑞数5.5案例:某证券_第63张图片
  3. 点击运行zj.py,会发现第二个请求报400,那是因为瑞数会检测当前执行的文件是哪一个
    爬虫瑞数5.5案例:某证券_第64张图片
  4. 修改zj.js,再运行fdc.py,会发现还是没获取成功,但是之前的cookie确实已经拿到,这就要考虑还有其他环境没补上
    爬虫瑞数5.5案例:某证券_第65张图片爬虫瑞数5.5案例:某证券_第66张图片
  5. 修改zj.js,打开之前注释的meta[1]下的content、js等代码,把补环境中有if、else判断的console,放在else中
    爬虫瑞数5.5案例:某证券_第67张图片爬虫瑞数5.5案例:某证券_第68张图片爬虫瑞数5.5案例:某证券_第69张图片
  6. 运行zj.js,先找出getElementsByTagName、createElement未补的环境,搜索getElementsByTagName发现base是需要补的,搜索createElement发现form、input是需要补的,而且input创建了三次,本文就不讲base和input怎么补的,只需补form就可以,在代码顶部补上代码
    爬虫瑞数5.5案例:某证券_第70张图片爬虫瑞数5.5案例:某证券_第71张图片爬虫瑞数5.5案例:某证券_第72张图片
  7. 修改代理数组,加上form,运行zj.js,会发现设置form时需要id、action
    在这里插入图片描述爬虫瑞数5.5案例:某证券_第73张图片
  8. 找到之前补meta的时候的断点KaTeX parse error: Expected group after '_' at position 4: av[_̲cL],点击跳过断点,直到在作用域中看到createElement、form,在虚拟文件内搜索KaTeX parse error: Expected group after '_' at position 4: av[_̲cL](,搜索到的都打上断点,点击跳过断点,仔细观察作用域中的信息,直到看到appendChild、body、form关键字说明要把创建好的form标签插入到body中,查看form信息会找到id、action,在顶部补上form,如果想补input可以继续点击跳过断点,就会看到向form中插入input,至于input插入三次id分别是username、password、innerText
    爬虫瑞数5.5案例:某证券_第74张图片爬虫瑞数5.5案例:某证券_第75张图片爬虫瑞数5.5案例:某证券_第76张图片
  9. 注释掉之前content的值、 t s = w i n d o w [ ′ _ts = window[' ts=window[_ts’]、js,在运行zj.py,会发现数据获取成功
    爬虫瑞数5.5案例:某证券_第77张图片爬虫瑞数5.5案例:某证券_第78张图片爬虫瑞数5.5案例:某证券_第79张图片
八、瑞数其他接口加密

如果cookie生成之后,有其他接口参数加密,直接使用明文参数一样可以调用成功,因为参数加密是瑞数加密,所以这里解密也是瑞数自己解密的;
测试请求/doc/queryDocList,通过XHR请求拦截,找到明文信息,修改zj.py,请求/doc/queryDocList,会发现即使是明文数据也可以获取成功
爬虫瑞数5.5案例:某证券_第80张图片爬虫瑞数5.5案例:某证券_第81张图片爬虫瑞数5.5案例:某证券_第82张图片

九、最终代码
  1. zj.js
delete __filename
delete __dirname

var getEnv = require('./jsProxy')

//补window
window = global
window.top = window
window.clearInterval = function () {
}

window.addEventListener = function (event) {
    console.log('window中addEventListener接受的值是:', event)
}

//补document
div = {
    getElementsByTagName: function (tag) {
        if (tag == 'i') {
            return {length: 0}
        } else {
            console.log('div中getElementsByTagName接受的值是', tag)
            return {}
        }
    }
}

script = {
    0: {
        getAttribute: function (attr) {
            console.log('script-0中getAttribute接受的值是', attr)
            if (attr == 'r') {
                return 'm'
            }
        },
        parentElement: {
            removeChild: function (tag) {
                console.log('script-1中的removeChild接受的值:', tag)
            }
        }
    },
    1: {
        getAttribute: function (attr) {
            console.log('script-1中getAttribute接受的值是', attr)
            if (attr == 'r') {
                return 'm'
            }
        },
        parentElement: {
            removeChild: function (tag) {
                console.log('script-1中的removeChild接受的值:', tag)
            }
        }
    },
    length: 2
}

meta = {
    0: {},
    1: {
        getAttribute: function (attr) {
            if (attr == 'r') {
                return 'm'
            } else {
                console.log('meta-1中getAttribute接受的值是', attr)
                return {}
            }
        },
        parentNode: {
            removeChild: function (tag) {
                console.log('meta-1中removeChild接受的值是:', tag)
            }
        },
        content: 'meta_content'
    },
    length: 2
}

form = {
    action: 'https://ucenter.miit.gov.cn/login.jsp',
    id: '__Zm9ybS5pZAo__',
}

document = {
    createElement: function (tag) {
        if (tag == 'div') {
            return div
        } else if (tag == 'form') {
            return form
        }
    },
    appendChild: function (tag) {
        console.log('document中appendChild接受的值是', tag)
        return tag || {};
    },
    removeChild: function (tag) {
        console.log('document中removeChild接受的值是', tag)
        return {}
    },
    getElementsByTagName: function (tag) {
        if (tag == 'script') {
            return script
        } else if (tag == 'meta') {
            return meta
        } else {
            console.log('document中getElementsByTagName接受的值是', tag)
            return {}
        }
    },
    getElementById: function (id) {
        console.log('document中的getElementById接受的值是:', id)
        if (id == 'root-hammerhead-shadow-ui') {
            return null
        }
    }
}

//补location

location = {
    href: "http://www.chinastock.com.cn/newsite/cgs-services/stockFinance/businessAnnc.html",
    origin: "http://www.chinastock.com.cn",
    protocol: "http:",
    host: "www.chinastock.com.cn",
    hostname: "www.chinastock.com.cn",
    pathname: "/newsite/cgs-services/stockFinance/businessAnnc.html"
}


setTimeout = function () {
}
setInterval = function () {
}

proxy_array = ['window', 'document', 'location', 'navigator', 'history', 'screen', 'target', 'script[0]', 'meta[1]', 'form']
getEnv(proxy_array)


'ts_code'
'js_code'

function get_cookie() {
    var EzPGwRUoQaWT = document.cookie.split('1EzPGwRUoQaWT=')[1].split(';')[0]
    return EzPGwRUoQaWT
}

console.log(get_cookie())
  1. zj.py
import requests
from lxml import etree
import execjs

headers = {
    "Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,image/avif,image/webp,image/apng,*/*;q=0.8,application/signed-exchange;v=b3;q=0.7",
    "Accept-Language": "en,zh-CN;q=0.9,zh;q=0.8",
    "Cache-Control": "no-cache",
    "Pragma": "no-cache",
    "Proxy-Connection": "keep-alive",
    "Referer": "http://www.chinastock.com.cn/newsite/cgs-services/stockFinance/businessAnnc.html",
    "Upgrade-Insecure-Requests": "1",
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36"
}
cookies = {
    # "aliyungf_tc": "d0a79762e3a5a1d8fae1f5815c7c8dfee488fd8bb3fe2e271ca7f6b32c4891e4",
    # "acw_tc": "ac11000117016103207903338ebe3da6d7f7013a812d4181d1c81f244b0c5e",
    # "1EzPGwRUoQaWS": "5Sd_7hNDdsibBtUr2KtaorX.oMnUzRBCHryQ5jRWd5MgFf4243PnXoAZTfhrUTSeItypKYhnttDwtt.8PaZXHhA",
    # "1EzPGwRUoQaWT": ".sHyUJtIBQzbbxLniztzoQdA3t20ZaSihfzHSypZM.4g_l7L7FR9B9dAic0hpBh2LoAoyddu75D2fGnxHgxjxvjwzNBjeXFFjmZ9KqNVuffkH3LGfYGIpCKE1zqsINGThR9wd2mY9o87Pu.89nXVRA_j2d.6nedwflKSAAkPCuL6TwVemW_lu.1lelL3uAUjcr2bpV2EQ2pdu6txVpYO1MieHfUtzKoxl2b6pSJgnPA"
}

url = "http://www.chinastock.com.cn/newsite/cgs-services/stockFinance/businessAnnc.html"

request_session = requests.session()
request_session.headers.update(headers)
request_session.cookies.update(cookies)


def get_ts():
    response = request_session.get(url)
    cookies['acw_tc'] = response.cookies['acw_tc']
    cookies['aliyungf_tc'] = response.cookies['aliyungf_tc']
    cookies['1EzPGwRUoQaWS'] = response.cookies['1EzPGwRUoQaWS']
    request_session.cookies.update(cookies)
    html = etree.HTML(response.text)
    ts_code = html.xpath('//script[1]/text()')[0]
    js_src = html.xpath('//script[2]/@src')[0]
    meta_content = html.xpath('//meta[2]/@content')[0]
    return ts_code, js_src, meta_content


ts_code, js_src, meta_content = get_ts()


def get_js():
    js_url = f'http://www.chinastock.com.cn{js_src}'
    response = request_session.get(js_url)
    request_session.cookies.update(cookies)
    return response.text


js_code = get_js()

with open('zj.js', 'r', encoding='utf-8') as js_file:
    js_text = js_file.read()
    js_text = js_text.replace('meta_content', meta_content)
    js_text = js_text.replace("'ts_code'", ts_code)
    js_text = js_text.replace("'js_code'", js_code)
    js = execjs.compile(js_text)
    cookies['1EzPGwRUoQaWT'] = js.call('get_cookie')
    request_session.cookies.update(cookies)
    response = request_session.get(url)
    response.encoding = 'utf-8'
    # print(response.text)
    # print(response)

get_data_par = {
    'catName': "yhgg_融资融券公告",
    'dayLimit': "9000",
    'pageNo': 2,
    'pageSize': "50",
}
get_data_url = 'http://www.chinastock.com.cn/website2020/doc/queryDocList'
response = request_session.get(get_data_url, params=get_data_par)

print(response.text)
print(response)

你可能感兴趣的:(python,爬虫)