curl打开网页403或者302的解决方法(详细总结)

curl打开网页403或者302的解决方法

这里我以大众点评网为例

1、浏览器访问:http://www.dianping.com/shop/65334856

我们先说说如何查看Headers的信息

(1)打开对应的网站

(2)按F12键打开调试

(3)选择Network

(4)按F5刷新网页

(5)然后选择左面名称,一般是第一个数字的

curl打开网页403或者302的解决方法(详细总结)_第1张图片

2、直接curl访问

curl -v "http://www.dianping.com/shop/65334856" 

-v:显示请求详细信息

[root@jerry ~]# curl -v "http://www.dianping.com/shop/65334856"
* About to connect() to www.dianping.com port 80 (#0)
*   Trying 203.76.216.1... connected
* Connected to www.dianping.com (203.76.216.1) port 80 (#0)
> GET /shop/65334856 HTTP/1.1
> User-Agent: curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2
> Host: www.dianping.com
> Accept: */*
> 
< HTTP/1.1 403 Forbidden
< Date: Thu, 20 Dec 2018 03:32:42 GMT
< Content-Type: text/html;charset=UTF-8
< Transfer-Encoding: chunked
< Connection: keep-alive
< Keep-Alive: timeout=5
< Vary: Accept-Encoding
< X-Forbid-Reason: .
< Vary: Accept-Encoding
< Content-Language: en-US
< Pragma: no-cache
< Cache-Control: no-cache
< Server: DPweb
< 



    
    
    
     美食, 餐厅餐饮, 团购,生活,优惠券-大众点评网
        
    
    
        
    
    
    


抱歉!页面无法访问......

错误信息:

currentDate:2018-12-20 11:32:42

userIp:111.196.130.106, 10.69.93.5

userAgent:curl/7.19.7 (x86_64-redhat-linux-gnu) libcurl/7.19.7 NSS/3.14.0.0 zlib/1.2.3 libidn/1.18 libssh2/1.4.2

以上数据中有两个点很重要:

(1)HTTP/1.1 403 Forbidde    #表示资源不可用,没有权限访问此站

(2)

抱歉!页面无法访问......

     #可以看出页面没有加载
         

错误信息:

3、先解决403的问题

添加User-Agent(创建请求的浏览器和用户代理名称等信息传达给服务器)信息就可以访问了。

注意:User-Agent信息在浏览器前面打开的Headers的信息最下面

[root@jerry ~]# curl -A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36" -v "http://www.dianping.com/shop/65334856" 
* Hostname was NOT found in DNS cache
> Host: www.dianping.com
> Accept: */*
> 
< HTTP/1.1 302 Found
< Date: Thu, 20 Dec 2018 04:08:57 GMT
< Content-Length: 0
< Connection: keep-alive
< Keep-Alive: timeout=5
< Location: http://www.dianping.com/citylist
< Content-Language: en-US
< Pragma: no-cache
< Cache-Control: no-cache
* Server DPweb is not blacklisted
< Server: DPweb
< 
* Connection #0 to host www.dianping.com left intact
jerrywang@transfer:~$ curl -v "http://www.dianping.com/shop/65734326"                                                                                                                        
* Hostname was NOT found in DNS cache
*   Trying 203.76.216.1...
* Connected to www.dianping.com (203.76.216.1) port 80 (#0)
> GET /shop/65734326 HTTP/1.1
> User-Agent: curl/7.38.0
> Host: www.dianping.com
> Accept: */*
> 
< HTTP/1.1 302 Found
< Date: Thu, 20 Dec 2018 04:09:53 GMT
< Content-Length: 0
< Connection: keep-alive
< Keep-Alive: timeout=5
< M-Appkey: com.sankuai.rc.mtsi.optimus
< M-SpanName: OptimusController.optimusAuthorize
< M-TraceId: 7369567874137451512
< Location: https://verify.meituan.com/v2/web/general_page?action=spiderindefence&requestCode=fb54aba8c15c40088b52a764e8d3bbdf&platform=1000&adaptor=auto&succCallbackUrl=https%3A%2F%2Foptimus-mtsi.meituan.com%2Foptimus%2FverifyResult%3ForiginUrl%3Dhttp%253A%252F%252Fwww.dianping.com%252Fshop%252F65734326&theme=dianping
< Pragma: no-cache
< Cache-Control: no-cache
* Server DPweb is not blacklisted< Server: DPweb
< 
* Connection #0 to host www.dianping.com left intact

这次还是有两个重要信息:

(1)< HTTP/1.1 302 Found  #302代表暂时性转移

(2)< Location: https://verify.meituan.com/v2/web/general_page?action=spiderindefence&requestCode=fb54aba8c15c40088b52a764e8d3bbdf&platform=1000&adaptor=auto&succCallbackUrl=https%3A%2F%2Foptimus-mtsi.meituan.com%2Foptimus%2FverifyResult%3ForiginUrl%3Dhttp%253A%252F%252Fwww.dianping.com%252Fshop%252F65734326&theme=dianping     #这个就是跳转的网页

我们浏览器打开跳转的网页看看,原来是让验证,如何跳过验证呢,继续往下看

https://verify.meituan.com/v2/web/general_page?action=spiderindefence&requestCode=fb54aba8c15c40088b52a764e8d3bbdf&platform=1000&adaptor=auto&succCallbackUrl=https%3A%2F%2Foptimus-mtsi.meituan.com%2Foptimus%2FverifyResult%3ForiginUrl%3Dhttp%253A%252F%252Fwww.dianping.com%252Fshop%252F65734326&theme=dianping

curl打开网页403或者302的解决方法(详细总结)_第2张图片

4、解决302跳转

添加cookie信息就可以访问了。

注意:cookie信息在浏览器前面打开的Headers的信息Request Headersview source下  #请求头视图源

[root@jerry ~]# curl -cookie "_lxsdk_cuid=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _lxsdk=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _hc.v=e410126e-1782-9469-7026-539f8d9d3d56.1545276646; cy=2; cye=beijing; s_ViewType=10; _lxsdk_s=167c9aa6119-9a2-e70-bcb%7C%7C226" -A "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36" -v "http://www.dianping.com/shop/22974252"
* getaddrinfo(3) failed for _lxsdk_cuid=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _lxsdk=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _hc.v=e410126e-1782-9469-7026-539f8d9d3d56.1545276646; cy=2; cye=beijing; s_ViewType=10; _lxsdk_s=167c9aa6119-9a2-e70-bcb%7C%7C226:80
* Couldn't resolve host '_lxsdk_cuid=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _lxsdk=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _hc.v=e410126e-1782-9469-7026-539f8d9d3d56.1545276646; cy=2; cye=beijing; s_ViewType=10; _lxsdk_s=167c9aa6119-9a2-e70-bcb%7C%7C226'
* Closing connection #0
curl: (6) Couldn't resolve host '_lxsdk_cuid=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _lxsdk=167c9aa6114c8-0a767bfa958c85-6313363-1fa400-167c9aa61154e; _hc.v=e410126e-1782-9469-7026-539f8d9d3d56.1545276646; cy=2; cye=beijing; s_ViewType=10; _lxsdk
* About to connect() to www.dianping.com port 80 (#0)
*   Trying 203.76.216.1... connected
* Connected to www.dianping.com (203.76.216.1) port 80 (#0)
> GET /shop/22974252 HTTP/1.1
> User-Agent: Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.110 Safari/537.36
> Host: www.dianping.com
> Accept: */*
> 
< HTTP/1.1 200 OK
< Date: Thu, 20 Dec 2018 04:18:05 GMT
< Content-Type: text/html;charset=utf-8
< Transfer-Encoding: chunked
< Connection: keep-alive
< Keep-Alive: timeout=5
< M-SpanName: /shop/{num}
< M-TraceId: 1068949537692350265
< Accept-Ranges: bytes
< Content-Encoding: UTF-8
< ETag: "5844cbf24132f867d91746a71dbfb653"
< Last-Modified: Thu, 20 Dec 2018 01:00:11 GMT
< X-Mss-Trace-Id: 5485949940881798827
< x-amz-storage-class: 3R
< Pragma: no-cache
< Cache-Control: no-cache
< Server: DPweb
< Vary: User-Agent, Accept-Encoding
< 
            【脑馋粉儿(三里屯店)】电话,地址,价格,营业时间(图) - 北京美食 - 大众点评网          

脑馋粉儿(三里屯店)
手机买单 积分抵现
其它3家分店

1 条评论
星级来自业内综合评估
人均: 口味: . 环境: . 服务: .
地址: 里屯SOHOB1B1-

电话: 1-1

更多信息

营业时间: 11:-: 1--11-- 修改

京荟广场店

小屯村梅市口路133号京荟广场文化产业园B座

四惠店

建国路力源里北街2号院4号楼1层106

朝阳门店

朝阳门外大街19号华普大厦福满格美食广场二层CY202-12

查看全部3家分店

修改时间

取消 保存修改

    网友点评(1923)

    • MirrorJane

      人均:0元

      出差北京,看低-10,立里屯逛逛,偶这家四川冒菜馆。本来抱什么希望,觉得在广州吃太多四川冒菜,惊,超级错哟。食材比较新鲜,肉和菜分开摆放,分开称,肉也是提前有酱拌,调了。煮出来常好,,强烈推。尤其是和牛肉,两个道煮出来别棒。

      2018-12-11 13:45 脑馋粉儿
    • piupiuhas

      人均:0元

      中午来三里团办事,正中午,是乎来心心***粉,真是有一阵不吃甚是想啊,

      ?置:三里屯soho下广场,门脸不是很大,但是很找,在边<......

      展开评论

      中午三里团办事,正好中午,于心心念念的***粉,真

      ?位置:三里soho沉广场,门脸,但很好

      ?品:自选的,肉类要类分开单独选,麻牛肉、掌中错,对于肉食说必类很多,蘑菇、菠、木耳、海带、银耳必品[开心]选两盘,瞬间觉吃,要的正常,本脑花,选的次吧,他家脑花也错的,最后剩

      ?服好,对于这自助的很要求服


      ?推荐推荐,喜欢吃冒的真心要

      收起评论
      喜欢的菜:
      麻辣牛肉 麻辣掌中宝
      该店适合:
      性价比高
      foodShopFitIds:
      315550.0
      2018-12-16 23:45 脑馋粉儿
    • tina田田

      人均:40元

      位置在里屯SOHO5西粉儿。说他家冒菜是老重饭馆味道。人均40,,荤素分开计种多样,生。香辣牛肉 肥肠 百叶 金针菇最好吃。店面大,女士居多,生意还挺红火。

      喜欢的菜:
      麻辣牛肉 冒菜 肥肠
      该店适合:
      性价比高 回头客多
      foodShopFitIds:
      315550.0 318915.0
      2018-12-17 22:53 脑馋粉儿
    • 来日方长Ei

      人均:0元

      下层广那边 不算很大 不难找
      的脑花儿感觉一般 糍粑也一般
      冒菜很吃 尤其肥肠 洗的很干净 虽然小卫生挺......

      展开评论

      场那边 门大 但是
      这家感觉一般 糍粑一般
      但是冒菜吃 尤其是肥  然小卫生挺

      服务态 可以自己择辣 荤素是分开装然后称重 价格高 能吃饱 肉类都是提前腌制过

      收起评论
      2018-12-18 08:26 脑馋粉儿
    • 安颜

      人均:0元

      东西味道很不错置相对说也比较好找!主要就品卫生不太好、看到一个阿姨然不戴手套直接用手去抓?天哪!们选完、收银写了个单子、直接放到面了!很不卫生!希多加意⚠️

      2018-12-17 00:29 脑馋粉儿
    • 飞天大宝宝是我

      人均:0元

      打卡➕拔草~
      确实去的点儿 周六的点钟

      多 坐的置 
      选择菜…荤分开放

      一个人去的 吃的并......

      展开评论

      打卡➕拔
       周上八

      多 位置 
      自助…荤素分开

       多 ?
      还要了柠檬

      钱 柠檬贵 因以买~

      「麻辣肉」罄了 

      「鸡脆骨」 但知道什么 太脆哦

      「午餐肉」特 推

      「鸭血」超爱鸭血 推

      「冬瓜」入儿 而且

      另外还些「土豆」「豆芽」「藕片」「脆豆腐」「原生」「花」
      多 浪费

      ?也满满  因饿

      调料 麻酱 花生碎 干辣椒 自助
       蚝

      颗星曲 当店里只  付料 了饮料 就找了 过会儿 问了前面桌  人看了 :“冬瓜” 然:“冬瓜了 ” 声音 啊  然了……之直在  但 嗓门儿大到所…………
      只想[][]
      就在收银台料 人给好像

      [环境] 欢暖暖光~

      [务]尽 和朋吧[羞][羞]

      收起评论
      喜欢的菜:
      鸡脆骨
      该店适合:
      价格实惠
      foodShopFitIds:
      316499.0
      2018-12-09 01:30 脑馋粉儿
    • Crazy

      人均:0元

      说走就走,脑馋粉儿。不是***粉是脑馋粉,家正宗传四川冒菜店。冒菜、米粉、脑花……
      以前三里屯总路过家店,中,环境吵吵本排不......

      展开评论

      走就走,去吃儿去。***家正宗传统冒菜店。冒菜、米花……
      前去吃三里总路这家店,中午人又多,环境嚷嚷,根队去品尝。在终于分店了,工作在家有福了,对于无孩子简直必探啊!鬼新店初体,给你带惊喜!
      ,但洁干净,柜,里放了牛、翅尖、脆骨、掌中、肥肠、虾丸、鱼豆腐等原料,还有菜菜柜,起码有20余,看起干净爽,该效了传统麻售卖式,荤素分装盛,可—中份菜送米饭。

      收起评论
      2018-11-15 23:19 脑馋粉儿
    • 泡沫9377

      拔草完全是冲店名,本来是来这,但是很多奶油太腻,吃口实在吃下,就想着吃点小吃类,***粉儿就在店斜对面,店面大,只有张小......

      展开评论

      以去拔草完全是冲名,本这边吃松是松搭配很多奶,吃几口实吃不下,就着吃点小吃,***粉斜对面,面不大,只几张小桌加张长桌,老板不知道是不是四川,主打,酸粉和,如果你搭配酸粉,你必须分别单独点酸粉和,点21/斤,荤38/斤,基本和差不多,也是红红,味道个没觉吃,般吧,是挺其实也是很般都是搭配米饭吃,免费酱和香小料,说个没觉吃吧,能还是看个

      收起评论
      2018-11-16 11:40 脑馋粉儿
    • 红黑116

      位置:三里屯soho的,就在中间广处,门显眼的,比
      第一次来他家,说实觉得名字起的有趣,***粉儿,应该家比有意思的店,便进去品尝。<......

      展开评论

      位置:里屯soho地下,广场处,门脸儿挺显找。
      家,说实话名字趣,***儿,意思店,于便
      了冒菜,菜都冰柜里,自选,菜单,可以点糖糍粑,酥肉等等。,肉,个人喜欢掌中宝,肚等,量还可以,,辣我觉刚刚家还一点些店个。
      路过家打包了酸辣要辣为听说用大棒骨熬,所以想,果然没让人失望。酸辣仅汤,一点都糟,里面配,豆芽菜,小油菜等等,东西
      服务小店,推

      收起评论
      2018-11-06 15:51 脑馋粉儿
    • 啊卟啦啦噜

      人均:40元

      好喜欢这哦,特别是近,像着魔样总想着吃。
      品很多,有两大冰柜,肉和分开放两盆。

      ?麻辣是首推!!冰柜上层全都是!!棒棒!
      展开评论

      喜欢这家哦,特别是最近,像样总想
      菜品很多,两个大柜,菜分开两个

      ?麻辣牛定是首!!柜最上层全都是!!棒棒!
      ?午餐的品质也很棒,但是里面应该是两种的,的时要注意下,那个的那种,是点的。次淀,很

      ?鱿荐!比较腥,而来没道。
      ?肥肠荐!处是很干净,而也是没麻辣汤汁,如肥肠火里的

      素菜本没什么雷,就是笋要季节然啊的很老。

      收起评论
      喜欢的菜:
      麻辣牛肉 午餐肉
      2018-12-03 17:27 脑馋粉儿

     

    你可能感兴趣的:(Web基础)