获取多个有规律网页的源代码部分内容

import requests
import re

for i in range(1,11):
    page = (i-1)*25
    url = f"https://movie.douban.com/top250?start={page}&filter="
    resp = requests.get(url,headers={"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36"})
    com = re.compile(r' 
.*?(?P.*?)' r'.*? / .*?',re.S) result = com.finditer(resp.text) for item in result: name = item.group("name") print(name)

运行结果

肖申克的救赎
霸王别姬
泰坦尼克号
这个杀手不太冷
千与千寻
美丽人生
星际穿越
辛德勒的名单
盗梦空间
楚门的世界
忠犬八公的故事
海上钢琴师
三傻大闹宝莱坞
放牛班的春天
机器人总动员
疯狂动物城
无间道
控方证人
大话西游之大圣娶亲
熔炉
教父
触不可及
当幸福来敲门
末代皇帝
龙猫
寻梦环游记
怦然心动
活着
哈利·波特与魔法石
指环王3:王者无敌
我不是药神
飞屋环游记
素媛
哈尔的移动城堡
十二怒汉
何以为家
摔跤吧!爸爸
让子弹飞
猫鼠游戏
鬼子来了
海蒂和爷爷
钢琴家
大话西游之月光宝盒
指环王2:双塔奇兵
闻香识女人
罗马假日
死亡诗社
绿皮书
天堂电影院
大闹天宫
黑客帝国
教父2
狮子王
辩护人
饮食男女
搏击俱乐部
美丽心灵
本杰明·巴顿奇事
穿条纹睡衣的男孩
窃听风暴
情书
两杆大烟枪
西西里的美丽传说
看不见的客人
音乐之声
阿凡达
拯救大兵瑞恩
哈利·波特与死亡圣器(下)
飞越疯人院
小鞋子
沉默的羔羊
布达佩斯大饭店
禁闭岛
功夫
致命魔术
哈利·波特与阿兹卡班的囚徒
心灵捕手
海豚湾
超脱
低俗小说
春光乍泄
摩登时代
美国往事
喜剧之王
致命ID
杀人回忆
七宗罪
红辣椒
加勒比海盗
哈利·波特与密室
一一
唐伯虎点秋香
7号房的礼物
被嫌弃的松子的一生
请以你的名字呼唤我
断背山
剪刀手爱德华
蝙蝠侠:黑暗骑士崛起
爱在黎明破晓前
入殓师
勇敢的心
第六感
重庆森林
超能陆战队
幽灵公主
爱在日落黄昏时
甜蜜蜜
借东西的小人阿莉埃蒂
消失的爱人
天使爱美丽
阳光灿烂的日子
完美的世界
无人知晓
倩女幽魂
时空恋旅人
侧耳倾听
小森林 冬春篇
幸福终点站
驯龙高手
一个叫欧维的男人决定去死
未麻的部屋
哈利·波特与火焰杯
教父3
怪兽电力公司
萤火之森
傲慢与偏见
玩具总动员3
新世界
釜山行
神偷奶爸
被解救的姜戈
玛丽和马克思
告白
茶馆
喜宴
模仿游戏
头号玩家
色,戒
阳光姐妹淘
花样年华
血战钢锯岭
头脑特工队
七武士
恐怖直播
惊魂记
黑客帝国3:矩阵革命
你的名字。
电锯惊魂
三块广告牌
达拉斯买家俱乐部
疯狂原始人
心迷宫
英雄本色
风之谷
纵横四海
卢旺达饭店
海街日记
爱在午夜降临前
绿里奇迹
记忆碎片
疯狂的石头
岁月神偷
雨中曲
背靠背,脸对脸
荒蛮故事
2001太空漫游
心灵奇旅
小偷家族
无间道2
无敌破坏王
爆裂鼓手
冰川时代
贫民窟的百万富翁
恐怖游轮
东邪西毒
牯岭街少年杀人事件
魔女宅急便
遗愿清单
东京教父
你看起来好像很好吃
真爱至上
黑天鹅
可可西里
源代码
雨人
海边的曼彻斯特
恋恋笔记本
初恋这件小事
波西米亚狂想曲
人工智能
青蛇
终结者2:审判日
疯狂的麦克斯4:狂暴之路
罗生门
末路狂花
新龙门客栈
萤火虫之墓
千钧一发
崖上的波妞
无耻混蛋
彗星来的那一夜
花束般的恋爱
奇迹男孩
爱乐之城
二十二
血钻
战争之王
哈利·波特与死亡圣器(上)
步履不停
房间
魂断蓝桥
火星救援
千年女优
谍影重重2
白日梦想家
哈利·波特与凤凰社
弱点
阿飞正传
谍影重重
蜘蛛侠:平行宇宙
朗读者
燃情岁月
再次出发之纽约遇见你
香水
发条橙

Process finished with exit code 0

#获取豆瓣top250的所有电影的名称,该案例的重点是如何获取多个有规律的网页url。

你可能感兴趣的:(python,scipy)