findhappy117

python一键电影搜索与下载

代码地址如下：
http://www.demodashi.com/demo/14313.html

python一键电影搜索与下载

概述

使用python搜索并爬取豆瓣电影信息,包括评分,主演,导演,类型,上映时间,电影简介等信息,然后再从电影天堂搜索并爬取电影下载链接.

准备工作

安装python3.6

略

安装requests库(用于请求静态页面)

    pip install requests -i https://mirrors.ustc.edu.cn/pypi/web/simple

安装lxml库(用于解析html文件)

pip install lxml -i https://mirrors.ustc.edu.cn/pypi/web/simple

本教程爬取的电影信息来自豆瓣电影,下载链接来自电影天堂

https://movie.douban.com/j/subject_suggest?q=电影名称
http://s.ygdy8.com/plus/so.php?keytype=0&pagesize=10&searchtype=title&keyword=电影名称

页面分析

豆瓣电影搜索

豆瓣电影搜索的链接如下:

https://movie.douban.com/j/subject_suggest?q=电影名称

只需要一个参数q,它的值是utf-8编码的电影名称,比如我们要搜索 星际穿越 相关信息, 其中 %e6%98%9f%e9%99%85%e7%a9%bf%e8%b6%8a 是 星际穿越 的url格式的utf-8编码.:

https://movie.douban.com/j/subject_suggest?q=%e6%98%9f%e9%99%85%e7%a9%bf%e8%b6%8a

服务器返回的搜索结果是一个json文件 subject_suggest.json ,如下:

[
   {
      "episode" : "",
      "id" : "1889243",
      "img" : "https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2206088801.jpg",
      "sub_title" : "Interstellar",
      "title" : "星际穿越",
      "type" : "movie",
      "url" : "https://movie.douban.com/subject/1889243/?suggest=%E6%98%9F%E9%99%85%E7%A9%BF%E8%B6%8A",
      "year" : "2014"
   },
   {
      "episode" : "",
      "id" : "26263467",
      "img" : "https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2445481443.jpg",
      "sub_title" : "The Science of Interstellar",
      "title" : "《星际穿越》中的科学",
      "type" : "movie",
      "url" : "https://movie.douban.com/subject/26263467/?suggest=%E6%98%9F%E9%99%85%E7%A9%BF%E8%B6%8A",
      "year" : "2014"
   },
   {
      "episode" : "",
      "id" : "26255844",
      "img" : "https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2519643575.jpg",
      "sub_title" : "Interstellar: Nolan's Odyssey",
      "title" : "星际穿越：诺兰的奥德赛",
      "type" : "movie",
      "url" : "https://movie.douban.com/subject/26255844/?suggest=%E6%98%9F%E9%99%85%E7%A9%BF%E8%B6%8A",
      "year" : "2014"
   }
]

共搜索到了3个与 星际穿越 相关的结果,其中我们需要关注的有:

key	含义
title	标题
sub_title	子标题(英文标题)
url	详情链接

我们需要再次打开搜索结果中对应的电影详情链接,获取电影的评分,导演,主演,类型,上映时间,简介,影评等信息.

比如我们打开搜索结果的第一项,结果如下:

我们打开它的源码看看(按F12打开调试):

可以看到其head中的一个标签 *** /html/head/script[@type=“application/ld+json”] *** 中存放的是一个json文件,这个json中就包含了我们需要的所有电影信息,提取出来如下:

{
  "@context": "http://schema.org",
  "name": "星际穿越 Interstellar",
  "url": "/subject/1889243/",
  "image": "https://img3.doubanio.com/view/photo/s_ratio_poster/public/p2206088801.jpg",
  "director": 
  [
    {
      "@type": "Person",
      "url": "/celebrity/1054524/",
      "name": "克里斯托弗·诺兰 Christopher Nolan"
    }
  ]
,
  "author": 
  [
    {
      "@type": "Person",
      "url": "/celebrity/1275104/",
      "name": "乔纳森·诺兰 Jonathan Nolan"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1054524/",
      "name": "克里斯托弗·诺兰 Christopher Nolan"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1018568/",
      "name": "基普·索恩 Kip Thorne"
    }
  ]
,
  "actor": 
  [
    {
      "@type": "Person",
      "url": "/celebrity/1040511/",
      "name": "马修·麦康纳 Matthew McConaughey"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1048027/",
      "name": "安妮·海瑟薇 Anne Hathaway"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1000225/",
      "name": "杰西卡·查斯坦 Jessica Chastain"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1022593/",
      "name": "卡西·阿弗莱克 Casey Affleck"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1054509/",
      "name": "迈克尔·凯恩 Michael Caine"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1054443/",
      "name": "马特·达蒙 Matt Damon"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1267954/",
      "name": "麦肯吉·弗依 Mackenzie Foy"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1325862/",
      "name": "蒂莫西·柴勒梅德 Timothée Chalamet"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1036407/",
      "name": "艾伦·伯斯汀 Ellen Burstyn"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1027824/",
      "name": "约翰·利思戈 John Lithgow"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1049518/",
      "name": "韦斯·本特利 Wes Bentley"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1201851/",
      "name": "大卫·吉雅西 David Gyasi"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1113911/",
      "name": "比尔·欧文 Bill Irwin"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1010536/",
      "name": "托弗·戈瑞斯 Topher Grace"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1313709/",
      "name": "科莱特·沃夫 Collette Wolfe"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1330971/",
      "name": "弗朗西斯·X·麦卡蒂 Francis X. McCarthy"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1344601/",
      "name": "安德鲁·博尔巴 Andrew Borba"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1004844/",
      "name": "乔什·斯图沃特 Josh Stewart"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1202795/",
      "name": "莱雅·卡里恩斯 Leah Cairns"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1338863/",
      "name": "利亚姆·迪金森 Liam Dickinson"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1274631/",
      "name": "杰夫·赫普内尔 Jeff Hephner"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1045604/",
      "name": "伊莱耶斯·加贝尔 Elyes Gabel"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1018020/",
      "name": "布鲁克·史密斯 Brooke Smith"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1000231/",
      "name": "大卫·奥伊罗 David Oyelowo"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1055380/",
      "name": "威廉姆·德瓦内 William Devane"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1366207/",
      "name": "拉什·费加 Russ Fega"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1344602/",
      "name": "格里芬·弗雷泽 Griffen Fraser"
    }
    ,
    {
      "@type": "Person",
      "url": "/celebrity/1344603/",
      "name": "弗洛拉·诺兰 Flora Nolan"
    }
  ]
,
  "datePublished": "2014-11-07",
  "genre": ["\u5267\u60c5", "\u79d1\u5e7b", "\u5192\u9669"],
  "duration": "PT2H49M",
  "description": "近未来的地球黄沙遍野，小麦、秋葵等基础农作物相继因枯萎病灭绝，人类不再像从前那样仰望星空，放纵想象力和灵感的迸发，而是每日在沙尘暴的肆虐下倒数着所剩不多的光景。在家务农的前NASA宇航员库珀（马修·麦...",
  "@type": "Movie",
  "aggregateRating": {
    "@type": "AggregateRating",
    "ratingCount": "638995",
    "bestRating": "10",
    "worstRating": "2",
    "ratingValue": "9.2"
  }
}

key	含义
name	电影名称
director	电影导演
author	主要演员
datePublished	上映时间
genre	电影类型
description	电影简介
aggregateRating[ratingValue]	电影评分

电影天堂搜索

豆瓣电影搜索的链接如下:

http://s.ygdy8.com/plus/so.php?keytype=0&pagesize=10&searchtype=title&keyword=电影名称

只需要一个参数q,它的值是utf-8编码的电影名称,比如我们要搜索 星际穿越 相关信息. 其中 %D0%C7%BC%CA%B4%A9%D4%BD 是 星际穿越 的url格式的gb2312编码::

http://s.ygdy8.com/plus/so.php?keytype=0&keyword=%D0%C7%BC%CA%B4%A9%D4%BD

服务器返回的搜索结果是一个html页面其中只有第一项是我们想要的结果,如下:

按F12打开调试可以看到,搜索结果列表包含在一个 class="co_content8" 的div标签中.搜索结果的标题对应的链接就是电影详情页面,其中无用的广告页面的链接中包含 game ,我们可以据此过滤掉不想要的结果.

打开电影详情页面,可以看到下载链接包含在一个 bgcolor="#fdfddf" 的table中:

源码详解

使用requests下载静态html页面

该函数用于下载图集列表页面，这个页面是静态的，可以直接通过 requests.get(url) 函数抓取。但是有一点需要注意，为了把我们的爬虫伪装成正常的浏览器请求，避免我们的爬虫被服务器禁止，我们需要给 requests 添加http请求头，其中包含伪造的 User-Agent 浏览器标识

def download_page_html(url, sel=0):
    phtml = None
    page = None
    try:
        requests_header["Host"] = host_cookie[sel][0]
        requests_header["Cookie"] = host_cookie[sel][1]

        # 选择一个随机的User-Agent
        requests_header["User-Agent"] = random.choice(user_agent_list)
        # print(requests_header["User-Agent"])
        # print(requests_header)
        page = requests.get(url=url, headers=requests_header, timeout=15)  # 请求指定的页面
        # print(page.encoding)
        if page.encoding == "ISO-8859-1":
            page.encoding = "gb2312"  # 转换页面的编码为gb2312(避免中文乱码)
        phtml = page.text  # 提取请求结果中包含的html文本
        # print("requests success")
    except requests.exceptions.RequestException as e:
        print("requests error:", e)
        phtml = None
    finally:
        if page != None:
            page.close()
        return phtml

从豆瓣电影上搜索并下载电影信息

该函数用于根据指定的电影名称,从豆瓣电影服务器上搜索电影,解析搜索结果并显示,然后根据输入显示指定搜索结果的详情.

def movie_douban(mvsearch_name):
    DOUBANMV_SEARCH_URL = "https://movie.douban.com/j/subject_suggest"
    DOUBANMV_SEARCH_PAR = {"q": ""}
    # mvsearch_name = "星际迷航"

    if mvsearch_name == None:
        return -1

    DOUBANMV_SEARCH_PAR["q"] = mvsearch_name

    # url参数编码
    mvsearch_par = parse.urlencode(DOUBANMV_SEARCH_PAR, encoding="utf-8")
    # print(mvsearch_par)
    mvsearch_url = "{0}?{1}".format(DOUBANMV_SEARCH_URL, mvsearch_par)
    # print(mvsearch_url)

    # 下载指定url
    mvsearch_html = download_page_html(mvsearch_url, 2)
    if mvsearch_html == None:
        print("下载出错,可能IP被服务器封禁,可稍后再试!")
        return -1

    # 解析下载的结果(json格式)
    try:
        mvsearch_json = json.loads(mvsearch_html)
    except json.JSONDecodeError as e:
        print("出现错误:", e)
        return -1

    if mvsearch_json == None or len(mvsearch_json) == 0:
        print("解析出错!")
        return -1
    # print(mvsearch_json)

    # 输出解析结果
    print("共找到", len(mvsearch_json), "个关于", mvname, "的结果: ")
    for i in range(len(mvsearch_json)):
        print("\t", i+1, mvsearch_json[i]["title"],
              "/", mvsearch_json[i]["sub_title"])

    # 选择需要查看的项
    search_sel = input("请选择需要查看的项:")
    if search_sel.isdigit() != True:
        print("输入有误!")
        return -1
    search_sel = int(search_sel)
    if search_sel > len(mvsearch_json) or search_sel < 1:
        print("输入有误!")
        return -1
    search_sel = search_sel - 1

    # 获取需要查看的项的url,下载需要查看的项
    mvcontent_url = mvsearch_json[search_sel]["url"]
    mvcontent_html = download_page_html(mvcontent_url, 2)

    # 解析需要查看的项
    doubanmv_etree_html = lxml.html.fromstring(mvcontent_html)
    mvcontent_xpath = '/html/head//script[@type="application/ld+json"]/text()'
    mvcontent_text = doubanmv_etree_html.xpath(mvcontent_xpath)
    if mvcontent_text == None or len(mvcontent_text) == 0:
        print("解析出错")
        return -1

    mvcontent_text[0] = mvcontent_text[0].replace("\n", "")  # 替换掉json字符串中的\n

    try:
        mvcontent_json = json.loads(mvcontent_text[0])
    except json.JSONDecodeError as e:
        print("解析出错:", e)
        return -1
    if mvcontent_json == None or len(mvcontent_json) == 0:
        print("解析出错")
        return -1


    # 输出电影详情
    print("\t电影名称", mvcontent_json["name"])

    # 合并显示电影类型
    mvcontent_genre = mvcontent_json["genre"]
    mvcontent_genre_str = ""
    for lst in mvcontent_genre:
        mvcontent_genre_str += (lst + "/")
    print("\t电影类型", mvcontent_genre_str)

    print("\t上映时间", mvcontent_json["datePublished"])
    print("\t豆瓣评分", mvcontent_json["aggregateRating"]["ratingValue"],
          "(", mvcontent_json["aggregateRating"]["ratingCount"], ")")
    print("\t电影导演", mvcontent_json["director"][0]["name"])
    # 合并显示电影主演(只显示前5个)
    mvcontent_actor = mvcontent_json["actor"]
    mvcontent_actor_str = ""
    mvcontent_actor_len = 0
    for lst in mvcontent_actor:
        mvcontent_actor_str += (lst["name"] + "/")
        mvcontent_actor_len += 1
        if mvcontent_actor_len > 5:
            mvcontent_actor_str += "..."
            break
    print("\t电影主演", mvcontent_actor_str)
    print("\t电影简述", mvcontent_json["description"])

    return 0

从电影天堂上搜索并提取电影下载链接

该函数用于根据指定的电影名称,从电影天堂服务器上搜索电影,解析搜索结果并显示,然后根据输入显示指定搜索结果的下载链接.

def movie_tiantang(mvsearch_name):
    MVSEARCH_URL = "http://s.ygdy8.com/plus/so.php"
    MVSEARCH_PAR = {"kwtype": "0", "searchtype": "title",
                    "pagesize": "100", "keyword": ""}
    MOVIE_URL = "http://www.ygdy8.com"

    # mvsearch_name = "星球大战"
    # mvsearch_name = input("请输入电影名称(输入\"exit\"退出):")

    if mvsearch_name == None:
        print("输入有误!")
        return -1

    # print("你输入的电影名称为:", mvsearch_name)

    # 搜索电影
    MVSEARCH_PAR["keyword"] = mvsearch_name
    mvsearch_par = parse.urlencode(MVSEARCH_PAR, encoding="gb2312")
    # print(mvsearch_par)
    mvsearch_url = "{0}?{1}".format(MVSEARCH_URL, mvsearch_par)
    # print(mvsearch_url)
    mvsearch_html = download_page_html(mvsearch_url, 0)
    if mvsearch_html == None:
        print("下载出错,可能IP被服务器封禁,可稍后再试!")
        return -1

    # print(mvsearch_html)

    # 获取搜索结果列表
    etree_html = lxml.html.fromstring(mvsearch_html)
    mvsearch_xpath = '//div[@class="co_content8"]/ul/tr/td/table[@width="100%"]'
    mvsearch_list = etree_html.xpath(mvsearch_xpath)
    # print(mvsearch_list)

    if len(mvsearch_list) == 0:
        print("未搜索到任何内容")
        return -1

    # print("共找到", len(mvsearch_list), "个关于", mvsearch_name, "的结果:")

    mvcontent_url = []
    mvcontent_title = []

    # 提取搜索结果中的电影链接
    mvsearch_list_len = len(mvsearch_list)
    for idx in range(1, mvsearch_list_len+1):
        # 提取链接
        mv_title_url = etree_html.xpath(
            mvsearch_xpath + '[{0}]//a[@href]/@href'.format(idx))
        # print(mv_title_url)

        if mv_title_url == None:
            print("解析出错!")
            return -1

        # 过滤掉游戏
        if mv_title_url[0].find("/html/game/") < 0:
            mv_title_url = "{0}{1}".format(MOVIE_URL, mv_title_url[0])
            mvcontent_url.insert(idx-1, mv_title_url)
            # 提取标题
            mv_title_str_lst = etree_html.xpath(
                mvsearch_xpath + '[{0}]//a[@href]//text()'.format(idx))
            if mv_title_str_lst == None:
                print("解析出错!")
                return -1
            mv_title_str = "".join(mv_title_str_lst)
            mvcontent_title.insert(idx-1, mv_title_str)
            # print("\t{0}, {1}, {2}".format(idx, mv_title_str, mv_title_url))

    mvcontent_len = len(mvcontent_url)

    if mvcontent_len == 0:
        print("未搜索到有效结果!")
        return -1

    # print("其中", mvcontent_len, "个有效结果:")
    print("共找到", mvcontent_len, "个关于", mvsearch_name, "的下载:")
    for idx in range(mvcontent_len):
        print("\t", idx+1, ", ",
              mvcontent_title[idx], ", ", mvcontent_url[idx])

    # 打开电影详情页面
    mvcontent_sel = input("请选择需要下载的项:")
    if mvcontent_sel.isdigit() != True:
        print("输入有误!")
        return -1
    mvcontent_sel = int(mvcontent_sel)
    if mvcontent_sel > mvcontent_len or mvcontent_sel < 1:
        print("输入有误!")
        return -1
    mvcontent_sel = mvcontent_sel - 1

    # 下载电影详情页面
    # print("即将下载: ", mvcontent_title[mvcontent_sel],
    #       ", " + mvcontent_url[mvcontent_sel])
    mvcontent_html = download_page_html(mvcontent_url[mvcontent_sel], 1)
    # print(mvcontent_html)

    if mvcontent_html == None:
        print("下载出错,可能IP被服务器封禁,可稍后再试!")
        return -1

    # 提取电影下载链接
    mvcontent_etree_html = lxml.html.fromstring(mvcontent_html)

    # '//div[@id="Zoom"]/table/tr/td/table'
    mvcontent_xpath = '//td[@bgcolor="#fdfddf"]'

    mvcontent_dwurl_lst = []

    mvcontent_urllst = mvcontent_etree_html.xpath(
        mvcontent_xpath + "//a[@href]/text()")
    if mvcontent_urllst == None:
        print("解析出错!")
        return -1

    for url in mvcontent_urllst:
        mvcontent_dwurl_lst.append(url)

    if mvcontent_dwurl_lst == None:
        print("未找到下载链接!")
        return -1

    # print("共找到", len(mvcontent_dwurl_lst), "个下载链接:")

    for dwurl in mvcontent_dwurl_lst:
        print("\t", dwurl)

    return 0

程序运行方法

打开命令行,定位到源码所在目录,然后输入 python py_movie.py ,回车运行

程序运行截图

项目文件截图

python一键电影搜索与下载

代码地址如下：
http://www.demodashi.com/demo/14313.html

注：本文著作权归作者，由demo大师发表，拒绝转载，转载需要作者授权

SQL面试题练习 —— 取出累计值与1000差值最小的记录夏木夕 SQL sql 面试数据库
题目来源：滴滴目录1题目2建表语句3题解1题目已知有表t_cost_detail包含id和money两列，id为自增，请累加计算money值，并求出累加值与1000差值最小的记录。+-----+--------+|id|money|+-----+--------+|1|200||2|300||3|200||4|100||5|150||6|80||7|100||8|200|+-----+------
Labelbox：引领AI与人类协作的未来魏兴雄Milburn
Labelbox：引领AI与人类协作的未来labelbox-pythonLabelboxPythonClient项目地址:https://gitcode.com/gh_mirrors/la/labelbox-python项目介绍Labelbox是一款专为企业和学术研究社区设计的开源工具，旨在简化数据标注、生成高质量的人类反馈数据、评估和提升模型性能，并通过无缝结合AI与人类工作流程来自动化任务。无
基于python使用scanpy分析单细胞转录组数据探序基因单细胞分析 python 开发语言
探序基因肿瘤研究院整理相关后缀的格式介绍：.h5ad：是一种用于存储单细胞数据的文件格式，可以通过anndata库在Python中处理.loom：高效的数据存储格式（.loom文件），使得用户可以轻松地存储、查询和分析大规模的单细胞数据集。Loompy的设计目标是提供一个快速、灵活且易于使用的工具，以支持生物信息学家和研究人员在单细胞水平上进行数据分析。python的单细胞转录组数据结构说明：da
GATK3.5GATK4.0与java版本的关系探序基因 java
探序基因肿瘤研究院整理操作系统centosstream9yum安装java后，输入java-version可看到：openjdkversion"11.0.20.1"2023-08-24LTSOpenJDKRuntimeEnvironment(Red_Hat-11.0.20.1.1-2)(build11.0.20.1+1-LTS)OpenJDK64-BitServerVM(Red_Hat-11.0.
单细胞轨迹分析-monocle包的使用探序基因 r语言
探序基因肿瘤研究院整理安装：monocle源码下载：https://www.bioconductor.org/packages/release/bioc/html/monocle.htmlR版本，4.2.0BiocManager::install("monocle")不过在安装过程中还是报错了：Warning:无法在https://bioconductor.org/packages/3.15/bi
Mybatis判断问题：深入解析与实战案例 DTcode7 sql数据库相关数据库 mysql SQL 数据库开发 sql
Mybatis判断问题：深入解析与实战案例基础概念与作用说明``标签``,``,````示例一：基本的``标签使用说明示例二：``,``,``的使用说明示例三：使用``标签简化条件语句说明实际工作中的使用技巧自行拓展内容在现代企业级应用开发中，MyBatis作为一款优秀的持久层框架，以其灵活的SQL映射机制和强大的动态SQL功能，深受广大开发者的喜爱。然而，在使用过程中，如何准确地进行条件判断，特
本地搭建小型 DeepSeek 并进行微调非著名架构师大模型知识文档智能硬件人工智能大数据大模型 deepseek
本文将指导您在本地搭建一个小型的DeepSeek模型，并进行微调，以处理您的特定数据。1.环境准备Python3.7或更高版本PyTorch1.8或更高版本CUDA(可选，用于GPU加速)Git2.克隆DeepSeek仓库bash复制gitclonehttps://github.com/deepseek-ai/deepseek.gitcddeepseek3.安装依赖bash复制pipinstall
前端导出word文件—包含canvas(echarts图表) Liuer_Qin js canvas echarts echarts 前端 javascript
一、使用的插件html-docx-js二、整体思路因为canvas是运行在内存中的，所以不能简单的通过dom获取canvas图片，需要手动的先将canvas转为image。三、实现先克隆要下载的DOM的副本。因为canvas是运行在内存中的，所以也不能通过cloneNode方法克隆下来（克隆下来是空的）。我们这里将原DOM中的canvas转成图片，然后插入到副本的对应位置，这样操作不会影响原DOM
HarmonyOS全栈开发指南：从入门到精通，构建万物智联的未来生态（一）林钟雪 Harmonyos harmonyos 华为
一、HarmonyOS基础认知篇1.HarmonyOS发展历程与核心使命内容摘要：HarmonyOS，由华为公司于2019年首次公开发布，标志着华为在操作系统领域的深度布局。从最初的智能物联网设备操作系统定位，到如今面向万物智联时代的分布式全场景操作系统，HarmonyOS经历了多次迭代与升级。发展历程：初期探索：2019年，华为正式推出HarmonyOS，旨在打造一个适用于智能物联网设备的操作系
语聊房软件开发流程与基础功能 ALLSectorSorft java html5 javascript
开发一款语聊房软件需要系统的规划和多领域技术整合。以下是关键流程、基础功能及示例代码：---一、开发流程1.需求分析-明确目标用户（社交/游戏/教育）-竞品分析（Clubhouse/Discord/狼人杀）-核心功能优先级排序2.技术选型-实时语音：声网Agora（推荐）/腾讯云TRTC/WebRTC-即时通讯：Socket.io/Sendbird/Firebase-后端框架：Node.js/Sp
Vue.js 基础与实战指南：从入门到跑路王嘉俊705 前端 javascript visual studio code html 前端 vue.js
一、Vue的两种使用方式扩展核心包开发直接通过引入Vue.js，适用于简单页面或局部功能增强。优点：轻量，无需构建工具。缺点：难以管理复杂项目，缺少工程化支持。工程化开发使用VueCLI、Vite等工具创建项目，结合Webpack/Vite构建。支持单文件组件（.vue文件），结构清晰（`,,）。插件生态丰富（如VueRouter、Vuex、Pinia）。二、Vue实例的深入理解核心配置项 new
使用Python和OpenCV实现图像像素压缩与解压东方佑量子变法 python opencv 开发语言
在本文中，我们将探讨如何使用Python和OpenCV库来实现一种简单的图像像素压缩算法。我们将详细讨论代码的工作原理，并提供一个具体的示例来演示该过程。1.引言随着数字媒体的普及，图像处理成为了一个重要的领域。无论是为了减少存储空间还是加快网络传输速度，图像压缩技术都扮演着至关重要的角色。这里，我们提出了一种基于像素重复模式的简单压缩算法，它适用于具有大量连续相同像素值的图像。2.技术栈介绍2.
【Python系列】Python 解释器的站点配置 Kwan的解忧杂货铺@新空间代码工作室 s1 Python python 开发语言
欢迎来到我的博客，很高兴能够在这里和您见面！希望您在这里可以感受到一份轻松愉快的氛围，不仅可以获得有趣的内容和知识，也可以畅所欲言、分享您的想法和见解。推荐:kwan的首页,持续学习,不断总结,共同进步,活到老学到老导航檀越剑指大厂系列:全面总结java核心技术点,如集合,jvm,并发编程redis,kafka,Spring,微服务,Netty等常用开发工具系列:罗列常用的开发工具,如IDEA,M
DeepSeek如何重塑我的编程学习：计算机新生的AI实践 EnigmaCoder DeepSeek 学习人工智能
目录前言邂逅DeepSeek：从困惑到惊喜初学编程的困境DeepSeek的优势️DeepSeek在编程学习中的运用注释算法逐步分析调试帮助跨语言迁移学习AI时代学习方法论革新知识获取方式转变新型学习能力培养反思与展望反思展望总结前言大家好！我是EnigmaCoder，本文我将介绍我的AI编程学习之旅。春节期间，DeepSeek横空出世，迅速登顶热榜。它功能强大，精准答疑、高效创作，瞬间点燃大众热情
SQL面试题集：累计值与1000差值最小的记录数星星的阿波罗 Sql能力通关 sql 算法数据库数据仓库大数据数据分析面试
一、题目描述司机累计收入首次接近目标值的订单定位，滴滴平台计划优化司机奖励策略的触发机制，需精准识别司机在接单过程中累计收入首次接近特定目标值1000元的订单节点。该分析用于动态调整奖励发放规则，提升司机接单积极性。样例数据假设表t_sales结构如下：driver_idorder_idincomeorder_time11012002025-02-1909:00:0011023002025-02-
深入解析JVM性能问题定位与优化测试不打烊性能测试 jvm 性能优化
JVM性能问题定位与优化详解：架构、内存、Linux命令与监控工具的全面解析引言Java虚拟机（JVM）是运行Java应用程序的核心组件，它管理内存、执行字节码，并提供垃圾回收机制等功能。然而，随着应用规模的增长，JVM的性能问题时常会成为系统瓶颈。为了有效定位和优化JVM性能问题，我们需要从JVM架构、内存管理、Linux系统命令，以及监控工具入手，对JVM的各类指标进行详尽的分析和优化。本文将
J-Link系列下载器的烧录问题彻底解决 1zero10 单片机单片机
1.确保成功安装好keil5方法:按照此链接中课程1.1准备安装环境进行操作【铁头山羊stm32入门教程【新版】-哔哩哔哩】https://b23.tv/wb5XUGo2.安装J-link驱动2-1从jlink官网下载最新版本驱动2-2按照此链接视频中jlink对应部分进行操作【STM32常用程序烧录方法，KeilIDE，ST-Link，Jlink-OB，DAPLink，串口（Uart）-哔哩哔哩
青龙面板京东cookies工具 zhiyi_1 学习人工智能
新增了一些功能，主要是有些老版本的适配，解决原先的bug更新方式，替换文件，config文件可以不替换，则保留配置使用方式：1.运行JD_Get.exe2.登录京东3.点击获取获取到cookie会在右侧显示4.点击发送到青龙面板（如果配置了青龙参数）下载地址：夸克网盘分享
安装与部署openeuler 的HA VX-IT BANG 服务器网络 linux
实现原理LinuxHA（HighAvailability，高可用性）是指利用Linux操作系统构建的高可用集群解决方案，旨在确保关键业务服务在面临硬件故障、软件错误、网络中断等各种异常情况时，依然能够持续、稳定地运行，尽量减少服务中断时间，提高系统的可靠性和可用性。以下从几个方面详细介绍：关键组件和技术心跳监测（Heartbeat）这是LinuxHA系统中最基础也是最重要的组件之一。它通过在节点之
关于个人财务系统的javaweb小项目竹木有心 tomcat java
个人财务管理系统-项目计划书1.项目背景与目的随着现代社会的进步与人们收入水平的提高，个人财务的管理变得越来越重要。如何有效地记录、管理、分析个人的收支状况，成为了很多人关注的焦点。本项目旨在设计并实现一个基于JavaWeb技术的个人财务管理系统，通过该系统，用户可以轻松管理自己的收入与支出，查看财务统计分析，帮助用户进行财务规划与控制。本系统适用于大三学生的课程设计要求，涉及JavaWeb技术、
Ubuntu终端常用快捷键总结机器人那些事儿开发环境 ubuntu
基本导航快捷键：Ctrl+A：将光标移到行首Ctrl+E：将光标移到行尾Ctrl+U：删除光标前的所有字符Ctrl+K：删除光标后的所有字符Ctrl+L：清屏（相当于执行clear命令）编辑命令行：Ctrl+W：删除光标前的一个单词Ctrl+Y：粘贴之前使用Ctrl+U或Ctrl+K删除的文本Ctrl+_：撤销上一步的操作历史命令：Ctrl+R：逆向搜索历史命令Ctrl+G：退出历史命令搜索模式C
利用Beautiful Soup和Pandas进行网页数据抓取与清洗处理实战傻啦嘿哟 pandas
目录一、准备工作二、抓取网页数据三、数据清洗四、数据处理五、保存数据六、完整代码示例七、总结在数据分析和机器学习的项目中，数据的获取、清洗和处理是非常关键的步骤。今天，我们将通过一个实战案例，演示如何利用Python中的BeautifulSoup库进行网页数据抓取，并使用Pandas库进行数据清洗和处理。这个案例不仅适合初学者，也能帮助有一定经验的朋友快速掌握这两个强大的工具。一、准备工作在开始之
ubuntu22.4搭建单节点es8.1 宇智波云大数据项目运维 elasticsearch
下载对应的包elasticsearch-8.1.1-linux-x86_64.tar.gz创建es租户groupaddelasticsearcuseraddelasticsearch-gelasticsearch-pelasticsearchchmodu+w/etc/sudoerschmod-Relasticsearch:elasticsearchelasticsearch修改配置文件vim/et
Mybatisplus更新某个字段为null 辉夜姬想环游世界日常记录 java spring 开发语言
使用@TableField(updateStrategy=FieldStrategy.IGNORED)注解要更新的字段。@TableField注解是Mybatisplus框架中提供的一个注解，主要用于实体类（Entity）的字段上，帮助开发者更灵活地映射Java对象属性与数据库表字段之间的关系主要功能：1、字段映射：当实体类和数据库字段不一致时，可以是使用value属性指定数据库字段名@Table
关于防火墙运维面试题2 编织幻境的妖运维网络 php
三、防火墙配置与管理类21.如何根据企业的网络安全策略，制定一套全面的防火墙规则集？需要考虑哪些关键因素？以下是根据企业网络安全策略制定全面防火墙规则集的指导，以及需要考虑的关键因素：一、关键因素（一）网络架构与拓扑了解企业的网络结构明确企业网络是简单的星型拓扑、复杂的网状拓扑还是混合拓扑等。例如，在星型拓扑中，所有设备都连接到一个中心交换机或集线器，这种结构下防火墙规则可能相对集中和简单；而在网
python做一个注册界面_python如何做一个登录注册界面 weixin_39824033 python做一个注册界面
python做一个登录注册界面的方法：首先初始化一个window界面，并使用画布实现欢迎的logo；然后用代码实现登录和注册按钮；接着并进行登录判断代码；最后完成注册界面即可。【相关学习推荐：python视频教程】python做一个登录注册界面的方法：一、登录界面1、首先初始化一个window界面window=tk.Tk()window.title('WelcometoMofanPython')w
python读取zip包内文件_Python模块学习：zipfile zip文件操作 weixin_40001634 python读取zip包内文件
最近在写一个网络客户端下载程序，用于下载服务器上的数据。有些数据(如文本，office文档)如果直接传输的话，将会增加通信的数据量，使下载时间变长。服务器在传输这些数据之前先对其进行压缩，客户端接收到数据之后进行解压，这样可以减小网通传输数据的通信量，缩短下载的时间，从而增加客户体验。以前用C#做类似应用程序的时候，我会用SharpZipLib这个开源组件，现在用Python做类似的工作，只要使用
python制作登陆窗口_python登陆界面 weixin_39758494 python制作登陆窗口
广告关闭腾讯云11.11云上盛惠，精选热门产品助力上云，云服务器首年88元起，买的越多返的越多，最高返5000元！print(账号密码错误！请重试。)returnfalsebutton(master,text=登陆,width=10,command=test).grid(row=3,column=0,sticky=w,padx=10,pady=5)button(master,text=退出,wid
如何使用零配置的Sphinx生成Python文档？潮易 sphinx 全文检索搜索引擎
如何使用零配置的Sphinx生成Python文档？在Python编程中，编写文档是非常重要的。一个好的文档可以帮助其他开发者理解和使用你的代码。Sphinx是一个用于生成Python项目的文档的静态网页生成器，它支持多种文档格式，包括ReStructuredText和Markdown。以下是使用零配置的方式来使用Sphinx生成Python文档的详细步骤：1.首先，确保你已经安装了Sphinx。打
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？潮易 python 开发语言
如何订阅&q；/扫描&q；主题、修改消息并发布到新主题？这个问题涉及到Python编程中的MQTT（MessageQueuingTelemetryTransport）库的使用，该库允许我们创建客户端订阅和发布消息到MQTT服务器。以下是一个简单的步骤：1.安装MQTT库：可以使用pip安装`paho-mqtt`库。```pythonpipinstallpaho-mqtt```2.创建一个MQTT客
面向对象面向过程 3213213333332132 java
面向对象：把要完成的一件事，通过对象间的协作实现。面向过程：把要完成的一件事，通过循序依次调用各个模块实现。我把大象装进冰箱这件事为例，用面向对象和面向过程实现，都是用java代码完成。 1、面向对象 package bigDemo.ObjectOriented; /** * 大象类 * * @Description * @author FuJian
Java Hotspot: Remove the Permanent Generation bookjovi HotSpot
openjdk上关于hotspot将移除永久带的描述非常详细，http://openjdk.java.net/jeps/122 JEP 122: Remove the Permanent Generation Author Jon Masamitsu Organization Oracle Created 2010/8/15 Updated 2011/
正则表达式向前查找向后查找,环绕或零宽断言 dcj3sjt126com 正则表达式
向前查找和向后查找 1. 向前查找：根据要匹配的字符序列后面存在一个特定的字符序列(肯定式向前查找)或不存在一个特定的序列(否定式向前查找)来决定是否匹配。.NET将向前查找称之为零宽度向前查找断言。对于向前查找，出现在指定项之后的字符序列不会被正则表达式引擎返回。 2. 向后查找：一个要匹配的字符序列前面有或者没有指定的
BaseDao 171815164 seda
import java.sql.Connection; import java.sql.DriverManager; import java.sql.SQLException; import java.sql.PreparedStatement; import java.sql.ResultSet; public class BaseDao { public Conn
Ant标签详解--Java命令 g21121 Java命令
这一篇主要介绍与java相关标签的使用终于开始重头戏了，Java部分是我们关注的重点也是项目中用处最多的部分。 1
[简单]代码片段_电梯数字排列 53873039oycg 代码
今天看电梯数字排列是9 18 26这样呈倒N排列的,写了个类似的打印例子，如下: import java.util.Arrays; public class 电梯数字排列_S3_Test { public static void main(S
Hessian原理云端月影 hessian原理
Hessian 原理分析一．远程通讯协议的基本原理网络通信需要做的就是将流从一台计算机传输到另外一台计算机，基于传输协议和网络 IO 来实现，其中传输协议比较出名的有 http 、 tcp 、 udp 等等， http 、 tcp 、 udp 都是在基于 Socket 概念上为某类应用场景而扩展出的传输协
区分Activity的四种加载模式----以及Intent的setFlags aijuans android
在多Activity开发中，有可能是自己应用之间的Activity跳转，或者夹带其他应用的可复用Activity。可能会希望跳转到原来某个Activity实例，而不是产生大量重复的Activity。这需要为Activity配置特定的加载模式，而不是使用默认的加载模式。加载模式分类及在哪里配置 Activity有四种加载模式： standard singleTop
hibernate几个核心API及其查询分析 antonyup_2006 html .net Hibernate xml 配置管理
(一) org.hibernate.cfg.Configuration类读取配置文件并创建唯一的SessionFactory对象.(一般,程序初始化hibernate时创建.) Configuration co
PL/SQL的流程控制百合不是茶 oracle PL/SQL编程循环控制
PL/SQL也是一门高级语言,所以流程控制是必须要有的,oracle数据库的pl/sql比sqlserver数据库要难,很多pl/sql中有的sqlserver里面没有流程控制; 分支语句 if 条件 then 结果 else 结果 end if ; 条件语句 case when 条件 then 结果; 循环语句 loop
强大的Mockito测试框架 bijian1013 mockito 单元测试
一.自动生成Mock类在需要Mock的属性上标记@Mock注解，然后@RunWith中配置Mockito的TestRunner或者在setUp()方法中显示调用MockitoAnnotations.initMocks(this);生成Mock类即可。二.自动注入Mock类到被测试类 &nbs
精通Oracle10编程SQL(11)开发子程序 bijian1013 oracle 数据库 plsql
/* *开发子程序 */ --子程序目是指被命名的PL/SQL块，这种块可以带有参数，可以在不同应用程序中多次调用 --PL/SQL有两种类型的子程序：过程和函数 --开发过程 --建立过程：不带任何参数 CREATE OR REPLACE PROCEDURE out_time IS BEGIN DBMS_OUTPUT.put_line(systimestamp); E
【EhCache一】EhCache版Hello World bit1129 Hello world
本篇是EhCache系列的第一篇，总体介绍使用EhCache缓存进行CRUD的API的基本使用，更细节的内容包括EhCache源代码和设计、实现原理在接下来的文章中进行介绍环境准备 1.新建Maven项目 2.添加EhCache的Maven依赖 <dependency> <groupId>ne
学习EJB3基础知识笔记白糖_ bean Hibernate jboss webservice ejb
最近项目进入系统测试阶段，全赖袁大虾领导有力，保持一周零bug记录，这也让自己腾出不少时间补充知识。花了两天时间把“传智播客EJB3.0”看完了，EJB基本的知识也有些了解，在这记录下EJB的部分知识，以供自己以后复习使用。 EJB是sun的服务器端组件模型，最大的用处是部署分布式应用程序。EJB (Enterprise JavaBean)是J2EE的一部分，定义了一个用于开发基
angular.bootstrap boyitech AngularJS AngularJS API angular中文api
angular.bootstrap 描述：手动初始化angular。这个函数会自动检测创建的module有没有被加载多次，如果有则会在浏览器的控制台打出警告日志，并且不会再次加载。这样可以避免在程序运行过程中许多奇怪的问题发生。使用方法： angular .
java-谷歌面试题-给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数 bylijinnan java
public class SearchInShiftedArray { /** * 题目：给定一个固定长度的数组，将递增整数序列写入这个数组。当写到数组尾部时，返回数组开始重新写，并覆盖先前写过的数。 * 请在这个特殊数组中找出给定的整数。 * 解答： * 其实就是“旋转数组”。旋转数组的最小元素见http://bylijinnan.iteye.com/bl
天使还是魔鬼？都是我们制造 ducklsl 生活教育情感
----------------------------剧透请原谅，有兴趣的朋友可以自己看看电影，互相讨论哦！！！从厦门回来的动车上，无意中瞟到了书中推荐的几部关于儿童的电影。当然，这几部电影可能会另大家失望，并不是类似小鬼当家的电影，而是关于“坏小孩”的电影！自己挑了两部先看了看，但是发现看完之后，心里久久不能平
[机器智能与生物]研究生物智能的问题 comsci 生物
我想,人的神经网络和苍蝇的神经网络,并没有本质的区别...就是大规模拓扑系统和中小规模拓扑分析的区别.... 但是,如果去研究活体人类的神经网络和脑系统,可能会受到一些法律和道德方面的限制,而且研究结果也不一定可靠,那么希望从事生物神经网络研究的朋友,不如把
获取Android Device的信息 dai_lm android
String phoneInfo = "PRODUCT: " + android.os.Build.PRODUCT; phoneInfo += ", CPU_ABI: " + android.os.Build.CPU_ABI; phoneInfo += ", TAGS: " + android.os.Build.TAGS; ph
最佳字符串匹配算法（Damerau-Levenshtein距离算法）的Java实现 datamachine java 算法字符串匹配
原文：http://www.javacodegeeks.com/2013/11/java-implementation-of-optimal-string-alignment.html------------------------------------------------------------------------------------------------------------
小学5年级英语单词背诵第一课 dcj3sjt126com english word
long 长的 show 给...看，出示 mouth 口，嘴 write 写 use 用，使用 take 拿，带来 hand 手 clever 聪明的 often 经常 wash 洗 slow 慢的 house 房子 water 水 clean 清洁的 supper 晚餐 out 在外 face 脸，
macvim的使用实战 dcj3sjt126com mac vim
macvim用的是mac里面的vim, 只不过是一个GUI的APP, 相当于一个壳 1. 下载macvim https://code.google.com/p/macvim/ 2. 了解macvim :h vim的使用帮助信息 :h macvim
java二分法查找蕃薯耀 java二分法查找二分法 java二分法
java二分法查找 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月23日 11:40:03 星期二 http:/
Spring Cache注解+Memcached hanqunfeng spring memcached
Spring3.1 Cache注解依赖jar包：  <dependency> <groupId>com.google.code.simple-spring-memcached</groupId> <artifactId>simple-s
apache commons io包快速入门 jackyrong apache commons
原文参考 http://www.javacodegeeks.com/2014/10/apache-commons-io-tutorial.html Apache Commons IO 包绝对是好东西，地址在http://commons.apache.org/proper/commons-io/，下面用例子分别介绍： 1）工具类 2
如何学习编程 lampcy java 编程 C++c
首先,我想说一下学习思想.学编程其实跟网络游戏有着类似的效果.开始的时候,你会对那些代码,函数等产生很大的兴趣,尤其是刚接触编程的人,刚学习第一种语言的人.可是,当你一步步深入的时候,你会发现你没有了以前那种斗志.就好象你在玩韩国泡菜网游似的,玩到一定程度,每天就是练级练级,完全是一个想冲到高级别的意志力在支持着你.而学编程就更难了,学了两个月后,总是觉得你好象全都学会了,却又什么都做不了,又没有
架构师之spring-----spring3.0新特性的bean加载控制@DependsOn和@Lazy nannan408 Spring3
1.前言。如题。 2.描述。 @DependsOn用于强制初始化其他Bean。可以修饰Bean类或方法，使用该Annotation时可以指定一个字符串数组作为参数，每个数组元素对应于一个强制初始化的Bean。 @DependsOn({"steelAxe","abc"}) @Comp
Spring4+quartz2的配置和代码方式调度 Everyday都不同代码配置 spring4 quartz2.x 定时任务
前言：这些天简直被quartz虐哭。。因为quartz 2.x版本相比quartz1.x版本的API改动太多，所以，只好自己去查阅底层API…… quartz定时任务必须搞清楚几个概念： JobDetail——处理类 Trigger——触发器，指定触发时间，必须要有JobDetail属性，即触发对象 Scheduler——调度器，组织处理类和触发器，配置方式一般只需指定触发
Hibernate入门 tntxia Hibernate
前言使用面向对象的语言和关系型的数据库，开发起来很繁琐，费时。由于现在流行的数据库都不面向对象。Hibernate 是一个Java的ORM（Object/Relational Mapping）解决方案。 Hibernte不仅关心把Java对象对应到数据库的表中，而且提供了请求和检索的方法。简化了手工进行JDBC操作的流程。如
Math类 xiaoxing598 Math
一、Java中的数字（Math）类是final类，不可继承。 1、常数 PI：double圆周率 E：double自然对数 2、截取（注意方法的返回类型） double ceil(double d) 返回不小于d的最小整数 double floor(double d) 返回不大于d的整最大数 int round(float f) 返回四舍五入后的整数 long round

python一键电影搜索与下载

python一键电影搜索与下载

概述

准备工作

安装python3.6

安装requests库(用于请求静态页面)

安装lxml库(用于解析html文件)

本教程爬取的电影信息来自豆瓣电影,下载链接来自电影天堂

页面分析

豆瓣电影搜索

电影天堂搜索

源码详解

使用requests下载静态html页面

从豆瓣电影上搜索并下载电影信息

从电影天堂上搜索并提取电影下载链接

程序运行方法

程序运行截图

项目文件截图

你可能感兴趣的:(python一键电影搜索与下载)