一文看懂Python 爬虫 进阶(一)
文章目录
一文看懂Python 爬虫 进阶(一)
必需模块
**请求模块(urllib.request)**
**编码模块(urllib.parse)**
**解析模块(re)**
**csv模块**
**猫眼电影top100抓取案例**
**数据持久化存储(MySQL数据库)**
**电影天堂案例(二级页面抓取)**
必需模块
-相信你已经对爬虫已经有过简单了解,所有这些都是直接切入主题的干货教程
-这些必需模块简单的看看下列代码就懂了,很简单,我们在后面的应用中会用到,现在看不懂,后面自然就懂了
请求模块(urllib.request)
req = request. Request( url, headers= headers)
res = request. urlopen( req)
html = res. read( ) . decode( 'utf-8' )
编码模块(urllib.parse)
1 、urlencode( { dict } )
urlencode( { 'wd' : '美女' , 'pn' : '20' } )
编码后 :'wd=%E8%D5XXX&pn=20'
2 、quote( string)
quote( '织女' )
编码后 :'%D3%F5XXX'
3 、unquote( '%D3%F5XXX' )
解析模块(re)
使用流程
p = re. compile ( '正则表达式' , re. S)
r_list = p. findall( html)
贪婪匹配和非贪婪匹配
贪婪匹配( 默认) : . *
非贪婪匹配 : . * ?
正则表达式分组
1 、想要什么内容在正则表达式中加( )
2 、多个分组, 先按整体正则匹配, 然后再提取( ) 中数据。结果:[ ( ) , ( ) , ( ) , ( ) , ( ) ]
csv模块
作用
将爬取的数据存放到本地的csv文件中
使用流程
1 、导入模块
2 、打开csv文件
3 、初始化写入对象
4 、写入数据( 参数为列表)
示例代码
创建 test.csv 文件,在文件中写入2条数据(01_csv_example.py)
import csv
with open ( 'test.csv' , 'w' ) as f:
writer = csv. writer( f)
writer. writerow( [ '詹姆斯' , '35' ] )
writer. writerow( [ '杜兰特' , '30' ] )
import csv
with open ( 'test.csv' , 'w' ) as f:
writer = csv. writer( f)
writer. writerows( [ ( '哈登' , '28' ) , ( '威少' , '27' ) , ( '卡佩拉' , '26' ) ] )
猫眼电影top100抓取案例
如图所示 确定URL网址 猫眼电影 - 榜单 - top100榜 目标 电影名称、主演、上映时间
操作步骤
第1 页:https: // maoyan. com/ board/ 4 ?offset= 0
第2 页:https: // maoyan. com/ board/ 4 ?offset= 10
第n页:offset= ( n- 1 ) * 10
< div class = "movie-item-info" > . * ?title= "(.*?)" . * ?class = "star" > ( . * ?) < / p> . * ?releasetime"> ( . * ?) < / p>
from urllib import request
import time
import re
import csv
import random
class MaoyanSpider ( object ) :
def __init__ ( self) :
self. url = 'https://maoyan.com/board/4?offset={}'
self. ua_list = [
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36' ,
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1' ,
'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0'
]
self. page = 1
def get_page ( self, url) :
headers = { 'User-Agent' : random. choice( self. ua_list) }
req = request. Request( url, headers= headers)
res = request. urlopen( req)
html = res. read( ) . decode( 'utf-8' )
self. parse_page( html)
def parse_page ( self, html) :
p = re. compile ( '.*?title="(.*?)".*?class="star">(.*?).*?releasetime">(.*?)'
, re
. S
)
r_list
= p
. findall
( html
)
self
. write_page
( r_list
)
def write_page ( self
, r_list
) :
print ( r_list
)
film_dict
= { }
for rt
in r_list
:
film_dict
[ 'name' ] = rt
[ 0 ] . strip
( )
film_dict
[ 'star' ] = rt
[ 1 ] . strip
( )
film_dict
[ 'time' ] = rt
[ 2 ] . strip
( )
print ( film_dict
)
def main ( self
) :
for offset
in range ( 0 , 41 , 10 ) :
url
= self
. url
. format ( offset
)
self
. get_page
( url
)
print ( '第{}页爬取成功' . format ( self
. page
) )
self
. page
+= 1
time
. sleep
( random
. randint
( 0 , 2 ) )
if __name__
== '__main__' :
spider
= MaoyanSpider
( )
spider
. main
( )
再次梳理一下爬取的流程
找URL规律
正则表达式
编写程序框架,完善程序(四部曲)
数据持久化存储(MySQL数据库)
让我们来回顾一下pymysql模块的基本使用
import pymysql
db = pymysql. connect( 'localhost' , 'root' , '123456' , 'maoyandb' , charset= 'utf8' )
cursor = db. cursor( )
cursor. execute( 'insert into film values(%s,%s,%s)' , [ '霸王别姬' , '张国荣' , '1993' ] )
db. commit( )
cursor. close( )
db. close( )
让我们来回顾一下pymysql中executemany()的用法
import pymysql
db = pymysql. connect(
'localhost' , 'root' , '123456' , charset= 'utf8'
)
cursor = db. cursor( )
ins_list = [ ]
for i in range ( 2 ) :
name = input ( '请输入第%d个学生姓名:' % ( i+ 1 ) )
age = input ( '请输入第%d个学生年龄:' % ( i+ 1 ) )
ins_list. append( [ name, age] )
ins = 'insert into t3 values(%s,%s)'
cursor. executemany( ins, ins_list)
db. commit( )
cursor. close( )
db. close( )
练习:把猫眼电影案例中电影信息存入MySQL数据库中(尽量使用executemany方法)
from urllib import request
import time
import re
import csv
import random
import pymysql
class MaoyanSpider ( object ) :
def __init__ ( self) :
self. url = 'https://maoyan.com/board/4?offset={}'
self. ua_list = [
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/72.0.3626.119 Safari/537.36' ,
'Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/535.1 (KHTML, like Gecko) Chrome/14.0.835.163 Safari/535.1' ,
'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:6.0) Gecko/20100101 Firefox/6.0'
]
self. page = 1
self. db = pymysql. connect(
'192.168.153.130' , 'tiger' , '123456' , 'maoyandb' ,
charset= 'utf8'
)
self. cursor = self. db. cursor( )
def get_page ( self, url) :
headers = { 'User-Agent' : random. choice( self. ua_list) }
req = request. Request( url, headers= headers)
res = request. urlopen( req)
html = res. read( ) . decode( 'utf-8' )
self. parse_page( html)
def parse_page ( self, html) :
p = re. compile ( '.*?title="(.*?)".*?class="star">(.*?).*?releasetime">(.*?)'
, re
. S
)
r_list
= p
. findall
( html
)
self
. write_page
( r_list
)
def write_page ( self
, r_list
) :
one_page_list
= [ ]
ins
= 'insert into maoyanfilm(name,star,time) values(%s,%s,%s)'
for rt
in r_list
:
one_film_list
= [
rt
[ 0 ] . strip
( ) ,
rt
[ 1 ] . strip
( ) ,
rt
[ 2 ] . strip
( ) [ 5 : 15 ]
]
one_page_list
. append
( one_film_list
)
self
. cursor
. executemany
( ins
, one_page_list
)
self
. db
. commit
( )
def main ( self
) :
for offset
in range ( 0 , 41 , 10 ) :
url
= self
. url
. format ( offset
)
self
. get_page
( url
)
print ( '第{}页爬取成功' . format ( self
. page
) )
self
. page
+= 1
time
. sleep
( random
. randint
( 0 , 2 ) )
if __name__
== '__main__' :
spider
= MaoyanSpider
( )
spider
. main
( )
让我们来做个SQL命令查询
1、查询20年以前的电影的名字和上映时间
select name,time from film where time<=(now()-interval 20 year);
2、查询1990-2000年的电影名字和上映时间
select name,time from film where time>='1990-01-01' and time<='2000-12-31';
电影天堂案例(二级页面抓取)
百度搜索 :电影天堂 - 2019年新片 - 更多
** ** ** ** * 一级页面** ** ** ** ** *
1 、电影名称
2 、电影链接
** ** ** ** * 二级页面** ** ** ** ** *
1 、下载链接
步骤
还是那四部曲,只不过在解析的时候多了一个对于二级页面的解析
找URL规律
第1 页 :https: // www. dytt8. net/ html/ gndy/ dyzz/ list_23_1. html
第2 页 :https: // www. dytt8. net/ html/ gndy/ dyzz/ list_23_2. html
第n页 :https: // www. dytt8. net/ html/ gndy/ dyzz/ list_23_n. html
写正则表达式
1 、一级页面正则表达式
< table width= "100%" . * ?< td width= "5%" . * ?< a href= "(.*?)" . * ?ulink"> ( . * ?) < / a> . * ?< / table>
2 、二级页面正则表达式
< td style= "WORD- WRAP. * ?> . * ?> ( . * ?) < / a>
代码实现
from urllib import request
import re
class FilmSpider ( object ) :
def __init__ ( self) :
self. url = 'https://www.dytt8.net/html/gndy/dyzz/list_23_{}.html'
self. headers = { 'User-Agent' : 'Mozilla/5.0' }
def get_page ( self, url) :
req = request. Request( url, headers= self. headers)
res = request. urlopen( req)
html = res. read( ) . decode( 'gb18030' , 'ignore' )
return html
def parse_one_page ( self, html) :
p = re. compile ( '' , re. S)
film_list = p. findall( html)
for film_info in film_list:
film_name = film_info[ 1 ]
film_link = 'https://www.dytt8.net{}' . format ( film_info[ 0 ] . strip( ) )
down_link = self. get_download_link( film_link)
film = {
'电影名称' : film_name,
'下载链接' : down_link[ 0 ] . strip( )
}
print ( film)
def get_download_link ( self, film_link) :
html = self. get_page( film_link)
p = re. compile ( ' , re. S)
download_link_list = p. findall( html)
return download_link_list
def main ( self) :
for i in range ( 1 , 11 ) :
url = self. url. format ( i)
html = self. get_page( url)
self. parse_one_page( html)
if __name__ == '__main__' :
spider = FilmSpider( )
spider. main( )
``
看到这里,那么恭喜你,你已经成功的会了爬虫入门的第一步
你可能感兴趣的:(Python,爬虫进阶教程)
PythonWeb——Django框架
Error_exception_worn
Python基础 数据库 Python django
框架介绍1.什么是框架?框架就是程序的骨架,主体结构,也是个半成品。2.框架的优缺点可重用、成熟,稳健、易扩展、易维护3.Python中常见的框架大包大揽Django被官方称之为完美主义者的Web框架。力求精简web.py和Tornado新生代微框架Flask和Bottle4.Web框架中的一些概念MVC(模型-视图-控制器)和MVT(模型-视图-模板)Django框架介绍Django是一个高级的
【报错】zipfile.BadZipFile: File is not a zip file
Jude_lennon
报错 python
pythonpd.read_excel(excel_path,sheet_name='Sheet1',engine='openpyxl',header=None)出现报错zipfile.BadZipFile:Fileisnotazipfile原代码:data_list=[load_graph_data(file)forfileindata_directory.glob("*.xlsx")]经过de
Python实现链表反转:迭代与递归双解法详解
达不溜先生 ୧⍢⃝୨
python 数据结构 链表 算法 leetcode
目录一、问题描述二、核心代码实现2.1迭代法实现迭代法中的prev初始值是None的原因:关键步骤图解2.2递归法实现递归法中要设置head.next=None的原因递归过程拆解三、方法对比与选择建议一、问题描述链表反转是数据结构中的基础算法问题,常见于面试和算法题库(如LeetCode#206)。要求将单向链表的节点顺序完全倒置二、核心代码实现2.1迭代法实现时间复杂度:O(n)空间复杂度:O(
Python机器学习实战:使用Flask构建机器学习API
AI天才研究院
DeepSeek R1 & 大数据AI人工智能大模型 AI大模型企业级应用开发实战 大厂Offer收割机 面试题 简历 程序员读书 硅基计算 碳基计算 认知计算 生物计算 深度学习 神经网络 大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战:使用Flask构建机器学习API作者:禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域,模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程,难以实现模型的自动化、可视化和复现。为了解决这一问题,将机器学习模型封装成可访问的API变得越来越流行。Fla
Html5学习教程,从入门到精通, HTML5超链接应用的详细语法知识点和案例代码(18)
知识分享小能手
网页开发 前端开发 编程语言如门 html5 学习 前端 html java 后端 css3
HTML5超链接应用的详细语法知识点和案例代码超链接(Hyperlink),也称为跃点链接,是互联网和文档编辑中的一种重要概念。超链接的定义超链接是指从一个网页指向一个目标的连接关系,这个目标可以是另一个网页,也可以是相同网页上的不同位置,还可以是一个图片、动画、程序、电子邮件地址、文件,甚至是一个音视频文件。如果点击了这个链接,当前页面的位置就会跳转到被链接的目标位置。在文档编辑中,超链接可以链
Django框架的全面指南:从入门到高级
步入烟尘
Python超入门指南全册 django sqlite 数据库
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学,从基础到精通不断进阶深入,后续还有实战项目,轻松应对面试,专栏订阅地址:https://blog.csdn.net/mrdeam/category_12647587.html优点:订阅限时19.9付费专栏,私信博主还可进入全栈VIP答疑群,作者优先解答机会(代码指导、远程服务),群里大佬众多可以
Sijia_y的个人经历以及计算机行业发展
Sijia_y
python
如今互联网发展的速度甚是快,以至于技术都在更新迭代。稍有不注意可能就会被淘汰甚至是替代。作为一名中专生,我的成绩也是很差。因为高中考不上的缘故,来到了江苏上学。计算机行业我了解的并不是很多,当时只是听说工资高,铁饭碗。我是一个很懒的人,也是很贪玩。并没有学习很高的兴趣。我接触编程语言,完全是因为我的朋友。因为他是自学C语言的,后面他参加比赛得奖了。我就觉得非常厉害。我就开始学习Python,学会一
为什么Python使用者远远大于perl
perlpython
不认为两者的语法差异是造成如此局面的主要原因.perl的语法虽然比较特立独行,但也不是很难.总结如下原因:library(或者叫package)的使用如果是本语言原生的library,那没有问题.如果是需要调用外部函数/过程的package的话,那么就会有巨大的差异.python是预编译然后从pypi上下载python(pip)将package下载到本地然后解压后将package内容安装到不同的指
AI 问答系统实战:用 Python + Flask + LLM 打造你的智能对话机器人!
Leaton Lee
人工智能 python flask
开篇互动:你是否想拥属于自己的AI问答机器人?“你是否想过拥有一个可以随时为你解答问题、提供建议的AI助手?”随着大语言模型(LLM)的快速发展,打造一个智能问答系统已经成为可能!本文将手把手教你如何利用Python和Flask快速搭建一个属于自己的AI问答系统,并集成强大的语言模型(如OpenAI的GPT-3.5或HuggingFace的LLaMA)。无论是技术小白还是有一定经验的开发者,都能轻
Webpack 打包详细教程
oliver.chau
前端开发 webpack 前端 node.js
Webpack是一个现代JavaScript应用的静态模块打包工具,它可以处理JavaScript、CSS、图片等资源,并优化它们以提高性能。以下是Webpack从基础到进阶的详细教程。1.Webpack基础概念Webpack的核心概念包括:Entry(入口):Webpack开始打包的起点。Output(输出):打包后的文件存放路径。Loaders(加载器):转换非JavaScript资源(如CS
【TVM教程】为 Mobile GPU 自动调优卷积网络
ApacheTVM是一个深度的深度学习编译框架,适用于CPU、GPU和各种机器学习加速芯片。更多TVM中文文档可访问→https://tvm.hyper.ai/作者:LianminZheng,EddieYan针对特定设备的自动调优对于获得最佳性能至关重要。本文介绍如何调优整个卷积网络。TVM中MobileGPU的算子实现是以template形式编写的。该template有许多可调参数(tile因子
tcc编译器教程6 进一步学习编译gmake源代码
刘阿去
学习 c语言
本文以编译gmake为例讲解如何使用tcc进行复杂一点的c代码的编译1简介前面主要讲解了如何编译lua解释器,lua解释器的编译很简单也很容易理解.当然大部分c语言程序编译没那么简单,下面对前面的gmake程序进行编译.2gmake源码结构首先打开之前tcc-busybox-for-win32\gmake文件夹,具体文件如下主要有3个文件夹和3个文件,分别为0.tcc-主要为编译所用的信息lib-
入坑 Python 全能实战小白训练营,470 集干货 12.9G 大揭秘!
七七知享
Python python 开发语言 pandas numpy matplotlib java php
家人们,我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集,内容超丰富,资源包有12.9G,完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入,会涉及到Python的各种高级特性,比如面向对象编程、模块与包的使用。在讲面向对象编程时,老师通过打造一个小型游戏角色系统,把类、对象、继承、多态这些抽象概念诠释得生动形象,让
PyCharm 对接 DeepSeek 大模型的详细操作流程
程之编
pycharm ide python
以下是使用PyCharm对接DeepSeek大模型的详细操作流程,基于Python开发环境。假设你已具备DeepSeekAPI的访问权限(需提前申请APIKey):步骤1:PyCharm环境准备创建新项目打开PyCharm→NewProject→选择纯Python项目→指定项目路径→创建虚拟环境(建议选Virtualenv)。安装依赖库打开终端(Terminal)执行以下命令:pipinstall
DeepSeek与剪映短视频创作指南
meisongqing
人工智能 DeepSeek 剪映
DeepSeek(深度求索)作为一家专注实现AGI的中国公司,其技术可能涉及AI文本生成、图像处理等领域,结合剪映的智能剪辑功能,可以大幅提升短视频创作效率。以下是结合两者优势的详细创作步骤:一、创意策划阶段AI灵感激发使用DeepSeek的AI文本生成功能,输入关键词(如"美食教程"、"科技科普")获取创意方向生成10-20个标题备选(示例Prompt:"生成10个吸引年轻人的美妆短视频标题")
MySQL保姆级教程(SQL语法基础篇)从小白到高手的进阶指南,收藏这一篇就够了
网安导师小李
网络安全 编程 程序员 mysql sql adb 安全 web安全 网络 自动化
本章节精心构构造SQL语法学习之旅的基石,旨在从基础出发,逐步深入,全面解析SQL语法规则并辅以丰富实例。通过这一篇章,您将循序渐进地掌握MySQL的核心语法,开启数据库操作的新境界。1:SQL语言概述SQL(StructuredQueryLanguage),简称SQL。结构化查询语言包含6个部分:类型释义范例数据查询语言DQL:DataQueryLanguage如SELECT数据操作语言DML:
量子计算如何颠覆能源优化领域:从理论到实践
Echo_Wish
人工智能 前沿技术 量子计算 能源
量子计算如何颠覆能源优化领域:从理论到实践大家好,我是Echo_Wish,一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天,我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势,也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用,量子计算已经在一些能源相关领域崭露头角,例如电网优化、可再生能源分配和物流节能规划。以下,让我们一步
Kibana 单机与集群部署教程
闲人编程
大数据集群部署教程 大数据 集群 单机 部署 Kibana 日志分析 数据可视化
目录Kibana单机与集群部署教程第一部分:Kibana概述第二部分:Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现(Python)3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分:Kibana集群部署教程1.配置集群节点1.1配置Elasticse
INCA二次开发GUI实例化
智海行舟
python 个人开发
【摘要】本文基于ETASINCA二次开发实践,深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术,实现从软件架构设计到功能模块开发的完整闭环,为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域,ETASINCA作为行业标准标定工具,其自动化测试需求日益增长。传统的手动操作模式存在以下痛点:重复性操作耗时严重(单
如何通过API用Python获取北向资金流向数据?
量化问财
量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易 量化软件 deepseek
推荐阅读:《【最全攻略】免费的量化软件有哪些?券商的交易接口怎么获取?》如何通过API用Python获取北向资金流向数据?北向资金指的是通过沪港通和深港通渠道,从香港市场流入A股市场的资金。对于投资者来说,了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面:资金流入量:指通过沪
ESP32 小智 AI 机器人入门教程从原理到实现(自己云端部署)
与光同尘 大道至简
人工智能 机器人 python 人机交互 github visual studio 单片机
此博客为一篇针对初学者的详细教程,涵盖小智AI机器人的原理、硬件准备、软件环境搭建、代码实现、云端部署以及优化扩展。文章结合了现有的网络资源,取长补短,确保内容易于理解和操作。简介:本教程将指导初学者使用ESP32微控制器开发一个简单的语音对话机器人“小智”。我们将介绍所需的基础原理、硬件准备、软件环境搭建,以及如何编写代码实现语音唤醒和与云端大模型的对接。通过本教程,即使没有深厚的AI或嵌入式经
go执行java -jar 完成DSA私钥解析并签名
DavidSoCool
java jar golang
起因,最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程,在百度提供的代码示例里面没有go代码的支持,示例中仅有php、python2和3、java的代码,网上找了半天发现go中对DSA私钥解析支持不友好,然后决定使用在java中完成签名计算过程,生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明:1)权限开通后,登录百度联盟媒体平台(union.baidu.com)
【30天玩转python】项目实战:从零开始开发一个Python项目
爱技术的小伙子
30天玩转python linux 运维 服务器
项目实战:从零开始开发一个Python项目在学习Python的过程中,开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识,还能提高实际编程能力。本文将带领你从零开始开发一个Python项目,介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例,逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100(七十六):计算机视觉-直方图和自适应直方图均衡化
是Dream呀
python 计算机视觉 开发语言
前言:零基础学Python:Python从0到100最新最全教程。想做这件事情很久了,这次我更新了自己所写过的所有博客,汇集成了Python从0到100,共一百节课,帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识,成为学习学习和学业的先行者!欢迎大家订阅专栏:零基础学Python:Python从0到100最新
python递推法_如何使用Python递归函数中的递推?
热茶走
python递推法
我们大家都知道,一个函数可能存在多种不同的用法,很少是有函数只针对一个方式,那么基于一种函数,我们肯定要了解多个方式,今日针对递归函数里的递推内容给大家介绍哦~递归是什么?是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解:递归就是在函数内部调用自己的函数被称之为递归。实例:#直接调用自己:deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions)
man One
python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介
tankusa
dash
Dash是一个基于Python的开源框架,专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发,旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用,而无需深入掌握前端技术(如HTML、CSS和JavaScript)。Dash的核心优势在于其简单易用性和强大的功能。通过Dash,用户可以使用纯Python代码来构建复杂的Web应用,而无需编写繁
FastAPI 自定义参数验证器完全指南:从基础到高级实战
qcidyu
文章归档 安全性 数据校验 Web开发 API设计 Field函数 参数验证 FastAPI
title:FastAPI自定义参数验证器完全指南:从基础到高级实战date:2025/3/11updated:2025/3/11author:cmdragonexcerpt:本教程深入探讨FastAPI中自定义参数验证器的使用,特别是通过Field函数进行数据校验。从基础概念到高级用法,通过详细的代码示例、课后测验和常见错误解决方案,帮助初学者快速掌握FastAPI中自定义参数验证器的核心知识。
视频下载插件:yt-dlp
小怪兽长大啦
python
Yt-dlp插件使用下载方法方法一:Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量,下载yt-dlp时不需要配置。方法二:直接下载EXE可执行文件网上下载yt-dlp应用程序:https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令(配置好环境变量后,控制台下输入命令即可)直接下载视频
Python __init__.py 模块详解
鱼丸丶粗面
Python __init__.py
文章目录1概述2导入演示2.1执行顺序:先父后子2.2导入所有模块(含子模块)1概述1.工具:Pycharm场景:在创建一个PythonPackage时,会默认在该包下生成一个'__init__.py'文件2.目的:'进行一些初始化操作'(1)当importpackage时,"自动"执行'__init__.py'文件中的内容(2)常用于导入模块2导入演示2.1执行顺序:先父后子目录结构:目录结构简
ViewController添加button按钮解析。(翻译)
张亚雄
c
<div class="it610-blog-content-contain" style="font-size: 14px"></div>// ViewController.m
// Reservation software
//
// Created by 张亚雄 on 15/6/2.
mongoDB 简单的增删改查
开窍的石头
mongodb
在上一篇文章中我们已经讲了mongodb怎么安装和数据库/表的创建。在这里我们讲mongoDB的数据库操作
在mongo中对于不存在的表当你用db.表名 他会自动统计
下边用到的user是表明,db代表的是数据库
添加(insert):
log4j配置
0624chenhong
log4j
1) 新建java项目
2) 导入jar包,项目右击,properties—java build path—libraries—Add External jar,加入log4j.jar包。
3) 新建一个类com.hand.Log4jTest
package com.hand;
import org.apache.log4j.Logger;
public class
多点触摸(图片缩放为例)
不懂事的小屁孩
多点触摸
多点触摸的事件跟单点是大同小异的,上个图片缩放的代码,供大家参考一下
import android.app.Activity;
import android.os.Bundle;
import android.view.MotionEvent;
import android.view.View;
import android.view.View.OnTouchListener
有关浏览器窗口宽度高度几个值的解析
换个号韩国红果果
JavaScript html
1 元素的 offsetWidth 包括border padding content 整体的宽度。
clientWidth 只包括内容区 padding 不包括border。
clientLeft = offsetWidth -clientWidth 即这个元素border的值
offsetLeft 若无已定位的包裹元素
数据库产品巡礼:IBM DB2概览
蓝儿唯美
db2
IBM DB2是一个支持了NoSQL功能的关系数据库管理系统,其包含了对XML,图像存储和Java脚本对象表示(JSON)的支持。DB2可被各种类型的企 业使用,它提供了一个数据平台,同时支持事务和分析操作,通过提供持续的数据流来保持事务工作流和分析操作的高效性。 DB2支持的操作系统
DB2可应用于以下三个主要的平台:
工作站,DB2可在Linus、Unix、Windo
java笔记5
a-john
java
控制执行流程:
1,true和false
利用条件表达式的真或假来决定执行路径。例:(a==b)。它利用条件操作符“==”来判断a值是否等于b值,返回true或false。java不允许我们将一个数字作为布尔值使用,虽然这在C和C++里是允许的。如果想在布尔测试中使用一个非布尔值,那么首先必须用一个条件表达式将其转化成布尔值,例如if(a!=0)。
2,if-els
Web开发常用手册汇总
aijuans
PHP
一门技术,如果没有好的参考手册指导,很难普及大众。这其实就是为什么很多技术,非常好,却得不到普遍运用的原因。
正如我们学习一门技术,过程大概是这个样子:
①我们日常工作中,遇到了问题,困难。寻找解决方案,即寻找新的技术;
②为什么要学习这门技术?这门技术是不是很好的解决了我们遇到的难题,困惑。这个问题,非常重要,我们不是为了学习技术而学习技术,而是为了更好的处理我们遇到的问题,才需要学习新的
今天帮助人解决的一个sql问题
asialee
sql
今天有个人问了一个问题,如下:
type AD value
A  
意图对象传递数据
百合不是茶
android 意图Intent Bundle对象数据的传递
学习意图将数据传递给目标活动; 初学者需要好好研究的
1,将下面的代码添加到main.xml中
<?xml version="1.0" encoding="utf-8"?>
<LinearLayout xmlns:android="http:/
oracle查询锁表解锁语句
bijian1013
oracle object session kill
一.查询锁定的表
如下语句,都可以查询锁定的表
语句一:
select a.sid,
a.serial#,
p.spid,
c.object_name,
b.session_id,
b.oracle_username,
b.os_user_name
from v$process p, v$s
mac osx 10.10 下安装 mysql 5.6 二进制文件[tar.gz]
征客丶
mysql osx
场景:在 mac osx 10.10 下安装 mysql 5.6 的二进制文件。
环境:mac osx 10.10、mysql 5.6 的二进制文件
步骤:[所有目录请从根“/”目录开始取,以免层级弄错导致找不到目录]
1、下载 mysql 5.6 的二进制文件,下载目录下面称之为 mysql5.6SourceDir;
下载地址:http://dev.mysql.com/downl
分布式系统与框架
bit1129
分布式
RPC框架 Dubbo
什么是Dubbo
Dubbo是一个分布式服务框架,致力于提供高性能和透明化的RPC远程服务调用方案,以及SOA服务治理方案。其核心部分包含: 远程通讯: 提供对多种基于长连接的NIO框架抽象封装,包括多种线程模型,序列化,以及“请求-响应”模式的信息交换方式。 集群容错: 提供基于接
那些令人蛋痛的专业术语
白糖_
spring Web SSO IOC
spring
【控制反转(IOC)/依赖注入(DI)】:
由容器控制程序之间的关系,而非传统实现中,由程序代码直接操控。这也就是所谓“控制反转”的概念所在:控制权由应用代码中转到了外部容器,控制权的转移,是所谓反转。
简单的说:对象的创建又容器(比如spring容器)来执行,程序里不直接new对象。
Web
【单点登录(SSO)】:SSO的定义是在多个应用系统中,用户
《给大忙人看的java8》摘抄
braveCS
java8
函数式接口:只包含一个抽象方法的接口
lambda表达式:是一段可以传递的代码
你最好将一个lambda表达式想象成一个函数,而不是一个对象,并记住它可以被转换为一个函数式接口。
事实上,函数式接口的转换是你在Java中使用lambda表达式能做的唯一一件事。
方法引用:又是要传递给其他代码的操作已经有实现的方法了,这时可以使
编程之美-计算字符串的相似度
bylijinnan
java 算法 编程之美
public class StringDistance {
/**
* 编程之美 计算字符串的相似度
* 我们定义一套操作方法来把两个不相同的字符串变得相同,具体的操作方法为:
* 1.修改一个字符(如把“a”替换为“b”);
* 2.增加一个字符(如把“abdd”变为“aebdd”);
* 3.删除一个字符(如把“travelling”变为“trav
上传、下载压缩图片
chengxuyuancsdn
下载
/**
*
* @param uploadImage --本地路径(tomacat路径)
* @param serverDir --服务器路径
* @param imageType --文件或图片类型
* 此方法可以上传文件或图片.txt,.jpg,.gif等
*/
public void upload(String uploadImage,Str
bellman-ford(贝尔曼-福特)算法
comsci
算法 F#
Bellman-Ford算法(根据发明者 Richard Bellman 和 Lester Ford 命名)是求解单源最短路径问题的一种算法。单源点的最短路径问题是指:给定一个加权有向图G和源点s,对于图G中的任意一点v,求从s到v的最短路径。有时候这种算法也被称为 Moore-Bellman-Ford 算法,因为 Edward F. Moore zu 也为这个算法的发展做出了贡献。
与迪科
oracle ASM中ASM_POWER_LIMIT参数
daizj
ASM oracle ASM_POWER_LIMIT 磁盘平衡
ASM_POWER_LIMIT
该初始化参数用于指定ASM例程平衡磁盘所用的最大权值,其数值范围为0~11,默认值为1。该初始化参数是动态参数,可以使用ALTER SESSION或ALTER SYSTEM命令进行修改。示例如下:
SQL>ALTER SESSION SET Asm_power_limit=2;
高级排序:快速排序
dieslrae
快速排序
public void quickSort(int[] array){
this.quickSort(array, 0, array.length - 1);
}
public void quickSort(int[] array,int left,int right){
if(right - left <= 0
C语言学习六指针_何谓变量的地址 一个指针变量到底占几个字节
dcj3sjt126com
C语言
# include <stdio.h>
int main(void)
{
/*
1、一个变量的地址只用第一个字节表示
2、虽然他只使用了第一个字节表示,但是他本身指针变量类型就可以确定出他指向的指针变量占几个字节了
3、他都只存了第一个字节地址,为什么只需要存一个字节的地址,却占了4个字节,虽然只有一个字节,
但是这些字节比较多,所以编号就比较大,
phpize使用方法
dcj3sjt126com
PHP
phpize是用来扩展php扩展模块的,通过phpize可以建立php的外挂模块,下面介绍一个它的使用方法,需要的朋友可以参考下
安装(fastcgi模式)的时候,常常有这样一句命令:
代码如下:
/usr/local/webserver/php/bin/phpize
一、phpize是干嘛的?
phpize是什么?
phpize是用来扩展php扩展模块的,通过phpi
Java虚拟机学习 - 对象引用强度
shuizhaosi888
JAVA虚拟机
本文原文链接:http://blog.csdn.net/java2000_wl/article/details/8090276 转载请注明出处!
无论是通过计数算法判断对象的引用数量,还是通过根搜索算法判断对象引用链是否可达,判定对象是否存活都与“引用”相关。
引用主要分为 :强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Wea
.NET Framework 3.5 Service Pack 1(完整软件包)下载地址
happyqing
.net 下载 framework
Microsoft .NET Framework 3.5 Service Pack 1(完整软件包)
http://www.microsoft.com/zh-cn/download/details.aspx?id=25150
Microsoft .NET Framework 3.5 Service Pack 1 是一个累积更新,包含很多基于 .NET Framewo
JAVA定时器的使用
jingjing0907
java timer 线程 定时器
1、在应用开发中,经常需要一些周期性的操作,比如每5分钟执行某一操作等。
对于这样的操作最方便、高效的实现方式就是使用java.util.Timer工具类。
privatejava.util.Timer timer;
timer = newTimer(true);
timer.schedule(
newjava.util.TimerTask() { public void run()
Webbench
流浪鱼
webbench
首页下载地址 http://home.tiscali.cz/~cz210552/webbench.html
Webbench是知名的网站压力测试工具,它是由Lionbridge公司(http://www.lionbridge.com)开发。
Webbench能测试处在相同硬件上,不同服务的性能以及不同硬件上同一个服务的运行状况。webbench的标准测试可以向我们展示服务器的两项内容:每秒钟相
第11章 动画效果(中)
onestopweb
动画
index.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
<html xmlns="http://www.w3.org/
windows下制作bat启动脚本.
sanyecao2314
java cmd 脚本 bat
java -classpath C:\dwjj\commons-dbcp.jar;C:\dwjj\commons-pool.jar;C:\dwjj\log4j-1.2.16.jar;C:\dwjj\poi-3.9-20121203.jar;C:\dwjj\sqljdbc4.jar;C:\dwjj\voucherimp.jar com.citsamex.core.startup.MainStart
Java进行RSA加解密的例子
tomcat_oracle
java
加密是保证数据安全的手段之一。加密是将纯文本数据转换为难以理解的密文;解密是将密文转换回纯文本。 数据的加解密属于密码学的范畴。通常,加密和解密都需要使用一些秘密信息,这些秘密信息叫做密钥,将纯文本转为密文或者转回的时候都要用到这些密钥。 对称加密指的是发送者和接收者共用同一个密钥的加解密方法。 非对称加密(又称公钥加密)指的是需要一个私有密钥一个公开密钥,两个不同的密钥的
Android_ViewStub
阿尔萨斯
ViewStub
public final class ViewStub extends View
java.lang.Object
android.view.View
android.view.ViewStub
类摘要: ViewStub 是一个隐藏的,不占用内存空间的视图对象,它可以在运行时延迟加载布局资源文件。当 ViewSt