chodo

python网络编程学习笔记（7）：HTML和XHTML解析(HTMLParser、BeautifulSoup)

在python中能够进行html和xhtml的库有很多，如HTMLParser、sgmllib、htmllib、BeautifulSoup、mxTidy、uTidylib等，这里介绍一下HTMLParser、BeautifulSoup等模块。

一、利用HTMLParser进行网页解析
具体HTMLParser官方文档可参考http://docs.python.org/library/htmlparser.html#HTMLParser.HTMLParser

1、从一个简单的解析例子开始
例1：
test1.html文件内容如下：

<html><head><title> XHTML 与 HTML 4.01 标准没有太多的不同</title></head><body> i love you </body></html>

下面是能够列出title和body的程序示例：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例 import HTMLParser class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['title','body'] #提出标签 
        self.processing=None         HTMLParser.HTMLParser.__init__(self)     def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             self.data=''             self.processing=tag     def handle_data(self,data):         if self.processing:             self.data +=data     def handle_endtag(self,tag):         if tag==self.processing:             print str(tag)+':'+str(tp.gettitle())             self.processing=None     def gettitle(self):         return self.data fd=open('test1.html') tp=TitleParser() tp.feed(fd.read())

运行结果如下：
title: XHTML 与 HTML 4.01 标准没有太多的不同
body:
i love you
程序定义了一个TitleParser类，它是HTMLParser类的子孙。HTMLParser的feed方法将接收数据，并通过定义的HTMLParser对象对数据进行相应的解析。其中handle_starttag、handle_endtag判断起始和终止tag，handle_data检查是否取得数据，如果self.processing不为None，那么就取得数据。

2、解决html实体问题
（HTML 中有用的字符实体）
（1）实体名称
当与到HTML中的实体问题时，上面的例子就无法实现，如这里将test1.html的代码改为：
例2：

<html><head><title> XHTML 与&quot; HTML 4.01 &quot;标准没有太多的不同</title></head><body> i love you&times;</body></html>

利用上面的例子进行分析，其结果是：
title: XHTML 与 HTML 4.01 标准没有太多的不同
body:
i love you
实体完全消失了。这是因为当出现实体的时候，HTMLParser调用了handle_entityref()方法，因为代码中没有定义这个方法，所以就什么都没有做。经过修改后，如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例：解决实体问题 from htmlentitydefs import entitydefs import HTMLParser class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['title','body']         self.processing=None         HTMLParser.HTMLParser.__init__(self)     def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             self.data=''             self.processing=tag     def handle_data(self,data):         if self.processing:             self.data +=data     def handle_endtag(self,tag):         if tag==self.processing:             print str(tag)+':'+str(tp.gettitle())             self.processing=None     def handle_entityref(self,name):         if entitydefs.has_key(name):             self.handle_data(entitydefs[name])         else:             self.handle_data('&'+name+';')     def gettitle(self):         return self.data fd=open('test1.html') tp=TitleParser() tp.feed(fd.read())

运行结果为：
title: XHTML 与" HTML 4.01 "标准没有太多的不同
body:
i love you×
这里就把所有的实体显示出来了。

（2）实体编码
例3：

<html><head><title> XHTML 与&quot; HTML 4.01 &quot;标准没有太多的不同</title></head><body> i love&#247; you&times;</body></html>

如果利用例2的代码执行后结果为：
title: XHTML 与" HTML 4.01 "标准没有太多的不同
body:
i love you×
结果中÷ 对应的÷没有显示出来。
添加handle_charref（）进行处理，具体代码如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例：解决实体问题 from htmlentitydefs import entitydefs import HTMLParser class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['title','body']         self.processing=None         HTMLParser.HTMLParser.__init__(self)     def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             self.data=''             self.processing=tag     def handle_data(self,data):         if self.processing:             self.data +=data     def handle_endtag(self,tag):         if tag==self.processing:             print str(tag)+':'+str(tp.gettitle())             self.processing=None     def handle_entityref(self,name):         if entitydefs.has_key(name):             self.handle_data(entitydefs[name])         else:             self.handle_data('&'+name+';')     def handle_charref(self,name):         try:             charnum=int(name)         except ValueError:             returnif charnum<1 or charnum>255:             return         self.handle_data(chr(charnum))     def gettitle(self):         return self.data fd=open('test1.html') tp=TitleParser() tp.feed(fd.read())

运行结果为：
title: XHTML 与" HTML 4.01 "标准没有太多的不同
body:
i love÷ you×

3、提取链接
例4：

<html><head><title> XHTML 与&quot; HTML 4.01 &quot;标准没有太多的不同</title></head><body><a href="http://pypi.python.org/pypi" title="link1">i love&#247; you&times;</a></body></html>

这里在handle_starttag(self,tag,attrs)中，tag=a时，attrs记录了属性值，因此只需要将attrs中name=href的value提出即可。具体如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例：提取链接 # -*- coding: cp936 -*- from htmlentitydefs import entitydefs import HTMLParser class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['title','body']         self.processing=None         HTMLParser.HTMLParser.__init__(self)            def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             self.data=''             self.processing=tag         if tag =='a':             for name,value in attrs:                 if name=='href':                     print'连接地址：'+value     def handle_data(self,data):         if self.processing:             self.data +=data     def handle_endtag(self,tag):         if tag==self.processing:             print str(tag)+':'+str(tp.gettitle())             self.processing=None     def handle_entityref(self,name):         if entitydefs.has_key(name):             self.handle_data(entitydefs[name])         else:             self.handle_data('&'+name+';')     def handle_charref(self,name):         try:             charnum=int(name)         except ValueError:             returnif charnum<1 or charnum>255:             return         self.handle_data(chr(charnum))     def gettitle(self):         return self.data fd=open('test1.html') tp=TitleParser() tp.feed(fd.read())

运行结果为：
title: XHTML 与" HTML 4.01 "标准没有太多的不同
连接地址：http://pypi.python.org/pypi
body:

i love÷ you×

4、提取图片
如果网页中有一个图片文件，将其提取出来，并存为一个单独的文件。
例5：

<html><head><title> XHTML 与&quot; HTML 4.01 &quot;标准没有太多的不同</title></head><body> i love&#247; you&times;<a href="http://pypi.python.org/pypi" title="link1">我想你</a><div id="m"><img src="http://www.baidu.com/img/baidu_sylogo1.gif" width="270" height="129"></div></body></html>

将baidu_sylogo1.gif存取出来，具体代码如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例：提取图片 # -*- coding: cp936 -*- from htmlentitydefs import entitydefs import HTMLParser,urllib def getimage(addr):#提取图片并存在当前目录下 
    u = urllib.urlopen(addr)     data = u.read()     filename=addr.split('/')[-1]     f=open(filename,'wb')     f.write(data)     f.close()     print filename+'已经生成！'class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['title','body']         self.processing=None         HTMLParser.HTMLParser.__init__(self)            def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             self.data=''             self.processing=tag         if tag =='a':             for name,value in attrs:                 if name=='href':                     print'连接地址：'+value         if tag=='img':             for name,value in attrs:                 if name=='src':                     getimage(value)     def handle_data(self,data):         if self.processing:             self.data +=data     def handle_endtag(self,tag):         if tag==self.processing:             print str(tag)+':'+str(tp.gettitle())             self.processing=None     def handle_entityref(self,name):         if entitydefs.has_key(name):             self.handle_data(entitydefs[name])         else:             self.handle_data('&'+name+';')     def handle_charref(self,name):         try:             charnum=int(name)         except ValueError:             returnif charnum<1 or charnum>255:             return         self.handle_data(chr(charnum))     def gettitle(self):         return self.data fd=open('test1.html') tp=TitleParser() tp.feed(fd.read())

运动结果为：
title: XHTML 与" HTML 4.01 "标准没有太多的不同
连接地址：http://pypi.python.org/pypi
baidu_sylogo1.gif已经生成！
body:
i love÷ you×
?ò????

5、实际例子：
例6、获取人人网首页上的各各链接地址，代码如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##HTMLParser示例：获取人人网首页上的各各链接地址 #coding: utf-8 from htmlentitydefs import entitydefs import HTMLParser,urllib def getimage(addr):     u = urllib.urlopen(addr)     data = u.read()     filename=addr.split('/')[-1]     f=open(filename,'wb')     f.write(data)     f.close()     print filename+'已经生成！'class TitleParser(HTMLParser.HTMLParser):     def__init__(self):         self.taglevels=[]         self.handledtags=['a']         self.processing=None         self.linkstring=''         self.linkaddr=''         HTMLParser.HTMLParser.__init__(self)            def handle_starttag(self,tag,attrs):         if tag in self.handledtags:             for name,value in attrs:                 if name=='href':                     self.linkaddr=value             self.processing=tag     def handle_data(self,data):         if self.processing:             self.linkstring +=data             #print data.decode('utf-8')+':'+self.linkaddr def handle_endtag(self,tag):         if tag==self.processing:             print self.linkstring.decode('utf-8')+':'+self.linkaddr             self.processing=None             self.linkstring=''def handle_entityref(self,name):         if entitydefs.has_key(name):             self.handle_data(entitydefs[name])         else:             self.handle_data('&'+name+';')     def handle_charref(self,name):         try:             charnum=int(name)         except ValueError:             returnif charnum<1 or charnum>255:             return         self.handle_data(chr(charnum))     def gettitle(self):         return self.linkaddr tp=TitleParser() tp.feed(urllib.urlopen('http://www.renren.com/').read())

运行结果：
分享:http://share.renren.com
应用程序:http://app.renren.com
公共主页:http://page.renren.com
人人生活:http://life.renren.com
人人小组:http://xiaozu.renren.com/
同名同姓:http://name.renren.com
人人中学:http://school.renren.com/allpages.html
大学百科:http://school.renren.com/daxue/
人人热点:http://life.renren.com/hot
人人小站:http://zhan.renren.com/
人人逛街:http://j.renren.com/
人人校招:http://xiaozhao.renren.com/
:http://www.renren.com
注册:http://wwv.renren.com/xn.do?ss=10113&rt=27
登录:http://www.renren.com/
帮助:http://support.renren.com/helpcenter
给我们提建议:http://support.renren.com/link/suggest
更多:#
:javascript:closeError();
打开邮箱查收确认信:#
重新输入:javascript:closeError();
:javascript:closeStop();
客服:http://help.renren.com/#http://help.renren.com/support/contomvice?pid=2&selection={couId:193,proId:342,cityId:1000375}
:javascript:closeLock();
立即解锁:http://safe.renren.com/relive.do
忘记密码？:http://safe.renren.com/findPass.do
忘记密码？:http://safe.renren.com/findPass.do
换一张:javascript:refreshCode_login();
MSN:#
360:https://openapi.360.cn/oauth2/authorize?client_id=5ddda4458747126a583c5d58716bab4c&response_type=code&redirect_uri=http://www.renren.com/bind/tsz/tszLoginCallBack&scope=basic&display=default
天翼:https://oauth.api.189.cn/emp/oauth2/authorize?app_id=296961050000000294&response_type=code&redirect_uri=http://www.renren.com/bind/ty/tyLoginCallBack
为什么要填写我的生日？:#birthday
看不清换一张?:javascript:refreshCode();
想了解更多人人网功能？点击此处:javascript:;
:javascript:;
:javascript:;
立刻注册:http://reg.renren.com/xn6245.do?ss=10113&rt=27
关于:http://www.renren.com/siteinfo/about
开放平台:http://dev.renren.com
人人游戏:http://wan.renren.com
公共主页:http://page.renren.com/register/regGuide/
手机人人:http://mobile.renren.com/mobilelink.do?psf=40002
团购:http://www.nuomi.com
皆喜网:http://www.jiexi.com
营销服务:http://ads.renren.com
招聘:http://job.renren-inc.com/
客服帮助:http://support.renren.com/helpcenter
隐私:http://www.renren.com/siteinfo/privacy
京ICP证090254号:http://www.miibeian.gov.cn/
互联网药品信息服务资格证:http://a.xnimg.cn/n/core/res/certificate.jpg

二、利用BeautifulSoup进行网页解析
1、BeautifulSoup下载和安装
下载地址：http://www.crummy.com/software/BeautifulSoup/download/3.x/
中文文档地址：http://www.crummy.com/software/BeautifulSoup/bs3/documentation.zh.html#Entity%20Conversion
安装方法：将下载的文件解压缩后，文件夹下有个setup.py文件，然后在cmd下，运行python setup.py install进行安装，注意setup.py的路径问题。安装成功后，在python中就可以直接import BeautifulSoup了。
2、从一个简单的解析例子开始
例7：

<html><head><title> XHTML 与&quot; HTML 4.01 &quot;标准没有太多的不同</title></head><body> i love&#247; you&times;<a href="http://pypi.python.org/pypi" title="link1">我想你</a><div id="m"><img src="http://www.baidu.com/img/baidu_sylogo1.gif" width="270" height="129"></div></body></html>

获取title的代码：

##@小五义：http://www.cnblogs.com/xiaowuyi ##BeautifulSoup示例：title #coding: utf8 import BeautifulSoup a=open('test1.html','r') htmlline=a.read() soup=BeautifulSoup.BeautifulSoup(htmlline.decode('gb2312')) #print soup.prettify()#规范化html文件 
titleTag=soup.html.head.title print titleTag.string

运行结果：
XHTML 与" HTML 4.01 "标准没有太多的不同
从代码和结果来看，应注意两点：
第一，在BeautifulSoup.BeautifulSoup(htmlline.decode('gb2312'))初始化过程中，应注意字符编码格式，从网上搜索了一下，开始用utf-8的编码显示不正常，换为gb2312后显示正常。其实可以用soup.originalEncoding方法来查看原文件的编码格式。
第二，结果中未对字符实体进行处理，在BeautifulSoup中文文档中，有专门对实体转换的解释，这里将上面的代码改为以下代码后，结果将正常显示：

##@小五义：http://www.cnblogs.com/xiaowuyi ##BeautifulSoup示例：title #coding: utf8 import BeautifulSoup a=open('test1.html','r') htmlline=a.read() soup=BeautifulSoup.BeautifulStoneSoup(htmlline.decode('gb2312'),convertEntities=BeautifulSoup.BeautifulStoneSoup.ALL_ENTITIES) #print soup.prettify()#规范化html文件 
titleTag=soup.html.head.title print titleTag.string

这里convertEntities=BeautifulSoup.BeautifulStoneSoup.ALL_ENTITIES中的ALL_ENTITIES定义了XML和HTML两者的实体代码。当然，也可以直接用XML_ENTITIES或者HTML_ENTITIES。运行结果如下：
XHTML 与" HTML 4.01 "标准没有太多的不同
3、提取链接
还有用上面的例子，这里代码变为：

##@小五义：http://www.cnblogs.com/xiaowuyi ##BeautifulSoup示例：提取链接 #coding: utf8 import BeautifulSoup a=open('test1.html','r') htmlline=a.read() a.close() soup=BeautifulSoup.BeautifulStoneSoup(htmlline.decode('gb2312'),convertEntities=BeautifulSoup.BeautifulStoneSoup.ALL_ENTITIES) name=soup.find('a').string links=soup.find('a')['href'] print name+':'+links

运行结果为：
我想你:http://pypi.python.org/pypi
4、提取图片
依然是用上面的例子，把baidu图片提取出来。
代码为：

##@小五义：http://www.cnblogs.com/xiaowuyi#coding: utf8 import BeautifulSoup,urllib def getimage(addr):#提取图片并存在当前目录下 
    u = urllib.urlopen(addr)     data = u.read()     filename=addr.split('/')[-1]     f=open(filename,'wb')     f.write(data)     f.close()     print filename+' finished!' a=open('test1.html','r') htmlline=a.read() soup=BeautifulSoup.BeautifulStoneSoup(htmlline.decode('gb2312'),convertEntities=BeautifulSoup.BeautifulStoneSoup.ALL_ENTITIES) links=soup.find('img')['src'] getimage(links)

提取链接和提取图片两部分主要都是用了find方法，具体方法为：
find(name, attrs, recursive, text, **kwargs)
findAll是列出全部符合条件的，find只列出第一条。这里注意的是findAll返回的是个list。
5、实际例子：
例8、获取人人网首页上的各各链接地址，代码如下：

##@小五义：http://www.cnblogs.com/xiaowuyi ##BeautifulSoup示例：获取人人网首页上的各各链接地址 #coding: utf8 import BeautifulSoup,urllib linkname='' htmlline=urllib.urlopen('http://www.renren.com/').read() soup=BeautifulSoup.BeautifulStoneSoup(htmlline.decode('utf-8')) links=soup.findAll('a') for i in links:     ##判断tag是a的里面，href是否存在。 if'href'in str(i):         linkname=i.string         linkaddr=i['href']         if'NoneType'in str(type(linkname)):#当i无内容是linkname为Nonetype类型。 print linkaddr         else:             print linkname+':'+linkaddr

运维常用AI工具与传统运维工具大集合浩特-ht 运维人工智能
运维常用AI工具与传统运维工具大集合一、AI驱动的运维工具（一）DeepSeek工具概述：这是一款专门为技术领域打造的AI工具，具备自然语言处理和代码生成能力，可助力运维人员排查服务器故障、优化配置文件以及编写自动化脚本。核心功能：能依据自然语言描述的问题生成对应的解决方案，例如分析服务器的CPU使用率过高问题。可自动生成各类脚本，像Shell脚本、Python脚本等，还能对配置文件进行优化，比如
网站安全攻防：十大常见漏洞及其防范对策_网络安全攻防演练常用漏洞码农x马马安全 web安全运维 linux 人工智能漏洞
**数据来源：**ChatGPTTOP10漏洞TOP10漏洞是OWASP（OpenWebApplicationSecurityProject）每年发布的最常见的网络安全漏洞排名。下面介绍TOP10漏洞及其原理、检测方式和修复措施。1）SQL注入漏洞**原理：**攻击者通过构造恶意SQL语句注入到应用程序的数据库中，从而获取敏感信息或控制数据库服务器。**检测方式：**使用工具或手工输入特殊字符并观
Python爬虫：Feapder 的详细使用和案例数据知道 2025年爬虫和逆向教程 python 爬虫开发语言
更多内容请见：爬虫和逆向教程-专栏介绍和目录文章目录1.Feapder概述1.1Feapder介绍1.2Feapder核心特点1.3Feapder主要组件1.4Feapder的安装2.基础爬虫编写2.1创建爬虫2.2运行爬虫3.数据采集案例3.1新闻网站采集3.2电商商品采集3.3使用Spider类创建更强大爬虫4.高级功能使用4.1分布式爬虫4.2浏览器渲染4.3文件下载4.4监控与报警5.数据
Python Joblib 使用详解：缓存与并行加速技术 egzosn python 缓存开发语言
Joblib简介Joblib是一个轻量级的Python工具集，主要用于两个方面：结果缓存(Memoization)利用Memory类，可以将函数的输出结果存储到磁盘上，避免多次重复计算。特别适合于数据处理和机器学习中一些耗时计算的场景。并行计算利用Parallel和delayed，可以方便地将循环中的任务分发到多个CPU核心上运行，从而加速计算过程。这些功能使得Joblib成为数据科学、机器学习和
机器学习经典算法——决策树算法详解与实现 SVIPCODE 机器学习算法决策树编程
机器学习经典算法——决策树算法详解与实现决策树（DecisionTree）是一种常用的机器学习算法，它是基于树形结构的有监督学习方法之一。在本文中，我们将详细介绍决策树算法的原理，并使用Python代码进行实现。1.决策树算法原理决策树算法通过对数据集进行划分来构建一棵树，每个节点表示一个特征属性，每个分支代表一个属性取值，叶子节点表示分类结果。根据不同的分裂准则，决策树可以采用多种算法进行构建，
利用Ollama部署Llama 3/deepseek-r1模型，只需5行代码即可实现对话 Lins号丹 Python编程 llama ollama deepseek-r1 聊天机器人
文章目录1.前言2.通过Ollama在本地运行Llama3和deepseek-r13.通过ollama的pythonapi与大模型对话4.部分LLM参数4.1Temperature调节推理能力和创造力4.2TestingSeed随机种子控制随机数4.3MaxTokens控制响应量4.4Streaming流式响应1.前言尽管目前开源的大语言模型很多，但是许多人想在电脑上部署，仍需要克服许多困难，例如
Python read_csv SemiconductorPhysics 编程
读入csv问题data=pd.read_csv(file,header=0,encoding='utf-8',error_bad_lines=False,engine="python")Skippingline968:Expected79fieldsinline968,saw151原因：矩阵没有对齐，长度不一致。
如何排查常见的 Windows 应用程序错误和崩溃 ManageEngine卓豪日志管理 windows 应用程序日志管理故障排除
当像AdobePhotoshop这样的关键应用程序在系统上崩溃时，系统管理员必须分析崩溃的原因并修复问题。通常，Windows应用程序崩溃会以日志的形式记录错误信息，可以使用事件查看器查看和分析这些日志。本文介绍如何通过事件日志分析来分析应用程序错误和崩溃的根本原因。什么是应用程序错误或崩溃？以及与它们相关的常见事件ID应用程序崩溃或错误是指破坏软件程序正常运行的意外故障，这可以通过多种方式表现出
Python（5）Python数据清洗指南：无效数据处理与实战案例解析（附完整代码）一个天蝎座白勺程序猿 python 大数据人工智能
目录一、背景与核心价值二、无效数据分类与识别技术1.常见无效数据类型2.高级检测技巧三、六大处理方法深度解析1.精准删除策略2.智能填充技术3.时间序列插值4.异常值分箱处理四、电商销售数据清洗实战1.数据集说明2.四步清洗流程五、工业级处理方案选择矩阵六、总结与进阶建议一、背景与核心价值在数据科学项目中，无效数据（缺失值、异常值、重复值）会导致高达35%的分析误差（来源：IBMDataQuali
机器学习模型的保存与加载：使用pickle和joblib FdmPatch 机器学习人工智能 scikit-learn
在机器学习中，模型的保存和加载是非常重要的步骤。一旦我们训练好了一个模型，我们希望能够将其保存到磁盘上，以便以后使用。Python中有几个常用的库可以实现这个功能，包括pickle和Scikit-learn的joblib。本文将介绍如何使用这两个库来保存和加载机器学习模型。使用pickle保存和加载模型Pickle是Python的标准库，可以将Python对象序列化为字节流，然后将其保存到文件中。
Python（4）Python函数编程性能优化全指南：从基础语法到并发调优一个天蝎座白勺程序猿 python 性能优化开发语言
目录一、Lambda性能优化原理1.1内联执行优势1.2并行计算加速二、工程级优化策略2.1内存管理机制2.2类型提示增强三、生产环境最佳实践3.1代码可读性平衡3.2异常处理模式四、性能调优案例4.1排序算法优化4.2数据管道加速五、未来演进方向5.1JIT编译优化5.2类型系统增强六、优化总结1.性能优势对比‌2.工程级优化策略‌3.生产环境实践‌一、Lambda性能优化原理1.1内联执行优势
STM32单片机学习记录（2.9）宣宣猪的小花园. STM32 空气动力学 stm32 无人机嵌入式硬件单片机空气动力学
一、STM3215.1-FLASH闪存1.FLASH简介（1）STM32系列的FLASH包含程序存储器、系统存储器和选项字节三个部分，通过闪存存储器接口（外设）可以对程序存储器和选项字节进行擦除和编程；（2）读写FLASH的用途：利用程序存储器的剩余空间来保存掉电不丢失的用户数据，通过在程序中编程（IAP），实现程序的自我更新；（3）在线编程（In-CircuitProgramming-lCP）用
Python的struct 2301_82309799 python
struct是Python中的一个内建模块，用于处理C语言结构体与Python数据类型之间的转换。它允许你将Python中的数据打包成二进制格式，或者将二进制数据解包成Python数据类型。这在处理二进制数据（如网络通信、文件读写等）时非常有用。基本用法打包（Packing）使用struct.pack方法将Python数据类型转换为二进制数据。struct.pack的第一个参数是一个格式字符串，用
蓝桥杯算法实战分享 YJlio 蓝桥杯算法职场和发展
蓝桥杯算法实战分享蓝桥杯是国内知名的程序设计竞赛，涵盖算法、数据结构、编程技巧等多个领域。本文将从实战角度分享蓝桥杯算法竞赛的常见题型、解题思路和优化技巧，帮助参赛者更好地备战。1.常见题型与解题思路蓝桥杯的题型主要包括以下几类：(1)基础算法题特点：考察基础算法（如排序、查找、递归等）。解题思路：熟练掌握常见算法（如快速排序、二分查找）。注意边界条件和特殊输入。(2)动态规划特点：考察状态转移和
Python Joblib库使用学习总结酒酿小小丸子 python 学习开发语言
实践环境python3.6.2Joblib简介Joblib是一组在Python中提供轻量级流水线的工具。特别是：函数的透明磁盘缓存和延迟重新计算（记忆模式）简单易用的并行计算Joblib已被优化得很快速，很健壮了，特别是在大数据上，并对numpy数组进行了特定的优化。主要功能输出值的透明快速磁盘缓存(Transparentandfastdisk-cachingofoutputvalue):Pyth
机器学习经典算法：决策树原理详解 xiaoyu❅ 机器学习算法决策树
决策树（DecisionTree）是一种直观且强大的机器学习算法，被广泛用于分类与回归任务。本文从核心原理（信息熵、基尼系数）、构建过程（ID3/C4.5/CART）、剪枝优化到Python代码实战，全方位解析决策树，并教你如何用Graphviz可视化树结构！目录一、什么是决策树？二、决策树的核心原理1.特征划分标准2.关键公式推导3.决策树构建流程三、Python代码实战1.数据集准备2.模型训
如何监控 SQL Server ManageEngine卓豪数据库数据库 SQL Server 数据库性能
监控SQLServer对于维护数据库性能、确保数据可用性和最大限度地减少停机时间至关重要。随着企业越来越依赖数据驱动的决策，高效的SQLServer监控策略能显著提升组织生产力和用户满意度。为什么要监控SQLServerSQLServer是许多关键应用程序的支柱，未受监控或监控不善可能会导致查询性能降低、应用程序无响应甚至数据丢失。以下是监控SQLServer重要的原因：资源管理：追踪CPU、内存
vue2 生成动态二维码 vue2组件化
因为项目使用的是vue2，下面那个组件，大佬没有写canvas的生成二维码+logo的形式。所以跟着大佬的vue3的代码，写了一遍vue2的。vue3直接安装使用npminstallqrcode@1@chenfengyuan/vue-qrcode@2vue2参考下面npminstallqrcode@1组件：QrcodeComponent.vueimport{toCanvas,toDataURL,t
flask开发中设置Flask SQLAlchemy 的 db.Column 只存储非负整数（即 0 或正整数）上趣工作室 flask flask
如果你想控制一个FlaskSQLAlchemy的db.Column只存储非负整数（即0或正整数），你可以在模型中使用验证来确保这一点。一种常见的方法是使用模型的validate方法或者在执行插入或更新操作时进行检查。以下是实现这一目标的几种方法：方法1：使用自定义验证你可以重写模型的__init__方法，或者在定义setter方法时加入验证：fromflask_sqlalchemyimportSQ
python系列：一文读懂FastAPI：Python 开发者的福音坦笑&&life #python python fastapi 开发语言
一文读懂FastAPI：Python开发者的福音一文读懂FastAPI：Python开发者的福音第一步：安装FastAPI第二步：创建一个FastAPI应用第三步：定义接口第四步：运行应用第五步：查看接口文档总结一文读懂FastAPI：Python开发者的福音FastAPI是一个基于Python的现代化Web框架，它提供了快速、简单和高性能的方式来构建API。它结合了Python的静态类型检查和自
AI算法成长练习第一篇——Task-Adaptive Negative Envision for Few-Shot Open-Set Recognition代码复现威少的书童人工智能算法 python 机器学习深度学习
论文代码复现代码结构ArchitecturesAttnClassifier.pyimporttorch.nnasnnimporttorchimporttorch.nn.functionalasFimportnumpyasnpclassClassifier(nn.Module):def__init__(self,args,feat_dim,param_seam,train_weight_base=F
一文读懂 Python 开发环境配置 felixmicrospace Python学习记录 python
文章目录Python多版本管理1.多版本使用需求2.Windows下多版本管理[^1]3.Linux系统下多版本管理[^2]Python虚拟环境配置1.原理和配置需求操作系统的环境变量虚拟环境运行和PATH修改Python解释器和虚拟环境关系2.安装&配置使用Virtualenv管理[^3]使用venv管理使用[pipenv](https://pipenv.pypa.io/en/latest/)管
pythonjson数据_一文看懂Python类型数据JSON序列化 weixin_39582569 pythonjson数据
现代网络应用WebAPP或大型网站的后台一般只有一个，然后客户端却是各种各样的(iOS,android,浏览器),而且客户端的开发语言很可能与后台的开发语言不一样。这时我们需要后台能够提供可以跨平台跨语言的一种标准的数据交换格式供前后端沟通(这就是WebAPI的作用)。如今大家最常用的跨平台跨语言数据交换格式就是JSON（JavaScriptObjectNotation）了。JSON是一种文本序列
python中pickle模块_一文带你读懂Python中的pickle模块 weixin_39640444 python中pickle模块
pickle模块：属于python专有的模块，用法，功能与json类似。常用方法：dump(obj,fp)：将对象以字符串的形式写入文件中。load(fp)：将数据从文件中读出，并返回(需要变量接收)。dumps(obj)：将对象转换成json字符串形式。loads(str)：将json字符串数据转换成原来的数据类型。dump(obj,fp)|load(fp)示例如下;importpickle#将
qt运行程序为什么没有窗口_Qt中创建控制台程序（cmd窗口） weixin_39701735 qt运行程序为什么没有窗口
有位朋友留言问，如何创建一个控制台的界面。因为Qt似乎直接创建的就是一个带有窗口的程序。额，其实我觉得吧，还是不够细心。、下面来演示一下吧。在新建项目的时候注意选择，默认的是widget程序，只需要选择成Console程序就可以了。下面就是一直点下一步就行了。当使用cout时候却发现编译器报错，提示并没有声明cout究其原因是需要的头文件，因此需要引入头文件#include但是，依旧报错因为忘了他
一文读懂Python之math模块（30）... 跟着杰哥学Python python
一、模块简介math库是python提供的内置数学类函数库，不支持复数类型，仅支持整数和浮点数运算，math库一共提供了4个数字常数和44个函数二、相关概念1、圆周率π：无理数，圆的周长和直径的比值3.141592653589792、自然对数e：无理数，2.718281828459045三、常用方法四、代码示例
一文读懂Python之csv模块（32）... 跟着杰哥学Python python
一、csv模块简介csv模块可以进行CSV文件的读写操作，支持不同的分隔符、引用风格等。二、csv模块相关概念1、csv文件CSV文件的每一行代表一条记录，记录中的每个字段由逗号分隔。通常，第一行包含字段名（标题），接下来的每一行是对应字段的数据。示例：id,name,age,address,sex1,amo,18,cq,male2,paul,25,cq,male3,crystal,19,cd,f
KubeSphere v4.1.3 开源版发布
KubeSphere4.1.3开源版正式发布，本次更新包含多项功能优化和缺陷修复，进一步提升安全性与易用性。功能优化优化企业空间的级联删除逻辑企业空间级联删除策略从被动改为主动，避免误操作。调整部分平台角色、企业空间角色的授权规则进一步细化RBAC授权规则，安全性提升。优化Pod列表页的数据展示更直观的展示资源状态信息，提升易用性。允许用户关联多个身份提供程序用户可同时绑定多个身份提供程序（IdP
Json冲突崩溃问题 GoKu~ json
在一个项目中同时使用RapidJSON库后崩溃了。。。。---###**一、潜在问题分析**1.**符号重复定义（ODR冲突）**-**原因**：若您的库和上位机主程序均静态链接了RapidJSON（如编译为`.a`或`.lib`），或通过不同方式包含头文件（如不同版本的RapidJSON头文件），可能导致同一符号（如类、函数）被多次定义，引发链接错误（`multipledefinition`）。
Qt 计算程序运行时间 Small—强 qt 开发语言
一、精度为us级别1、方法一#include#includeQElapsedTimermstimer;mstimer.start()//你所要测试的代码块floattime=(double)mstimer.nsecsElapsed()/(double)1000000;qDebug()#includestructtimevaltpstart,tpend;floattimeuse;gettimeofd
jquery实现的jsonp掉java后台知了ing java jsonp jquery
什么是JSONP？先说说JSONP是怎么产生的：其实网上关于JSONP的讲解有很多，但却千篇一律，而且云里雾里，对于很多刚接触的人来讲理解起来有些困难，小可不才，试着用自己的方式来阐释一下这个问题，看看是否有帮助。 1、一个众所周知的问题，Ajax直接请求普通文件存在跨域无权限访问的问题，甭管你是静态页面、动态网页、web服务、WCF，只要是跨域请求，一律不准； 2、
Struts2学习笔记 caoyong struts2
SSH : Spring + Struts2 + Hibernate 三层架构(表示层,业务逻辑层,数据访问层) MVC模式 (Model View Controller) 分层原则:单向依赖，接口耦合 1、Struts2 = Struts + Webwork 2、搭建struts2开发环境 a>、到www.apac
SpringMVC学习之后台往前台传值方法满城风雨近重阳 springMVC
springMVC控制器往前台传值的方法有以下几种： 1.ModelAndView 通过往ModelAndView中存放viewName：目标地址和attribute参数来实现传参： ModelAndView mv=new ModelAndView(); mv.setViewName="success
WebService存在的必要性？一炮送你回车库 webservice
做Java的经常在选择Webservice框架上徘徊很久，Axis Xfire Axis2 CXF ，他们只有一个功能，发布HTTP服务然后用XML做数据传输。是的，他们就做了两个功能，发布一个http服务让客户端或者浏览器连接，接收xml参数并发送xml结果。当在不同的平台间传输数据时，就需要一个都能解析的数据格式。但是为什么要使用xml呢？不能使json或者其他通用数据
js年份下拉框 3213213333332132 java web ee
<div id="divValue">test...</div>测试 //年份 <select id="year"></select> <script type="text/javascript"> window.onload =
简单链式调用的实现技术归来朝歌方法调用链式反应编程思想
在编程中，我们可以经常遇到这样一种场景：一个实例不断调用它自身的方法，像一条链条一样进行调用这样的调用你可能在Ajax中，在页面中添加标签： $("<p>").append($("<span>").text(list[i].name)).appendTo("#result"); 也可能在HQ
JAVA调用.net 发布的webservice 接口 darkranger webservice
/** * @Title: callInvoke * @Description: TODO(调用接口公共方法) * @param @param url 地址 * @param @param method 方法 * @param @param pama 参数 * @param @return * @param @throws BusinessException
Javascript模糊查找 | 第一章循环不能不重视。 aijuans Way
最近受我的朋友委托用js+HTML做一个像手册一样的程序，里面要有可展开的大纲，模糊查找等功能。我这个人说实在的懒，本来是不愿意的，但想起了父亲以前教我要给朋友搞好关系，再加上这也可以巩固自己的js技术，于是就开始开发这个程序，没想到却出了点小问题，我做的查找只能绝对查找。具体的js代码如下： function search(){ var arr=new Array("my
狼和羊，该怎么抉择 atongyeye 工作
狼和羊，该怎么抉择在做一个链家的小项目，只有我和另外一个同事两个人负责，各负责一部分接口，我的接口写完，并全部测联调试通过。所以工作就剩下一下细枝末节的，工作就轻松很多。每天会帮另一个同事测试一些功能点，协助他完成一些业务型不强的工作。今天早上到公司没多久，领导就在QQ上给我发信息，让我多协助同事测试，让我积极主动些，有点责任心等等，我听了这话，心里面立马凉半截，首先一个领导轻易说
读取android系统的联系人拨号百合不是茶 android sqlite数据库内容提供者系统服务的使用
联系人的姓名和号码是保存在不同的表中,不要一下子把号码查询来,我开始就是把姓名和电话同时查询出来的,导致系统非常的慢关键代码: 1, 使用javabean操作存储读取到的数据 package com.example.bean; /** * * @author Admini
ORACLE自定义异常 bijian1013 数据库自定义异常
实例： CREATE OR REPLACE PROCEDURE test_Exception ( ParameterA IN varchar2, ParameterB IN varchar2, ErrorCode OUT varchar2 --返回值,错误编码 ) AS /*以下是一些变量的定义*/ V1 NUMBER; V2 nvarc
查看端号使用情况征客丶 windows
一、查看端口在windows命令行窗口下执行： >netstat -aon|findstr "8080" 显示结果： TCP 127.0.0.1:80 0.0.0.0:0 &
【Spark二十】运行Spark Streaming的NetworkWordCount实例 bit1129 wordcount
Spark Streaming简介 NetworkWordCount代码 /* * Licensed to the Apache Software Foundation (ASF) under one or more * contributor license agreements. See the NOTICE file distributed with
Struts2 与 SpringMVC的比较 BlueSkator struts2 spring mvc
1. 机制：spring mvc的入口是servlet，而struts2是filter，这样就导致了二者的机制不同。 2. 性能：spring会稍微比struts快。spring mvc是基于方法的设计，而sturts是基于类，每次发一次请求都会实例一个action，每个action都会被注入属性，而spring基于方法，粒度更细，但要小心把握像在servlet控制数据一样。spring
Hibernate在更新时，是可以不用session的update方法的(转帖） BreakingBad Hibernate update
地址：http://blog.csdn.net/plpblue/article/details/9304459 public void synDevNameWithItil() {Session session = null;Transaction tr = null;try{session = HibernateUtil.getSession();tr = session.beginTran
读《研磨设计模式》-代码笔记-观察者模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; import java.util.Observable; import java.util.Observer; /** * “观
重置MySQL密码 chenhbc mysql 重置密码忘记密码
如果你也像我这么健忘，把MySQL的密码搞忘记了，经过下面几个步骤就可以重置了（以Windows为例，Linux/Unix类似）： 1、关闭MySQL服务 2、打开CMD，进入MySQL安装目录的bin目录下，以跳过权限检查的方式启动MySQL mysqld --skip-grant-tables 3、新开一个CMD窗口，进入MySQL mysql -uroot
再谈系统论，控制论和信息论 comsci 设计模式生物能源企业应用领域模型
再谈系统论，控制论和信息论偶然看
oracle moving window size与 AWR retention period关系 daizj oracle
转自： http://tomszrp.itpub.net/post/11835/494147 晚上在做11gR1的一个awrrpt报告时,顺便想调整一下AWR snapshot的保留时间,结果遇到了ORA-13541这样的错误.下面是这个问题的发生和解决过程. SQL> select * from v$version; BANNER -------------------
Python版B树 dieslrae python
话说以前的树都用java写的,最近发现python有点生疏了,于是用python写了个B树实现,B树在索引领域用得还是蛮多了,如果没记错mysql的默认索引好像就是B树... 首先是数据实体对象,很简单,只存放key,value class Entity(object): '''数据实体''' def __init__(self,key,value)
C语言冒泡排序 dcj3sjt126com 算法
代码示例： # include <stdio.h> //冒泡排序 void sort(int * a, int len) { int i, j, t; for (i=0; i<len-1; i++) { for (j=0; j<len-1-i; j++) { if (a[j] > a[j+1]) // >表示升序
自定义导航栏样式 dcj3sjt126com 自定义
-(void)setupAppAppearance { [[UILabel appearance] setFont:[UIFont fontWithName:@"FZLTHK—GBK1-0" size:20]]; [UIButton appearance].titleLabel.font =[UIFont fontWithName:@"FZLTH
11.性能优化-优化-JVM参数总结 frank1234 jvm参数性能优化
1.堆 -Xms --初始堆大小 -Xmx --最大堆大小 -Xmn --新生代大小 -Xss --线程栈大小 -XX:PermSize --永久代初始大小 -XX:MaxPermSize --永久代最大值 -XX:SurvivorRatio --新生代和suvivor比例,默认为8 -XX:TargetSurvivorRatio --survivor可使用
nginx日志分割 for linux HarborChung nginx linux 脚本
nginx日志分割 for linux 默认情况下，nginx是不分割访问日志的，久而久之，网站的日志文件将会越来越大，占用空间不说，如果有问题要查看网站的日志的话，庞大的文件也将很难打开，于是便有了下面的脚本使用方法，先将以下脚本保存为 cutlog.sh，放在/root 目录下，然后给予此脚本执行的权限复制代码代码如下: chmo
Spring4新特性——泛型限定式依赖注入 jinnianshilongnian spring spring4 泛型式依赖注入
Spring4新特性——泛型限定式依赖注入 Spring4新特性——核心容器的其他改进 Spring4新特性——Web开发的增强 Spring4新特性——集成Bean Validation 1.1(JSR-349)到SpringMVC Spring4新特性——Groovy Bean定义DSL Spring4新特性——更好的Java泛型操作API Spring4新
centOS安装GCC和G++ liuxihope centos gcc
Centos支持yum安装，安装软件一般格式为yum install .......，注意安装时要先成为root用户。按照这个思路，我想安装过程如下：安装gcc：yum install gcc 安装g++： yum install g++ 实际操作过程发现，只能有gcc安装成功，而g++安装失败，提示g++ command not found。上网查了一下，正确安装应该
第13章 Ajax进阶（上） onestopweb Ajax
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
How to determine BusinessObjects service pack and fix pack blueoxygen BO
http://bukhantsov.org/2011/08/how-to-determine-businessobjects-service-pack-and-fix-pack/ The table below is helpful. Reference BOE XI 3.x 12.0.0. y BOE XI 3.0 12.0. x. y BO
Oracle里的自增字段设置 tomcat_oracle oracle
　大家都知道吧，这很坑，尤其是用惯了mysql里的自增字段设置，结果oracle里面没有的。oh，no 　　我用的是12c版本的，它有一个新特性，可以这样设置自增序列，在创建表是，把id设置为自增序列 create table t ( id 　　　　 number generated by default as identity (start with 1 increment b
Spring Security（01）——初体验 yang_winnie spring Security
Spring Security（01）——初体验博客分类： spring Security Spring Security入门安全认证首先我们为Spring Security专门建立一个Spring的配置文件，该文件就专门用来作为Spring Security的配置

python网络编程学习笔记（7）：HTML和XHTML解析(HTMLParser、BeautifulSoup)

你可能感兴趣的:(python,网络编程,程序,import,title)