aijie6150

python--爬虫入门（八）体验HTMLParser解析网页，网页抓取解析整合练习

原文链接： http://www.cnblogs.com/lmei/p/5338026.html

python系列均基于python3.4环境

基本概念

　　html.parser的核心是HTMLParser类。工作的流程是：当你feed给它一个类似HTML格式的字符串时，它会调用goahead方法向前迭代各个标签，并调用对应的parse_xxxx方法提取start_tag,tag,data,comment和end_tag等等标签信息和数据，然后调用对应的方法对这些抽取出来的内容进行处理。

几个比较常用的：

handle_startendtag  #处理开始标签和结束标签
handle_starttag     #处理开始标签，比如
handle_endtag       #处理结束标签，比如或者<……/>
handle_charref      #处理特殊字符串，就是以&#开头的，一般是内码表示的字符
handle_entityref    #处理一些特殊字符，以&开头的，比如  
handle_data         #处理data中间的那些数据
handle_comment      #处理注释
handle_decl         #处理
handle_pi           #处理形如的

　　@_@) 接下来，我们来体验下html.parser!!!

下面这一段将是用来做测试数据的html代码段：

<head>
    <meta charset="utf-8"/>
    <title>找找看 - 博客园title>
    <link rel="shortcut icon" href="/Content/Images/favicon.ico" type="image/x-icon"/>
    <meta content="技术搜索,IT搜索,程序搜索,代码搜索,程序员搜索引擎" name="keywords" />
    <meta content="面向程序员的专业搜索引擎。遇到技术问题怎么办，到博客园找找看..." name="description" />
    <link type="text/css" href="/Content/Style.css" rel="stylesheet" />
    <script src="http://common.cnblogs.com/script/jquery.js" type="text/javascript">script>
    <script src="/Scripts/Common.js" type="text/javascript">script>
    <script src="/Scripts/Home.js" type="text/javascript">script>
head>

体验三个基本函数：

def handle_starttag(self, tag, attrs)  #处理开始标签，比如
def handle_data(self, data)            #处理data中间的那些数据
def handle_endtag(self, tag)           #处理结束标签，比如或者<……/>

代码示例:(python3.4)

import html.parser as h

class MyHTMLParser(h.HTMLParser):

    a_t=False

    #处理开始标签，比如
    def handle_starttag(self, tag, attrs):
        print("开始一个标签:",tag)

        if str(tag).startswith("title"):
            self.a_t=True

        for attr in attrs:
            print("属性值：",attr)
       # print()

    #处理data中间的那些数据
    def handle_data(self, data):
        if self.a_t is True:
            print("得到的数据: ",data)

    #处理结束标签，比如或者<……/>
    def handle_endtag(self, tag):
        self.a_t=False
        print("结束一个标签:",tag)
        print()

p=MyHTMLParser()
mystr = '''
    
    找找看 - 博客园
    
    
    
    
    
    
    
'''
p.feed(mystr)
p.close()

运行结果：

C:\Python34\python.exe E:/pythone_workspace/mydemo/spider/h2.py
开始一个标签: head
开始一个标签: meta
属性值： ('charset', 'utf-8')
结束一个标签: meta

开始一个标签: title
得到的数据:  找找看 - 博客园
结束一个标签: title

开始一个标签: link
属性值： ('rel', 'shortcut icon')
属性值： ('href', '/Content/Images/favicon.ico')
属性值： ('type', 'image/x-icon')
结束一个标签: link

开始一个标签: meta
属性值： ('content', '技术搜索,IT搜索,程序搜索,代码搜索,程序员搜索引擎')
属性值： ('name', 'keywords')
结束一个标签: meta

开始一个标签: meta
属性值： ('content', '面向程序员的专业搜索引擎。遇到技术问题怎么办，到博客园找找看...')
属性值： ('name', 'description')
结束一个标签: meta

开始一个标签: link
属性值： ('type', 'text/css')
属性值： ('href', '/Content/Style.css')
属性值： ('rel', 'stylesheet')
结束一个标签: link

开始一个标签: script
属性值： ('src', 'http://common.cnblogs.com/script/jquery.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

开始一个标签: script
属性值： ('src', '/Scripts/Common.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

开始一个标签: script
属性值： ('src', '/Scripts/Home.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

结束一个标签: head


Process finished with exit code 0

View Result

-------@_@? html.parser------------------------------------------------------------

提问：除了上面列出的比较常用的功能之外？还有什么别的功能呢？

--------------------------------------------------------------------------------------

了解下html.parser还有什么功能！！！

代码如下：

import html.parser
help(html.parser)

运行结果：

C:\Python34\python.exe E:/pythone_workspace/mydemo/test.py
Help on module html.parser in html:

NAME
    html.parser - A parser for HTML and XHTML.

CLASSES
    _markupbase.ParserBase(builtins.object)
        HTMLParser
    
    class HTMLParser(_markupbase.ParserBase)
     |  Find tags and other markup and call handler functions.
     |  
     |  Usage:
     |      p = HTMLParser()
     |      p.feed(data)
     |      ...
     |      p.close()
     |  
     |  Start tags are handled by calling self.handle_starttag() or
     |  self.handle_startendtag(); end tags by self.handle_endtag().  The
     |  data between tags is passed from the parser to the derived class
     |  by calling self.handle_data() with the data as argument (the data
     |  may be split up in arbitrary chunks).  If convert_charrefs is
     |  True the character references are converted automatically to the
     |  corresponding Unicode character (and self.handle_data() is no
     |  longer split in chunks), otherwise they are passed by calling
     |  self.handle_entityref() or self.handle_charref() with the string
     |  containing respectively the named or numeric reference as the
     |  argument.
     |  
     |  Method resolution order:
     |      HTMLParser
     |      _markupbase.ParserBase
     |      builtins.object
     |  
     |  Methods defined here:
     |  
     |  __init__(self, strict=<object object at 0x00A50488>, *, convert_charrefs=<object object at 0x00A50488>)
     |      Initialize and reset this instance.
     |      
     |      If convert_charrefs is True (default: False), all character references
     |      are automatically converted to the corresponding Unicode characters.
     |      If strict is set to False (the default) the parser will parse invalid
     |      markup, otherwise it will raise an error.  Note that the strict mode
     |      and argument are deprecated.
     |  
     |  check_for_whole_start_tag(self, i)
     |      # Internal -- check to see if we have a complete starttag; return end
     |      # or -1 if incomplete.
     |  
     |  clear_cdata_mode(self)
     |  
     |  close(self)
     |      Handle any buffered data.
     |  
     |  error(self, message)
     |  
     |  feed(self, data)
     |      Feed data to the parser.
     |      
     |      Call this as often as you want, with as little or as much text
     |      as you want (may include '\n').
     |  
     |  get_starttag_text(self)
     |      Return full source of start tag: '<...>'.
     |  
     |  goahead(self, end)
     |      # Internal -- handle data as far as reasonable.  May leave state
     |      # and data to be processed by a subsequent call.  If 'end' is
     |      # true, force handling all data as if followed by EOF marker.
     |  
     |  handle_charref(self, name)
     |      # Overridable -- handle character reference
     |  
     |  handle_comment(self, data)
     |      # Overridable -- handle comment
     |  
     |  handle_data(self, data)
     |      # Overridable -- handle data
     |  
     |  handle_decl(self, decl)
     |      # Overridable -- handle declaration
     |  
     |  handle_endtag(self, tag)
     |      # Overridable -- handle end tag
     |  
     |  handle_entityref(self, name)
     |      # Overridable -- handle entity reference
     |  
     |  handle_pi(self, data)
     |      # Overridable -- handle processing instruction
     |  
     |  handle_startendtag(self, tag, attrs)
     |      # Overridable -- finish processing of start+end tag: 
     |  
     |  handle_starttag(self, tag, attrs)
     |      # Overridable -- handle start tag
     |  
     |  parse_bogus_comment(self, i, report=1)
     |      # Internal -- parse bogus comment, return length or -1 if not terminated
     |      # see http://www.w3.org/TR/html5/tokenization.html#bogus-comment-state
     |  
     |  parse_endtag(self, i)
     |      # Internal -- parse endtag, return end or -1 if incomplete
     |  
     |  parse_html_declaration(self, i)
     |      # Internal -- parse html declarations, return length or -1 if not terminated
     |      # See w3.org/TR/html5/tokenization.html#markup-declaration-open-state
     |      # See also parse_declaration in _markupbase
     |  
     |  parse_pi(self, i)
     |      # Internal -- parse processing instr, return end or -1 if not terminated
     |  
     |  parse_starttag(self, i)
     |      # Internal -- handle starttag, return end or -1 if not terminated
     |  
     |  reset(self)
     |      Reset this instance.  Loses all unprocessed data.
     |  
     |  set_cdata_mode(self, elem)
     |  
     |  unescape(self, s)
     |      # Internal -- helper to remove special character quoting
     |  
     |  unknown_decl(self, data)
     |  
     |  ----------------------------------------------------------------------
     |  Data and other attributes defined here:
     |  
     |  CDATA_CONTENT_ELEMENTS = ('script', 'style')
     |  
     |  ----------------------------------------------------------------------
     |  Methods inherited from _markupbase.ParserBase:
     |  
     |  getpos(self)
     |      Return current line number and offset.
     |  
     |  parse_comment(self, i, report=1)
     |      # Internal -- parse comment, return length or -1 if not terminated
     |  
     |  parse_declaration(self, i)
     |      # Internal -- parse declaration (for use by subclasses).
     |  
     |  parse_marked_section(self, i, report=1)
     |      # Internal -- parse a marked section
     |      # Override this to handle MS-word extension syntax if word]>content
     |  
     |  updatepos(self, i, j)
     |      # Internal -- update line number and offset.  This should be
     |      # called for each piece of data exactly once, in order -- in other
     |      # words the concatenation of all the input strings to this
     |      # function should be exactly the entire input.
     |  
     |  ----------------------------------------------------------------------
     |  Data descriptors inherited from _markupbase.ParserBase:
     |  
     |  __dict__
     |      dictionary for instance variables (if defined)
     |  
     |  __weakref__
     |      list of weak references to the object (if defined)

DATA
    __all__ = ['HTMLParser']

FILE
    c:\python34\lib\html\parser.py



Process finished with exit code 0

View Result

---------@_@！整合练习--------------------------------------------------------------

上一篇python--爬虫入门（七）urllib库初体验以及中文编码问题的探讨，提到抓取网页！

那么，我们将前面内容和上篇整合一下，练习练习

----------------------------------------------------------------------------------------

开始整合练习！！！

新建package，命名为spider，新建两个.py文件。

（1）HtmlParser.py代码如下：

import html.parser as h

class MyHTMLParser(h.HTMLParser):

    a_t=False

    #处理开始标签，比如
    def handle_starttag(self, tag, attrs):
        print("开始一个标签:",tag)

        if str(tag).startswith("title"):
            self.a_t=True

        for attr in attrs:
            print("属性值：",attr)
       # print()

    #处理data中间的那些数据
    def handle_data(self, data):
        if self.a_t is True:
            print("得到的数据: ",data)

    #处理结束标签，比如或者<……/>
    def handle_endtag(self, tag):
        self.a_t=False
        print("结束一个标签:",tag)
        print()

（2）Demo.py代码如下：

import urllib.request
import urllib.parse
import spider.HtmlParser

response=urllib.request.urlopen("http://zzk.cnblogs.com/b")
myStr=response.read().decode('UTF-8')
print("-----------网页源码-----------------")
print(myStr)
print("-----------开始解析网页-------------")
p=spider.HtmlParser.MyHTMLParser()
p.feed(myStr)
p.close()

运行Demo.py，结果显示：

C:\Python34\python.exe E:/pythone_workspace/mydemo/spider/Demo.py
-----------网页源码-----------------



<head>
    "utf-8"/>
    找找看 - 博客园    
    "shortcut icon" href="/Content/Images/favicon.ico" type="image/x-icon"/>
    "技术搜索,IT搜索,程序搜索,代码搜索,程序员搜索引擎" name="keywords" />
    "面向程序员的专业搜索引擎。遇到技术问题怎么办，到博客园找找看..." name="description" />
    "text/css" href="/Content/Style.css" rel="stylesheet" />
    
    
    
head>

    "top">
        
        "top_tabs">
            "http://www.cnblogs.com">« 博客园首页 
        
        id="span_userinfo" class="top_links">
        
    
    "clear: both">
    
    
        id="main">
            "logo_index">
                "http://zzk.cnblogs.com">
                    "找找看logo" src="/images/logo.gif" />
            
            "index_sozone">
                "index_tab">
                    "/n" οnclick="return  channelSwitch('n');">新闻
"tab_selected" href="/b" οnclick="return  channelSwitch('b');">博客                    "/k" οnclick="return  channelSwitch('k');">知识库
                    "/q" οnclick="return  channelSwitch('q');">博问
                
                "search_block">
                    "index_btn">
                        "button" class="btn_so_index" οnclick="Search();" value=" 找一下 " />
                        "help_link">"_blank" href="/help">帮助
                    
                    "text" οnkeydοwn="searchEnter(event);" class="input_index" name="w" id="w" />
                
            
        
        "footer">
            ©2004-2016 "http://www.cnblogs.com">博客园
        
    



-----------开始解析网页-------------
开始一个标签: html
开始一个标签: head
开始一个标签: meta
属性值： ('charset', 'utf-8')
结束一个标签: meta

开始一个标签: title
得到的数据:  找找看 - 博客园
结束一个标签: title

开始一个标签: link
属性值： ('rel', 'shortcut icon')
属性值： ('href', '/Content/Images/favicon.ico')
属性值： ('type', 'image/x-icon')
结束一个标签: link

开始一个标签: meta
属性值： ('content', '技术搜索,IT搜索,程序搜索,代码搜索,程序员搜索引擎')
属性值： ('name', 'keywords')
结束一个标签: meta

开始一个标签: meta
属性值： ('content', '面向程序员的专业搜索引擎。遇到技术问题怎么办，到博客园找找看...')
属性值： ('name', 'description')
结束一个标签: meta

开始一个标签: link
属性值： ('type', 'text/css')
属性值： ('href', '/Content/Style.css')
属性值： ('rel', 'stylesheet')
结束一个标签: link

开始一个标签: script
属性值： ('src', 'http://common.cnblogs.com/script/jquery.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

开始一个标签: script
属性值： ('src', '/Scripts/Common.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

开始一个标签: script
属性值： ('src', '/Scripts/Home.js')
属性值： ('type', 'text/javascript')
结束一个标签: script

结束一个标签: head

开始一个标签: body
开始一个标签: div
属性值： ('class', 'top')
开始一个标签: div
属性值： ('class', 'top_tabs')
开始一个标签: a
属性值： ('href', 'http://www.cnblogs.com')
结束一个标签: a

结束一个标签: div

开始一个标签: div
属性值： ('id', 'span_userinfo')
属性值： ('class', 'top_links')
结束一个标签: div

结束一个标签: div

开始一个标签: div
属性值： ('style', 'clear: both')
结束一个标签: div

开始一个标签: center
开始一个标签: div
属性值： ('id', 'main')
开始一个标签: div
属性值： ('class', 'logo_index')
开始一个标签: a
属性值： ('href', 'http://zzk.cnblogs.com')
开始一个标签: img
属性值： ('alt', '找找看logo')
属性值： ('src', '/images/logo.gif')
结束一个标签: img

结束一个标签: a

结束一个标签: div

开始一个标签: div
属性值： ('class', 'index_sozone')
开始一个标签: div
属性值： ('class', 'index_tab')
开始一个标签: a
属性值： ('href', '/n')
属性值： ('onclick', "return  channelSwitch('n');")
结束一个标签: a

开始一个标签: a
属性值： ('class', 'tab_selected')
属性值： ('href', '/b')
属性值： ('onclick', "return  channelSwitch('b');")
结束一个标签: a

开始一个标签: a
属性值： ('href', '/k')
属性值： ('onclick', "return  channelSwitch('k');")
结束一个标签: a

开始一个标签: a
属性值： ('href', '/q')
属性值： ('onclick', "return  channelSwitch('q');")
结束一个标签: a

结束一个标签: div

开始一个标签: div
属性值： ('class', 'search_block')
开始一个标签: div
属性值： ('class', 'index_btn')
开始一个标签: input
属性值： ('type', 'button')
属性值： ('class', 'btn_so_index')
属性值： ('onclick', 'Search();')
属性值： ('value', '\xa0找一下\xa0')
结束一个标签: input

开始一个标签: span
属性值： ('class', 'help_link')
开始一个标签: a
属性值： ('target', '_blank')
属性值： ('href', '/help')
结束一个标签: a

结束一个标签: span

结束一个标签: div

开始一个标签: input
属性值： ('type', 'text')
属性值： ('onkeydown', 'searchEnter(event);')
属性值： ('class', 'input_index')
属性值： ('name', 'w')
属性值： ('id', 'w')
结束一个标签: input

结束一个标签: div

结束一个标签: div

结束一个标签: div

开始一个标签: div
属性值： ('class', 'footer')
开始一个标签: a
属性值： ('href', 'http://www.cnblogs.com')
结束一个标签: a

结束一个标签: div

结束一个标签: center

结束一个标签: body

结束一个标签: html


Process finished with exit code 0

View Result

(@_@)Y，本篇分享到这里！待续~

转载于:https://www.cnblogs.com/lmei/p/5338026.html

卡尔曼滤波算法从理论到实践：在STM32中的嵌入式实现 DOMINICHZL STM32 算法 stm32 嵌入式硬件
摘要：卡尔曼滤波（KalmanFilter）是传感器数据融合领域的经典算法，在姿态解算、导航定位等嵌入式场景中广泛应用。本文将从公式推导、代码实现、参数调试三个维度深入解析卡尔曼滤波，并给出基于STM32硬件的完整工程案例。一、卡尔曼滤波核心思想1.1什么是卡尔曼滤波？卡尔曼滤波是一种最优递归估计算法，通过融合预测值（系统模型）与观测值（传感器数据），在噪声干扰环境下实现对系统状态的动态估计。其核
IEC104协议解析上海研博数据后端
一、IEC104协议核心特性与应用场景IEC104（IEC60870-5-104）是电力系统中广泛使用的通信协议，基于TCP/IP实现主从站（SCADA与RTU/变电站设备）的实时数据交互‌。其核心功能包括：1.四遥操作‌：‌遥测‌（YC）：采集电压、电流等模拟量数据（如类型标识0x0D）‌。遥信‌（YX）：监测开关状态等数字量信号（如M_SP_NA_1单点遥信）‌。遥控‌（YK）：远程控制断路器
固定表头、首列 —— uniapp、vue 项目菲力蒲LY vue.js uni-app 前端
项目实地：也可以在【微信小程序】搜索体验：xny.handbook另一个体验项目：官网一、效果展示二、代码展示（1）html部分股票代码建议投金额实际投金额建议股数实际股数◎原单价涨出-单价↑跌出+单价↓+○预赚+●实赚-○预赔-●实赔操作{{item.stockCode}}{{item.calculAdvsIvsMoney}}{{item.calculRealIvsMoney}}{{item.t
个人NAS方案，终端字符界面浏览器耶耶耶耶耶~ 其它 NAS
文章目录前言需求分析Linux配置smb服务-Linux服务端配置-windows客户端配置Linux安装流媒体服务在终端界面中浏览网页references前言个人nas需要满足的需求：可以通过浏览器访问nas中的文件、图片、视频支持像访问本地分区一样访问nas，对应用程序来讲文件在nas和本地是透明的需求分析硬件方面可用arm开发版+外置大硬盘软件方面采用Linux系统+一系列服务程序实现总结一
cpp-httplib 解析耶耶耶耶耶~ C++network http cpp
文章目录前言headerrequest-responsecpphttplib结构解析有意思的trick利用对象的生命周期判断fd是否健在阻塞式读写防止阻塞的方法listen,acceptcpp-httplib解析1.创建server_socket_fd2.监听事件循环3.处理单用户请求的函数process_and_close_socket4.获取clientsock的一些信息5.一些列令人窒息的c
【UI自动化框架设计思路】runner：如何运行框架小怪兽长大啦 UI自动化测试技术分享 ui 自动化运维
一、简介**功能：**自动化测试的运行器，负责整合UI识别与UI操作、读取配置文件并执行测试用例步骤。参数：config_pth：配置文件的路径（字符串类型）。说明：Runner类是整个自动化测试流程的核心入口点，通过加载配置文件并结合UI操作类，执行测试用例的步骤。它将配置管理、UI操作和测试执行整合为一个完整的自动化测试流程。二、代码解析1.init方法**功能：**初始化Runner类，加载
Android Glide 的显示与回调模块原理源码级深度剖析 &有梦想的咸鱼& Android Glide原理 Android开发大全 android glide
一、引言在当今的Android应用开发中，图片处理是一个至关重要的环节。从应用的图标展示到复杂的图片画廊，图片的加载和显示直接影响着用户体验。Glide作为一款功能强大且广泛使用的图片加载库，凭借其高效的性能、丰富的功能和简洁的API，成为了开发者的首选。其中，显示与回调模块更是Glide的核心部分，它负责将加载好的图片资源准确无误地显示在目标视图上，并在整个过程中提供各种回调机制，让开发者能够实
Android Glide 框架线程管理模块原理的源码级别深入分析 &有梦想的咸鱼& Android Glide原理 glide android
一、引言在现代的Android应用开发中，图片加载是一个常见且重要的功能。Glide作为一款广泛使用的图片加载框架，以其高效、灵活和易用的特点受到了开发者的青睐。其中，线程管理模块是Glide框架中至关重要的一部分，它负责协调不同线程之间的工作，确保图片的加载、解码、处理等操作能够高效、有序地进行。合理的线程管理可以提高应用的性能，避免主线程阻塞，从而为用户提供流畅的交互体验。本文将深入Glide
从零打造工业级智能二维码识别系统：基于PyQt5与ZXingCpp的实战指南蜡笔小新星 PyQt5 qt 开发语言 python 图像处理经验分享 pyqt 扫码读码解码
文章目录第一章：系统全景解析1.1实时识别工作流图解1.2界面布局与功能分区说明1.3代码文件结构树形图第二章：环境搭建与依赖管理2.1必需组件清单2.2虚拟环境配置步骤2.3摄像头硬件检测方法第三章：多线程视频采集3.1VideoThread类设计剖析3.2图像采集核心循环3.3线程安全停止机制3.4信号槽通信实例第四章：图像预处理流水线4.1预处理方法开关实现4.2自适应二值化算法4.3图像格
解析JSON的这 6 种方案（带示例）浪九天企业级开发效率提升 java spring spring boot spring cloud
目录1.使用Gson详细解释运用场景代码示例2.使用Jackson详细解释运用场景代码示例3.使用JSON.simple详细解释运用场景代码示例4.使用org.json详细解释运用场景代码示例5.使用FastJSON详细解释运用场景代码示例6.使用Moshi详细解释运用场景代码示例在Java中，有多种方案可以用于解析JSON数据，以下为你详细介绍6种常见的方案：1.使用Gson详细解释Gson是G
centos7使用yum网络安装
CentOS7Yum网络安装完全指南核心原理分析Yum（YellowdogUpdater,Modified）作为RPM系统的智能化软件包管理工具，通过以下机制实现自动化安装：依赖解析：自动识别软件包的前置依赖关系仓库同步：连接配置的软件仓库（repo）获取元数据事务处理：采用原子化操作保证安装/更新的完整性️全流程安装步骤详解步骤1：连接CentOS7服务器sshusername@server-i
面试了一个 7 年 Java 程序员，结果真让我哭笑不得。。。 java
大家好，我是R哥。作为一名资深的Java程序员、面试官，同时也做后端面试辅导，面试过许多人，也见过不少神奇的面试经历。但昨晚的一次模拟面试，真的让我哭笑不得。这兄弟来自92名校，毕业7年，干了几个中厂，想冲大厂，目标：40K，于是想模拟面试一下，体验下我们导师的实力。模拟面试之前，说自己八股文准备好了，面试完，竟然连许多常见的八股文都答不上来，而且他还很疑惑地问我：“你们的面试题是哪来的？怎么和我
拆解报告：SOAIY索爱GK9开放式耳机 zhangjiaofa 智能硬件拆解与分析报告 SOAIY 索爱GK9 开放式耳机拆解报告
开放式蓝牙耳机中，耳夹式设计凭借更加轻巧的体积，与眼镜不冲突的佩戴方式，赢得了许多用户的喜爱。近期也对目前市场上的11款热门产品进行了横评，从便携性、佩戴体验、音质等角度分享实际的使用体验。接下来将再次通过拆解，为大家分享内部的硬件配置信息。此次将要拆解的SOAIY索爱GK9开放式耳机外观上非常的轻巧便携，功能配置上搭载了12mm动圈喇叭，支持三频数字增强技术，支持DT定向传音技术，提供清晰的音质
tauri + vue3 如何实现在一个页面上局部加载外部网页？ bug菌¹ 全栈Bug调优(实战版)#CSDN问答解惑(全栈版)tauri vue3
本文收录于「Bug调优」专栏，主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案，希望能够助你一臂之力，帮你早日登顶实现财富自由；同时，欢迎大家关注&&收藏&&订阅！持续更新中，up！up！up！！问题描述 tauriv1（1.6左右）+vue3我想在vue3前端页面上在一个页面而不是window.open打开一个新的窗口去加载外部网页我想在一个页面中局部中间加载一个外部网页（试过
有趣的学习Python-第八篇：Python的“魔法盾牌”：错误与异常处理王盼达有趣的学习Python 学习 python 开发语言
在Python的魔法世界里，即使是经验丰富的魔法师也可能遇到一些“魔法失误”。这些失误分为两种：语法错误和异常。别担心，Python为你准备了一面强大的“魔法盾牌”，帮助你应对这些挑战。8.1语法错误：魔法咒语写错了语法错误就像是你在念魔法咒语时，不小心说错了单词。这是学习Python过程中最常见的问题。比如，你可能忘记在while循环后面加上冒号：whileTrueprint('Hellowor
深度解析：DETR的多尺度特征融合 AI天才研究院 AI大模型企业级应用开发实战 DeepSeek R1 &大数据AI人工智能大模型计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
"深度解析：DETR的多尺度特征融合"作者：禅与计算机程序设计艺术1.背景介绍1.1目标检测的挑战与传统方法的局限性目标检测是计算机视觉领域中的一个基本任务，其目标是识别图像或视频中所有感兴趣的目标，并确定它们的位置和类别。传统的目标检测方法，如FasterR-CNN和YOLO，通常依赖于预定义的锚框或候选区域来生成目标proposals。然而，这些方法存在一些固有的局限性：人工先验知识:锚框的设
浏览器自动复制插件-速记超人记事本V1.0 铁头大蚂蚁 javascript 开发语言 ecmascript
有这么一个需求，就是经常要复制某些网站的资料存到word、txt、或者excel中反复切换浏览器比较麻烦，思索再三，开发了一个浏览器插件取名为“速记超人记事本”功能如下：当我复制网页内容的时候会自动存储到浏览器插件中，如图：记录的内容自动存储到插件中，可以删除，编辑搜索，也可以导出为excel,txt格式这样我们就可以直接愉快的ctrl+c了，待我复制完成后，一键导出就可以了之前做了个1.0版本，
Java的定时器Timer和TimerTask使用全解析程序员总部 java java python 开发语言
在Java编程中，定时任务是一个常见的需求。无论是定期执行某些操作，还是在特定时间点执行任务，Java提供的Timer和TimerTask类就可以帮助我们轻松实现这些功能。今天将详细介绍如何使用这两个类，包括任务的执行和暂停。理解Timer和TimerTaskTimer是一个可以安排任务在指定的时间或周期性地执行的类。TimerTask是一个抽象类，表示要被定时执行的任务。使用Timer时，我们需
【UDS诊断（ClearDiagnosticInformation_0x84服务）测试用例CAPL代码全解析⑦】车端域控测试工程师测试用例汽车经验分享 CANoe 学习
ISO14229-1:2023UDS诊断【ClearDiagnosticInformation_0x84服务】_TestCase07作者：车端域控测试工程师更新日期：2025年03月11日关键词：UDS诊断协议、清除诊断信息服务、ClearDiagnosticInformation_0x84服务、ISO14229-1:2023TC84-007测试用例用例ID测试场景验证要点参考条款预期结果TC84
ES6语法详解八月五前端前端 es6
ES的全称是ECMAScript,它是由ECMA国际标准化组织,制定的一项脚本语言的标准化规范。ES6实际上是一个泛指，泛指ES2015及后续的版本。目录1.let关键字和const关键字let关键字const关键字2.解构赋值数组解构赋值对象解构赋值解构赋值用于传参3.字符串新增特性模板字符串字符串实例新增方法4.数值新增特性新增二进制和八进制表示方法Number构造函数本身新增方法和属性安全整
CentOS停更；阿里发布全新操作系统（Anolis OS）萌褚 Linux 运维
镜像下载、域名解析、时间同步请点击阿里云开源镜像站Linux系统对于Java程序员来说，就好比“乞丐手里的碗”，任何业务都离不开他的身影，因为服务端的广泛使用，也因此衍生出了各种不同的发行版，其中我个人用的最多、且最喜欢的就是CentOS；不幸的是，2021年底CentOS8宣布停止了维护；不过，喜欢CentOS的朋友们不用为此而难过；21年的云栖大会上，阿里云发布全新操作系统“龙蜥”（Anoli
零基础必看！CCF-GESP Python一级考点全解析：运算符这样学就对了奕澄羽邦 python 开发语言
第一章编程世界的基础工具：运算符三剑客在Python编程语言中，运算符如同魔法咒语般神奇。对于CCF-GESPPython一级考生而言，正确掌握比较运算符、算术运算符和逻辑运算符这三大基础工具，就相当于打开了数字世界的大门。这三个运算符家族共同构成了程序逻辑的核心骨架，其灵活组合能实现从简单计算到复杂判断的多样功能。1.1运算符分类图谱算术运算符：负责数字间的数学运算（+-*/%）比较运算符：用于
web前端期末大作业：婚纱网页主题网站设计——唯一旅拍婚纱公司网站HTML+CSS+JavaScript IT-司马青衫前端课程设计 html
‍静态网站的编写主要是用HTMLDⅣV+CSSJS等来完成页面的排版设计‍，一般的网页作业需要融入以下知识点：div布局、浮动定位、高级css、表格、表单及验证、js轮播图、音频视频Fash的应用、uli、下拉导航栏、鼠标划过效果等知识点，学生网页作业源码，制作水平和原创度都适合学习或交作业用，记得点赞。精彩专栏推荐【作者主页——获取更多优质源码】【web前端期末大作业——毕设项目精品实战案例(1
Vue初体验码上跑步 vue.js 前端
Vue基础Vue是什么？Vue是javascript的渐进式框架。Vue初识Vue工作时必须要创建一个Vue的实例，并且传入一个配置对象。root容器里的代码是符合html的语法但是新添加了一些Vue语法，在这些地方Vue会自动进行解析。root容器里的代码称为Vue模版。Vue实例和容器是一一对应的。在实际开发中只有一个Vue，配合组件使用。在vue里的插值{{}}内部只要写js表达式就能正常解
vue脚手架码上跑步 vue.js 前端 javascript
Vue脚手架脚手架是官方提供的标准化开发工具。下载配置//全局安装vue的脚手架npminstall@vue/cli-g//在项目目录下开启一个脚手架vuecreate‘项目名’//进入项目目录，直接运行npmrunserve1.vue.js与vue.runtime.xxx.js的区别：（1).vue.js是完整版的Vue，包含：核心功能+模板解析器。（2）.vue.runtime.xxx.js是
一文理清概念：数据中台(DMP)-数据仓库(DW)-数据湖(DL)-湖仓一体-数据治理(DG) Debug_Snail Hadoop Big Data Data Science 数据仓库大数据数据中台数据湖数据治理
数据仓库、数据中台、数据湖、湖仓一体是数据管理和分析领域的重要概念，它们在功能、架构和应用场景上各有特点，同时也在演进中相互关联和补充。以下是对它们的定义和关系的详细解析：1.核心概念（1）数据仓库（DataWarehouse,DW）定义：一种面向主题的、集成的、稳定的数据存储系统，用于支持企业决策分析（如BI、报表）。数据通常经过ETL（抽取、转换、加载）处理，以结构化形式存储，采用Schema
前端实现版本更新自动检测✅ 水煮白菜王前端 Vue JavaScript 前端 vue.js javascript
作者简介：水煮白菜王，一位资深前端劝退师文章专栏：前端专栏，记录一下平时在博客写作中，总结出的一些开发技巧和知识归纳总结✍。感谢支持目录一、背景二、实现原理2.1逻辑2.2一些好处三、具体实现3.1工程化封装3.2关键方法解析脚本哈希获取：对比逻辑：四、全部代码4.1vue34.2vue2五、注意事项与常见问题5.1可能出现的问题5.2浏览器兼容方案一、背景在现代Web应用中，部署前端版本更新后及
什么是XSS 藤原千花的败北 web漏洞 xss 前端 web安全网络安全
文章目录前言1.前端知识2.什么是XSS3.漏洞挖掘4.参考前言之前对XSS的理解就是停留在弹窗，认为XSS这种漏洞真的是漏洞吗？安全学习了蛮久了，也应该对XSS有更进一步的认识了。1.前端知识现代浏览器是一个高度复杂的软件系统，由多个核心组件协同工作，旨在高效、安全地呈现网页内容并执行交互逻辑。对一般用户来讲，其主要功能就是向服务器发出请求，在窗口中展示用户所选择的网络资源。这里所说的资源一般是
CSS入门指南：从零开始学习网页开发——（一）简介 GIS小白吃 css 学习前端
一、什么是CSS？CSS（CascadingStyleSheets，层叠样式表）是一种用于描述网页的外观和布局的样式表语言。它通过定义网页元素的样式（如颜色、字体、边距等）来与HTML内容分离，提升了网页的可维护性和设计的灵活性。CSS的核心目的是增强网页的表现力。早期的网页仅使用HTML来进行内容的展示，但由于HTML只能描述内容的结构，页面设计和内容变得难以管理。于是，CSS作为一种辅助技术应
异地收款被拦截？一文读懂聚合二维码风控解决方案畅联支付大数据支付经验分享笔记
随着移动支付的普及，许多商家使用聚合二维码实现多平台收款。但近期不少用户反馈"人在外地扫自家二维码付款却被风控拦截"，这不仅影响经营效率，还可能引发资金冻结风险。今天我们就来解析这个问题的成因和应对策略。一、为什么会触发风控？1.地理位置异常：支付系统发现收款设备与常用地址存在跨省变动（如北京商家突然在上海收款）2.交易行为突变：短期内出现远超日常交易量的资金流动3.信息不匹配：营业执照注册地与收
[黑洞与暗粒子]没有光的世界 comsci
无论是相对论还是其它现代物理学,都显然有个缺陷,那就是必须有光才能够计算但是,我相信,在我们的世界和宇宙平面中,肯定存在没有光的世界.... 那么,在没有光的世界,光子和其它粒子的规律无法被应用和考察,那么以光速为核心的 &nbs
jQuery Lazy Load 图片延迟加载 aijuans jquery
基于 jQuery 的图片延迟加载插件，在用户滚动页面到图片之后才进行加载。对于有较多的图片的网页，使用图片延迟加载，能有效的提高页面加载速度。版本： jQuery v1.4.4+ jQuery Lazy Load v1.7.2 注意事项：需要真正实现图片延迟加载，必须将真实图片地址写在 data-original 属性中。若 src
使用Jodd的优点 Kai_Ge jodd
1. 简化和统一 controller ，抛弃 extends SimpleFormController ，统一使用 implements Controller 的方式。 2. 简化 JSP 页面的 bind, 不需要一个字段一个字段的绑定。 3. 对 bean 没有任何要求，可以使用任意的 bean 做为 formBean。使用方法简介
jpa Query转hibernate Query 120153216 Hibernate
public List<Map> getMapList(String hql, Map map) { org.hibernate.Query jpaQuery = entityManager.createQuery(hql); if (null != map) { for (String parameter : map.keySet()) { jp
Django_Python3添加MySQL/MariaDB支持 2002wmj mariaDB
现状首先，[email protected] 中默认的引擎为 django.db.backends.mysql 。但是在Python3中如果这样写的话，会发现 django.db.backends.mysql 依赖 MySQLdb[5] ，而 MySQLdb 又不兼容 Python3 于是要找一种新的方式来继续使用MySQL。 MySQL官方的方案首先据MySQL文档[3]说，自从MySQL
在SQLSERVER中查找消耗IO最多的SQL 357029540 SQL Server
返回做IO数目最多的50条语句以及它们的执行计划。 select top 50 (total_logical_reads/execution_count) as avg_logical_reads, (total_logical_writes/execution_count) as avg_logical_writes, (tot
spring UnChecked 异常官方定义！ 7454103 spring
如果你接触过spring的事物管理！那么你必须明白 spring的非捕获异常！即 unchecked 异常！因为 spring 默认这类异常事物自动回滚！！ public static boolean isCheckedException(Throwable ex) { return !(ex instanceof RuntimeExcep
mongoDB 入门指南、示例 adminjun java mongodb 操作
一、准备工作 1、下载mongoDB 下载地址：http://www.mongodb.org/downloads 选择合适你的版本相关文档：http://www.mongodb.org/display/DOCS/Tutorial 2、安装mongoDB A、不解压模式：将下载下来的mongoDB-xxx.zip打开，找到bin目录，运行mongod.exe就可以启动服务，默
CUDA 5 Release Candidate Now Available aijuans CUDA
The CUDA 5 Release Candidate is now available at http://developer.nvidia.com/<wbr></wbr>cuda/cuda-pre-production. Now applicable to a broader set of algorithms, CUDA 5 has advanced fe
Essential Studio for WinRT网格控件测评 Axiba JavaScript html5
Essential Studio for WinRT界面控件包含了商业平板应用程序开发中所需的所有控件，如市场上运行速度最快的grid 和chart、地图、RDL报表查看器、丰富的文本查看器及图表等等。同时，该控件还包含了一组独特的库，用于从WinRT应用程序中生成Excel、Word以及PDF格式的文件。此文将对其另外一个强大的控件——网格控件进行专门的测评详述。网格控件功能 1、
java 获取windows系统安装的证书或证书链 bewithme windows
有时需要获取windows系统安装的证书或证书链，比如说你要通过证书来创建java的密钥库。有关证书链的解释可以查看此处。 public static void main(String[] args) { SunMSCAPI providerMSCAPI = new SunMSCAPI(); S
NoSQL数据库之Redis数据库管理(set类型和zset类型) bijian1013 redis 数据库 NoSQL
4.sets类型 Set是集合，它是string类型的无序集合。set是通过hash table实现的，添加、删除和查找的复杂度都是O(1)。对集合我们可以取并集、交集、差集。通过这些操作我们可以实现sns中的好友推荐和blog的tag功能。 sadd：向名称为key的set中添加元
异常捕获何时用Exception，何时用Throwable bingyingao
用Exception的情况 try { //可能发生空指针、数组溢出等异常 } catch (Exception e) {
【Kafka四】Kakfa伪分布式安装 bit1129 kafka
在http://bit1129.iteye.com/blog/2174791一文中，实现了单Kafka服务器的安装，在Kafka中，每个Kafka服务器称为一个broker。本文简单介绍下，在单机环境下Kafka的伪分布式安装和测试验证 1. 安装步骤 Kafka伪分布式安装的思路跟Zookeeper的伪分布式安装思路完全一样，不过比Zookeeper稍微简单些(不
Project Euler bookjovi haskell
Project Euler是个数学问题求解网站，网站设计的很有意思，有很多problem，在未提交正确答案前不能查看problem的overview，也不能查看关于problem的discussion thread，只能看到现在problem已经被多少人解决了，人数越多往往代表问题越容易。看看problem 1吧： Add all the natural num
Java-Collections Framework学习与总结-ArrayDeque BrokenDreams Collections
表、栈和队列是三种基本的数据结构，前面总结的ArrayList和LinkedList可以作为任意一种数据结构来使用，当然由于实现方式的不同，操作的效率也会不同。这篇要看一下java.util.ArrayDeque。从命名上看
读《研磨设计模式》-代码笔记-装饰模式-Decorator bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.io.BufferedOutputStream; import java.io.DataOutputStream; import java.io.FileOutputStream; import java.io.Fi
Maven学习(一) chenyu19891124 Maven私服
学习一门技术和工具总得花费一段时间，5月底6月初自己学习了一些工具，maven+Hudson+nexus的搭建，对于maven以前只是听说，顺便再自己的电脑上搭建了一个maven环境，但是完全不了解maven这一强大的构建工具，还有ant也是一个构建工具，但ant就没有maven那么的简单方便，其实简单点说maven是一个运用命令行就能完成构建，测试，打包，发布一系列功
[原创]JWFD工作流引擎设计----节点匹配搜索算法(用于初步解决条件异步汇聚问题) 补充 comsci 算法工作 PHP 搜索引擎嵌入式
本文主要介绍在JWFD工作流引擎设计中遇到的一个实际问题的解决方案，请参考我的博文"带条件选择的并行汇聚路由问题"中图例A2描述的情况(http://comsci.iteye.com/blog/339756),我现在把我对图例A2的一个解决方案公布出来，请大家多指点节点匹配搜索算法(用于解决标准对称流程图条件汇聚点运行控制参数的算法) 需要解决的问题：已知分支
Linux中用shell获取昨天、明天或多天前的日期 daizj linux shell 上几年昨天获取上几个月
在Linux中可以通过date命令获取昨天、明天、上个月、下个月、上一年和下一年 # 获取昨天 date -d 'yesterday' # 或 date -d 'last day' # 获取明天 date -d 'tomorrow' # 或 date -d 'next day' # 获取上个月 date -d 'last month' #
我所理解的云计算 dongwei_6688 云计算
在刚开始接触到一个概念时，人们往往都会去探寻这个概念的含义，以达到对其有一个感性的认知，在Wikipedia上关于“云计算”是这么定义的，它说： Cloud computing is a phrase used to describe a variety of computing co
YII CMenu配置 dcj3sjt126com yii
Adding id and class names to CMenu We use the id and htmlOptions to accomplish this. Watch. //in your view $this->widget('zii.widgets.CMenu', array( 'id'=>'myMenu', 'items'=>$this-&g
设计模式之静态代理与动态代理 come_for_dream 设计模式
静态代理与动态代理代理模式是java开发中用到的相对比较多的设计模式，其中的思想就是主业务和相关业务分离。所谓的代理设计就是指由一个代理主题来操作真实主题，真实主题执行具体的业务操作，而代理主题负责其他相关业务的处理。比如我们在进行删除操作的时候需要检验一下用户是否登陆，我们可以删除看成主业务，而把检验用户是否登陆看成其相关业务
【转】理解Javascript 系列 gcc2ge JavaScript
理解Javascript_13_执行模型详解摘要: 在《理解Javascript_12_执行模型浅析》一文中,我们初步的了解了执行上下文与作用域的概念，那么这一篇将深入分析执行上下文的构建过程，了解执行上下文、函数对象、作用域三者之间的关系。函数执行环境简单的代码:当调用say方法时，第一步是创建其执行环境，在创建执行环境的过程中，会按照定义的先后顺序完成一系列操作:1.首先会创建一个
Subsets II hcx2013 set
Given a collection of integers that might contain duplicates, nums, return all possible subsets. Note: Elements in a subset must be in non-descending order. The solution set must not conta
Spring4.1新特性——Spring缓存框架增强 jinnianshilongnian spring4
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
shell嵌套expect执行命令 liyonghui160com
一直都想把expect的操作写到bash脚本里,这样就不用我再写两个脚本来执行了,搞了一下午终于有点小成就,给大家看看吧. 系统:centos 5.x 1.先安装expect yum -y install expect 2.脚本内容: cat auto_svn.sh #!/bin/bash
Linux实用命令整理 pda158 linux
0. 基本命令　　linux 基本命令整理　　1. 压缩解压　　tar -zcvf a.tar.gz a #把a压缩成a.tar.gz 　　tar -zxvf a.tar.gz #把a.tar.gz解压成a 　　2. vim小结　　2.1 vim替换　　:m,ns/word_1/word_2/gc
独立开发人员通向成功的29个小贴士 shoothao 独立开发
概述：本文收集了关于独立开发人员通向成功需要注意的一些东西,对于具体的每个贴士的注解有兴趣的朋友可以查看下面标注的原文地址。明白你从事独立开发的原因和目的。保持坚持制定计划的好习惯。万事开头难，第一份订单是关键。培养多元化业务技能。提供卓越的服务和品质。谨小慎微。营销是必备技能。学会组织，有条理的工作才是最有效率的。 “独立
JAVA中堆栈和内存分配原理 uule java
1、栈、堆 1.寄存器：最快的存储区, 由编译器根据需求进行分配,我们在程序中无法控制.2. 栈：存放基本类型的变量数据和对象的引用，但对象本身不存放在栈中，而是存放在堆（new 出来的对象）或者常量池中（字符串常量对象存放在常量池中。）3. 堆：存放所有new出来的对象。4. 静态域：存放静态成员（static定义的）5. 常量池：存放字符串常量和基本类型常量（public static f

python--爬虫入门（八）体验HTMLParser解析网页，网页抓取解析整合练习

你可能感兴趣的:(python--爬虫入门（八）体验HTMLParser解析网页，网页抓取解析整合练习)