sxyyu1

史上最全的 Python 爬虫工具列表大全

这个列表包含与网页抓取和数据处理的Python库。

网络

[if !supportLists]· [endif]通用

[if !supportLists]§ [endif]urllib -网络库(stdlib)。

[if !supportLists]§ [endif]requests -网络库。

[if !supportLists]§ [endif]grab – 网络库（基于pycurl）。

[if !supportLists]§ [endif]pycurl – 网络库（绑定libcurl）。

[if !supportLists]§ [endif]urllib3 – Python HTTP库，安全连接池、支持文件post、可用性高。

[if !supportLists]§ [endif]httplib2 – 网络库。

[if !supportLists]§ [endif]RoboBrowser – 一个简单的、极具Python风格的Python库，无需独立的浏览器即可浏览网页。

[if !supportLists]§ [endif]MechanicalSoup -一个与网站自动交互Python库。

[if !supportLists]§ [endif]mechanize -有状态、可编程的Web浏览库。

[if !supportLists]§ [endif]socket – 底层网络接口(stdlib)。

[if !supportLists]§ [endif]Unirest for Python – Unirest是一套可用于多种语言的轻量级的HTTP库。

[if !supportLists]§ [endif]hyper – Python的HTTP/2客户端。

[if !supportLists]§ [endif]PySocks – SocksiPy更新并积极维护的版本，包括错误修复和一些其他的特征。作为socket模块的直接替换。

[if !supportLists]· [endif]异步

[if !supportLists]§ [endif]treq – 类似于requests的API（基于twisted）。

[if !supportLists]§ [endif]aiohttp – asyncio的HTTP客户端/服务器(PEP-3156)。

网络爬虫框架

[if !supportLists]· [endif]功能齐全的爬虫

[if !supportLists]§ [endif]grab – 网络爬虫框架（基于pycurl/multicur）。

[if !supportLists]§ [endif]scrapy – 网络爬虫框架（基于twisted），不支持Python3。

[if !supportLists]§ [endif]pyspider – 一个强大的爬虫系统。

[if !supportLists]§ [endif]cola – 一个分布式爬虫框架。

[if !supportLists]· [endif]其他

[if !supportLists]§ [endif]portia – 基于Scrapy的可视化爬虫。

[if !supportLists]§ [endif]restkit – Python的HTTP资源工具包。它可以让你轻松地访问HTTP资源，并围绕它建立的对象。

[if !supportLists]§ [endif]demiurge – 基于PyQuery的爬虫微框架。

HTML/XML解析器

[if !supportLists]· [endif]通用

[if !supportLists]§ [endif]lxml – C语言编写高效HTML/

XML处理库。支持XPath。

[if !supportLists]§ [endif]cssselect – 解析DOM树和CSS选择器。

[if !supportLists]§ [endif]pyquery – 解析DOM树和jQuery选择器。

[if !supportLists]§ [endif]BeautifulSoup – 低效HTML/ XML处理库，纯Python实现。

[if !supportLists]§ [endif]html5lib – 根据WHATWG规范生成HTML/ XML文档的DOM。该规范被用在现在所有的浏览器上。

[if !supportLists]§ [endif]feedparser – 解析RSS/ATOM feeds。

[if !supportLists]§ [endif]MarkupSafe – 为XML/HTML/XHTML提供了安全转义的字符串。

[if !supportLists]§ [endif]xmltodict – 一个可以让你在处理XML时感觉像在处理JSON一样的Python模块。

[if !supportLists]§ [endif]xhtml2pdf – 将HTML/CSS转换为PDF。

[if !supportLists]§ [endif]untangle – 轻松实现将XML文件转换为Python对象。

[if !supportLists]· [endif]清理

[if !supportLists]§ [endif]Bleach – 清理HTML（需要html5lib）。

[if !supportLists]§ [endif]sanitize – 为混乱的数据世界带来清明。

文本处理

用于解析和操作简单文本的库。

[if !supportLists]· [endif]通用

[if !supportLists]· [endif]difflib – （Python标准库）帮助进行差异化比较。

[if !supportLists]· [endif]Levenshtein – 快速计算Levenshtein距离和字符串相似度。

[if !supportLists]· [endif]fuzzywuzzy – 模糊字符串匹配。

[if !supportLists]· [endif]esmre – 正则表达式加速器。

[if !supportLists]· [endif]ftfy – 自动整理Unicode文本，减少碎片化。

[if !supportLists]· [endif]转换

[if !supportLists]· [endif]unidecode – 将Unicode文本转为ASCII。

[if !supportLists]· [endif]字符编码

[if !supportLists]· [endif]uniout – 打印可读字符，而不是被转义的字符串。

[if !supportLists]· [endif]chardet – 兼容 Python的2/3的字符编码器。

[if !supportLists]· [endif]xpinyin – 一个将中国汉字转为拼音的库。

[if !supportLists]· [endif]pangu.py – 格式化文本中CJK和字母数字的间距。

[if !supportLists]· [endif]Slug化

[if !supportLists]· [endif]awesome-slugify – 一个可以保留unicode的Python slugify库。

[if !supportLists]· [endif]python-slugify – 一个可以将Unicode转为ASCII的Python

slugify库。

[if !supportLists]· [endif]unicode-slugify – 一个可以将生成Unicode slugs的工具。

[if !supportLists]· [endif]pytils – 处理俄语字符串的简单工具（包括pytils.translit.slugify）。

[if !supportLists]· [endif]通用解析器

[if !supportLists]· [endif]PLY –lex和yacc解析工具的Python实现。

[if !supportLists]· [endif]pyparsing – 一个通用框架的生成语法分析器。

[if !supportLists]· [endif]人的名字

[if !supportLists]· [endif]python-nameparser -解析人的名字的组件。

[if !supportLists]· [endif]电话号码

[if !supportLists]· [endif]phonenumbers -解析，格式化，存储和验证国际电话号码。

[if !supportLists]· [endif]用户代理字符串

[if !supportLists]· [endif]python-user-agents – 浏览器用户代理的解析器。

[if !supportLists]· [endif]HTTP Agent Parser – Python的HTTP代理分析器。

特定格式文件处理

解析和处理特定文本格式的库。

[if !supportLists]· [endif]通用

[if !supportLists]· [endif]tablib – 一个把数据导出为XLS、CSV、JSON、YAML等格式的模块。

[if !supportLists]· [endif]textract – 从各种文件中提取文本，比如 Word、PowerPoint、PDF等。

[if !supportLists]· [endif]messytables – 解析混乱的表格数据的工具。

[if !supportLists]· [endif]rows – 一个常用数据接口，支持的格式很多（目前支持CSV，HTML，XLS，TXT – 将来还会提供更多！）。

[if !supportLists]· [endif]Office

[if !supportLists]· [endif]python-docx – 读取，查询和修改的Microsoft Word2007/2008的docx文件。

[if !supportLists]· [endif]xlwt / xlrd – 从Excel文件读取写入数据和格式信息。

[if !supportLists]· [endif]XlsxWriter – 一个创建Excel.xlsx文件的Python模块。

[if !supportLists]· [endif]xlwings – 一个BSD许可的库，可以很容易地在Excel中调用Python，反之亦然。

[if !supportLists]· [endif]openpyxl – 一个用于读取和写入的Excel2010 XLSX/ XLSM/ xltx/ XLTM文件的库。

[if !supportLists]· [endif]Marmir – 提取Python数据结构并将其转换为电子表格。

[if !supportLists]· [endif]PDF

[if !supportLists]· [endif]PDFMiner – 一个从PDF文档中提取信息的工具。

[if !supportLists]· [endif]PyPDF2 – 一个能够分割、合并和转换PDF页面的库。

[if !supportLists]· [endif]ReportLab – 允许快速创建丰富的PDF文档。

[if !supportLists]· [endif]pdftables – 直接从PDF文件中提取表格。

[if !supportLists]· [endif]Markdown

[if !supportLists]· [endif]Python-Markdown – 一个用Python实现的John Gruber的Markdown。

[if !supportLists]· [endif]Mistune – 速度最快，功能全面的Markdown纯Python解析器。

[if !supportLists]· [endif]markdown2 – 一个完全用Python实现的快速的Markdown。

[if !supportLists]· [endif]YAML

[if !supportLists]· [endif]PyYAML – 一个Python的YAML解析器。

[if !supportLists]· [endif]CSS

[if !supportLists]· [endif]cssutils – 一个Python的CSS库。

[if !supportLists]· [endif]ATOM/RSS

[if !supportLists]· [endif]feedparser – 通用的feed解析器。

[if !supportLists]· [endif]SQL

[if !supportLists]· [endif]sqlparse – 一个非验证的SQL语句分析器。

[if !supportLists]· [endif]HTTP

[if !supportLists]· [endif]http-parser – C语言实现的HTTP请求/响应消息解析器。

[if !supportLists]· [endif]微格式

[if !supportLists]· [endif]opengraph – 一个用来解析Open Graph协议标签的Python模块。

[if !supportLists]· [endif]可移植的执行体

[if !supportLists]· [endif]pefile – 一个多平台的用于解析和处理可移植执行体（即PE）文件的模块。

[if !supportLists]· [endif]PSD

[if !supportLists]· [endif]psd-tools – 将Adobe Photoshop PSD（即PE）文件读取到Python数据结构。

自然语言处理

处理人类语言问题的库。

[if !supportLists]· [endif]NLTK -编写Python程序来处理人类语言数据的最好平台。

[if !supportLists]· [endif]Pattern – Python的网络挖掘模块。他有自然语言处理工具，机器学习以及其它。

[if !supportLists]· [endif]TextBlob – 为深入自然语言处理任务提供了一致的API。是基于NLTK以及Pattern的巨人之肩上发展的。

[if !supportLists]· [endif]jieba – 中文分词工具。

[if !supportLists]· [endif]SnowNLP – 中文文本处理库。

[if !supportLists]· [endif]loso – 另一个中文分词库。

[if !supportLists]· [endif]genius – 基于条件随机域的中文分词。

[if !supportLists]· [endif]langid.py – 独立的语言识别系统。

[if !supportLists]· [endif]Korean – 一个韩文形态库。

[if !supportLists]· [endif]pymorphy2 – 俄语形态分析器（词性标注+词形变化引擎）。

[if !supportLists]· [endif]PyPLN – 用Python编写的分布式自然语言处理通道。这个项目的目标是创建一种简单的方法使用NLTK通过网络接口处理大语言库。

浏览器自动化与仿真

[if !supportLists]· [endif]selenium – 自动化真正的浏览器（Chrome浏览器，火狐浏览器，Opera浏览器，IE浏览器）。

[if !supportLists]· [endif]Ghost.py – 对PyQt的webkit的封装（需要PyQT）。

[if !supportLists]· [endif]Spynner – 对PyQt的webkit的封装（需要PyQT）。

[if !supportLists]· [endif]Splinter – 通用API浏览器模拟器（selenium web驱动，Django客户端，Zope）。

多重处理

[if !supportLists]· [endif]threading – Python标准库的线程运行。对于I/O密集型任务很有效。对于CPU绑定的任务没用，因为python GIL。

[if !supportLists]· [endif]multiprocessing – 标准的Python库运行多进程。

[if !supportLists]· [endif]celery – 基于分布式消息传递的异步任务队列/作业队列。

[if !supportLists]· [endif]concurrent-futures – concurrent-futures 模块为调用异步执行提供了一个高层次的接口。

异步

异步网络编程库

[if !supportLists]· [endif]asyncio – （在Python 3.4 +版本以上的 Python标准库）异步I/O，时间循环，协同程序和任务。

[if !supportLists]· [endif]Twisted – 基于事件驱动的网络引擎框架。

[if !supportLists]· [endif]Tornado – 一个网络框架和异步网络库。

[if !supportLists]· [endif]pulsar –Python事件驱动的并发框架。

[if !supportLists]· [endif]diesel – Python的基于绿色事件的I/O框架。

[if !supportLists]· [endif]gevent – 一个使用greenlet 的基于协程的Python网络库。

[if !supportLists]· [endif]eventlet – 有WSGI支持的异步框架。

[if !supportLists]· [endif]Tomorrow – 异步代码的奇妙的修饰语法。

队列

[if !supportLists]· [endif]celery – 基于分布式消息传递的异步任务队列/作业队列。

[if !supportLists]· [endif]huey – 小型多线程任务队列。

[if !supportLists]· [endif]mrq –Mr. Queue – 使用redis & Gevent 的Python分布式工作任务队列。

[if !supportLists]· [endif]RQ – 基于Redis的轻量级任务队列管理器。

[if !supportLists]· [endif]simpleq – 一个简单的，可无限扩展，基于Amazon SQS的队列。

[if !supportLists]· [endif]python-gearman – Gearman的Python API。

云计算

[if !supportLists]· [endif]picloud – 云端执行Python代码。

[if !supportLists]· [endif]dominoup.com – 云端执行R，Python和matlab代码。

电子邮件

电子邮件解析库

[if !supportLists]· [endif]flanker – 电子邮件地址和Mime解析库。

[if !supportLists]· [endif]Talon –Mailgun库用于提取消息的报价和签名。

网址和网络地址操作

解析/修改网址和网络地址库。

[if !supportLists]· [endif]URL

[if !supportLists]§ [endif]furl – 一个小的Python库，使得操纵URL简单化。

[if !supportLists]§ [endif]purl – 一个简单的不可改变的URL以及一个干净的用于调试和操作的API。

[if !supportLists]§ [endif]urllib.parse – 用于打破统一资源定位器（URL）的字符串在组件（寻址方案，网络位置，路径等）之间的隔断，为了结合组件到一个URL字符串，并将“相对URL”转化为一个绝对URL，称之为“基本URL”。

[if !supportLists]§ [endif]tldextract – 从URL的注册域和子域中准确分离TLD，使用公共后缀列表。

[if !supportLists]· [endif]网络地址

[if !supportLists]§ [endif]netaddr – 用于显示和操纵网络地址的Python库。

网页内容提取

提取网页内容的库。

[if !supportLists]· [endif]HTML页面的文本和元数据

[if !supportLists]§ [endif]newspaper – 用Python进行新闻提取、文章提取和内容策展。

[if !supportLists]§ [endif]html2text – 将HTML转为Markdown格式文本。

[if !supportLists]§ [endif]python-goose – HTML内容/文章提取器。

[if !supportLists]§ [endif]lassie – 人性化的网页内容检索工具

[if !supportLists]§ [endif]micawber – 一个从网址中提取丰富内容的小库。

[if !supportLists]§ [endif]sumy -一个自动汇总文本文件和HTML网页的模块

[if !supportLists]§ [endif]Haul – 一个可扩展的图像爬虫。

[if !supportLists]§ [endif]python-readability – arc90 readability工具的快速Python接口。

[if !supportLists]§ [endif]scrapely – 从HTML网页中提取结构化数据的库。给出了一些Web页面和数据提取的示例，scrapely为所有类似的网页构建一个分析器。

[if !supportLists]· [endif]视频

[if !supportLists]§ [endif]youtube-dl – 一个从YouTube下载视频的小命令行程序。

[if !supportLists]§ [endif]you-get – Python3的YouTube、优酷/ Niconico视频下载器。

[if !supportLists]· [endif]维基

[if !supportLists]§ [endif]WikiTeam – 下载和保存wikis的工具。

WebSocket

用于WebSocket的库。

[if !supportLists]· [endif]Crossbar – 开源的应用消息传递路由器（Python实现的用于Autobahn的WebSocket和WAMP）。

[if !supportLists]· [endif]AutobahnPython – 提供了WebSocket协议和WAMP协议的Python实现并且开源。

[if !supportLists]· [endif]WebSocket-for-Python – Python 2和3以及PyPy的WebSocket客户端和服务器库。

DNS解析

[if !supportLists]· [endif]dnsyo – 在全球超过1500个的DNS服务器上检查你的DNS。

[if !supportLists]· [endif]pycares – c-ares的接口。c-ares是进行DNS请求和异步名称决议的C语言库。

计算机视觉

[if !supportLists]· [endif]OpenCV – 开源计算机视觉库。

[if !supportLists]· [endif]SimpleCV – 用于照相机、图像处理、特征提取、格式转换的简介，可读性强的接口（基于OpenCV）。

[if !supportLists]· [endif]mahotas – 快速计算机图像处理算法（完全使用 C++ 实现），完全基于 numpy 的数组作为它的数据类型。

代理服务器

[if !supportLists]· [endif]s – 一个快速隧道代理，可帮你穿透防火墙（支持TCP和UDP，TFO，多用户和平滑重启，目的IP黑名单）。

[if !supportLists]· [endif]tproxy – tproxy是一个简单的TCP路由代理（第7层），基于Gevent，用Python进行配置。

其他Python工具列表

[if !supportLists]· [endif]awesome-python

[if !supportLists]· [endif]pycrumbs

[if !supportLists]· [endif]python-github-projects

[if !supportLists]· [endif]python_reference

[if !supportLists]· [endif]pythonidae

喜欢的朋友可以加QQ群813622576，群内有免费资料个大家一起交流学习哦！！

你可能感兴趣的:(史上最全的 Python 爬虫工具列表大全)

STLG_02_32_SQL Server常用函数魔都天健数据库 mssql
SQLServer提供了丰富的内置函数，用于处理数据、执行计算、格式化输出、日期操作等。以下是一些常用的SQLServer函数，按类别进行分类：1.聚合函数这些函数用于对一组值进行计算并返回单个值。COUNT()：计算行数。SELECTCOUNT(*)FROMEmployees;SUM()：计算数值列的总和。SELECTSUM(Quantity)FROMOrders;AVG()：计算数值列的平均值
保护你的会话令牌博文视点信息安全技术 ESAPI OWASP Top10 web Web WEB 会话安全
保护你的会话令牌通常我们会采取以下的措施来保护会话。1．采用强算法生成SessionID正如我们前面用WebScrab分析的那样，会话ID必须具有随机性和不可预测性。一般来说，会话ID的长度至少为128位。下面我们就拿常见的应用服务器Tomcat来说明如何配置会话ID的长度和生成算法。首先我们找到{TOMCAT_HOME}\conf\context.xml，然后加入下面一段设置➊定义会话ID的长度
使用Claude构建文本生成应用 asd5646asd easyui 前端 javascript python
在现代AI技术领域，Claude以其在广泛的文本任务中的优越表现受到广泛关注。无论是处理代码、撰写散文还是其他自然语言任务，Claude都能提供精准的文本输出。为了更好地实现这些功能，我们需要掌握Claude的API使用，以及如何编写有效的提示词。本文将深入探讨Claude的文本生成能力，通过可运行的代码示例，帮助您快速上手实际开发。技术背景介绍Claude是由Anthropic开发的一种智能文本
C# 解析 HTML 实战指南 code_shenbing C#c#html 开发语言
在网页开发和数据处理的场景中，经常需要从HTML文档里提取有用的信息。C#作为一门强大的编程语言，提供了丰富的工具和库来实现HTML的解析。这篇博客就带你深入了解如何使用C#高效地解析HTML。一、为什么要在C#中解析HTML在实际项目中，无论是进行网页数据采集、网页内容分析，还是开发网页爬虫，都离不开对HTML的解析。例如，电商平台可能需要从竞品网站上采集商品价格和库存信息；新闻聚合应用可能需要
C# 程序加密发布：守护知识产权的坚固防线 code_shenbing C#c#
在当今数字化时代，软件行业蓬勃发展，C#凭借其强大的功能和广泛的应用场景，成为众多开发者的首选语言之一。然而，随着软件的传播与使用，知识产权保护问题日益凸显。辛辛苦苦开发的C#程序，一旦被轻易破解和盗用，不仅会损害开发者的经济利益，还会打击创新积极性。因此，对C#程序进行加密发布，成为保障知识产权的关键举措。一、C#程序为何需要加密防止反编译：C#程序编译后生成的中间语言（IL）代码相对容易被反编
【Python】selenium结合js模拟鼠标点击、拦截弹窗、鼠标悬停方法汇总（使用 execute_script 执行点击的方法）翠花上酸菜 selenium 网络爬虫 python selenium javascript
我们在写selenium获取网络信息的时候，有时候我们会受到对方浏览器的监控，对方通过分析用户行为模式，如点击、滚动、停留时间等，网站可以识别出异常行为，进而对Selenium爬虫进行限制。这里我们可以加入JavaScript的使用。Selenium可以执行JavaScript，通过使用execute_script方法，来执行点击操作。它可以绕过一些Selenium直接操作元素时可能遇到的问题，比
SpringBoot应用自定义logback日志小二上酒8 spring boot logback java 数据库数据结构
概述默认情况下，SpringBoot内部使用logback作为系统日志实现的框架，将日志输出到控制台，不会写到日志文件。如果在application.properties或application.yml配置，这样只能配置简单的场景，保存路径、日志格式等。复杂的场景（区分info和error的日志、每天产生一个日志文件等）满足不了，只能自定义配置文件logback-spring.xml或者logba
BUUCTF gyctf_2020_borrowstack Bengd0u
第一个read的只能溢出0x10字节，也就是刚好覆盖返回地址，如果要ROP地方肯定不够所以栈迁移到bank，在那里ROP之前没遇到过这样的题，怎么迁过去我苦思冥想，最终还是看了wp，，用两个leave来控制rsp和rbp寄存器，太妙了leave是个伪代码，，分解开就是movrsp,rbppoprbp如果把栈构造成这样‘A’*0x60bank_addrleave_addr那么就有两次leavemov
C++的输入与输出 huang-jy c++开发语言
（作为小白刚开始学C++的第一篇学习笔记，很多深层面的知识都还不是很清楚）命令空间的使用与作用：作用：命令空间（namespace）：是用来组织代码并避免名字冲突的。std是C++标准库的命令空间，包含了很多常用的功能和对象，如cout、cin、vector等。如在C++中，std::cout是std命令空间下一个对象。使用：可以在全局中添加usingnamespacestd，也可以在main函数
一篇文章搞懂Spring AOP的历程 2401_89285805 spring sql java
publicMethodMatchergetMethodMatcher(){returnnewMethodMatcher(){@Overridepublicbooleanmatches(Methodmethod,ClasstargetClass){return“echo”.equals(method.getName())&&method.getParameterTypes().length==1&
Conda与Bash的完美融合：激活你的开发环境 2401_85760095 conda bash 开发语言
Conda与Bash的完美融合：激活你的开发环境在Python开发者的日常工作中，Conda不仅作为包管理器，更是一个强大的环境管理工具。为了在bashshell中使用Conda创建的环境，需要进行初始化操作。condainitbash命令正是为此设计的，它可以修改bash的配置文件，使得Conda的环境能够在每次启动bashshell时自动激活。本文将详细介绍如何使用condainitbash命
2024年最全selenium UI使用小技巧集合_python selenium 中 2401_84692253 程序员 selenium ui python
al=driver.switch_to.alertal.send_keys(“口罩太贵了”)al.accept()#确认对话框time.sleep(3)driver.quit()###鼠标事件用selenium做自动化，有时候会遇到需要模拟鼠标操作才能进行的情况，比如单击、双击、点击鼠标右键、拖拽等等。而selenium给我们提供了一个类来处理这类事件——ActionChainsActionCha
Mysql数据库和Sql语句 Jessica小戴数据库 mysql sql
数据库管理：sql语句：数据库用来增删改查的语句（重要）备份：数据库的数据进行备份主从复制、读写分离、高可用（重要）Mysql数据库和Sql语句一、Mysql数据库1、数据库：组织、存储、管理数据的仓库2、数据库的管理系统（DBMS）：实现对数据有效组织、管理和存取的系统软件3、数据库软件：mysql、oracle（大数据系统一般使用、大企业使用）、sql-server、MariaDB也是mysq
webUI自动化之基本框架搭建（python + selenium + unittest）_python ui自动框架 2401_84140628 2024年程序员学习自动化 python selenium
先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！因此收集整理了一份《2024年最新Python全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课
Spring框架深度解析：从IOC容器到AOP 吃个早饭 Spring Java spring java 后端
Spring框架深度解析：从IOC容器到AOP目录Spring框架深度解析：从IOC容器到AOP1.Spring的核心：IOC容器1.1什么是SpringIOC?1.2SpringIOC的好处1.3Spring中的DI是什么?2.SpringBean2.1什么是SpringBean?2.2SpringBean的作用域2.3Spring中的BeanFactory是什么?2.4Spring中的Fact
【2025年】全国CTF夺旗赛-从零基础入门到竞赛，看这一篇就稳了！白帽黑客鹏哥 linux 网络安全 web安全密码学 CTF夺旗赛
基于入门网络安全/黑客打造的：黑客&网络安全入门&进阶学习资源包目录一、CTF简介二、CTF竞赛模式三、CTF各大题型简介四、CTF学习路线4.1、初期1、html+css+js（2-3天）2、apache+php（4-5天）3、mysql（2-3天）4、python(2-3天)5、burpsuite（1-2天）4.2、中期1、SQL注入（7-8天）2、文件上传（7-8天）3、其他漏洞（14-15
数据结构——堆详解（c语言版）吹个泡泡（c++服务端开发）数据结构 c语言
目录1堆的概念和结构和性质1.1堆的概念和结构1.2堆的性质2堆的实现2.1堆的结构创建2.1堆的功能声明2.2堆的功能实现2.2.1打印堆数据2.2.2堆的初始化2.2.3交换函数2.2.4向下调整法2.2.5向上调整法2.2.6添加数据2.2.7删除数据2.2.8求堆的大小2.2.9获取堆顶数据2.2.10销毁堆3全部代码1堆的概念和结构和性质1.1堆的概念和结构如果有一个关键码的集合K={，
Vue3项目el-table表格动态合并相同数据单元格(可指定列+自定义合并) KT553 vue.js javascript 前端 elementui html 前端框架 typescript
一、先看效果：二、完整代码：import{reactive,onMounted}from'vue';//存放所有的表头一定要与tableData一致constcolFields=reactive(["city","name","life","ind","agr","eco"]);//存储合并单元格的开始位置constspanArr=reactive([]);//表格数据consttableData
在 Windows 下利用 `.pem` 文件配置 VS Code Remote-SSH 连接远程服务器微凉的衣柜系统设置 ssh 服务器运维
在日常开发中，使用VSCode的Remote-SSH插件可以方便地通过SSH连接远程服务器，实现本地开发与调试的无缝衔接。然而，在Windows系统下，如果使用.pem私钥文件，配置过程中可能会遇到权限或路径相关问题。本文将详细讲解如何在Windows下通过.pem文件配置VSCode连接远程服务器。1.准备工作在开始之前，请确保您已经具备以下条件：VSCode已安装，并安装了Remote-SSH
数据库管理语句分类旦沐已成舟数据库的日子数据库
1.SQL语句概述它是一种对关系型数据库中的数据进行定义和操作的语言，是大多数关系数据库管理系统所支持的工业标准语言。1.2SQL语句的分类分类说明涉及语句DDL数据定义语言create(创建)，alter（修改），delete（删除）等DCL数据控制语言grant（授权），revoke（权限回收），commit（提交），rollback（回滚）DML数据操作语言insert，delete，upd
【SpringBoot】【log】自定义logback日志配置 m0_74823561 spring boot logback java
前言：默认情况下，SpringBoot内部使用logback作为系统日志实现的框架，将日志输出到控制台，不会写到日志文件。如果在application.properties或application.yml配置，这样只能配置简单的场景，保存路径、日志格式等。复杂的场景（区分info和error的日志、每天产生一个日志文件等）满足不了，只能自定义配置文件logback-spring.xml。一、app
Nginx正向代理配置 KwokRoot Nginx Linux DevOps nginx 运维
Nginx正向代理默认只支持http协议，不支持https协议，需借助"ngx_http_proxy_connect_module"模块实现https正向代理，详情请参考：https://github.com/chobits/ngx_http_proxy_connect_module安装Nginx某些模块会用到的系统类库yuminstall-ydnfinstalllibxml2libxml2-de
【计算机视觉】人脸识别油泼辣子多加计算机视觉计算机视觉 opencv 人工智能
一、简介人脸识别是将图像或者视频帧中的人脸与数据库中的人脸进行对比，判断输入人脸是否与数据库中的某一张人脸匹配，即判断输入人脸是谁或者判断输入人脸是否是数据库中的某个人。人脸识别属于1：N的比对，输入人脸身份是1，数据库人脸身份数量为N，一般应用在办公室门禁，疑犯追踪；人脸验证属于1:1的比对，输入人脸身份为1，数据库中为同一人的数据，在安全领域应用比较多。一个完整的人脸识别流程主要包括人脸检测、
mybatis-plus: 多租户隔离机制玉成226 【MyBatis-plus】mybatis
文章目录一、TenantLineHandler1、介绍2、包含的方法二、简单实例三、实践1、实现TenantLineHandler接口一、TenantLineHandler1、介绍TenantLineHandler是Mybatis-Plus中用于处理多租户的接口，用于实现多租户数据隔离的具体逻辑。通过实现这个接口，我们可以自定义多租户的处理方式，例如根据不同的租户信息动态拼装SQL条件，实现数据的
Mybatis-plus 实现多租户业务实战 Java技术攻略 mybatis
前言今天来了解下如何使用mybatis-plus实现我们的多租户实战，从多租户概念引入到SpringBoot项目中的实际应用。这块也之前已经在项目中应用，将这部分功能摘取出来进行demo演示。一、多租户概念1.1云服务模式要想了解下多租户的概念，我们需要了解下几种云服务模式，常见的有IAAS、PAAS、SAAS等服务。而我们的多租户是SAAS服务特有的产物。SAAS服务是部署在云端，客户可以同时使
Python: Python 多版本管理 mikes zhang python python 大数据 pip
PythonLauncherPythonLauncher是PythonforWindows才有的功能.(注一)PythonLauncher的出现,让我们可以不必依赖环境变数PATH的设定来简化python执行档的使用,同时也简化了多个版本的python同时存在时的管理工作.(试想如果你的系统里安装3或4个python时,你到底要如何指定使用其中一个版本?)PythonLauncherpy.exe是
NAT静态原理NAT动态原理NAPT原理 aicc221016 计算机网络网络智能路由器
现网:环境dev开发环境，开发专用sit:测试环境。测试人员用的，需要的测试的代码，程序之类的都会在测试环境运行。pre:预生产环境。在版本最后上线之前会在预生产最后执行一遍。确保万无一失(狗头)运维，也有测试。prd:生产环境/现网:10运维人员。数据库3DBA数据库运维。100.00129.9999991201361.36私网访问公网的过程:百度192.168.233.10(主机ip)180.
MySQL字段约束条件,外键约束条件,表关系 Yietong309 MySQL数据库 mysql 数据库开发语言
目录字符编码与配置文件统一字符编码存储引擎修改存储引擎的方式自定义选项存储引擎不同存储引擎产生的表文件有几个?MERGEInnoDBArchiveBLACKHOLEblackhole与memory存取数据的特征Blackhole：丢弃写操作，读操作会返回空内容Memory：置于内存的表创建表的完整语法字段类型之整型字段类型之浮点型字段类型之字符类型字段类型之枚举与集合字段类型之日期类型约束条件自增
GPU介绍之GPU监控中，如何确定GPU忙碌程度借雨醉东风热点追踪人工智能大数据
关注我，持续分享逻辑思维&管理思维&面试题；可提供大厂面试辅导、及定制化求职/在职/管理/架构辅导；推荐专栏《10天学会使用asp.net编程AI大模型》，目前已完成所有内容。一顿烧烤不到的费用，让人能紧跟时代的浪潮。从普通网站，到公众号、小程序，再到AI大模型网站。干货满满。学成后可接项目赚外快，绝对划算。不仅学会如何编程，还将学会如何将AI技术应用到实际问题中，为您的职业生涯增添一笔宝贵的财富
HarmonyOS状态管理之组件通讯秃顶老男孩. harmonyos 华为 ui
状态管理（组件通讯）1：概述在使用状态管理之前，我们所构建的页面大多数为静态页面，如果希望构建一个动态的，有交互的界面，就要引用‘状态’的概念状态的概念：在ArkUI框架中，UI是程序运行的结果，用户构建了一个UI模型，其中运行时的状态为参数，当参数改变时，UI作为返回的结果，也会随之发生了改变，这些运行的变化所带来的UI重新渲染，在ArkUI中统称为状态管理机制（什么是状态管理机制）自定义组件拥
scala的option和some 矮蛋蛋编程 scala
原文地址： http://blog.sina.com.cn/s/blog_68af3f090100qkt8.html 对于学习 Scala 的 Java™ 开发人员来说，对象是一个比较自然、简单的入口点。在本系列前几期文章中，我介绍了 Scala 中一些面向对象的编程方法，这些方法实际上与 Java 编程的区别不是很大。我还向您展示了 Scala 如何重新应用传统的面向对象概念，找到其缺点
NullPointerException Cb123456 android BaseAdapter
java.lang.NullPointerException: Attempt to invoke virtual method 'int android.view.View.getImportantForAccessibility()' on a null object reference 出现以上异常.然后就在baidu上
PHP使用文件和目录天子之骄 php文件和目录读取和写入 php验证文件 php锁定文件
PHP使用文件和目录 1.使用include()包含文件 (1)：使用include()从一个被包含文档返回一个值 (2)：在控制结构中使用include() include_once()函数需要一个包含文件的路径，此外，第一次调用它的情况和include()一样，如果在脚本执行中再次对同一个文件调用，那么这个文件不会再次包含。在php.ini文件中设置
SQL SELECT DISTINCT 语句何必如此 sql
SELECT DISTINCT 语句用于返回唯一不同的值。 SQL SELECT DISTINCT 语句在表中，一个列可能会包含多个重复值，有时您也许希望仅仅列出不同（distinct）的值。 DISTINCT 关键词用于返回唯一不同的值。 SQL SELECT DISTINCT 语法 SELECT DISTINCT column_name,column_name F
java冒泡排序 3213213333332132 java 冒泡排序
package com.algorithm; /** * @Description 冒泡 * @author FuJianyong * 2015-1-22上午09:58:39 */ public class MaoPao { public static void main(String[] args) { int[] mao = {17,50,26,18,9,10
struts2.18 +json,struts2-json-plugin-2.1.8.1.jar配置及问题！ 7454103 DAO spring Ajax json qq
struts2.18 出来有段时间了！（貌似是稳定版）闲时研究下下！貌似 sruts2 搭配 json 做 ajax 很吃香！实践了下下！不当之处请绕过！呵呵网上一大堆 struts2+json 不过大多的json 插件都是 jsonplugin.34.jar strut
struts2 数据标签说明 darkranger jsp bean struts servlet Scheme
数据标签主要用于提供各种数据访问相关的功能，包括显示一个Action里的属性，以及生成国际化输出等功能数据标签主要包括： action ：该标签用于在JSP页面中直接调用一个Action，通过指定executeResult参数，还可将该Action的处理结果包含到本页面来。 bean ：该标签用于创建一个javabean实例。如果指定了id属性，则可以将创建的javabean实例放入Sta
链表.简单的链表节点构建 aijuans 编程技巧
/*编程环境WIN-TC*/ #include "stdio.h" #include "conio.h" #define NODE(name, key_word, help) \ Node name[1]={{NULL, NULL, NULL, key_word, help}} typedef struct node { &nbs
tomcat下jndi的三种配置方式 avords tomcat
jndi(Java Naming and Directory Interface，Java命名和目录接口)是一组在Java应用中访问命名和目录服务的API。命名服务将名称和对象联系起来，使得我们可以用名称访问对象。目录服务是一种命名服务，在这种服务里，对象不但有名称，还有属性。 tomcat配置
关于敏捷的一些想法 houxinyou 敏捷
从网上看到这样一句话：“敏捷开发的最重要目标就是：满足用户多变的需求，说白了就是最大程度的让客户满意。” 感觉表达的不太清楚。感觉容易被人误解的地方主要在“用户多变的需求”上。第一种多变，实际上就是没有从根本上了解了用户的需求。用户的需求实际是稳定的，只是比较多，也比较混乱，用户一般只能了解自己的那一小部分，所以没有用户能清楚的表达出整体需求。而由于各种条件的，用户表达自己那一部分时也有
富养还是穷养，决定孩子的一生 bijian1013 教育人生
是什么决定孩子未来物质能否丰盛？为什么说寒门很难出贵子，三代才能出贵族？真的是父母必须有钱，才能大概率保证孩子未来富有吗？-----作者：@李雪爱与自由事实并非由物质决定，而是由心灵决定。一朋友富有而且修养气质很好，兄弟姐妹也都如此。她的童年时代，物质上大家都很贫乏，但妈妈总是保持生活中的美感，时不时给孩子们带回一些美好小玩意，从来不对孩子传递生活艰辛、金钱来之不易、要懂得珍惜
oracle 日期时间格式转化征客丶 oracle
oracle 系统时间有 SYSDATE 与 SYSTIMESTAMP； SYSDATE：不支持毫秒，取的是系统时间； SYSTIMESTAMP：支持毫秒，日期，时间是给时区转换的，秒和毫秒是取的系统的。日期转字符窜：一、不取毫秒： TO_CHAR(SYSDATE, 'YYYY-MM-DD HH24:MI:SS') 简要说明， YYYY 年 MM 月
【Scala六】分析Spark源代码总结的Scala语法四 bit1129 scala
1. apply语法 FileShuffleBlockManager中定义的类ShuffleFileGroup，定义： private class ShuffleFileGroup(val shuffleId: Int, val fileId: Int, val files: Array[File]) { ... def apply(bucketId
Erlang中有意思的bug bookjovi erlang
代码中常有一些很搞笑的bug，如下面的一行代码被调用两次（Erlang beam） commit f667e4a47b07b07ed035073b94d699ff5fe0ba9b Author: Jovi Zhang <[email protected]> Date: Fri Dec 2 16:19:22 2011 +0100 erts:
移位打印10进制数转16进制-2008-08-18 ljy325 java 基础
/** * Description 移位打印10进制的16进制形式 * Creation Date 15-08-2008 9:00 * @author 卢俊宇 * @version 1.0 * */ public class PrintHex { // 备选字符 static final char di
读《研磨设计模式》-代码笔记-组合模式 bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; abstract class Component { public abstract void printStruct(Str
利用cmd命令将.class文件打包成jar chenyu19891124 cmd jar
cmd命令打jar是如下实现：在运行里输入cmd，利用cmd命令进入到本地的工作盘符。(如我的是D盘下的文件有此路径 D:\workspace\prpall\WEB-INF\classes) 现在是想把D:\workspace\prpall\WEB-INF\classes路径下所有的文件打包成prpall.jar。然后继续如下操作： cd D: 回车 cd workspace/prpal
[原创]JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 comsci eclipse 设计模式算法工作 swing
JWFD v0.96 工作流系统二次开发包 for Eclipse 简要说明 &nb
SecureCRT右键粘贴的设置 daizj secureCRT 右键粘贴
一般都习惯鼠标右键自动粘贴的功能，对于SecureCRT6.7.5 ，这个功能也已经是默认配置了。老版本的SecureCRT其实也有这个功能，只是不是默认设置，很多人不知道罢了。菜单： Options->Global Options ...->Terminal 右边有个Mouse的选项块。 Copy on Select Paste on Right/Middle
Linux 软链接和硬链接 dongwei_6688 linux
1.Linux链接概念Linux链接分两种，一种被称为硬链接（Hard Link），另一种被称为符号链接（Symbolic Link）。默认情况下，ln命令产生硬链接。【硬连接】硬连接指通过索引节点来进行连接。在Linux的文件系统中，保存在磁盘分区中的文件不管是什么类型都给它分配一个编号，称为索引节点号(Inode Index)。在Linux中，多个文件名指向同一索引节点是存在的。一般这种连
DIV底部自适应 dcj3sjt126com JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
Centos6.5使用yum安装mysql——快速上手必备 dcj3sjt126com mysql
第1步、yum安装mysql [root@stonex ~]# yum -y install mysql-server 安装结果： Installed: mysql-server.x86_64 0:5.1.73-3.el6_5 &nb
如何调试JDK源码 frank1234 jdk
相信各位小伙伴们跟我一样，想通过JDK源码来学习Java，比如collections包，java.util.concurrent包。可惜的是sun提供的jdk并不能查看运行中的局部变量，需要重新编译一下rt.jar。下面是编译jdk的具体步骤： 1.把C:\java\jdk1.6.0_26\sr
Maximal Rectangle hcx2013 max
Given a 2D binary matrix filled with 0's and 1's, find the largest rectangle containing all ones and return its area. public class Solution { public int maximalRectangle(char[][] matrix)
Spring MVC测试框架详解——服务端测试 jinnianshilongnian spring mvc test
随着RESTful Web Service的流行，测试对外的Service是否满足期望也变的必要的。从Spring 3.2开始Spring了Spring Web测试框架，如果版本低于3.2，请使用spring-test-mvc项目（合并到spring3.2中了）。 Spring MVC测试框架提供了对服务器端和客户端（基于RestTemplate的客户端）提供了支持。 &nbs
Linux64位操作系统（CentOS6.6）上如何编译hadoop2.4.0 liyong0802 hadoop
一、准备编译软件 1.在官网下载jdk1.7、maven3.2.1、ant1.9.4，解压设置好环境变量就可以用。环境变量设置如下：（1）执行vim /etc/profile （2）在文件尾部加入: export JAVA_HOME=/home/spark/jdk1.7 export MAVEN_HOME=/ho
StatusBar 字体白色 pangyulei status
[[UIApplication sharedApplication] setStatusBarStyle:UIStatusBarStyleLightContent]; /*you'll also need to set UIViewControllerBasedStatusBarAppearance to NO in the plist file if you use this method
如何分析Java虚拟机死锁 sesame java thread oracle 虚拟机 jdbc
英文资料： Thread Dump and Concurrency Locks Thread dumps are very useful for diagnosing synchronization related problems such as deadlocks on object monitors. Ctrl-\ on Solaris/Linux or Ctrl-B
位运算简介及实用技巧（一）：基础篇 tw_wangzhengquan 位运算
http://www.matrix67.com/blog/archives/263 去年年底写的关于位运算的日志是这个Blog里少数大受欢迎的文章之一，很多人都希望我能不断完善那篇文章。后来我看到了不少其它的资料，学习到了更多关于位运算的知识，有了重新整理位运算技巧的想法。从今天起我就开始写这一系列位运算讲解文章，与其说是原来那篇文章的follow-up，不如说是一个r
jsearch的索引文件结构 yangshangchuan 搜索引擎 jsearch 全文检索信息检索 word分词
jsearch是一个高性能的全文检索工具包，基于倒排索引，基于java8，类似于lucene，但更轻量级。 jsearch的索引文件结构定义如下： 1、一个词的索引由=分割的三部分组成：第一部分是词第二部分是这个词在多少