qq_27446553

python 安全编码&代码审计

0x00 前言

现在一般的web开发框架安全已经做的挺好的了，比如大家常用的django，但是一些不规范的开发方式还是会导致一些常用的安全问题，下面就针对这些常用问题做一些总结。代码审计准备部分见《php代码审计》，这篇文档主要讲述各种常用错误场景，基本上都是咱们自己的开发人员犯的错误，敏感信息已经去除。

0x01 XSS

未对输入和输出做过滤，场景：

 
         def 
         xss_test(request): 
        
         name  
         = 
          request.GET[ 
         'name' 
         ] 
        
         return 
         HttpResponse( 
         'hello %s' 
         % 
         (name))

在代码中一搜，发现有大量地方使用，比较正确的使用方式如下：

 
         def 
         xss_test(request): 
        
         name  
         = 
          request.GET[ 
         'name' 
         ] 
        
         #return HttpResponse('hello %s' %(name)) 
        
         return 
         render_to_response( 
         'hello.html' 
         , { 
         'name' 
         :name})

更好的就是对输入做限制，比如说一个正则范围，输出使用正确的api或者做好过滤。

0x02 CSRF

对系统中一些重要的操作要做CSRF防护，比如登录，关机，扫描等。django 提供CSRF中间件django.middleware.csrf.CsrfViewMiddleware,写入到settings.py的中间件即可。另外再在函数前加上@csrf_exempt修饰器。

0x03 命令注入

审计代码过程中发现了一些编写代码的不好的习惯，体现最严重的就是在命令注入方面，本来python自身的一些函数库就能完成的功能，偏偏要调用os.system来通过shell 命令执行来完成，老实说最烦这种写代码的啦。下面举个简单的例子：

 
         def 
         myserve(request, filename, dirname): 
        
         re  
         = 
          serve(request 
         = 
         request,path 
         = 
         filename,document_root 
         = 
         dirname,show_indexes 
         = 
         True 
         ) 
        
         filestr 
         = 
         'authExport.dat' 
        
         re[ 
         'Content-Disposition' 
         ]  
         = 
          'attachment; filename="' 
         + 
          urlquote(filestr)  
         + 
         '"' 
         fullname 
         = 
         os.path.join(dirname,filename) 
        
         os.system( 
         'sudo rm -f %s' 
         % 
         fullname) 
        
         return 
         re

很显然这段代码是存在问题的，因为fullname是用户可控的。正确的做法是不使用os.system接口，改成python自有的库函数，这样就能避免命令注入。python的三种删除文件方式：

（1）shutil.rmtree 删除一个文件夹及所有文件  
（2）os.rmdir 删除一个空目录  
（3）os.remove，unlink 删除一个文件

使用了上述接口之后还得注意不能穿越目录，不然整个系统都有可能被删除了。常见的存在命令执行风险的函数如下：

 
         os.system,os.popen,os.spaw 
         * 
         ,os. 
         exec 
         * 
         ,os. 
         open 
         ,os.popen 
         * 
         ,commands.call,commands.getoutput,Popen 
         *

推荐使用subprocess模块，同时确保shell=True未设置，否则也是存在注入风险的。

0x04 sql注入

如果是使用django的api去操作数据库就应该不会有sql注入了，但是因为一些其他原因使用了拼接sql，就会有sql注入风险。下面贴一个有注入风险的例子：

 
         def 
         getUsers(user_id 
         = 
         None 
         ): 
        
         conn  
         = 
          psycopg2.connect( 
         "dbname='××' user='××' host='' password=''" 
         ) 
        
         cur  
         = 
          conn.cursor(cursor_factory 
         = 
         psycopg2.extras.DictCursor) 
        
         if 
         user_id 
         = 
         = 
         None 
         : 
        
         str 
         = 
          'select distinct * from auth_user' 
        
         else 
         : 
        
         str 
         = 
         'select distinct * from auth_user where id=%d' 
         % 
         user_id 
        
         res  
         = 
          cur.execute( 
         str 
         ) 
        
         res  
         = 
          cur.fetchall() 
        
         conn.close() 
        
         return 
         res

像这种sql拼接就有sql注入问题，正常情况下应该使用django的数据库api，如果实在有这方面的需求，可以按照如下方式写：

 
         def 
         user_contacts(request): 
        
         user  
         = 
          request.GET[ 
         'username' 
         ] 
        
         sql  
         = 
          "SELECT * FROM user_contacts WHERE username = %s" 
        
         cursor  
         = 
          connection.cursor() 
        
         cursor.execute(sql, [user]) 
        
         # do something with the results 
        
         results  
         = 
          cursor.fetchone()    
         #or  results = cursor.fetchall() 
        
         cursor.close()

直接拼接的是万万不可的，如果采用ModelInstance.objects.raw(sql,[]),或者connection.objects.execute(sql,[]) ,通过列表传进去的参数是没有注入风险的，因为django会有处理。

0x05 代码执行

一般是由于eval和pickle.loads的滥用造成的，特别是eval，大家都没有意识到这方面的问题。下面举个代码中的例子：

 
         @login_required 
        
         @permission_required 
         ( 
         "accounts.newTask_assess" 
         ) 
        
         def 
         targetLogin(request): 
        
         req  
         = 
          simplejson.loads(request.POST[ 
         'loginarray' 
         ]) 
        
         req 
         = 
         unicode 
         (req).encode( 
         "utf-8" 
         ) 
        
         loginarray 
         = 
         eval 
         (req) 
        
         ip 
         = 
         _e(request, 
         'ipList' 
         ) 
        
         #targets=base64.b64decode(targets) 
        
         (iplist1,iplist2) 
         = 
         getIPTwoList(ip) 
        
         iplist1 
         = 
         list 
         ( 
         set 
         (iplist1)) 
        
         iplist2 
         = 
         list 
         ( 
         set 
         (iplist2)) 
        
         loginlist 
         = 
         [] 
        
         delobjs 
         = 
         [] 
        
         holdobjs 
         = 
         []

这一段代码就是就是因为eval的参数不可控，导致任意代码执行，正确的做法就是literal.eval接口。再取个pickle.loads的例子：

 
         >>>  
         import 
          cPickle 
        
         >>> cPickle.loads( 
         "cos\nsystem\n(S'uname -a'\ntR." 
         ) 
        
         Linux RCM 
         - 
         RSAS 
         - 
         V6 
         - 
         Dev  
         3.9 
         . 
         0 
         - 
         aurora  
         #4 SMP PREEMPT Fri Jun 7 14:50:52 CST 2013 i686 Intel(R) Core(TM) i7-2600 CPU @ 3.40GHz GenuineIntel GNU/Linux 
        
         0

0x06 文件操作

文件操作主要包含任意文件下载，删除，写入，覆盖等，如果能达到写入的目的时基本上就能写一个webshell了。下面举个任意文件下载的例子：

 
         @login_required 
        
         @permission_required 
         ( 
         "accounts.newTask_assess" 
         ) 
        
         def 
         exportLoginCheck(request,filename): 
        
         if 
         re.match(r“ 
         * 
         .lic”，filename): 
        
         fullname  
         = 
          filename 
        
         else 
         : 
        
         fullname  
         = 
          "/tmp/test.lic" 
        
         print 
         fullname 
        
         return 
         HttpResponse(fullname)

这段代码就存在着任意.lic文件下载的问题，没有做好限制目录穿越，同理

0x07 文件上传

1 任意文件上传

这里主要是未限制文件大小，可能导致ddos，未限制文件后缀，导致任意文件上传，未给文件重命名，可能导致目录穿越，文件覆盖等问题。

2 xml，excel等上传

在我们的产品中经常用到xml来保存一些配置文件，同时也支持xml文件的导出导入，这样在libxml2.9以下就可能导致xxe漏洞。就拿lxml来说吧：

 
    
     
       
       
         root@kali:~ 
         /python 
         # cat test.xml 
        
 
         <?xml version= 
         "1.0" 
         encoding= 
         "utf-8" 
         ?> 
        
 
         <!DOCTYPE xdsec [ <!ENTITY xxe SYSTEM  
         "file:///etc/passwd" 
          > 
        
 
         ]> 
        
 
         <root> 
        
 
              
         <node  
         id 
         = 
         "11" 
         name= 
         "bb" 
         net= 
         "192.168.0.2-192.168.0.37" 
         ltd= 
         "" 
         gid= 
         "" 
         /> 
         test 
         &xxe;< 
         /root 
         > 
        

            
        
 
         >>> from lxml  
         import 
          etree 
        
 
         >>> tree1 = etree.parse( 
         'test.xml' 
         ) 
        
 
         >>> print etree.tostring(tree1.getroot()) 
        
 
         <root> 
        
 
              
         <node  
         id 
         = 
         "11" 
         name= 
         "bb" 
         net= 
         "192.168.0.2-192.168.0.37" 
         ltd= 
         "" 
         gid= 
         "" 
         />testroot:x:0:0:root: 
         /root 
         : 
         /bin/bash 
        
 
         daemon:x:1:1:daemon: 
         /usr/sbin 
         : 
         /bin/sh 
        
 
         bin:x:2:2:bin: 
         /bin 
         : 
         /bin/sh 
        
 
         sys:x:3:3:sys: 
         /dev 
         : 
         /bin/sh 
        
 
         sync 
         :x:4:65534: 
         sync 
         : 
         /bin 
         : 
         /bin/sync 
        
 
         games:x:5:60:games: 
         /usr/games 
         : 
         /bin/sh 
        
 
         man 
         :x:6:12: 
         man 
         : 
         /var/cache/man 
         : 
         /bin/sh 
        
 
     
 
    
  

这是因为在lxml中默认采用的XMLParser导致的：

 
    
     
       
       
         class 
         XMLParser(_FeedParser) 
        
 
         |  XMLParser( 
         self 
         , encoding 
         = 
         None 
         , attribute_defaults 
         = 
         False 
         , dtd_validation 
         = 
         False 
         , load_dtd 
         = 
         False 
         , no_network 
         = 
         True 
         , ns_clean 
         = 
         False 
         , recover 
         = 
         False 
         , XMLSchema schema 
         = 
         None 
         , remove_blank_text 
         = 
         False 
         , resolve_entities 
         = 
         True 
         , remove_comments 
         = 
         False 
         , remove_pis 
         = 
         False 
         , strip_cdata 
         = 
         True 
         , target 
         = 
         None 
         , compact 
         = 
         True 
         ) 
        
 
     
 
    
  

关注其中两个关键参数，其中resolve_entities=True,no_network=True,其中resolve_entities=True会导致解析实体，no_network会为True就导致了该利用条件比较有效，会导致一些ssrf问题，不能将数据带出。在python中xml.dom.minidom,xml.etree.ElementTree不受影响

0x08 不安全的封装

1 eval 封装不彻底

仅仅是将__builtings__置为空，如下方式即可绕过

 
         >>> s2 
         = 
         """ 
        
         ... [x for x in ().__class__.__bases__[0].__subclasses__() 
        
         ...    if x.__name__ == "zipimporter"][0]( 
        
         ...      "/home/liaoxinxi/eval_test/configobj-4.4.0-py2.5.egg").load_module( 
        
         ...      "configobj").os.system("uname") 
        
         ... """ 
        
         >>>  
         eval 
         (s2,{ 
         '__builtins__' 
         :{}}) 
        
         Linux 
        
         0

2 执行命令接口封装不彻底

在底层封装函数没有过滤shell元字符，仅仅是限定一些命令，但是其参数未做控制.

0x0a 总结

一切输入都是不可靠的，做好严格过滤。

你可能感兴趣的:(python 安全编码&代码审计)

HarmonyOS 数据加密深度实践：守护用户隐私的最后一道防线逻极笔记 harmonyos 鸿蒙 harmonyos 华为鸿蒙 arkts 数据加密加密算法
在当今数字化时代，数据安全已成为用户关注的核心焦点。鸿蒙系统深刻认识到这一点，为开发者精心打造了全面且强大的加密框架和安全存储机制。本文将深入剖析如何巧妙运用鸿蒙的加密技术，全方位保障敏感数据在存储与传输过程中的安全性，为用户隐私构建起坚固的防护壁垒。一、AES-GCM加密算法的实战应用在众多加密算法中，AES-GCM凭借其卓越的高效性和强大的数据完整性保护能力，成为数据加密的优选方案。初始化向量
内网和外网可以共享一台打印机吗？怎么设置实现跨网电脑远程连接打印搬码临时工网络
内网和外网可以通过特定技术手段实现共享一台打印机‌。实现方式主要包括物理切换器、网络分段映射（如路由设置）、类似nat123内网穿透等技术方案，但需根据网络环境安全等级选择合适方案，并注意数据隔离要求。‌‌一、物理切换器方案‌实现内外网共离同一打印机使用USB打印机共享器或网络切换器，通过物理按钮切换内外网连接。这类设备可实现电路层面的隔离，避免数据泄露风险。例如：采用二进一出的USB切换器连接内
Spring Security 中的 SecurityFilterChain 深度解析 csdn_tom_168 #Security spring java 后端 Security
SpringSecurity中的SecurityFilterChain深度解析在SpringSecurity6中，SecurityFilterChain已成为安全配置的核心接口，彻底取代了传统的WebSecurityConfigurerAdapter继承方式。以下是其核心功能、配置方法及与旧版本的差异对比：一、SecurityFilterChain的核心角色安全规则容器定义HTTP请求的授权规则（
国内主流云服务商对比？阿里云、腾讯云、华为云怎么选？ NicolasLearner 服务器云服务器云主机云服务云服务器阿里云腾讯云华为云
随着中国企业云服务器使用率的不断提升，虽然与国外一些国家相比还有很大差距。但得益于政策红利和中国企业的数字化转型，市场潜力空间仍然很大，而作为互联网行业中的一员，我们也应当对云服务器的基础知识有一定的了解，利用具有较多优势的云服务平台，研发应用层人工智能产品提供决策辅助。一、什么是云服务器云服务器(ElasticComputeService,ECS)是一种简单高效、安全可靠、处理能力可弹性伸缩的计
Ollama实践之：Python代码生成与执行小村学长毕业设计 python 开发语言
Ollama实践之：Python代码生成与执行在人工智能领域，生成式模型正逐渐展现出其强大的潜力。Ollama，作为一个先进的生成式语言模型，不仅能生成连贯的文本，还能生成代码片段，并在某些情况下，生成可执行的代码。本文将详细探讨如何使用Ollama生成Python代码，以及执行这些代码的实践过程。我们不仅会讨论技术细节，还会探讨其应用场景、潜在风险以及未来的发展趋势。一、Ollama简介Olla
探索未来科技：Ollama Python 库——Python 与 AI 的无缝对接尚绮令Imogen
探索未来科技：OllamaPython库——Python与AI的无缝对接项目地址:https://gitcode.com/gh_mirrors/ol/ollama-python在人工智能领域，Python是无可争议的首选语言。而OllamaPythonLibrary正是为了让开发者更加便捷地将Python3.8及以上版本项目与Ollama平台集成，从而解锁更强大的AI功能。这个库以其直观的API设
后端密码加密：守护用户数据的钢铁长城
“系统被拖库了！”这可能是开发者最恐惧的噩梦。而当用户密码以明文暴露时，灾难将席卷每个用户——密码重用的惯性会让黑客轻松攻破他们在其他平台的账户。作为后端开发者，我们握有守护用户安全的第一道钥匙：科学的密码存储策略。血的教训：密码存储的三大禁忌❌明文存储--致命操作！永远不要这样做！INSERTINTOusers(username,password)VALUES('alice','P@ssw0rd
HTML表格导出为Excel文件的实现方案 ~风清扬~ 前端技术 html excel 前端
1、前端javascript可通过mime类型、blob对象或专业库（如sheetjs）实现html表格导出excel，适用于中小型数据量；2、服务器端方案利用后端语言（如python的openpyxl、java的apachepoi）处理复杂报表和大数据，确保安全性与格式控制；3、常见问题包括数据类型识别错误、样式丢失、大文件卡顿、浏览器兼容性及乱码，需通过设置单元格类型、使用后端样式api、分页
Ollama-python：调用大模型服务实现代码自动补全，提升编程开发效率！
Ollama是一个优秀的本地部署与管理大模型的框架。通过Ollama，我们可以在本地部署、定制自己的大模型服务。大模型部署在本地后，我们可以有哪些应用呢？本文介绍如何通过Ollama的pythonsdk，调用本地部署的大模型服务，对我们的代码进行自动补全，提升日常的编程开发效率。安装Ollama及其pythonsdk在https://ollama.com/download下载Ollama安装程序并
网安系列【3】之深入理解内容安全策略（CSP）缘友一世网络安全网络安全 web安全
文章目录一CSP(内容安全策略)二CSP基础：如何实现内容安全策略2.1主要实现方式2.2基本指令解析三简单到复杂：CSP策略示例3.1示例1：最基本的CSP策略3.2示例2：允许特定CDN资源3.3示例3：更复杂的策略四CSP进阶概念4.1非ce与哈希值4.2报告机制五CSP案例5.1案例1：防止XSS攻击5.2案例2：第三方集成5.3案例3：渐进式采用CSP六CSP的局限性七总结一CSP(内容
【零基础学AI】第22讲：PyTorch入门 - 动态图计算与图像分类器实战 1989 0基础学AI 人工智能 pytorch python 机器学习 sklearn 深度学习
本节课你将学到理解PyTorch的核心概念和优势掌握张量(Tensor)的基本操作学会使用动态计算图构建神经网络实现一个完整的图像分类器项目训练模型并进行预测开始之前环境要求Python3.8+建议使用GPU（可选，CPU也能运行）内存：至少4GB需要安装的包#CPU版本（推荐新手）pipinstalltorchtorchvisionmatplotlibpillow#GPU版本（如果有NVIDIA
Ubuntu 22.04 修改默认 Python 版本为 Python3 笔记笑衬人心。 ubuntu python 笔记
Ubuntu系统默认使用的是Python2.x作为python命令的映射，而现代开发（如pip、Django、Flask、Scrapy等）大多基于Python3。本笔记将教你如何将默认python命令指向Python3（如Python3.8、3.10）。背景说明在Ubuntu22.04中：系统默认安装了Python2和Python3；运行python命令默认启动的是Python2；运行python
网络设备安装与调试【4.1】 BinaryStarXin 网络工程师提升计划4 智能路由器网络使用 PPP 的 PAP 认证 PAP 安全认证使用 PPP 的CHAP认证信息与通信网络协议
学习任务2路由器广域网协议的PPP封装验证广域网协议的PPP具有PAP和CHAP两种验证协议，PAP认证只在链路建立初期进行，只有两次信息的交换，因此被称为两次握手。CHAP验证比PAP验证安全。本学习任务分成以下两个学习活动进行。学习活动1使用PPP的PAP认证。学习活动2使用PPP的CHAP认证。学习活动1使用PPP的PAP认证学习情境某公司为了满足不断增长的业务需求，申请了专线接入。公司的路
【Security】操作系统安全 KAZIMIYA 小资料安全操作系统
【Security】操作系统安全一、主体与客体访问控制关注的对象要么是主体，要么是客体客体（objects）：客体是一个被动的实体。在操作系统中，客体可以是按照一定格式存储在一定记录介质上的数据信息（通常以文件系统格式存储数据），也可以是操作系统中的进程。图书是保护对象，那么他是客体。对一个客体的访问隐含着对其包含信息的访问。文件，IPC资源等就是客体，进程也可以是客体。主体（subjects）：
【Day 13-N24】 Python 的异常捕获、多重异常捕获、try-except 语句嵌套、使用finally代码块、自定义异常类、手动引发异常 DES 仿真实践家 14天Python入门学习笔记 python 开发语言
挑战14天学会Python，第13天学习笔记！加油！1.异常处理概述在Python编程中，异常处理是保证程序健壮性的重要机制。异常(Exception)是程序运行时发生的错误事件，会中断正常的程序流程。良好的异常处理能够：防止程序意外崩溃提供友好的错误提示实现错误恢复逻辑保证资源正确释放Python使用try-except语句结构来处理异常，其基本语法如下：try:#可能引发异常的代码except
建筑设备监控与调控双管齐下，楼宇自控达成建筑环境全方位智慧化管理 ctrlworks 楼宇自控楼宇自控系统厂家 ba系统厂商建筑管理系统厂家 ibms系统厂家能耗监测系统厂家康沃思物联
在数字化与智能化技术深度渗透的当下，建筑行业正经历从传统运维向智慧管理的深刻变革。建筑设备作为维持建筑正常运行的“神经与脉络”，其管理效率直接影响建筑的能耗水平、安全性能与用户体验。传统建筑管理中，设备监控与调控常处于割裂状态，难以实现资源的最优配置。而通过将设备监控与调控有机结合、双管齐下，正成为实现建筑环境全方位智慧化管理的关键路径，为建筑的可持续发展注入新动能。一、精准监控：构筑建筑设备管理
2025web建议
随便收集的信息新手入门路线推荐第一步：Web安全相关概念建议学习时间：2周学习内容如下：1、熟悉基本概念(SQL注入、上传、XSS、CSRF、一句话木马等)。2、通过关键字(SQL注入、上传、XSS、CSRF、一句话木马等)进行Google。3、阅读《Web安全深度剖析》，作为入门学习还是可以的。4、看一些渗透笔记/视频，了解渗透实战的整个过程，可以Google(渗透笔记、渗透过程、入侵过程等)。
实用指南：网络安全核心技能清单，必备知识一网打尽！～小羊没烦恼～ web安全 php 网络数据库安全开发语言人工智能
嗨咯，各位网安爱好者，今天我要为大家分享一份网络安全必备技能清单。作为一名摸爬滚打多年的网安从业者，我总结了一些关键技能，希望能帮助大家在网络安全领域少走弯路，更上一层楼。一、编程能力编程是网安工作者的基本功。我知道有不少朋友一听到“编程”二字就感到头大，但对于想投身网络安全行业的来说，至少掌握一门编程语言是必不可少的。而在众多编程语言中，Python往往是最佳的选择。为什么呢？因为：语法简单，学
鸿蒙系统（HarmonyOS）应用开发之手势锁屏密码锁（PatternLock）伍哥的传说 HarmonyOS资源华为鸿蒙 harmonyos 前端前端框架
项目概述基于鸿蒙（OpenHarmony）平台开发的手势密码锁应用，旨在为用户提供安全、便捷且具有良好交互体验的身份验证方式。通过手势图案输入，用户可以轻松设置和验证密码，提升设备的安全性和个性化体验。功能特点手势密码设置与验证：支持用户自定义手势密码，输入手势后进行验证，保障账户安全。动态提示与反馈：输入正确或错误时，界面会以不同颜色和动画进行反馈，并通过Toast提示用户操作结果。密码重置：一
HarmonyOS免密认证方案助力应用登录安全升级 HarmonyOS SDK 应用场景 harmonyos 安全华为
6月21日，2025年华为开发者大会"安全与隐私分论坛"在松山湖顺利举办。本论坛聚焦App治理与监管、星盾安全2.0的核心能力等进行深度分享与探讨。其中，HarmonyOSPasskey免密认证方案作为安全技术创新成果备受瞩目。该方案基于FIDO协议实现，支持用户在应用内、网页上乃至跨设备间实现无缝且安全的免密登录体验。火山引擎飞连作为伙伴代表，在现场分享了基于HarmonyOSPasskey免密
android python ide_轻量级Python IDE : Thonny weixin_39673037 android python ide
1.简介Thonny是基于python内置图形库tkinter开发出来的支持多平台(windows,Mac,Linux)的pythonIDE，支持语法着色、代码自动补全、debug等功能，如果你正在寻找一种“轻量级”的pythonIDE，那么可以试一试Thonny。2.安装有两种方式可以安装Thonny，从官网下载exe文件，然后安装，或者直接使用pip安装。2.1从exe文件安装进入Thonny
linux echo 字体大小背景字体颜色的编码 qq_16827895
linux终端颜色代码echo-e"\033[背景;字体颜色m字符串\033[0m"eg:echo-e"\033[30m黑色字\033[0m"字体颜色(30-37)------------------背景颜色(40-47)------------------特色功能------------------\33[0m关闭所有属性\33[1m设置高亮度\33[4m下划线\33[5m闪烁\33[7m反显\
Protobuf在游戏开发中的应用：TypeScript + Golang 实践 qq_16827895 golang 游戏引擎服务器
Protobuf在游戏开发中的应用：TypeScript+Golang实践指南前言在游戏开发中，客户端与服务器之间的通信是核心功能之一。随着游戏复杂度的增加，传统的JSON通信方式在性能、数据大小和类型安全方面逐渐显现出不足。ProtocolBuffers（简称Protobuf）作为Google开发的数据序列化格式，以其高效的二进制编码、强类型定义和跨语言支持等优势，成为游戏开发中理想的通信协议选
使用 Python 编写一个简单的网页爬虫小张同学的解忧笔记 python 爬虫开发语言
在数据时代，信息是金子。而网络上蕴藏着海量的数据资源，掌握一门自动化获取数据的技术就尤为重要。今天我们将通过Python来编写一个简单的网页爬虫，从一个网页中提取我们想要的数据内容。一、什么是网页爬虫？网页爬虫（WebCrawler）是一种自动访问网站并抓取其页面内容的程序。它模拟浏览器的行为，访问网站并提取页面中的结构化数据，如文本、图片、链接等。二、准备工作我们需要安装以下Python库：pi
验证码(三)快速使用滑块验证码.
滑块验证码类似于滑动验证码，通常是将一个滑块从初始位置拖动到与背景图匹配的缺口位置，以验证用户的身份。优点视觉效果好：以图形化的方式呈现，更加直观和美观，给用户带来较好的视觉体验。安全性较强：通过对滑块的位置、拖动轨迹等进行精确检测和分析，能够有效防范自动化攻击，保障系统安全。缺点对网络要求较高：如果网络环境不佳，验证码图片可能加载缓慢，影响用户验证的速度和体验。可能被绕过：虽然安全性较高，但一些
Dash 安装使用教程小奇JAVA面试安装使用教程 dash
一、Dash简介Dash是一个基于Python的Web应用框架，专为构建数据可视化界面而设计。它由Plotly团队开发，适合构建交互式仪表盘、可视化分析工具和Web应用，无需使用JavaScript。二、安装Dash2.1使用pip安装pipinstalldash推荐同时安装Plotly：pipinstallplotly2.2验证安装python-c"importdash;print(dash._
ISO/IEC 27001 高阶架构 “规划” 之风险评估小木话安全信息安全网络安全职场和发展学习方法
---写在前面的话---我们该讨论信息安全风险评估章节了，简称“风险评估”，我把它称为“拍脑袋”。不要误解，这里的“拍脑袋”是中性词，因为真正的风险评估不是个人行为，是组织行为并且风险评估的结果需要是客观的、需要加入定量的元素，比如风险数值&概率计算，威胁大小的数据分析等等一系列复杂的运算，最后得出风险数值。而企业内部的风险评估基本就两步：1、发现有问题；2、经验判断风险；3、证明风险是正确的。有
树莓派用c语言pwm控制电机,树莓派学习笔记之PWM控制直流电机转速简单的艾伦树莓派用c语言pwm控制电机
树莓派控制PWM控制电机转速一、硬件树莓派12V直流电机L298N电机驱动器220V转12V变压器二、连线树莓派与L298N需要共地L298N驱动模块树莓派接线三、树莓派python库配置安装GPIO库sudoapt-getinstallpython3-rpi.gpio电机控制程序importtimeimportRPi.GPIOasGPIO#定义树莓派BCM编码引脚Motor_A_EN=16Mot
树莓派4B控制步进电机（电机28BYJ4+驱动板ULN2003）
由于比赛要用到就捣鼓了一下，花了一些时间走了一些弯路，记录一下。使用材料：树莓派4B、电机28BYJ4、驱动板ULN2003、杜邦线若干电机和驱动板的淘宝链接：https://m.tb.cn/h.fmtAmLW?tk=nZVJ2VDNXfWhttps://m.tb.cn/h.fmtAmLW?tk=nZVJ2VDNXfW我使用的是树莓派口是GPIO.21-24，对应的BCM编码是5，6，13，19引
树莓派5-编写python、实现io口点灯
利用树莓派5点亮小灯我们可以用gpiozero库一、安装gpiozero库sudoaptupdatesudoaptinstallpython3-gpiozeropinoutgpiozero库文档：gpiozero—gpiozero2.0.1Documentation复现第一个例子，实现灯闪烁。二、保存代码在树莓派的led.py文件中fromgpi
基本数据类型和引用类型的初始值 3213213333332132 java基础
package com.array; /** * @Description 测试初始值 * @author FuJianyong * 2015-1-22上午10:31:53 */ public class ArrayTest { ArrayTest at; String str; byte bt; short s; int i; long
摘抄笔记--《编写高质量代码：改善Java程序的151个建议》白糖_ 高质量代码
记得3年前刚到公司，同桌同事见我无事可做就借我看《编写高质量代码：改善Java程序的151个建议》这本书，当时看了几页没上心就没研究了。到上个月在公司偶然看到，于是乎又找来看看，我的天，真是非常多的干货，对于我这种静不下心的人真是帮助莫大呀。看完整本书，也记了不少笔记
【备忘】Django 常用命令及最佳实践 dongwei_6688 django
注意：本文基于 Django 1.8.2 版本生成数据库迁移脚本（python 脚本） python manage.py makemigrations polls 说明：polls 是你的应用名字，运行该命令时需要根据你的应用名字进行调整查看该次迁移需要执行的 SQL 语句（只查看语句，并不应用到数据库上）： python manage.p
阶乘算法之一N! 末尾有多少个零周凡杨 java 算法阶乘面试效率
&n
spring注入servlet g21121 Spring注入
传统的配置方法是无法将bean或属性直接注入到servlet中的，配置代理servlet亦比较麻烦，这里其实有比较简单的方法，其实就是在servlet的init()方法中加入要注入的内容： ServletContext application = getServletContext(); WebApplicationContext wac = WebApplicationContextUtil
Jenkins 命令行操作说明文档 510888780 centos
假设Jenkins的URL为http://22.11.140.38:9080/jenkins/ 基本的格式为 java 基本的格式为 java -jar jenkins-cli.jar [-s JENKINS_URL] command [options][args] 下面具体介绍各个命令的作用及基本使用方法 1. &nb
UnicodeBlock检测中文用法布衣凌宇 UnicodeBlock
/** * 判断输入的是汉字 */ public static boolean isChinese(char c) { Character.UnicodeBlock ub = Character.UnicodeBlock.of(c);
java下实现调用oracle的存储过程和函数 aijuans java orale
1.创建表：STOCK_PRICES 2.插入测试数据： 3.建立一个返回游标： PKG_PUB_UTILS 4.创建和存储过程：P_GET_PRICE 5.创建函数： 6.JAVA调用存储过程返回结果集 JDBCoracle10G_INVO
Velocity Toolbox antlove 模板 tool box velocity
velocity.VelocityUtil package velocity; import org.apache.velocity.Template; import org.apache.velocity.app.Velocity; import org.apache.velocity.app.VelocityEngine; import org.apache.velocity.c
JAVA正则表达式匹配基础百合不是茶 java 正则表达式的匹配
正则表达式;提高程序的性能,简化代码,提高代码的可读性,简化对字符串的操作正则表达式的用途; 字符串的匹配字符串的分割字符串的查找字符串的替换正则表达式的验证语法 [a] //[]表示这个字符只出现一次 ,[a] 表示a只出现一
是否使用EL表达式的配置 bijian1013 jsp web.xml EL EasyTemplate
今天在开发过程中发现一个细节问题，由于前端采用EasyTemplate模板方法实现数据展示，但老是不能正常显示出来。后来发现竟是EL将我的EasyTemplate的${...}解释执行了，导致我的模板不能正常展示后台数据。网
精通Oracle10编程SQL(1-3)PLSQL基础 bijian1013 oracle 数据库 plsql
--只包含执行部分的PL/SQL块 --set serveroutput off begin dbms_output.put_line('Hello,everyone!'); end; select * from emp; --包含定义部分和执行部分的PL/SQL块 declare v_ename varchar2(5); begin select
【Nginx三】Nginx作为反向代理服务器 bit1129 nginx
Nginx一个常用的功能是作为代理服务器。代理服务器通常完成如下的功能：接受客户端请求将请求转发给被代理的服务器从被代理的服务器获得响应结果把响应结果返回给客户端实例本文把Nginx配置成一个简单的代理服务器对于静态的html和图片，直接从Nginx获取对于动态的页面，例如JSP或者Servlet，Nginx则将请求转发给Res
Plugin execution not covered by lifecycle configuration: org.apache.maven.plugin blackproof maven 报错
转：http://stackoverflow.com/questions/6352208/how-to-solve-plugin-execution-not-covered-by-lifecycle-configuration-for-sprin maven报错： Plugin execution not covered by lifecycle configuration:
发布docker程序到marathon ronin47 docker 发布应用
1 发布docker程序到marathon 1.1 搭建私有docker registry 1.1.1 安装docker regisry docker pull docker-registry docker run -t -p 5000:5000 docker-registry 下载docker镜像并发布到私有registry docker pull consol/tomcat-8.0
java-57-用两个栈实现队列&&用两个队列实现一个栈 bylijinnan java
import java.util.ArrayList; import java.util.List; import java.util.Stack; /* * Q 57 用两个栈实现队列 */ public class QueueImplementByTwoStacks { private Stack<Integer> stack1; pr
Nginx配置性能优化 cfyme nginx
转载地址：http://blog.csdn.net/xifeijian/article/details/20956605 大多数的Nginx安装指南告诉你如下基础知识——通过apt-get安装，修改这里或那里的几行配置，好了，你已经有了一个Web服务器了。而且，在大多数情况下，一个常规安装的nginx对你的网站来说已经能很好地工作了。然而，如果你真的想挤压出Nginx的性能，你必
[JAVA图形图像]JAVA体系需要稳扎稳打,逐步推进图像图形处理技术 comsci java
对图形图像进行精确处理，需要大量的数学工具，即使是从底层硬件模拟层开始设计，也离不开大量的数学工具包，因为我认为，JAVA语言体系在图形图像处理模块上面的研发工作，需要从开发一些基础的，类似实时数学函数构造器和解析器的软件包入手，而不是急于利用第三方代码工具来实现一个不严格的图形图像处理软件...... &nb
MonkeyRunner的使用 dai_lm android MonkeyRunner
要使用MonkeyRunner，就要学习使用Python，哎先抄一段官方doc里的代码作用是启动一个程序（应该是启动程序默认的Activity），然后按MENU键，并截屏 # Imports the monkeyrunner modules used by this program from com.android.monkeyrunner import MonkeyRun
Hadoop-- 海量文件的分布式计算处理方案 datamachine mapreduce hadoop 分布式计算
csdn的一个关于hadoop的分布式处理方案，存档。原帖：http://blog.csdn.net/calvinxiu/article/details/1506112。 Hadoop 是Google MapReduce的一个Java实现。MapReduce是一种简化的分布式编程模式，让程序自动分布到一个由普通机器组成的超大集群上并发执行。就如同ja
以資料庫驗證登入 dcj3sjt126com yii
以資料庫驗證登入由於 Yii 內定的原始框架程式, 採用綁定在UserIdentity.php 的 demo 與 admin 帳號密碼: public function authenticate() { $users=array( &nbs
github做webhooks：[2]php版本自动触发更新 dcj3sjt126com github git webhooks
上次已经说过了如何在github控制面板做查看url的返回信息了。这次就到了直接贴钩子代码的时候了。工具/原料 git github 方法/步骤在github的setting里面的webhooks里把我们的url地址填进去。钩子更新的代码如下： error_reportin
Eos开发常用表达式蕃薯耀 Eos开发 Eos入门 Eos开发常用表达式
Eos开发常用表达式 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2014年8月18日 15:03:35 星期一 &
SpringSecurity3.X--SpEL 表达式 hanqunfeng SpringSecurity
使用 Spring 表达式语言配置访问控制，要实现这一功能的直接方式是在<http>配置元素上添加 use-expressions 属性： <http auto-config="true" use-expressions="true"> 这样就会在投票器中自动增加一个投票器：org.springframework
Redis vs Memcache IXHONG redis
1. Redis中，并不是所有的数据都一直存储在内存中的，这是和Memcached相比一个最大的区别。 2. Redis不仅仅支持简单的k/v类型的数据，同时还提供list，set，hash等数据结构的存储。 3. Redis支持数据的备份，即master-slave模式的数据备份。 4. Redis支持数据的持久化，可以将内存中的数据保持在磁盘中，重启的时候可以再次加载进行使用。 Red
Python - 装饰器使用过程中的误区解读 kvhur JavaScript jquery html5 css
大家都知道装饰器是一个很著名的设计模式，经常被用于AOP(面向切面编程)的场景，较为经典的有插入日志，性能测试，事务处理，Web权限校验， Cache等。原文链接：http://www.gbtags.com/gb/share/5563.htm Python语言本身提供了装饰器语法（@），典型的装饰器实现如下： @function_wrapper de
架构师之mybatis-----update 带case when 针对多种情况更新 nannan408 case when
1.前言. 如题. 2. 代码. <update id="batchUpdate" parameterType="java.util.List"> <foreach collection="list" item="list" index=&
Algorithm算法视频教程栏目记者 Algorithm 算法
课程：Algorithm算法视频教程百度网盘下载地址： http://pan.baidu.com/s/1qWFjjQW 密码: 2mji 程序写的好不好,还得看算法屌不屌！Algorithm算法博大精深。一、课程内容：课时1、算法的基本概念 + Sequential search 课时2、Binary search 课时3、Hash table 课时4、Algor
C语言算法之冒泡排序 qiufeihu c 算法
任意输入10个数字由小到大进行排序。代码： #include <stdio.h> int main() { int i,j,t,a[11]; /*定义变量及数组为基本类型*/ for(i = 1;i < 11;i++){ scanf("%d",&a[i]); /*从键盘中输入10个数*/ } for
JSP异常处理 wyzuomumu Web jsp
1.在可能发生异常的网页中通过指令将HTTP请求转发给另一个专门处理异常的网页中: <%@ page errorPage="errors.jsp"%> 2.在处理异常的网页中做如下声明： errors.jsp: <%@ page isErrorPage="true"%>，这样设置完后就可以在网页中直接访问exc