A-L-Kun

Python中xpath解析

文章目录

简介
- 安装
- 本文示例的html代码
使用
- 实例化etree
- xpth表达式
- - 定位
  - - 根据层级定位
    - 根据属性进行定位
    - 根据id进行定位
    - 根据索引号进行定位
  - 取值
  - - 获取文本
    - 获取属性
实例

简介

XPath 是一门在 XML 文档中查找信息的语言。XPath 可用来在 XML 文档中对元素和属性进行遍历。XPath 是 W3C XSLT 标准的主要元素，并且 XQuery 和 XPointer 都构建于 XPath 表达之上。

安装

pip install lxml

本文示例的html代码

<div>
    <div>
        <ul>
            <li class="item-0">
                <a href="link1.html">first itema>
            li>
            <li class="item-1">
                <a href="link2.html">second itema>
            li>
        ul>
    div>
    <div id="111">
        <div class="item-1">
            <a href="www.qq.com">qq.coma>
            <p>this is p labelp>
            <ul>
                <li class="item-2">
                    <a href="link1.html">first item1a>
                li>
                <li class="item-3">
                    <a href="link2.html">second item2a>
                li>
            ul>
        div>
        <a href="www.baidu.com">baidu.coma>
    div>
div>

使用

实例化etree

from lxml import etree

# 将本地的html文件加载etree对象中
html = etree.parse("file_path")
# 将互联网上获取的源码数据加载到该对象中
html = etree.HTML(resp.text)
result = etree.tostring(html)  # 格式化html代码

xpth表达式

定位

根据层级定位

/ ：表示从根节点开始定位
// ：表示多个层级，可以从任意位置开始定位
./：从当前位置开始定位

根据属性进行定位

text = html.xpath("/div[1]//li[@class='item-0']")

根据id进行定位

text = html.xpath("//div[@id='111']")

根据索引号进行定位

text = html.xpath("/div/div[1]/ul/li[2]/a/text()")  # 注意xpath索引是从1开始的

取值

获取文本

该节点下的直系文本：/text()
该节点下的所有文本：//text()

from lxml import etree

wb_data = """

    
        
            
                first item
            
            
                second item
            
        
    
    
        
            qq.com
            this is p label
            
                
                    first item1
                
                
                    second item2
                
            
        
        baidu.com
    

"""
html = etree.HTML(wb_data)  # 实例化HTML对象
# 获取/div/div[2]下面的所有文本内容
text = html.xpath("//div[@id='111']//text()")
print([i.strip() for i in text])  # 去除换行符，空格等
# 获取/div/div[1]/ul/li[1]/里面的文本信息
print(html.xpath("//li[@class='item-0']/a/text()")[0])

获取属性

/@属性名称：获取该节点下的直系属性值
//@属性名称：获取该节点下的所有属性值

from lxml import etree

wb_data = """

    
        
            
                first item
            
            
                second item
            
        
    
    
        
            qq.com
            this is p label
            
                
                    first item1
                
                
                    second item2
                
            
        
        baidu.com
    

"""
html = etree.HTML(wb_data)  # 实例化HTML对象
# 获取/div/div[2]/div/下所有的href值
print(html.xpath("//div[@class='item-1']//@href"))
# 获取/div/div[2]/a下的href值
print(html.xpath("//div[@id='111']/a/@href")[0])

实例

首先自制了一个多线程爬虫模块用于发送请求，模块名称为MyModule

import threading, queue

"""爬虫多线程"""


class SpiderThread(threading.Thread):

    def __init__(self) -> "里面包含了请求头和代理IP 代理ip自己设置":
        super().__init__(daemon=True)  # daemon线程等待，target是运行的函数
        # 开启队列对象
        self.queue = queue.Queue()

        # 线程
        self.start()  # 实例化的时候自动运行run函数

        try:
            # 构建ip池，此ip地址仅支持http请求
            file = open("./ip.txt", "r")  # 得到大量ip地址，与文件同一目录下，存储http类型的ip池
            ipList = file.readlines()
            file.close()
            import random
            self.ip = random.choice(ipList).strip()
        except Exception as e:
            print(f"没有批量ip地址，使用本机ip地址{e}")
            import socket
            s = socket.socket(socket.AF_INET, socket.SOCK_DGRAM)
            s.connect(('8.8.8.8', 80))
            import random
            self.ip = s.getsockname()[0] + f":{random.randint(1, 8080)}"  # 获取本电脑的ip地址，同时随机使用端口访问网址
            s.close()

        # 传入requests所需要的参数
        self.headers = {
            'User-Agent': "Mozilla / 5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 96.0.4664 .93 Safari / 537.36"
        }
        self.proxy = {
            "http": f"https://{self.ip}",
            # 注意：如果请求的ip是https类型的，但代理的ip是只支持http的，那么还是使用本机的ip，如果请求的ip是http类型的，那么代理的ip一定要是http的，前面不能写成https，否则使用本机IP地址
        }

    def run(self) -> None:  # run方法线程自带的方法,内置方法，在线程运行时会自动调用
        while True:  # 不断处理任务
            func, args, kwargs = self.queue.get()
            func(*args, **kwargs)  # 调用函数执行任务 元组不定长记得一定要拆包
            self.queue.task_done()  # 解决一个任务就让计数器减一，避免阻塞

    # 生产者模型
    def submit_task(self, func, args=(), kwargs={}):  # func为要执行的任务，加入不定长参数使用（默认使用默认参数）
        self.queue.put((func, args, kwargs))  # 提交任务

    # 重写join方法
    def join(self):
        self.queue.join()  # 查看队列计时器是否为0 任务为空 为空关闭队列

        
def crawl(url, lis, cookies=None, headers=SpiderThread().headers,
          proxy=SpiderThread().proxy) -> "lis用来存储返回的resp响应 其是发送get请求":  # cookies是一个字典
    import requests
    if not isinstance(cookies, dict):
        resp = requests.get(url=url, headers=headers, proxies=proxy)
    else:
        resp = requests.get(url=url, headers=headers, cookies=cookies)
    if resp.status_code == 200:
        print("获取完成，返回的数据在传入的列表里面")
        lis.append(resp)  # 多线程没有返回值
    else:
        SpiderThread().submit_task(crawl, args=(i, lis))

# 爬取58同城中全国销售职位的名称
from lxml import etree
import MyModule
from concurrent.futures import ThreadPoolExecutor

spider = MyModule.SpiderThread()  # 实例化爬虫对象


"""
通过分析url可得到 url = 'https://nc.58.com/yewu/pu1/?key=%E9%94%80%E5%94%AE'；
又第二页的 		 url = 'https://nc.58.com/yewu/pn2/?key=%E9%94%80%E5%94%AE'
"""


# 得到所有页面的url
def spider1():
    resp = []  # 接收返回的页面源代码
    url = "https://nc.58.com/yewu/?key=%E9%94%80%E5%94%AE"
    spider.submit_task(MyModule.crawl, args=(url, resp))
    spider.join()  # 等待线程完成
    page_source = resp[0].text  # 得到页面源码
    html = etree.HTML(page_source)  # 实例化etree对象
    num = int(html.xpath("/html/body/div[3]/div[3]/div/div/div/span[2]/text()")[0])  # 通过分析网页可得该xpath解析
   	return [f"https://nc.58.com/yewu/pn{i}/?key=%E9%94%80%E5%94%AE" for i in range(1, num)]


def crawl():
    respAll = []  # 存储响应
    for i in spider1():
        spider.submit_task(MyModule.crawl, args=(i, respAll))  # 运行封装的模块
    spider.join()  # 等待全部线程完成
    return [i.text for i in respAll]  # 返回响应源代码


def save(resp_text):
    html = etree.HTML(resp_text)
    torr = html.xpath("//*[@id='list_con']/li")
    file = open("./a.txt", "a+", encoding="utf-8")  # 写入文件
    for i in torr:
        temp = i.xpath("./div[1]//a//text()")
        name = "".join(temp)  # 将名字组装
        file.write(f"名称：{name}")
    file.close()

    
def main(respAll):
    with ThreadPoolExecutor(50) as pool:  # 使用线程池，开启50个线程，对文件进行存储
        pool.map(save, respAll)


if __name__ == '__main__':
    main(crawl())  # 注意：由于是高性能爬虫，电脑的ip地址很大概率会被58同城封了，尽量使用代理ip

你可能感兴趣的:(python,#,爬虫,python,开发语言,后端)

python创建配置文件_如何写python的配置文件 weixin_39622399 python创建配置文件
一、创建配置文件在D盘建立一个配置文件，名字为：test.ini内容如下：[baseconf]host=127.0.0.1port=3306user=rootpassword=rootdb_name=gloryroad[test]ip=127.0.0.1int=1float=1.5bool=True注意：要将文件保存为ansi编码，utf-8编码会报错文件中的[baseconf]为section二
Python 开发者：如何养成良好编码习惯？很酷的站长 Python python 开发语言
当你已经是一名Python开发人员时，可能养成了一些习惯：有好的，也有坏的。编码本质是一种艺术形式。我们鼓励灵活性与可定制性。我们可以在编程语言的上下文中按照自己想要的方式编码。而现在需要面对的问题是，实际你正在公开与计算机通信，因此需要以一种其他人可以理解的方式编写代码。另外，使用不正确的语法或没有有效编写代码也会导致编程错误。混乱的代码使得以后很难发现这些错误。而可读、整洁的编码才是王道，这意
Python中9个常见字典与异常处理错误与解决方案很酷的站长 Python python 开发语言
今天，我们将一起发现并解决在使用字典时遇到的15个常见陷阱，让你的编程之旅更加顺畅。第一部分：字典基础与常见错误1.创建字典的误解错误场景：尝试用列表推导式创建字典时，键重复导致覆盖。#错误示范keys=['a','b','a']values=[1,2,3]my_dict={k:vfork,vinzip(keys,values)}print(my_dict)#输出可能不是预期，因为'a'键被覆盖了
Python新手：学习 itertools.takewhile 迭代右过滤很酷的站长 Python python 学习开发语言
在Python中，itertools.takewhile是另一个有用的工具，常用于从可迭代对象中获取基本示例假设我们有一个数字列表[1,2,3,6,7,8,2,3]，希望获取前面所有小于5的元素，一旦遇到不小于5的元素，停止获取并返回结果。示例代码importitertools#定义一个简单的条件函数：获取所有小于5的元素defis_less_than_5(x):returnx<5#输入序列num
Python教程：Python中如何优雅的合并两个字典！很酷的站长 Python python 开发语言
在Python的世界里，字典作为一种强大的数据结构，扮演着举足轻重的角色。而合并字典，则是我们经常遇到的操作。Python为我们提供了多种合并字典的方式，每种方式都有其独特的应用场景。今天，我们就来一起探索Python中合并两个字典的七种方法，找到最适合你的那一款！1.简单粗暴：update()方法update()方法就像一把利刃，直接将一个字典的内容更新到另一个字典中。如果存在相同的键，则更新后
Python面向对象教程：多重继承和MRO深入解析很酷的站长 Python python 开发语言
Python是一种面向对象的编程语言，其类继承机制为开发者提供了强大的工具来构建复杂的系统。多重继承允许一个类从多个基类继承属性和方法，而方法解析顺序（MRO）决定了在多重继承情况下方法的调用顺序。本文将详细介绍Python中的多重继承和方法解析顺序，涵盖基本概念、具体用法和实际应用示例。类继承的基本概念在Python中，类继承允许一个类（子类）继承另一个类（父类）的属性和方法，从而实现代码复用和
Python编程进阶：深入探索if-elif-else的高级技巧！很酷的站长 Python python 开发语言
条件语句是编程中控制流程的重要工具。Python中的if-elif-else语句用于根据条件执行不同的代码块。虽然基本用法简单，但在实际应用中，了解一些高级用法和技巧可以使代码更加简洁、可读和高效。本文将详细介绍Python中if-elif-else语句的高级用法，包含示例代码，帮助在编写Python程序时更好地控制程序逻辑。基本用法在介绍高级用法之前，先回顾一下if-elif-else语句的基本
探索Python列表生成式：魔法般的快捷方式！很酷的站长 Python python 开发语言
欢迎来到Python世界的一个魅力角落，今天我们要聊聊Python列表生成式—一个强大的工具，用来创建列表的魔法般的快捷方式。让我们踏上一段有趣的学习之旅，一起探索这项Python中的神奇魔法。起步：什么是列表生成式？列表生成式，顾名思义，是生成列表的一个简单又直接的方法。它使用了一种紧凑的语法来构造列表，能够以一种更清晰、更简洁的方式来表达循环和过滤逻辑。基础示例让我们看看这个魔法是如何工作的，
Python简单实用的连点器仍稽 python
python中可以控制鼠标和键盘的库有很多个，这个连点器使用的是pynput库。首先，我们要先安装pynput库。pipinstallpynput如果觉得太慢了或者报错了，可以使用国内镜像。pipinstallpynput-ihttps://pypi.tuna.tsinghua.edu.cn/simple废话不多说，直接上程序。frompynput.keyboardimportKey,Contro
PythonOCC安装步骤与注意事项我们的武平工作室 IFC学习相关 python bim anaconda
ifcbimifcxmlifcowl交流群。群号：10275989842020-0113补充：有网友提到了pyqt的安装不正确，这里给大家找到了一份安装方式。我自己也是使用该链接的pip安装方式安装的。因此后文没提，以为大家这个点不是问题。总之，有问题再更新！[PyQt]在Windows系统中安装PyQt5-乐松-博客园https://www.cnblogs.com/syh6324/p/94842
Debian11之DataX安装大能嘚吧嘚 Linux_Debian 分布式调度中心大数据
下载github地址安装mkdir/usr/local/DataX&&cd/usr/local/DataXtar-zvxfdatax.tar.gz自检python/usr/local/DataX/bin/datax.py/usr/local/DataX/job/job.json
Debian11之Python3安装大能嘚吧嘚 Linux_Debian Python 后端 python
依赖环境aptupdate&&aptupgradeaptinstallwgetbuild-essentiallibncursesw5-devlibssl-devlibsqlite3-devtk-devlibgdbm-devlibc6-devlibbz2-devlibffi-devzlib1g-dev下载cduse/local/pythonwgethttps://www.python.org/ftp
PythonOCC 环境配置幽殇默 Brep python
PythonOCC环境配置#OCC7.5.1condacreate--name=pyoccenvpython=3.7sourceactivatepyoccenvcondainstall-cconda-forgepythonocc-core=7.5.1#OCC7.7.0condacreate--name=pyoccenvpython=3.9activatepyoccenvcondainstall-c
Python 自制自动连点器黑客白泽 Python程序脚本 python android 开发语言
Python自制自动连点器1.简介：‌连点器‌是一种能够模拟鼠标点击操作的计算机软件，主要用于自动化和简化重复的鼠标点击任务。它可以根据用户设定的参数，自动进行连续的鼠标点击操作。连点器的工作原理是通过模拟鼠标点击动作，将用户设定的点击位置、点击频率、点击次数等参数转化为实际的鼠标点击操作。用户只需设置好相应的参数，按下热键即可启动连点器，实现自动化操作‌。2.运行效果：3.相关源码：#-*-co
[Python办公]Nuitka 详细介绍与打包 Python 项目的步骤 William数据分析 python python 算法程序人生
Nuitka是一个将Python源代码编译为C/C++并生成二进制可执行文件的编译器。它不仅支持Python的所有特性，还能优化代码运行速度，并生成比解释型运行的Python更小的文件。相比于其他打包工具，如PyInstaller、cx_Freeze，Nuitka通过将Python编译为C提升性能，同时生成更高效的可执行文件。1.Nuitka的工作原理Nuitka并不像PyInstaller等工具
基于Python的Selenium详细教程总结（极简版） weixin_41663997 python selenium 开发语言
基于Python的Selenium详细教程总结一、PyCharm安装配置Selenium使用环境:Windows11,Python3.10.5,PyCharm2022.1.3,Selenium4.3.0需要技术:Python,HTML,CSS,JavaScriptSelenium安装:查看已安装的Python包:piplist安装Selenium4.3.0:pipinstallselenium==
基于requests库的爬虫实战京东商品信息爬取 Jerry104393 Python python 爬虫正则表达式
一，功能描述：目标：从京东商城爬取商品信息，输出商品名称和价格二、技术路线：requests-re-bs4三，程序设计结构：1.爬取网页内容：getHTMLText()2.提取信息到合适的数据结构中:parsePage()3.利用数据结构展示并输出:printGoodsList()四、体会：本次实验遇到的最大技术难题就是怎么剔除HTML标签（查看源代码发现可以用i和em两个标签精确定位），后来查看
python中单，双引号和三个双引号的区别 tycoon1988
先说1双引号与3个双引号的区别，双引号所表示的字符串通常要写成一行如：s1="hello,world"如果要写成多行，那么就要使用/(“连行符”)吧，如s2="hello,/world"s2与s1是一样的。如果你用3个双引号的话，就可以直接写了，如下：s3="""hello,world,hahaha."""，那么s3实际上就是"hello,/nworld,/nhahaha.",注意“/n”，所以，
python+selenium定位网页动态元素 + 定位非select（即input）的下拉列表 + 返回上一个函数进行保存操作心田婷 python 定位 selenium python
1、python+selenium定位网页动态元素这个折磨我快一天的小东西，磨的我都快想睡觉了网上大佬门的经验啥的都看遍了，或许是看到不够多，找了一天都没解决，然后现在终于找到了解决的办法！！！报错：selenium.common.exceptions.NoSuchElementException:Message:nosuchelement:Unabletolocateelement:{“meth
Python Django ORM qq_15654157 Python python
一、ORM介绍1.什么是ORM?ORM全拼Object-RelationMapping.中文意为对象-关系映射.在MVC/MVT设计模式中的Model模块中都包括ORM2.ORM优势（1）只需要面向对象编程,不需要面向数据库编写代码.对数据库的操作都转化成对类属性和方法的操作.不用编写各种数据库的sql语句.（2）实现了数据模型与数据库的解耦,屏蔽了不同数据库操作上的差异.不在关注用的是mysql
计算机毕业设计JAVA房屋租赁系统mybatis 煦洋cxsj985 mybatis java 开发语言
计算机毕业设计JAVA房屋租赁系统mybatis计算机毕业设计JAVA房屋租赁系统mybatis+源码+调试部署+系统+数据库+lw本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：MySQL5.7/8.0源码地址：https://pan
大数据分析案例-基于逻辑回归算法构建抑郁非抑郁推文识别模型艾派森大数据分析案例合集机器学习人工智能 python 数据挖掘回归
‍♂️个人主页：@艾派森的个人主页✍作者简介：Python学习者希望大家多多支持，我们一起进步！如果文章对你有帮助的话，欢迎评论点赞收藏加关注+喜欢大数据分析项目的小伙伴，希望可以多多支持该系列的其他文章大数据分析案例合集
oracle通过pid查找执行SQL two_rain oracle oracle sql 数据库
通过TOP命令查看PID:1560PIDUSERPRNIVIRTRESSHRS%CPU%MEMTIME+COMMAND1560oracle20038.978g0.038t16296R100.015.31069:13python3Main_Mem.pyProcessLog1config.ini通过spid查找对应SQL:1、SELECTaddrFROMv$processcWHEREc.spid=15
掌握Python Selenium：网页元素自动化定位实战指南 jardonwang1 python selenium 自动化
一、Selenium框架介绍Selenium是一个用于自动化web应用程序测试的工具，它直接运行在浏览器中，就像真实用户在操作一样。这个框架支持多种浏览器（包括Chrome、Firefox、Safari等），并且可以在多种操作系统（Windows、Linux、macOS等）上运行。Selenium的主要目标是使自动化测试变得简单，以支持开发人员和测试人员快速编写测试用例。以下是Selenium框架
【python中级】安装nuitka打包工具 jn10010537 python 服务器开发语言
【python中级】安装nuitka打包工具1.背景2.nuitka简介3.nuitka安装4.nuitka文档1.背景最近发程序执行包，被人说程序包很大。比如python通过pyinstaller打包的可执行程序有30M，然而有同事通过C#编译的程序只有几百K；一度让领导觉得C#这个开发者在忽悠或者摸鱼。我感觉到有点尴尬，但是如果都需要解释一遍，显得苍白无力。虽然python开发效率是快，但是执
Python 的打包神器 — Nuitka LinkSLA 云计算 python 开发语言
一.pyinstaller和Nuitka使用感受1.1使用需求这次也是由于项目需要，要将python的代码转成exe的程序，在找了许久后，发现了2个都能对python项目打包的工具——pyintaller和nuitka。这2个工具同时都能满足项目的需要：隐藏源码。这里的pyinstaller是通过设置key来对源码进行加密的；而nuitka则是将python源码转成C++（这里得到的是二进制的py
Python中selenium的玩法，小朋友看了都说学会了 2401_87361571 python selenium 开发语言
2.selenium的作用和工作原理利用浏览器原生的API，封装成一套更加面向对象的SeleniumWebDriverAPI，直接操作浏览器页面里的元素，甚至操作浏览器本身（截屏，窗口大小，启动，关闭，安装插件，配置证书之类的）webdriver本质是一个web-server，对外提供webapi，其中封装了浏览器的各种功能不同的浏览器使用各自不同的webdriver3.selenium的安装以及
实验四 XML 无尽罚坐的人生 #Java Web xml
实验四XML目的：1、安装和使用XML的开发环境2、认识XML的不同类型3、掌握XML文档的基本语法4、了解DTD的作用5、掌握DTD的语法6、掌握Schema的语法实验过程：1、安装XML的编辑器，可以选择以下之一a)XMLSpyb)VScode，Vscode中安装XML插件2、给定一个XML文档test.xmltom24Python1861111111118622222222sammy25C+
为你「量身打造」的Python快速入门到实战和“图文双杀”（第1期）创文工作室 Python基础教程 python
Hello，大家好，欢迎来到创文工作室，这里是为你量身打造的Python快速入门到实战第1期。相信各位python学子一定愁于没有合适的教材而心急如焚吧，不用担心，这里是创文工作室为你良心打造的Python入门到实战,请大家先看目录目录0.写在前面0.1作者感言0.2Python介绍0.3Python安装1.注释1.1单行注释1.2多行注释2.输入与输出1.1输出1.1.1单行输出1.1.2多行输
python期末复习——python知识要点敲代码痛苦吗？ Python 其他 python
1、Python语言的特点及书写规范。特点：Python语言是一种面向对象的解释型语言1、解释型，开源，简单，易学，免费2.可扩展性，丰富的库，可移植性，面向对象3.规范的代码，可读性较强书写规范：缩进；注释；每个import只导入一个模块，尽量避免一次导入多个模块；语句太长可以在行尾使用续行符’’’’，来表示下面紧接的一行仍然属于当前的语句，也可以使用括号来包含多行内容；使用必要的空格和空行增强
戴尔笔记本win8系统改装win7系统 sophia天雪 win7 戴尔改装系统 win8
戴尔win8 系统改装win7 系统详述第一步：使用U盘制作虚拟光驱： 1）下载安装UltraISO：注册码可以在网上搜索。 2）启动UltraISO，点击“文件”—》“打开”按钮，打开已经准备好的ISO镜像文
BeanUtils.copyProperties使用笔记 bylijinnan java
BeanUtils.copyProperties VS PropertyUtils.copyProperties 两者最大的区别是： BeanUtils.copyProperties会进行类型转换，而PropertyUtils.copyProperties不会。既然进行了类型转换，那BeanUtils.copyProperties的速度比不上PropertyUtils.copyProp
MyEclipse中文乱码问题 0624chenhong MyEclipse
一、设置新建常见文件的默认编码格式，也就是文件保存的格式。在不对MyEclipse进行设置的时候，默认保存文件的编码，一般跟简体中文操作系统（如windows2000，windowsXP）的编码一致，即GBK。在简体中文系统下，ANSI 编码代表 GBK编码;在日文操作系统下，ANSI 编码代表 JIS 编码。 Window-->Preferences-->General -
发送邮件不懂事的小屁孩 send email
import org.apache.commons.mail.EmailAttachment; import org.apache.commons.mail.EmailException; import org.apache.commons.mail.HtmlEmail; import org.apache.commons.mail.MultiPartEmail;
动画合集换个号韩国红果果 html css
动画指一种样式变为另一种样式 keyframes应当始终定义0 100 过程 1 transition 制作鼠标滑过图片时的放大效果 css .wrap{ width: 340px;height: 340px; position: absolute; top: 30%; left: 20%; overflow: hidden; bor
网络最常见的攻击方式竟然是SQL注入蓝儿唯美 sql注入
NTT研究表明，尽管SQL注入（SQLi）型攻击记录详尽且为人熟知，但目前网络应用程序仍然是SQLi攻击的重灾区。信息安全和风险管理公司NTTCom Security发布的《2015全球智能威胁风险报告》表明，目前黑客攻击网络应用程序方式中最流行的，要数SQLi攻击。报告对去年发生的60亿攻击行为进行分析，指出SQLi攻击是最常见的网络应用程序攻击方式。全球网络应用程序攻击中，SQLi攻击占
java笔记2 a-john java
类的封装： 1，java中，对象就是一个封装体。封装是把对象的属性和服务结合成一个独立的的单位。并尽可能隐藏对象的内部细节（尤其是私有数据） 2，目的：使对象以外的部分不能随意存取对象的内部数据（如属性），从而使软件错误能够局部化，减少差错和排错的难度。 3，简单来说，“隐藏属性、方法或实现细节的过程”称为——封装。 4，封装的特性： 4.1设置
[Andengine]Error：can't creat bitmap form path “gfx/xxx.xxx” aijuans 学习Android遇到的错误
最开始遇到这个错误是很早以前了，以前也没注意，只当是一个不理解的bug，因为所有的texture，textureregion都没有问题，但是就是提示错误。昨天和美工要图片，本来是要背景透明的png格式，可是她却给了我一个jpg的。说明了之后她说没法改，因为没有png这个保存选项。我就看了一下，和她要了psd的文件，还好我有一点
自己写的一个繁体到简体的转换程序 asialee java 转换繁体 filter 简体
今天调研一个任务，基于java的filter实现繁体到简体的转换，于是写了一个demo，给各位博友奉上，欢迎批评指正。实现的思路是重载request的调取参数的几个方法，然后做下转换。
android意图和意图监听器技术百合不是茶 android 显示意图隐式意图意图监听器
Intent是在activity之间传递数据;Intent的传递分为显示传递和隐式传递显式意图：调用Intent.setComponent() 或 Intent.setClassName() 或 Intent.setClass()方法明确指定了组件名的Intent为显式意图，显式意图明确指定了Intent应该传递给哪个组件。隐式意图;不指明调用的名称,根据设
spring3中新增的@value注解 bijian1013 java spring @Value
在spring 3.0中，可以通过使用@value，对一些如xxx.properties文件中的文件，进行键值对的注入，例子如下： 1.首先在applicationContext.xml中加入： <beans xmlns="http://www.springframework.
Jboss启用CXF日志 sunjing log jboss CXF
1. 在standalone.xml配置文件中添加system-properties： <system-properties> <property name="org.apache.cxf.logging.enabled" value=&
【Hadoop三】Centos7_x86_64部署Hadoop集群之编译Hadoop源代码 bit1129 centos
编译必需的软件 Firebugs3.0.0 Maven3.2.3 Ant JDK1.7.0_67 protobuf-2.5.0 Hadoop 2.5.2源码包 Firebugs3.0.0 http://sourceforge.jp/projects/sfnet_findbug
struts2验证框架的使用和扩展白糖_ 框架 xml bean struts 正则表达式
struts2能够对前台提交的表单数据进行输入有效性校验，通常有两种方式： 1、在Action类中通过validatexx方法验证，这种方式很简单，在此不再赘述； 2、通过编写xx-validation.xml文件执行表单验证，当用户提交表单请求后，struts会优先执行xml文件，如果校验不通过是不会让请求访问指定action的。本文介绍一下struts2通过xml文件进行校验的方法并说
记录-感悟 braveCS 感悟
再翻翻以前写的感悟，有时会发现自己很幼稚，也会让自己找回初心。 2015-1-11 1. 能在工作之余学习感兴趣的东西已经很幸福了； 2. 要改变自己，不能这样一直在原来区域，要突破安全区舒适区，才能提高自己，往好的方面发展； 3. 多反省多思考；要会用工具，而不是变成工具的奴隶； 4. 一天内集中一个定长时间段看最新资讯和偏流式博
编程之美-数组中最长递增子序列 bylijinnan 编程之美
import java.util.Arrays; import java.util.Random; public class LongestAccendingSubSequence { /** * 编程之美数组中最长递增子序列 * 书上的解法容易理解 * 另一方法书上没有提到的是，可以将数组排序（由小到大）得到新的数组， * 然后求排序后的数组与原数
读书笔记5 chengxuyuancsdn 重复提交 struts2的token验证
1、重复提交 2、struts2的token验证 3、用response返回xml时的注意 1、重复提交 (1)应用场景 (1-1)点击提交按钮两次。 (1-2)使用浏览器后退按钮重复之前的操作，导致重复提交表单。 (1-3)刷新页面 (1-4)使用浏览器历史记录重复提交表单。 (1-5)浏览器重复的 HTTP 请求。 (2)解决方法 (2-1)禁掉提交按钮 (2-2)
[时空与探索]全球联合进行第二次费城实验的可能性 comsci
二次世界大战前后,由爱因斯坦参加的一次在海军舰艇上进行的物理学实验 -费城实验至今给我们大家留下很多迷团..... 关于费城实验的详细过程,大家可以在网络上搜索一下,我这里就不详细描述了在这里,我的意思是,现在
easy connect 之 ORA-12154: TNS: 无法解析指定的连接标识符 daizj oracle ORA-12154
用easy connect连接出现“tns无法解析指定的连接标示符”的错误，如下： C:\Users\Administrator>sqlplus username/[email protected]:1521/orcl SQL*Plus: Release 10.2.0.1.0 – Production on 星期一 5月 21 18:16:20 2012 Copyright (c) 198
简单排序:归并排序 dieslrae 归并排序
public void mergeSort(int[] array){ int temp = array.length/2; if(temp == 0){ return; } int[] a = new int[temp]; int
C语言中字符串的\0和空格 dcj3sjt126com c
\0 为字符串结束符，比如说： abcd (空格)cdefg；存入数组时，空格作为一个字符占有一个字节的空间，我们
解决Composer国内速度慢的办法 dcj3sjt126com Composer
用法：有两种方式启用本镜像服务： 1 将以下配置信息添加到 Composer 的配置文件 config.json 中（系统全局配置）。见“例1” 2 将以下配置信息添加到你的项目的 composer.json 文件中（针对单个项目配置）。见“例2” 为了避免安装包的时候都要执行两次查询，切记要添加禁用 packagist 的设置，如下 1 2 3 4 5
高效可伸缩的结果缓存 shuizhaosi888 高效可伸缩的结果缓存
/** * 要执行的算法，返回结果v */ public interface Computable<A, V> { public V comput(final A arg); } /** * 用于缓存数据 */ public class Memoizer<A, V> implements Computable<A,
三点定位的算法 haoningabc c 算法
三点定位，已知a,b,c三个顶点的x,y坐标和三个点都z坐标的距离，la，lb,lc 求z点的坐标原理就是围绕a,b,c 三个点画圆，三个圆焦点的部分就是所求但是，由于三个点的距离可能不准，不一定会有结果，所以是三个圆环的焦点，环的宽度开始为0，没有取到则加1 运行 gcc -lm test.c test.c代码如下 #include "stdi
epoll使用详解 jimmee c linux 服务端编程 epoll
epoll - I/O event notification facility在linux的网络编程中，很长的时间都在使用select来做事件触发。在linux新的内核中，有了一种替换它的机制，就是epoll。相比于select，epoll最大的好处在于它不会随着监听fd数目的增长而降低效率。因为在内核中的select实现中，它是采用轮询来处理的，轮询的fd数目越多，自然耗时越多。并且，在linu
Hibernate对Enum的映射的基本使用方法 linzx0212 enum Hibernate
枚举 /** * 性别枚举 */ public enum Gender { MALE(0), FEMALE(1), OTHER(2); private Gender(int i) { this.i = i; } private int i; public int getI
第10章高级事件（下） onestopweb 事件
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
孙子兵法 roadrunners 孙子兵法
始计第一孙子曰：兵者，国之大事，死生之地，存亡之道，不可不察也。故经之以五事，校之以计，而索其情：一曰道，二曰天，三曰地，四曰将，五曰法。道者，令民于上同意，可与之死，可与之生，而不危也；天者，阴阳、寒暑、时制也；地者，远近、险易、广狭、死生也；将者，智、信、仁、勇、严也；法者，曲制、官道、主用也。凡此五者，将莫不闻，知之者胜，不知之者不胜。故校之以计，而索其情，曰
MySQL双向复制 tomcat_oracle mysql
本文包括: 主机配置从机配置建立主-从复制建立双向复制背景按照以下简单的步骤: 参考一下：在机器A配置主机(192.168.1.30) 在机器B配置从机(192.168.1.29) 我们可以使用下面的步骤来实现这一点步骤1：机器A设置主机在主机中打开配置文件 ,
zoj 3822 Domination(dp) 阿尔萨斯 Mina
题目链接：zoj 3822 Domination 题目大意：给定一个N∗M的棋盘，每次任选一个位置放置一枚棋子，直到每行每列上都至少有一枚棋子，问放置棋子个数的期望。解题思路：大白书上概率那一张有一道类似的题目，但是因为时间比较久了，还是稍微想了一下。dp[i][j][k]表示i行j列上均有至少一枚棋子，并且消耗k步的概率（k≤i∗j）,因为放置在i+1~n上等价与放在i+1行上，同理

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他