quanmoupy

python爬虫从0到1(第五天)——Xpath与Jsonpath

数据解析之Xpath与Jsonpath

取其精华去其糟粕

通过前面几篇文章的学习，我们已经能够处理简单的需要登录的网站并且能够去分析我们需要的目标数据所在的url了，但可以发现获取到的响应不是一段html文本就是很长的一串json串，也就是说目标数据中掺杂了很多的无用信息。不管是html也好还是json也好，我们都可以很明显的看到它们的结构就像是一个大盒子，大盒子里面又有小盒子这样的结构，而这个入口呢我们可以称其为节点(要深入了解的朋友请自行学习前端三剑，对爬虫来说还是比较重要的)。那么对于节点对应的数据我们又要如何去进行提取呢？其实刚刚已经说过啦，它就像是大盒子里面包含了小盒子，例如html中包含了body和head，body中有有div、table等，所以也能知道其具有的层次关系，所以要去提取出其中的节点的话我们只要去一层一层地剥开它的“皮”就好了。在python中的话是有很多方法能够实现我们的需求的库，在这些库的帮助下我们就能够高效准确得提取出我们需要的目标数据了。

一、Xpath的使用

xpath全称为XML Path Language，即XML路径语言，用以在XML文档中查找信息，同时也是适用于HTML文档的搜索。因此我们完全可以在爬虫中使用xpath来进行信息提取。

1.1 xpath节点关系

在XML或者HTML中的标签就是我们所说的节点，其中最外层的称为根节点。如下方代码的节点分析。

<bookstore>
<book category="COOKING">
  <title lang="en">Everyday Italiantitle> 
  <author>Giada De Laurentiisauthor> 
  <year>2005year> 
  <price>30.00price> 
book>
<book category="CHILDREN">
  <title lang="en">Harry Pottertitle> 
  <author>J K. Rowlingauthor> 
  <year>2005year> 
  <price>29.99price> 
book>
<book category="WEB">
  <title lang="en">Learning XMLtitle> 
  <author>Erik T. Rayauthor> 
  <year>2003year> 
  <price>39.95price> 
book>
bookstore>

其转换为树结构如下图所示

其中我们就可以看到bookstore就是根节点，然后其包含了三个book标签，称其为bookstore的子节点，反之称bookstore为book的父节点，book节点下又有title、author、year、price四个子节点，这四个子节点位于同一父节点下互为兄弟节点。代入代码分析是同样的道理，如下图。

1.2 lxml的使用

lxml是HTML和XML的解析器，其主要功能就是能够从XML和HTML中解析和提取数据。

安装方式：通过包管理工具pip进行安装

pip install lxml

安装完成后代码中导包进行使用即可，导包方式

from lxml import etree

导包后要将字符串实例化为Element对象，该对象具有xpath的方法，返回的结果为列表类型。
html = etree.XML(text)	# 或html = etree.HTML(text)
# 当为XML时表示处理XML文档，为HTML时表示处理HTML文档
result_list = html.xpath('写入xpath路径表达式')

1.3 Xpath表达式

定位语法主要依赖以下符号

表达式说明举例

/ 从根节点开始选取(绝对路径) /html/div/span

// 从任意节点开始选取(相对路径) //input

. 选取当前节点

.. 选取当前节点的父节点 //input/… 会选取 input 的父节点

@ 选取属性，或者根据属性选取 //input[@data] 选取具备 data 属性的 input 元素 //@data 选取所有 data 属性

* 通配符，表示任意节点或任意属性 //*

表达式	说明	举例
`/`	从根节点开始选取(绝对路径)	/html/div/span
`//`	从任意节点开始选取(相对路径)	//input
`.`	选取当前节点
`..`	选取当前节点的父节点	//input/… 会选取 input 的父节点
`@`	选取属性，或者根据属性选取	//input[@data] 选取具备 data 属性的 input 元素 //@data 选取所有 data 属性
`*`	通配符，表示任意节点或任意属性	//*

接下来以1.1中的XML文本为例学习xpath表达式

from lxml import etree

xml_local = etree.XML(xml)

# 选取根节点bookstore。 假如路径起始于正斜杠（/），则此路径始终代表到某元素的绝对路径
xpath_bookstore = xml_local.xpath('/bookstore')
print(xpath_bookstore)
print(type(xpath_bookstore[0]))

# 选取根节点bookstore的子节点book
xpath_book = xml_local.xpath('/bookstore/book')
print(xpath_book)
print(type(xpath_book[0]))

# 跨节点进行解析book的结果
xpath_book = xml_local.xpath('//book')
print(xpath_book)

# 选择bookstore节点的所有book节点
xpath_book = xml_local.xpath('/bookstore//book')
print(xpath_book)

# 提取对应位置的标签，注意：xpath中下标是从1开始
xpath_book1 = xml_local.xpath('//book[1]')
print(xpath_book1)

# 文本提取
xpath_text_book = xml_local.xpath('//book[1]//text()')
print(xpath_text_book)

# 根据属性值来提取标签
xpath_book = xml_local.xpath('//book/title[@lang="eng"]//text()')
print(xpath_book)

# 获取标签中的属性值
xpath_elements = xml_local.xpath('//book/title/@lang')
print(xpath_elements)

# 选取bookstore子节点中最后一个book节点中的元素
last_book = xml_local.xpath('//book[last()]/title/text()')
print(last_book)

# 选取bookstore子节点book中title文本，从第二个开始选取
xpath_large1 = xml_local.xpath('//book[position()>1]/title/text()')
print(xpath_large1)

# 仅选择文本为Harry Potter的title的文本
xpath_book_harry = xml_local.xpath('//book/title[text()="Harry Potter"]/text()')
print(xpath_book_harry)

# 选取 bookstore 元素中的 book 元素的所有 title 文本，且其中的 price 元素的值须大于 35.00
xpath_price_l35 = xml_local.xpath('book[price>35]/title/text()')
print(xpath_price_l35)

# *选取所有节点
xpath_all = xml_local.xpath('//book/*')
print(xpath_all)

# 选取所有带有属性的title节点
xpath_all_title = xml_local.xpath('//book/title[@*]')
print(xpath_all_title)

# 使用"|"两个表达式分别提取title和price的结果
xpath_both_pt = xml_local.xpath('//book/title | //book/price')
print(xpath_both_pt)

# 通过在路径表达式中使用“|”运算符，可以选取若干个路径。
# 选取 book 元素的所有 title 和 price 元素。
xml = etree.XML(str)
xpath_data = xml.xpath("//book/title | //book/price")
print(xpath_data)

# 选取文档中的所有 title 和 price 元素。
xml = etree.XML(str)
xpath_data = xml.xpath("//title | //price")
print(xpath_data)

# 选取属于 bookstore 元素的 book 元素的所有 title 元素，以及文档中所有的 price 元素。
xml = etree.XML(str)
xpath_data = xml.xpath("/bookstore/book/title | //price")
print(xpath_data)

上方代码请逐个运行测试。

二、json的数据提取

JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式，它使得人们很容易的进行阅读和编写。同时也方便了机器进行解析和生成。适用于进行数据交互的场景，比如网站前端与后端之间的数据交互。

1.1 json.dumps()和json.loads()是json格式处理函数

可以这么理解，json是字符串

(1)json.dumps()函数是将一个Python数据类型字典转换为json格式

json.dumps()函数是将字典转化为字符串

json.dumps(python数据类型字典, indent=空格数, ensure_ascii=False)
	indent:参数根据数据格式缩进显示，读起来更加清晰
	ensure_ascii=True：默认输出ASCLL码，如果把这个该成False,就可以输出中文

(2)json.loads()函数是将json格式数据转换为字典

json.loads()函数是将字符串转化为字典

json.loads(json字符串)

import json
# json.dumps 实现python类型转化为json字符串
# json.dumps(dict_data, indent=2, ensure_ascii=False)
# dict_data 要转换的数据
# indent实现换行和空格
# ensure_ascii=False实现让中文写入的时候保持为中文
import json

dict_data = {
    'name': '靓女',
    'age': 18
}
# json.dumps() 将python数据类型（字典）转换为json(字符串)
json_str = json.dumps(dict_data,indent =2, ensure_ascii=False)
print(json_str)  # 发现引号变成了双引号，因为json格式的引号为双引号
print(type(json_str))  # 字符串类型

# json.loads()实现json（字符串）转化为python的数据类型（字典）
python_dict = json.loads(json_str)
print(python_dict)  # 发现双引号又变为单引号了
print(type(python_dict))  # 字典类型

2.2 json.dump()和json.load()主要用来读写json文件的函数

(1) json.dump()函数是将一个Python数据类型字典写入到json文件里面

json.dump(python数据类型字典, 文件变量，indent=空格数, ensure_ascii=False)
	文件变量：open返回的变量
	indent:参数根据数据格式缩进显示，读起来更加清晰
	ensure_ascii=True：默认输出ASCLL码，如果把这个该成False,就可以输出中文

(2)json.load()函数是将json文件的字符串转化为python数据类型的列表

# json.dump 实现把python类型写入json类文件对象
# json.dump(dict_data, 文件变量，indent=空格数, ensure_ascii=False)
# dict_data 要转换的数据
# indent实现换行和空格
# ensure_ascii=False实现让中文写入的时候保持为中文


# json.dump()函数将一个python数据类型列表（字典）写入到json文件
with open("dict_data.json", "w", encoding="utf-8") as f:
    json.dump(dict_data, f, ensure_ascii=False)  # 查看写入的文件发现转换为json类型了

# json.load()函数 将json文件的数据转换为python数据类型
with open("dict_data.json", "r", encoding="utf-8") as f:
    python_dict = json.load(f)
    print(python_dict)  # 引号又变为单引号了
    print(type(python_dict))  # 发现又变为字典类型了

总结：

json.dumps()函数是将一个Python数据类型（字典）转换为json类型（字符串）
json.dump()函数是将一个Python数据类型（字典）写入到json文件里面并且转换为json类型（字符串）

json.loads()函数是将json格式（字符串）转换为python数据类型（字典）
json.load()函数是将json文件的json数据类型（字符串）转换为python数据类型（字典）

三、jsonpath

3.1 jsonpath介绍

用来解析多层嵌套的json数据;JsonPath 是一种信息抽取类库，是从JSON文档中抽取指定信息的工具，提供多种语言实现版本，包括：Javascript, Python， PHP 和 Java。

4.2 JsonPath 对于 JSON 来说，相当于 XPath 对于 XML。

    安装方法：pip install jsonpath
	语法： jsonpath.jsonpath(json数据，筛选条件)  
	     没筛选到则返回False
    官方文档：http://goessner.net/articles/JsonPath

4.3 JsonPath语法

JsonPath	根节点
$	根节点（就相当于windows电脑的此电脑）
@	当前选中得节点
.	选取子节点
…	跨节点
*	匹配所有元素节点
[]	迭代器标示（可以在这里面做简单的迭代操作，如列表下标，根据内容选值等）
[,]	支持迭代器中做多选
?()	通过条件过滤数据
()	支持表达式计算

4.4代码示例

dict_data = {"store": {
    "book": [
        {"category": "reference",
         "author": "吴承恩",
         "title": "西游记",
         "price": 8.95
         },
        {"category": "fiction",
         "author": "曹雪芹",
         "title": "红楼梦",
         "price": 12.99
         },
        {"category": "fiction",
         "author": "罗贯中",
         "title": "三国演义",
         "isbn": "0-553-21311-3",
         "price": 8.99
         },
        {"category": "fiction",
         "author": "施耐庵",
         "title": "水浒传",
         "isbn": "0-395-19395-8",
         "price": 22.99
         }
    ],
    "bicycle": {
        "color": "red",
        "price": 19.95
    }
}
            }

import jsonpath
import json

dict_data = {"store": {
    "book": [
        {"category": "reference",
         "author": "吴承恩",
         "title": "西游记",
         "price": 8.95
         },
        {"category": "fiction",
         "author": "曹雪芹",
         "title": "红楼梦",
         "price": 12.99
         },
        {"category": "fiction",
         "author": "罗贯中",
         "title": "三国演义",
         "isbn": "0-553-21311-3",
         "price": 8.99
         },
        {"category": "fiction",
         "author": "施耐庵",
         "title": "水浒传",
         "isbn": "0-395-19395-8",
         "price": 22.99
         }
    ],
    "bicycle": {
        "color": "red",
        "price": 19.95
    }
}
}

# $ 根节点  .选取子节点
# 获取store的值
citylist = jsonpath.jsonpath(dict_data, '$.store')
# 获取book的值
citylist = jsonpath.jsonpath(dict_data, '$.store.book')
print(citylist)

# * 匹配所有元素节点
# 获取book所有值
citylist = jsonpath.jsonpath(dict_data, '$.store.book.*')
print(citylist)


# .. 跨节点     $..元素    跨过根节点到元素之间的节点直接找到元素
# 使用..获取book的值
citylist = jsonpath.jsonpath(dict_data, '$..book')
print(citylist)

# * 匹配所有元素节点
#使用..获取book所有值
citylist = jsonpath.jsonpath(dict_data, '$..book.*')
print(citylist)
# 获取根节点下面的所有值
citylist = jsonpath.jsonpath(dict_data, '$..*')
print(citylist)
# 总结： . 和..
# 使用.选取子节点必须要一个节点一个节点的取，直到定位到对应的节点元素为止
# 使用.. 可以直接定位到要取的值，不用考虑中间有多少节点


# 获取第三本书
# 这里的第几本书是不是列表里面的元素，同学们还记不记得我们列表里面怎么取列表里面某个值的
# # $ 根节点  .选取子节点   [] 迭代器标示（下标取值）    * 匹配所有元素节点
citylist = jsonpath.jsonpath(dict_data, '$.store.book[2]')
print(citylist)
# 获取前两本书
# [,] 多个下标
citylist = jsonpath.jsonpath(dict_data, '$.store.book[0,1]')  # 注意下标也是从0开始，0代表第一个，1代表第二个，取第一个和第二个
print(citylist)
citylist = jsonpath.jsonpath(dict_data, '$.store.book[:1]')
print(citylist)
# 总结 :这里获取列表里面的某个元素跟我们python基础里面一样的通过下标获取

# () 支持表达式计算 @.length-1 取最后一个值
# $..book[(@.length-1)] | $..book[-1:]
# 最后一本书
citylist = jsonpath.jsonpath(dict_data, '$..book[(@.length-1)]')
print(citylist)
citylist = jsonpath.jsonpath(dict_data, '$..book[-1:]')
print(citylist)

citylist = jsonpath.jsonpath(dict_data, '$..book.*')
print(len(citylist)-1)
# 总结： @.length  就相当len()函数

# 获取有author的所有值
#  [] 根据内容选值  ?()根据条件过滤   @ 当前选中的节点
"""
分析：
    1. 根据json数据可以看出，author是在book的列表里的列表
    2. 所以我们要有  $.store.book[]  ，book里面的值
    3.接下来我就要筛选出book里面的有author的值了  
    4.筛选的话就要使用 ?()根据条件过滤
    5.里面的值就是author ，我们要选择author这个节点 就可以使用 @
"""
citylist = jsonpath.jsonpath(dict_data, '$.store.book[*].author')
print(citylist)
citylist = jsonpath.jsonpath(dict_data, '$.store.book[?(@.author)]')
print(citylist)

# 获取有isbn的所有值
citylist = jsonpath.jsonpath(dict_data, '$.store.book[?(@.isbn)]')
print(citylist)

# 获取价格小于10的所有书
citylist = jsonpath.jsonpath(dict_data, '$.store.book[?(@.price<10)]')
print(citylist)

Python爬虫：高效获取1688商品详情的实战指南数据小爬虫@ python 爬虫开发语言
在电商行业，数据是商家制定策略、优化运营的核心资源。1688作为国内领先的B2B电商平台，拥有海量的商品信息。通过Python爬虫技术，我们可以高效地获取这些商品详情数据，为商业决策提供有力支持。一、为什么选择Python爬虫？Python以其简洁易读的语法和强大的库支持，成为爬虫开发的首选语言之一。利用Python爬虫，可以快速实现从1688平台获取商品详情的功能，包括商品标题、价格、图片、描述
python模块triton安装教程 2401_85863780 1024程序员节 triton whl
Triton是一个用于高性能计算的开源库，特别适用于深度学习和科学计算。通过预编译的whl文件安装Triton可以简化安装过程，尤其是在编译时可能会遇到依赖问题的情况下。以下是详细的安装步骤：安装前准备：Python环境：确保已经安装了Python，并且Python版本与whl文件兼容。pip：确保已经安装了pip，这是Python的包管理器，用来安装外部库。下载whl文件：从可靠的来源下载适用于
python模块mediapipe安装教程 2401_85863780 python 开发语言 mediapipe
安装MediaPipe通过.whl文件的方法与安装其他Python库相似。下面是详细的步骤，指导你如何通过.whl文件安装MediaPipe。1.确认Python和pip已经安装首先，确保你的系统上已经安装了Python和pip。你可以通过打开命令行（对于Windows用户，这可以是CMD或PowerShell；对于macOS和Linux用户，这可以是终端）并运行以下命令来检查：python--v
【whl文件】python各版本whl下载地址汇总 2401_85863780 python linux 开发语言
whl文件，全称为wheel文件，是Python分发包的一种标准格式。它是预编译的二进制包，包含了Python模块的压缩形式（如.py文件和编译后的.pyd文件）以及这些模块的元数据，通常通过Zip压缩算法进行压缩。whl文件的出现，使得Python包的安装过程变得更为简单和高效，因为它允许用户快速安装Python包及其依赖项，而无需从源代码开始编译。此外，whl文件还具有良好的跨平台兼容性，可以
Ubuntu下 Python 版本切换 Tobey袁 Ubuntu shell ubuntu linux
在Ubuntu的开发环境下，由于Python2和Python3很多不兼容，经常会需要我们手动切换Python版本。sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python2100sudoupdate-alternatives--install/usr/bin/pythonpython/usr/bin/python315
python中set的用法_Python中set的用法 weixin_39876645 python中set的用法
python的集合类型和其他语言类似,是一个无序不重复元素集,我在之前学过的其他的语言好像没有见过这个类型，基本功能包括关系测试和消除重复元素.集合对象还支持union(联合),intersection(交),difference(差)和sysmmetricdifference(对称差集)等数学运算,和我们初中数学学的集合的非常的相似。1先看下python集合类型的不重复性，这方面做一些去重处理非
python set用法小结 Super_Meredith pandas set
1.创建集合set()>>>set('python'){'o','p','h','n','t','y'}>>>set(['python']){'python'}#去重>>>list1=[11,11,12,13,14,14,15]>>>set(list1){11,12,13,14,15}2.添加add()，update()#add():把传入的元素做为一个整体添加到集合中>>>set1=set('p
python 集合概念set用法 shuwenting python 基础
Python中set的用法python的集合类型和其他语言类似,是一个无序不重复元素集,我在之前学过的其他的语言好像没有见过这个类型，基本功能包括关系测试和消除重复元素.集合对象还支持union(联合),intersection(交),difference(差)和sysmmetricdifference(对称差集)等数学运算,和我们初中数学学的集合的非常的相似。1先看下python集合类型的不重复
python set operation screaming Python Set
Setcanbeconvertedtolistbylist(set)add(elem)¶Addelementelemtotheset.remove(elem)Removeelementelemfromtheset.RaisesKeyErrorifelemisnotcontainedintheset.discard(elem)Removeelementelemfromthesetifitispres
Python Web开发记录 Day12：Django part6 用户登录 Code_流苏 #---Python Web开发---#Django 项目探索实验室 python 前端 django
名人说：东边日出西边雨，道是无晴却有晴。——刘禹锡《竹枝词》创作者：Code_流苏(CSDN)（一个喜欢古诗词和编程的Coder）目录1、登录界面2、用户名密码校验3、cookie与session配置①cookie与session②配置4、登录验证5、注销登录6、图片验证码①Pillow库②图片验证码的实现7、补充：图片验证码的作用和扩展①作用②其他类型的验证码8、验证码校验在上一篇博客中我们实现
Ubuntu中如何使用pip切换不同的python版本建立虚拟环境挪威的深林【Linux】操作命令 linux问题 python教程 pip virtualenv python
一.前言最近遇到非常头疼的问题,在ubuntu中运行不同的项目或者downloadgithub的项目时,总是需要不同版本的python,不同版本的pkgs.因此,为不同的项目建立各自的虚拟环境是一个比较方便的事情.对于建立虚拟环境,目前本人所掌握的主要是conda,以及pip,如果使用conda去建立虚拟环境,则需要安装anaconda,或则minianaconda.在安装anaconda后才能够
代码随想录day3 mvufi python 开发语言
203.移除链表元素虚拟头结点：增加删除都很容易python不用new，直接=ListNode(...)#Definitionforsingly-linkedlist.#classListNode:#def__init__(self,val=0,next=None):#self.val=val#self.next=nextclassSolution:defremoveElements(self,h
[LeetCode-Python版]Hot100（2/100）——128. 最长连续序列古希腊掌管学习的神 LeetCode-Python leetcode python 算法
题目给定一个未排序的整数数组nums，找出数字连续的最长序列（不要求序列元素在原数组中连续）的长度。请你设计并实现时间复杂度为O(n)的算法解决此问题。示例1：输入：nums=[100,4,200,1,3,2]输出：4解释：最长数字连续序列是[1,2,3,4]。它的长度为4。示例2：输入：nums=[0,3,7,2,5,8,4,6,0,1]输出：9题目链接思路因为题目要求O（n）的时间复杂度，所以
[LeetCode-Python版]Hot100（1/100）——49. 字母异位词分组古希腊掌管学习的神 LeetCode-Python leetcode python 算法
题目给你一个字符串数组，请你将字母异位词组合在一起。可以按任意顺序返回结果列表。字母异位词是由重新排列源单词的所有字母得到的一个新单词。示例1:输入:strs=[“eat”,“tea”,“tan”,“ate”,“nat”,“bat”]输出:[[“bat”],[“nat”,“tan”],[“ate”,“eat”,“tea”]]示例2:输入:strs=[“”]输出:[[“”]]示例3:输入:strs=
ubuntu系统切换python版本的方法 lkasi Ubuntu ubuntu linux 运维
1.查看所有的python版本终端输入ls/usr/bin/python*结果2.切换版本终端输入sudoupdate-alternatives--configpython结果输入对应的选择编号即可切换python版本
python版本升级 HiSiri~ python python 开发语言
python版本升级背景在对centos机器升级Python版本从3.6到3.10后，pip安装出现了一些问题[解决pipisconfiguredwithlocationsthatrequireTLS/SSL问题]操作下载在官方主站找到合适的版本，并下载https://www.python.org/ftp/python/wgethttps://www.python.org/ftp/python/3
Python集合之set()使用方法详解 lmseo5hy python培训 python集合
set是一个无序且不重复的元素集合，它有可变集合(set())和不可变集合(frozenset)两种，可以对set()集合进行创建、添加、删除、交集、并集和差集的操作，非常实用，以下是具体用法：一、创建集合setpythonset类是在python的sets模块中，新的python版本可以直接创建集合，不需要导入sets模块。具体用法：1.set('old')2.set(‘o’,’l’,’d’)二
[LeetCode-Python版]动态规划——0-1背包和完全背包问题总结古希腊掌管学习的神 LeetCode-Python leetcode python 动态规划
0-1背包有n个物品，第i个物品的体积为wiw_iwi，价值为viv_ivi，每个物品至多选一个，求体积和不超过capacity时的最大价值和状态转移：dfs(i,c)=max(dfs(i−1,c),dfs(i−1,c−w[i])+v[i]dfs(i,c)=max(dfs(i-1,c),dfs(i-1,c-w[i])+v[i]dfs(i,c)=max(dfs(i−1,c),dfs(i−1,c−w[
ipykernel-4.10.0-py2-none-any.whl文件解析与安装指南嗹国学长
本文还有配套的精品资源，点击获取简介：PyPI是Python的软件包仓库，本篇将解析一个特定Python包——ipykernel的4.10.0版本。ipykernel是Jupyter项目的核心组件，用于创建和运行交互式Python内核。本指南将介绍其功能、特点和安装过程，并强调其在跨语言支持、异步I/O处理、调试和交互式通信等方面的重要性。用户可通过pip安装该版本，以支持Python2环境中的J
[解决ERROR]VScode中运行ipynb文件报错缺少ipykernel 又困又爱睡 vscode jupyter
[解决ERROR]VScode中运行ipynb文件报错缺少ipykernel1.在VScode中添加jupyter插件2.建议大家安装python版本目前不要大于3.93.在环境中安装jupyter的包，同时会帮我们下载好ipykernel的包4.如果你不幸发现自己的pyzmq包已经下载且版本是23.3.1或以上版本导致FailedtostarttheKernel5.结语前言：最近帮大家配置ana
python字典的嵌套计算机小白的爬坑之路 python基础 python
字典嵌套及打印题目：城市创建一个名为cities的字典，其中将三个城市名用作键；对于每座城市，都创建一个字典，并在其中包含该城市所属的国家、人口约数以及一个有关该城市的事实。在表示每座城市的字典中，应包含country、population和fact等键。将每座城市的名字以及有关它们的信息都打印出来。代码如下所示：cities={'北京':{'country':'China','populatio
w224疫情管理系统设计与实现卓怡学长计算机毕业设计 java spring spring boot 数据库 intellij-idea
作者简介：多年一线开发工作经验，原创团队，分享技术代码帮助学生学习，独立完成自己的网站项目。代码可以查看文章末尾⬇️联系方式获取，记得注明来意哦~赠送计算机毕业设计600个选题excel文件，帮助大学选题。赠送开题报告模板，帮助书写开题报告。作者完整代码目录供你选择：《Springboot网站项目》400套《ssm网站项目》800套《小程序项目》300套《App项目》500套《Python网站项目
Python:字典嵌套 lcqin111 python
可以在列表中嵌套字典、在字典中嵌套列表甚至在字典中嵌套字典alien_0={'color':'green','points':5}alien_1={'color':'yellow','points':10}alien_2={'color':'red','points':15}aliens=[alien_0,alien_1,alien_2]foralieninaliens:print(alien)这
Conda添加新的Kernel _TFboy conda python 开发语言
官方说明:https://ipython.readthedocs.io/en/stable/install/kernel_install.html要向Conda添加一个新的内核（kernel），你可以按照以下步骤进行操作：确保你已经激活了你想要添加内核的Conda环境。运行以下命令激活环境：condaactivateyour_environment_name将“your_environment_n
探索IPykernel：Python交互式计算的核心引擎解然嫚Keegan
探索IPykernel：Python交互式计算的核心引擎项目地址:https://gitcode.com/gh_mirrors/ip/ipykernel是一个开放源代码项目，它是IPythonNotebook和JupyterNotebook背后的驱动力，使得在Python环境中进行交互式计算成为可能。本文将带你深入了解IPykernel的技术特性、应用及优势，引导你更有效地利用它提升开发效率。项目
【20天快速掌握Python】day20-手动搭建HTTP服务器菜鸟进阶站 Python 后端开发编程 python http 服务器
演示代码： importre importsocket frommultiprocessingimportProcess classWSGIServer(): def__init__(self,server,port,root): self.server=server self.port=port self.root=root self.server_s
【20天快速掌握Python】day18-进程菜鸟进阶站 Python 编程后端开发 python 前端 javascript
进程程序：例如xxx.py这是程序，是一个静态的。进程：一个程序运行起来后，代码+用到的资源称之为进程，它是操作系统分配资源的基本单元。不仅可以通过线程完成多任务，进程也是可以的。进程的状态工作中，任务数往往大于cpu的核数，即一定有一些任务正在执行，而另外一些任务在等待cpu进行执行，因此导致了有了不同的状态。就绪态：运行的条件都已经满足，正在等在cpu执行。执行态：cpu正在执行其功能。等待态
【20天快速掌握Python】day17-线程菜鸟进阶站 Python 编程后端开发 python 前端 java
1.线程安全问题1.1线程访问全局变量importthreadingg_num=0deftest(n):globalg_numforxinrange(n):g_num+=xg_num-=xprint(g_num)if__name__=='__main__':t1=threading.Thread(target=test,args=(10,))t2=threading.Thread(target=t
【20天快速掌握Python】day08-高阶函数菜鸟进阶站 Python 编程后端开发 python 开发语言 numpy
1.递归函数什么是递归函数？如果一个函数在内部不调用其它的函数，而是自己本身的话，这个函数就是递归函数。递归函数的作用举个例子，我们来计算阶乘n!=1*2*3*...*n解决办法1:使用循环来完成 defcal(num): result,i=1,1 whilei函数对应的数据类型是function,可以把它当做是一种复杂的数据类型。既然同样都是一种数据类型，我们就可以把它当做数字或者字符串
【20天快速掌握Python】day09-模块和包菜鸟进阶站 Python 编程后端开发 python 开发语言前端
1.Python中的模块在Python中有一个概念叫做模块（module）。说的通俗点：模块就好比是工具包，要想使用这个工具包中的工具(就好比函数)，就需要导入这个模块比如我们经常使用工具random，就是一个模块。使用importrandom导入工具之后，就可以使用random的函数。导入模块有五种方式import模块名from模块名import功能名from模块名import*import模块
ztree异步加载 3213213333332132 JavaScript Ajax json Web ztree
相信新手用ztree的时候,对异步加载会有些困惑，我开始的时候也是看了API花了些时间才搞定了异步加载，在这里分享给大家。我后台代码生成的是json格式的数据，数据大家按各自的需求生成，这里只给出前端的代码。设置setting，这里只关注async属性的配置 var setting = { //异步加载配置
thirft rpc 具体调用流程 BlueSkator 中间件 rpc thrift
Thrift调用过程中，Thrift客户端和服务器之间主要用到传输层类、协议层类和处理类三个主要的核心类，这三个类的相互协作共同完成rpc的整个调用过程。在调用过程中将按照以下顺序进行协同工作：（1）将客户端程序调用的函数名和参数传递给协议层（TProtocol），协议
异或运算推导, 交换数据 dcj3sjt126com PHP 异或 ^
/* * 5 0101 * 9 1010 * * 5 ^ 5 * 0101 * 0101 * ----- * 0000 * 得出第一个规律: 相同的数进行异或, 结果是0 * * 9 ^ 5 ^ 6 * 1010 * 0101 * ---- * 1111 * * 1111 * 0110 * ---- * 1001
事件源对象周华华 JavaScript
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/1999/xhtml&q
MySql配置及相关命令 g21121 mysql
MySQL安装完毕后我们需要对它进行一些设置及性能优化，主要包括字符集设置，启动设置，连接优化，表优化，分区优化等等。一修改MySQL密码及用户
[简单]poi删除excel 2007超链接 53873039oycg Excel
采用解析sheet.xml方式删除超链接，缺点是要打开文件2次,代码如下: public void removeExcel2007AllHyperLink(String filePath) throws Exception { OPCPackage ocPkg = OPCPac
Struts2添加 open flash chart 云端月影
准备以下开源项目： 1. Struts 2.1.6 2. Open Flash Chart 2 Version 2 Lug Wyrm Charmer (28th, July 2009) 3. jofc2，这东西不知道是没做好还是什么意思，好像和ofc2不怎么匹配，最好下源码，有什么问题直接改。 4. log4j 用eclipse新建动态网站，取名OFC2Demo，将Struts2 l
spring包详解 aijuans spring
下载的spring包中文件及各种包众多，在项目中往往只有部分是我们必须的，如果不清楚什么时候需要什么包的话，看看下面就知道了。 aspectj目录下是在Spring框架下使用aspectj的源代码和测试程序文件。Aspectj是java最早的提供AOP的应用框架。 dist 目录下是Spring 的发布包，关于发布包下面会详细进行说明。 docs&nb
网站推广之seo概念 antonyup_2006 算法 Web 应用服务器搜索引擎 Google
持续开发一年多的b2c网站终于在08年10月23日上线了。作为开发人员的我在修改bug的同时，准备了解下网站的推广分析策略。所谓网站推广，目的在于让尽可能多的潜在用户了解并访问网站，通过网站获得有关产品和服务等信息，为最终形成购买决策提供支持。网站推广策略有很多，seo，email，adv
单例模式,sql注入,序列百合不是茶单例模式序列 sql注入预编译
序列在前面写过有关的博客,也有过总结,但是今天在做一个JDBC操作数据库的相关内容时需要使用序列创建一个自增长的字段居然不会了,所以将序列写在本篇的前面 1,序列是一个保存数据连续的增长的一种方式; 序列的创建; CREATE SEQUENCE seq_pro 2 INCREMENT BY 1 -- 每次加几个 3
Mockito单元测试实例 bijian1013 单元测试 mockito
Mockito单元测试实例： public class SettingServiceTest { private List<PersonDTO> personList = new ArrayList<PersonDTO>(); @InjectMocks private SettingPojoService settin
精通Oracle10编程SQL(9)使用游标 bijian1013 oracle 数据库 plsql
/* *使用游标 */ --显示游标 --在显式游标中使用FETCH...INTO语句 DECLARE CURSOR emp_cursor is select ename,sal from emp where deptno=1; v_ename emp.ename%TYPE; v_sal emp.sal%TYPE; begin ope
【Java语言】动态代理 bit1129 java语言
JDK接口动态代理 JDK自带的动态代理通过动态的根据接口生成字节码(实现接口的一个具体类)的方式，为接口的实现类提供代理。被代理的对象和代理对象通过InvocationHandler建立关联 package com.tom; import com.tom.model.User; import com.tom.service.IUserService;
Java通信之URL通信基础白糖_ java jdk webservice 网络协议 ITeye
java对网络通信以及提供了比较全面的jdk支持，java.net包能让程序员直接在程序中实现网络通信。在技术日新月异的现在，我们能通过很多方式实现数据通信，比如webservice、url通信、socket通信等等，今天简单介绍下URL通信。学习准备：建议首先学习java的IO基础知识 URL是统一资源定位器的简写，URL可以访问Internet和www，可以通过url
博弈Java讲义 - Java线程同步 (1) boyitech java 多线程同步锁
在并发编程中经常会碰到多个执行线程共享资源的问题。例如多个线程同时读写文件，共用数据库连接，全局的计数器等。如果不处理好多线程之间的同步问题很容易引起状态不一致或者其他的错误。同步不仅可以阻止一个线程看到对象处于不一致的状态，它还可以保证进入同步方法或者块的每个线程，都看到由同一锁保护的之前所有的修改结果。处理同步的关键就是要正确的识别临界条件（cri
java-给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 bylijinnan java
public class DeleteExtraSpace { /** * 题目：给定字符串，删除开始和结尾处的空格，并将中间的多个连续的空格合并成一个。 * 方法1.用已有的String类的trim和replaceAll方法 * 方法2.全部用正则表达式，这个我不熟 * 方法3.“重新发明轮子”，从头遍历一次 */ public static v
An error has occurred.See the log file错误解决！ Kai_Ge MyEclipse
今天早上打开MyEclipse时，自动关闭！弹出An error has occurred.See the log file错误提示！很郁闷昨天启动和关闭还好着！！！打开几次依然报此错误，确定不是眼花了！打开日志文件！找到当日错误文件内容： --------------------------------------------------------------------------
[矿业与工业]修建一个空间矿床开采站要多少钱? comsci
地球上的钛金属矿藏已经接近枯竭........... 我们在冥王星的一颗卫星上面发现一些具有开采价值的矿床..... 那么,现在要编制一个预算,提交给财政部门..
解析Google Map Routes dai_lm google api
为了获得从A点到B点的路劲，经常会使用Google提供的API，例如 [url] http://maps.googleapis.com/maps/api/directions/json?origin=40.7144,-74.0060&destination=47.6063,-122.3204&sensor=false [/url] 从返回的结果上，大致可以了解应该怎么走，但
SQL还有多少“理所应当”？ datamachine sql
转贴存档，原帖地址：http://blog.chinaunix.net/uid-29242841-id-3968998.html、http://blog.chinaunix.net/uid-29242841-id-3971046.html！ ------------------------------------华丽的分割线--------------------------------
Yii使用Ajax验证时，如何设置某些字段不需要验证 dcj3sjt126com Ajax yii
经常像你注册页面,你可能非常希望只需要Ajax去验证用户名和Email,而不需要使用Ajax再去验证密码,默认如果你使用Yii 内置的ajax验证Form,例如: $form=$this->beginWidget('CActiveForm', array( 'id'=>'usuario-form',&
使用git同步网站代码 dcj3sjt126com crontab git
转自:http://ued.ctrip.com/blog/?p=3646?tn=gongxinjun.com 管理一网站，最开始使用的虚拟空间，采用提供商支持的ftp上传网站文件，后换用vps，vps可以自己搭建ftp的，但是懒得搞，直接使用scp传输文件到服务器，现在需要更新文件到服务器，使用scp真的很烦。发现本人就职的公司，采用的git+rsync的方式来管理、同步代码，遂
sql基本操作蕃薯耀 sql sql基本操作 sql常用操作
sql基本操作 >>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>>> 蕃薯耀 2015年6月1日 17:30:33 星期一 &
Spring4+Hibernate4+Atomikos3.3多数据源事务管理 hanqunfeng Hibernate4
Spring3+后不再对JTOM提供支持，所以可以改用Atomikos管理多数据源事务。Spring2.5+Hibernate3+JTOM参考：http://hanqunfeng.iteye.com/blog/1554251Atomikos官网网站：http://www.atomikos.com/ 一.pom.xml <dependency> <
jquery中两个值得注意的方法one()和trigger()方法 jackyrong trigger
在jquery中，有两个值得注意但容易忽视的方法，分别是one()方法和trigger()方法,这是从国内作者<<jquery权威指南》一书中看到不错的介绍 1） one方法 one方法的功能是让所选定的元素绑定一个仅触发一次的处理函数，格式为 one(type,${data},fn) &nb
拿工资不仅仅是让你写代码的 lampcy 工作面试咨询
这是我对团队每个新进员工说的第一件事情。这句话的意思是，我并不关心你是如何快速完成任务的，哪怕代码很差，只要它像救生艇通气门一样管用就行。这句话也是我最喜欢的座右铭之一。这个说法其实很合理：我们的工作是思考客户提出的问题，然后制定解决方案。思考第一，代码第二，公司请我们的最终目的不是写代码，而是想出解决方案。话粗理不粗。付你薪水不是让你来思考的，也不是让你来写代码的，你的目的是交付产品
架构师之对象操作----------对象的效率复制和判断是否全为空 nannan408 架构师
1.前言。如题。 2.代码。 (1)对象的复制，比spring的beanCopier在大并发下效率要高，利用net.sf.cglib.beans.BeanCopier Src src=new Src(); BeanCopier beanCopier = BeanCopier.create(Src.class, Des.class, false);
ajax 被缓存的解决方案 Rainbow702 JavaScript jquery Ajax cache 缓存
使用jquery的ajax来发送请求进行局部刷新画面，各位可能都做过。今天碰到一个奇怪的现象，就是，同一个ajax请求，在chrome中，不论发送多少次，都可以发送至服务器端，而不会被缓存。但是，换成在IE下的时候，发现，同一个ajax请求，会发生被缓存的情况，只有第一次才会被发送至服务器端，之后的不会再被发送。郁闷。解决方法如下： ① 直接使用 JQuery提供的 “cache”参数，
修改date.toLocaleString()的警告 tntxia String
我们在写程序的时候，经常要查看时间，所以我们经常会用到date.toLocaleString()，但是date.toLocaleString()是一个过时的API，代替的方法如下： package com.tntxia.htmlmaker.util; import java.text.SimpleDateFormat; import java.util.
项目完成后的小总结 xiaomiya js 总结项目
项目完成了，突然想做个总结但是有点无从下手了。做之前对于客户端给的接口很模式。然而定义好了格式要求就如此的愉快了。先说说项目主要实现的功能吧 1，按键精灵 2，获取行情数据 3，各种input输入条件判断 4，发送数据（有json格式和string格式） 5，获取预警条件列表和预警结果列表， 6，排序， 7，预警结果分页获取 8，导出文件（excel，text等） 9，修