weixin_34400525

Python学习笔记三——文件操作及处理json

一、文件操作

基础知识：

1.open是打开已存在的文件或新建一个文件(在文件名后需加访问模式)

2.close是把刚刚新建或打开的文件关闭

3.write可以向文件中导入数据

4.read(num)可以从文本中读取数据，num表示要从文件中读取的数据的长度(单位是字节)，如果没有传入num,那么就表示读取文件中所有的数据

5.readlines可以按照操作行的方式把整个文件中的内容一次性读取，并且返回的是一个列表，其中每一行的数据为一个元素

6.tell在读写过程中可以知道文件的地址

7.seek()在读写过程中可以进行另一个位置操作
seek(offset,fom)
offset:偏移量
from:方向
0：表示文件开头
1：表示当前位置
2：表示文件末尾

另：

在os模块中对文件的操作
1.rename 可以对文件重命名
2.remove 可以对文件进行删除操作
3.mkdir 创建文件夹
4.getcwd 获取当前目录
5.chdir 改变默认目录
6.listdir 获取目录列表
7.rmdir 删除文件夹

对文件的操作分三步：

1、打开文件获取文件的句柄，句柄就理解为这个文件

2、通过文件句柄操作文件

3、关闭文件。

基本操作：

1         f = open('file.txt','r') #以只读方式打开一个文件，获取文件句柄，如果是读的话，r可以不写，默认就是只读,
2         在python2中还有file方法可以打开文件，python3中file方法已经没有了，只有open        
           res = f.read()#获取所有文件内容

print(res) #打印文件的所有内容

f.close()#关闭文件

           f = open('file.txt','r')

3         frist_line = f.readline()#获取文件的第一行内容，返回的是一个list
4         print(frist_line)#打印第一行
 　　　　   f.close()#关闭文件

打开文件时，需要指定文件路径和以何等方式打开文件，打开后，即可获取该文件句柄，后面通过此文件句柄对该文件操作，

打开文件的模式有：

 1  r，只读模式（默认）。打开文件不存的话，会报错
 2  w，只写模式。【不可读；不存在则创建；存在则删除内容；】
 3  a，追加模式。【不可读； 不存在则创建；存在则只追加内容；】
 4 
 5 
 6 "+" 表示可以同时读写某个文件
 7 
 8 r+  读写模式  【可读、可写；可追加，如果打开的文件不存在的话，会报错】
 9 w+   写读模式  【写读模式，使用w+的话，已经存在的文件内容会被清空，可以读到已经写的文件内容】
10 a+    追加读模式  【追加读写模式，不存在则创建；存在则只追加内容；】
11  
12 "U"表示在读取时，可以将 \r \n \r\n自动转换成 \n （与 r 或 r+ 模式同使用）
13 
14  rU
15 r+U
16 
17 "b"表示处理二进制文件（如：FTP发送上传ISO镜像文件，linux可忽略，windows处理二进制文件时需标注）
18 rb
19 wb
20 ab

文件操作方法：

 1             f = open('file.txt','r+',encoding='utf-8')#encoding参数可以指定文件的编码
 2             f.readline()#读一行
 3             f.readable()#判断文件是否可读
 4             fr.writable()#判断文件是否可写
 5             fr.encoding#打印文件的编码
 6             f.read()#读取所有内容，大文件时不要用，因为会把文件内容都读到内存中，内存不够的话，会把内存撑爆
 7             f.readlines()#读取所有文件内容，返回一个list，元素是每行的数据，大文件时不要用，因为会把文件内容都读到内存中，内存不够的话，会把内存撑爆
 8             f.tell()#获取当前文件的指针指向
 9             f.seek(0)#把当前文件指针指向哪
10             f.write('爱情证书')#写入内容
11             f.fulsh()#写入文件后，立即从内存中把数据写到磁盘中
12             f.truncate()#清空文件内容
13             f.writelines(['爱情证书','孙燕姿'])#将一个列表写入文件中
14             f.close()关闭文件

读取小文件时，可以

 1 f = open('users.txt',encoding='utf-8')
 2 #文件对象、文件句柄
 3
 4 # while True:
 5 #     line = f.readline()
 6 #     if line!='':
 7 #         print('line:',line)
 8 #     else:
 9 #         print('文件内容都读完了，结束了')
10 #         break

用上面的read()和readlines()方法操作文件的话，会先把文件所有内容读到内存中，这样的话，内存数据一多，非常卡，高效的操作，就是读一行操作一行，读过的内容就从内存中释放了

大文件时，读取文件高效的操作方法：

　　f = open('users.txt',encoding='utf-8')

 　　　　for line in f:
2    　 print(line)

这样的话，line就是每行文件的内容，读完一行的话，就会释放一行的内存

with使用：

在操作文件的时候，经常忘了关闭文件，这样的就可以使用with，它会在使用完这个文件句柄之后，自动关闭该文件，使用方式如下：

1     with open('file.txt','r') as f:#打开一个文件，把这个文件的句柄付给f
2           for line in f:
3               print(line)
4    with open('file.txt') as fr,with open('file_bak','w') as fw: #这个是多文件的操作，打开两个文件，fr是读file.txt，fw是新建一个file_bak文件
5            for line in fr:#循环file.txt中的每一行
6                fw.write(line)#写到file_bak文件中

修改文件：

修改文件的话，有两种方式，

一种是把文件的全部内容都读到内存中，然后把原有的文件内容清空，重新写新的内容；

第二种是把修改后的文件内容写到一个新的文件中

下面是一个file.txt

        寂寞当然有一点

        你不在我身边

        总是特别想念你的脸

        距离是一份考卷

第一种方法： a:

1 #1、简单、粗暴直接的
2 f = open('file.txt',encoding='utf-8')
3 res = f.read().replace('一点','二点')
4 f.close()
5 f = open('file.txt',mode='w',encoding='utf-8')
6 f.write(res)
7 f.flush()  # 立即把缓冲区里面的内容，写到磁盘上
8 f.close()

替换后的lile.txt :

        寂寞当然有二点 

        你不在我身边

        总是特别想念你的脸

        距离是一份考卷

或者： b:

1 with open('file.txt', 'r+',encoding='utf-8') as fr:
2     res1 = fr.read()
3     fr.seek(0)
4     new_res = res1.replace('你', 'you')
5     fr.write(new_res)

或者：

f = open('file.txt','a+',encoding='utf-8')
f.seek(0)
res = f.read().replace('你','you')
f.seek(0)
f.truncate() #清空文件里面的内容
f.write(res)
f.close()

修改后的file.txt:

   寂寞当然有二点

        you不在我身边

        总是特别想念you的脸

        距离是一份考卷

第二种方法：

 （二）a:
import os
f = open('file.txt',encoding='utf-8')
f2 = open('file.txt.bak','w',encoding='utf-8')
for line in f:
    new_line = line.replace('一点','二点')
    f2.write(new_line)
f.close()
f2.close()
os.remove('file.txt')
os.rename('file.txt.bak','file.txt')

 （二）b:
import os
with open('file.txt',encoding='utf-8') as f, open('file.txt.bak','w',encoding='utf-8') as f2:  #这个是多文件的操作，打开两个文件，f是读file.txt，f2是新建一个file_bak文件
    for line in f:  #循环file.txt中的每一行
        new_line = line.replace('一点','二点')
        f2.write(new_line)  #写到file_bak文件中

os.remove('file.txt')
os.rename('file.txt.bak','file.txt')

替换后file.txt:

  寂寞当然有二点 

        你不在我身边

        总是特别想念你的脸

        距离是一份考卷

拓展练习：监控日志

日志文件：

access.log

178.210.90.90 - - [04/Jun/2017:03:44:13 +0800] "GET /wp-includes/logo_img.php HTTP/1.0" 302 161 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
178.210.90.90 - - [04/Jun/2017:03:44:13 +0800] "GET /blog HTTP/1.0" 301 233 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
178.210.90.90 - - [04/Jun/2017:03:44:15 +0800] "GET /blog/ HTTP/1.0" 200 38278 "http://nnzhp.cn/wp-includes/logo_img.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "10.3.152.221"
66.249.75.29 - - [04/Jun/2017:03:45:55 +0800] "GET /bbs/forum.php?mod=forumdisplay&fid=574&filter=hot HTTP/1.1" 200 17482 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "-"
37.9.169.20 - - [04/Jun/2017:03:47:59 +0800] "GET /wp-admin/security.php HTTP/1.1" 302 161 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
37.9.169.20 - - [04/Jun/2017:03:48:01 +0800] "GET /blog HTTP/1.1" 301 233 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
37.9.169.20 - - [04/Jun/2017:03:48:02 +0800] "GET /blog/ HTTP/1.1" 200 38330 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
37.9.169.20 - - [04/Jun/2017:03:48:21 +0800] "GET /wp-admin/security.php HTTP/1.1" 302 161 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
37.9.169.20 - - [04/Jun/2017:03:48:21 +0800] "GET /blog HTTP/1.1" 301 233 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
37.9.169.20 - - [04/Jun/2017:03:48:23 +0800] "GET /blog/ HTTP/1.1" 200 38330 "http://nnzhp.cn/wp-admin/security.php" "Mozilla/5.0 (Windows; U; Windows NT 5.1; en-US) AppleWebKit/533.4 (KHTML, like Gecko) Chrome/5.0.375.99 Safari/533.4" "-"
42.236.49.31 - - [04/Jun/2017:03:49:04 +0800] "GET /questions HTTP/1.1" 200 41977 "http://bbs.besttest.cn/questions" "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36; 360Spider" "-"
66.249.75.28 - - [04/Jun/2017:03:49:42 +0800] "GET /bbs/forum.php?mod=forumdisplay&fid=473&filter=digest&digest=1 HTTP/1.1" 200 17242 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "-"
123.125.71.60 - - [04/Jun/2017:03:52:50 +0800] "GET /robots.txt HTTP/1.1" 302 161 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" "-"
123.125.71.117 - - [04/Jun/2017:03:52:50 +0800] "GET /blog HTTP/1.1" 301 233 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" "-"
123.125.71.80 - - [04/Jun/2017:03:52:51 +0800] "GET /blog/ HTTP/1.1" 200 38330 "-" "Mozilla/5.0 (compatible; Baiduspider/2.0; +http://www.baidu.com/search/spider.html)" "-"
66.249.75.28 - - [04/Jun/2017:03:53:29 +0800] "GET /bbs/forum.php?mod=forumdisplay&fid=516&filter=heat&orderby=heats HTTP/1.1" 200 17019 "-" "Mozilla/5.0 (compatible; Googlebot/2.1; +http://www.google.com/bot.html)" "-"
40.77.167.135 - - [04/Jun/2017:03:55:07 +0800] "GET /static/css/bootstrap/fonts/glyphicon

 1 #1、要从日志里面找到1分钟之内访问超过200次的
 2 #2、每分钟都运行一次
 3 
 4 # 1、读取文件内容，获取到ip地址
 5 # 2、把每个ip地址存起来 {}
 6 # 3、判断ip访问的次数是否超过200次
 7 # 4、加入黑名单 print
 8 
 9 #['118.24.4.30','118.24.4.30','118.24.4.30','118.1xx.x.xx','118.1xx.x.xx']
10 # {
11 #     '118.23.3.40':2,
12 #     '118.23.3.41':5
13 # }
14 import time
15 point = 0 #初始的位置  
16 while True:
17     ips = {}  # 存放ips字典
18     f = open('access.log',encoding='utf-8')
19     f.seek(point)
20     for line in f: #循环取文件里面每行数据
21         ip = line.split()[0] #按照空格分割，取第一个元素就ip
22         if ip in ips:#判断这个ip是否存在
23             # ips[ip] = ips[ip]+1
24             ips[ip]+=1#如果存在的话，次数加+1
25         else:
26             ips[ip]=1 #如果不存在ip的次数就是1
27     point = f.tell() #记录文件指针位置，下一个60s后从这个位置开始循环
28     f.close()
29     for ip,count in ips.items():#循环这个字典，判断次数大于200的
30         if count>=200:
31             print('%s 加入黑名单'%ip)
32     time.sleep(60)
3

二、处理Json

# json通用的数据类型，所有的语言都认识
# k-v { }
#json串是字符串

json串格式 ：  用三个单引号 引住json    ps: json的键值一定是用双引号

 1 s='''
 2 {
 3         "error_code": 0,
 4         "stu_info": [
 5                 {
 6                         "id": 309,
 7                         "name": "小白",
 8                         "sex": "男",
 9                         "age": 28,
10                         "addr": "河南省济源市北海大道32号",
11                         "grade": "天蝎座",
12                         "phone": "18512572946",
13                         "gold": 100
14                 },
15                 {
16                         "id": 310,
17                         "name": "小白",
18                         "sex": "男",
19                         "age": 28,
20                         "addr": "河南省济源市北海大道32号",
21                         "grade": "天蝎座",
22                         "phone": "18516572946",
23                         "gold": 100
24                 }
25         ]
26 }
27 
28 '''

json是一种所有语言中都通用的key-value数据结构的数据类型，很像python中的字典，json处理使用json模块，json模块有下面常用的方法：

json.dumps()

json.dump()

json.loads()

json.load()

1     import json    
2     dic = {"name":"niuniu","age":18}
3     print(json.dumps(dic))#把字典转成json串
# 输出 ： 
    {"age": 18, "name": "niuniu"}  



4     fj = open('a.json','w')   # a.json不存在的
5     print(json.dump(dic,fj))#把字典转换成的json串写到一个文件里面
#  输出 ：  在当前的目录下，新增了一个a.json文件，文件内容为json ：

{"age": 18, "name": "niuniu"}

 

6     s_json = '{"name":"niuniu","age":20,"status":true}'
7     print(json.loads(s_json))#把json串转换成字典
# 输出 ：  
{'status': True, 'name': 'niuniu', 'age': 20}




8     fr = open('a.json','r')      # a.json 内容为 ： {"age": 18, "name": "niuniu"}
9 　　print(json.load(fr))#从文件中读取json数据，然后转成字典
# 输出 ：
   {'name': 'niuniu', 'age': 18}

转载于:https://www.cnblogs.com/tanzitanzi/p/9573251.html

计算机视觉｜解锁视频理解三剑客——TimeSformer 紫雾凌寒 AI 炼金厂 #计算机视觉 #自然语言处理（NPL）计算机视觉深度学习神经网络 TimeSformer transformer python timesformer
一、引言在当今数字化时代，视频数据呈爆炸式增长，从日常的社交媒体分享到安防监控、医疗影像、自动驾驶等专业领域，视频无处不在。视频理解作为计算机视觉领域的重要研究方向，旨在让计算机能够像人类一样理解视频中的内容，包括识别视频中的物体、动作、场景，以及理解事件的发展过程和语义信息等。这一技术的发展对于实现智能视频分析、视频检索、自动驾驶、智能安防等应用具有至关重要的意义，它能够帮助我们从海量的视频数据
从零打造 Python 爬虫项目：需求分析到部署西攻城狮北 python 爬虫实战案例
一、项目概述二、需求分析三、开发环境搭建四、代码实现1.爬虫基础2.数据解析与存储3.应对反爬虫机制4.多页爬取五、部署与运行1.定时任务2.云服务器部署六、常见问题解决七、总结随着互联网的飞速发展，信息获取成为了人们日常生活和工作中不可或缺的一部分。然而，传统的手动收集信息的方式效率低下、准确性难以保证，无法满足大量数据需求。Python爬虫技术应运而生，它能够自动化地从互联网上获取大量数据，为
MacBook Pro使用FFmpeg捕获摄像头与麦克风推流音视频自由软件开发者 MacOS ffmpeg macos 音视频
FFmpeg查看macos系统音视频设备列表ffmpeg-favfoundation-list_devicestrue-i""使用摄像头及麦克风同时推送音频及视频流:ffmpeg-favfoundation-pixel_formatyuyv422-framerate30-i"0:1"-c:vlibx264-presetultrafast-b:v1000k-maxrate1000k-bufsize2
SpringBoot架构下宠物领养解决方案 2402_85758349 spring boot 架构宠物
第1章绪论1.1课题背景二十一世纪互联网的出现，改变了几千年以来人们的生活，不仅仅是生活物资的丰富，还有精神层次的丰富。时代进步的标志，就是让人们过上更好的生活。在互联网诞生之前，地域位置往往是人们思想上不可跨域的鸿沟，信息的传播速度极慢，信息处理的速度和要求还是通过人们骑马或者是信鸽传递，这些信息传递都是不可控制的，中间很有可能丢失，信息的传递水平决定了人们生活的水平。现如今，大家都在用互联网来
Readability.js 与 Newspaper提取网页内容和元数据黑金IT nodejs 开发语言全文检索
在当今信息爆炸的时代，网页内容的提取和处理变得尤为重要。无论是从新闻网站、博客还是教程网站中提取内容，都需要一个高效、准确的工具来帮助我们去除无关信息，提取出有价值的正文内容。这不仅能够提高我们的工作效率，还能让我们更好地专注于内容本身。为什么选择Readability.js和Newspaper？Readability.js和Newspaper是两个非常流行的Node.js库，它们能够帮助我们从网
Python Selenium 库学习指南不是二师兄的八戒 python selenium
PythonSelenium库学习指南目录Selenium基础介绍Selenium是什么安装SeleniumSelenium的工作原理Selenium基本用法启动浏览器定位元素常见操作：点击、输入、滚动高级用法切换窗口与标签页模拟鼠标操作与键盘输入动态加载的网页处理等待机制显式等待与隐式等待等待条件与时间限制Selenium与浏览器交互模拟用户行为上传与下载文件Selenium与JavaScrip
【Python】之线程池黏苞米开发语言 python
一、线程池定义线程池（ThreadPool）是一种高效管理多线程任务的机制，通过复用固定数量的线程来处理多个任务，避免频繁创建和销毁线程的开销。线程池在系统启动时即创建大量空闲的线程，程序只要将一个函数提交给线程池，线程池就会启动一个空闲的线程来执行它。当该函数执行结束后，该线程并不会死亡，而是再次返回到线程池中变成空闲状态，等待执行下一个函数。此外，使用线程池可以有效地控制系统中并发线程的数量。
Python PDF神器PyMuPDF使用指南 (六)——Document类详解塞大花 Python学习笔记 pdf python PDF文件提取 PDF内容提取 PDF数据提取 PDF RAG PDF文件内容提取
系列文章：PythonPDF神器PyMuPDF使用指南(一)——安装和基础功能PythonPDF神器PyMuPDF使用指南(二)——文件和文本功能PythonPDF神器PyMuPDF使用指南(三)——图像和注释功能PythonPDF神器PyMuPDF使用指南(四)——绘图、多线程和OCR功能PythonPDF神器PyMuPDF使用指南(五)——命令行使用PythonPDF神器PyMuPDF使用指南
Python并发编程 06 进程、协程撸码侠 Python网络编程与并发编程 python windows 开发语言
文章目录一、多进程调用二、Process类1、主要参数2、实例方法3、属性4、代码示例三、进程通讯1、进程队列通讯2、管道通讯3、Manager对象四、进程同步五、进程池六、协程1、协程简述2、用greenlet库实现协程3、用gevent库实现协程一、多进程调用与多线程调用相似frommultiprocessingimportProcessimporttimedeff(name):time.sl
PalmImage-开源：图像格式转换器的开源项目解析胡说先森
本文还有配套的精品资源，点击获取简介：PalmImage是一个开源Java应用程序，专为桌面和服务器环境设计，它能够将GIF、JPEG等常见图像格式以及View文档转换为适用于Palm设备的格式。通过Java技术的应用，PalmImage提供跨平台支持，并利用JavaAPI处理图像转换。作为开源项目，它鼓励社区参与改进，并提供免费使用的优势。同时，PalmImage的命令行界面和脚本自动化为用户提
单稳态多谐振荡器的综合设计与应用文档胡说先森
本文还有配套的精品资源，点击获取简介：单稳态多谐振荡器是一种电子电路，以其产生固定长度脉冲的独特功能，在信号处理、定时和脉冲整形等领域得到广泛应用。本文档详细介绍了单稳态多谐振荡器的工作原理、电路设计、特性及实际应用。电路由两个反相器和RC网络组成，工作原理包含触发、稳态和复位三个阶段。其特性如脉冲宽度可调、输入脉冲影响小、脉冲形状的稳定性等决定了在脉冲整形、定时器、延时、分频和边沿检测等应用中的
【Python爬虫(96)】从0到1：打造爬虫驱动的数据分析平台奔跑吧邓邓子 Python爬虫 python 爬虫数据分析开发语言平台
【Python爬虫】专栏简介：本专栏是Python爬虫领域的集大成之作，共100章节。从Python基础语法、爬虫入门知识讲起，深入探讨反爬虫、多线程、分布式等进阶技术。以大量实例为支撑，覆盖网页、图片、音频等各类数据爬取，还涉及数据处理与分析。无论是新手小白还是进阶开发者，都能从中汲取知识，助力掌握爬虫核心技能，开拓技术视野。目录一、平台搭建基础1.1明确平台目标与定位1.2技术选型依据二、数据
[JMeter性能测试实战]如何做单接口性能测试职说测试 JMeter性能测试全攻略 jmeter 场景设计单接口压测性能测试
文章目录一、前言二、思路2.1、以查询页面为例2.2、脚本设计2.3、**RandomVariable**元件映入眼帘三、总结一、前言作为一名性能测试工程师，肯定需要解决一类问题，就是针对单接口做性能测试，而实际业务场景呢，这个可能存在一些难度，譬如，一个页面查询功能，如果只是查询接口，那么它查询的条件最好要有业务支撑，换句话说一定要查出结果，这样查出的结果页就是一个列表，至少从服务器监控的数据得
Python接口自动化测试框架（工具篇）-- 接口测试工具JMeter 职说测试 python 自动化测试工具
文章目录一、前言二、JMeter2.1、安装jmeter2.2、JMeter接口测试案例2.3、快速创建JMeter接口测试计划三、扩展3.1、接口自动化测试3.2、性能自动化测试一、前言相比使用postman做接口测试，作为测试人员，熟练使用jmeter做接口测试已经是必备技能，这可以从各大招聘测试岗的JD中得到印证，它不仅仅能做接口测试、还有可以做性能测试、自动化测试都能作为其解决方案之一；其
Python处理PDF——PyMuPDF的安装与使用程序员小六进阶技术 python技术 python 开发语言
1、PyMuPDF简介1.介绍在介绍PyMuPDF之前，先来了解一下MuPDF，从命名形式中就可以看出，PyMuPDF是MuPDF的Python接口形式。MuPDFMuPDF是一个轻量级的PDF、XPS和电子书查看器。MuPDF由软件库、命令行工具和各种平台的查看器组成。MuPDF中的渲染器专为高质量抗锯齿图形量身定制。它以精确到像素的几分之一内的度量和间距呈现文本，以在屏幕上再现打印页面的外观时
eNSP中AR2220、AR201、AR1220、AR2240、AR3260、Router、NE40E、NE5000E、NE9000、CX路由器学习笔记 learning-striving eNSP 笔记 eNSP 路由器路由器接口 VRP
eNSP中常见华为路由器型号的接口特性详解及横向对比，重点关注接口类型、扩展能力和适用场景：缩写解释：LPU：LineProcessingUnit（线路处理单元）SPU：ServiceProcessingUnit（业务处理单元）PoE：PoweroverEthernet（以太网供电）GE：GigabitEthernet（千兆以太网）FE：FastEthernet（快速以太网）SFP：SmallFo
LeetCode 热题 HOT 100 （226. 翻转二叉树） Chen_Chance LeetCode HOT 100 leetcode 算法职场和发展
问题描述给定一棵二叉树的根节点root，要求翻转这棵二叉树，并返回其根节点。例如：示例1：输入：root=[4,2,7,1,3,6,9]输出：[4,7,2,9,6,3,1]示例2：输入：root=[2,1,3]输出：[2,3,1]示例3：输入：root=[]输出：[]第一部分：二叉树基础知识1.什么是二叉树？二叉树是一种常见的数据结构，由多个**节点（Node）**构成。每个节点包含三个部分：数据
Python 用 Selenium & DataFrame 提取网页内表格数据 solosoft python selenium
提取的数据导入DataFrame，方便后期处理frompandas.core.frameimportDataFramefromseleniumimportwebdriverdriver=webdriver.Edge();driver.get("http://data.eastmoney.com/hsgt/index.html")table_content=driver.find_element_b
Windows 安装pyenv 码农小钢 python linux java windows shell
步骤一：安装命令pipinstallpyenv-win--target%USERPROFILE%/.pyenv步骤二：在文件管理器试试pyenv-winimage.png步骤三：复制路径步骤四：添加环境变量变量把PYENV添加到系统变量。注意不是用户变量。变量名：PYENV变量值：C:\Users\Administrator\.pyenv\pyenv-win这里填写你的pyenv路径path添加把
【安装教程】Windows环境下Neo4j的安装与配置慢热型网友. 机器学习作业报告 windows neo4j
【安装教程】Windows环境下Neo4j的安装与配置Neo4j的概念一、安装前准备——JDK二、Neo4j的安装三、Neo4j的环境配置四、安装验证Neo4j的概念Neo4j是一个高性能的图形数据库管理系统，它使用图形模型来存储和处理数据。Neo4j的图形模型由节点和边组成，节点代表实体或对象，边表示它们之间的关系。节点和边都可以拥有属性，这些属性可以是任何类型的数据。Neo4j的图形模型可以轻
探索vLLM Chat：作为OpenAI API替代方案的强大工具 qq_37836323 python
#探索vLLMChat：作为OpenAIAPI替代方案的强大工具##引言随着生成式AI技术的发展，许多应用都依赖于强大的语言模型API来提供自然语言处理任务的支持。vLLM是一款可以作为OpenAIAPI协议替代品的聊天模型服务器。它的设计允许您在应用中无缝替换OpenAIAPI，实现相似的功能和性能。本文将介绍如何使用vLLM，结合langchain-openai包，来快速部署和集成聊天模型。#
【数学建模】基于matlab模拟无人车泊车问题仿真 matlab科研助手数学建模 matlab 开发语言
✅作者简介：热爱科研的Matlab仿真开发者，修心和技术同步精进，代码获取、论文复现及科研仿真合作可私信。个人主页：Matlab科研工作室个人信条：格物致知。更多Matlab完整代码及仿真定制内容点击智能优化算法神经网络预测雷达通信无线传感器电力系统信号处理图像处理路径规划元胞自动机无人机物理应用机器学习内容介绍无人驾驶汽车技术近年来取得了飞速发展，其中自动泊车功能是关键技术之一。本文将重点讨论无
python爬取网页的方法总结,python爬虫获取网页数据阳阳2013哈哈 python
大家好，小编来为大家解答以下问题，python爬取网页信息代码正确爬取不到，利用python爬取简单网页数据步骤，今天让我们一起来看看吧！文章目录1.抓取网页源代码2.抓取一个网页源代码中的某标签内容3.抓取多个网页子标签的内容Python用做数据处理还是相当不错的，如果你想要做爬虫，Python是很好的选择，它有很多已经写好的类包，只要调用，即可完成很多复杂的功能在我们开始之前，我们需要安装一些
【2025年14期免费获取股票数据API接口】实例演示五种主流语言获取股票行情api接口之沪深A股近年增发数据获取实例演示及接口API说明文档不会写代码的码农农 python 开发语言 java 股票API 股票数据接口
在近一至两年期间，股票量化分析逐步成为备受关注的热门议题。对于投身于该领域工作而言，首要步骤便是获取全面且精准的股票数据。无论是实时交易数据、历史交易记录、财务数据，亦或是基本面信息，这些数据均是开展量化分析过程中不可或缺的宝贵资源。我们的核心任务在于从这些数据中提炼出具有价值的信息，从而为投资策略提供坚实有力的指导。在数据探索进程中，我尝试运用了多种方法，涵盖自编网易股票页面爬虫程序、申万行业数
AI大语言模型概述：从GPT到BERT的技术演进 AI智能涌现深度研究 AI大模型应用入门实战与进阶 DeepSeek R1 &大数据AI人工智能计算大数据人工智能语言模型 AI 大模型 LLM Java Python 架构设计 Agent RPA
1.背景介绍1.1什么是大语言模型大语言模型是一种基于深度学习的自然语言处理技术，它可以理解和生成人类语言。这些模型通过学习大量的文本数据，捕捉到语言的语法、语义和情感等信息，从而实现对自然语言的理解和生成。1.2为什么大语言模型如此重要大语言模型在近年来取得了显著的进展，它们在各种自然语言处理任务中都取得了最先进的性能。这些任务包括机器翻译、情感分析、文本摘要、问答系统等。大语言模型的成功在很大
AUTOSAR 的运行时环境（RTE）详解及综合实例大模型大数据攻城狮嵌入式面试单片机面经 iot 硬件架构 arm开发 fpga开发硬件工程
目录1.运行时环境（RTE）概述1.1RTE的核心功能1.2RTE的架构1.3RTE的工作流程2.RTE的详细功能解析2.1通信管理2.1.1通信模式2.1.2通信机制2.1.3实例：CAN通信的RTE实现2.2调度管理2.2.1调度策略2.2.2调度器实现2.2.3实例：发动机控制的调度2.3事件管理2.3.1事件类型2.3.2事件处理流程2.3.3实例：CAN消息的事件处理3.综合实例：发动机
每日新闻掌握【2025年2月28日星期五】 cdmt 每日新闻掌握科技
2025年2月28日星期五农历二月初一大公司/大事件2024年中国手机出口量八年后首度增长36氪获悉，据中国机电商会消息，海关总署统计，2024年中国手机出口8.14亿部，同比增长1.5%，这也是2015年出口13.43亿部顶峰后连降八年的首度回正，并连续第三年保持在8亿部之上。手机出口额同比下降3.1%至1343.6亿美元，占货物出口总额的3.8%，较2018年最高值的5.7%已明显下滑。百度与
精通Simulink第一课：在Simulink中基于水箱水位控制的三参数PID整定 Qing_er爱吃山竹 simulink matlab 自动化
在Simulink中基于水箱水位控制的三参数PID整定主要包括以下几个步骤：建立水箱水位模型：首先，需要建立一个反映水箱水位变化的数学模型。这个模型应该能够描述水箱水位（输出变量）如何响应进水量变化（输入变量）。在Simulink中，你可以使用连续时间积分器（Integrator）和增益（Gain）等基本组件来构建这个模型。设计PID控制器：PID控制器由比例（P）、积分（I）和微分（D）三个部分
C++学习：多态 DesolateGIS 学习
目录文章目录一、多态的基本语法二、多态的原理剖析三、纯虚函数和抽象类四、虚析构和纯虚析构五、多态的案例案例一:计算机类案例二：制作饮品总结一、多态的基本语法多态分为两类：静态多态:函数重载和运算符重载属于静态多态，复用函数名动态多态:派生类和虚函数实现运行时多态静态多态和动态多态区别：静态多态的函数地址早绑定-编译阶段确定函数地址动态多态的函数地址晚绑定-运行阶段确定函数地址程序调用的结果是动物在
C++学习：继承 DesolateGIS 学习
文章目录文章目录前言一、继承的基本语法二、继承的方式1.公共继承2.保护继承3.私有继承三、继承中的对象模型四、继承中的构造和析构顺序五、继承同名成员处理方式1.继承同名非静态成员处理方式2.继承同名静态成员处理方式总结前言x继承是一个类从另一个类获取成员变量和成员函数的过程，通过继承创建的新类称为“派生类”或“子类”，被继承的类称为“基类”或“父类”。一、继承的基本语法继承的好处：减少重复代码继
关于旗正规则引擎下载页面需要弹窗保存到本地目录的问题何必如此 jsp 超链接文件下载窗口
生成下载页面是需要选择“录入提交页面”，生成之后默认的下载页面<a>标签超链接为：<a href="<%=root_stimage%>stimage/image.jsp?filename=<%=strfile234%>&attachname=<%=java.net.URLEncoder.encode(file234filesourc
【Spark九十八】Standalone Cluster Mode下的资源调度源代码分析 bit1129 cluster
在分析源代码之前，首先对Standalone Cluster Mode的资源调度有一个基本的认识：首先，运行一个Application需要Driver进程和一组Executor进程。在Standalone Cluster Mode下，Driver和Executor都是在Master的监护下给Worker发消息创建(Driver进程和Executor进程都需要分配内存和CPU，这就需要Maste
linux上独立安装部署spark daizj linux 安装 spark 1.4 部署
下面讲一下linux上安装spark，以 Standalone Mode 安装 1）首先安装JDK 下载JDK：jdk-7u79-linux-x64.tar.gz ，版本是1.7以上都行，解压 tar -zxvf jdk-7u79-linux-x64.tar.gz 然后配置 ~/.bashrc&nb
Java 字节码之解析一周凡杨 java 字节码 javap
一： Java 字节代码的组织形式类文件 { OxCAFEBABE ，小版本号，大版本号，常量池大小，常量池数组，访问控制标记，当前类信息，父类信息，实现的接口个数，实现的接口信息数组，域个数，域信息数组，方法个数，方法信息数组，属性个数，属性信息数组 } &nbs
java各种小工具代码 g21121 java
1.数组转换成List import java.util.Arrays; Arrays.asList(Object[] obj); 2.判断一个String型是否有值 import org.springframework.util.StringUtils; if (StringUtils.hasText(str)) 3.判断一个List是否有值 import org.spring
加快FineReport报表设计的几个心得体会老A不折腾 finereport
一、从远程服务器大批量取数进行表样设计时，最好按“列顺序”取一个“空的SQL语句”，这样可提高设计速度。否则每次设计时模板均要从远程读取数据，速度相当慢！！二、找一个富文本编辑软件（如NOTEPAD+）编辑SQL语句，这样会很好地检查语法。有时候带参数较多检查语法复杂时，结合FineReport中生成的日志，再找一个第三方数据库访问软件（如PL/SQL）进行数据检索，可以很快定位语法错误。
mysql linux启动与停止墙头上一根草
如何启动/停止/重启MySQL一、启动方式1、使用 service 启动：service mysqld start2、使用 mysqld 脚本启动：/etc/inint.d/mysqld start3、使用 safe_mysqld 启动：safe_mysqld&二、停止1、使用 service 启动：service mysqld stop2、使用 mysqld 脚本启动：/etc/inin
Spring中事务管理浅谈 aijuans spring 事务管理
Spring中事务管理浅谈 By Tony Jiang@2012-1-20 Spring中对事务的声明式管理拿一个XML举例 [html] view plain copy print ? <?xml version="1.0" encoding="UTF-8"?>&nb
php中隐形字符65279（utf-8的BOM头）问题 alxw4616
php中隐形字符65279（utf-8的BOM头）问题今天遇到一个问题. php输出JSON 前端在解析时发生问题:parsererror. 调试: 1.仔细对比字符串发现字符串拼写正确.怀疑是非打印字符的问题. 2.逐一将字符串还原为unicode编码. 发现在字符串头的位置出现了一个 65279的非打印字符.
调用对象是否需要传递对象(初学者一定要注意这个问题) 百合不是茶对象的传递与调用技巧
类和对象的简单的复习,在做项目的过程中有时候不知道怎样来调用类创建的对象,简单的几个类可以看清楚,一般在项目中创建十几个类往往就不知道怎么来看为了以后能够看清楚,现在来回顾一下类和对象的创建,对象的调用和传递(前面写过一篇) 类和对象的基础概念: JAVA中万事万物都是类类有字段(属性),方法,嵌套类和嵌套接
JDK1.5 AtomicLong实例 bijian1013 java thread java多线程 AtomicLong
JDK1.5 AtomicLong实例类 AtomicLong 可以用原子方式更新的 long 值。有关原子变量属性的描述，请参阅 java.util.concurrent.atomic 包规范。AtomicLong 可用在应用程序中（如以原子方式增加的序列号），并且不能用于替换 Long。但是，此类确实扩展了 Number，允许那些处理基于数字类的工具和实用工具进行统一访问。
自定义的RPC的Java实现 bijian1013 java rpc
网上看到纯java实现的RPC，很不错。 RPC的全名Remote Process Call，即远程过程调用。使用RPC，可以像使用本地的程序一样使用远程服务器上的程序。下面是一个简单的RPC 调用实例，从中可以看到RPC如何
【RPC框架Hessian一】Hessian RPC Hello World bit1129 Hello world
什么是Hessian The Hessian binary web service protocol makes web services usable without requiring a large framework, and without learning yet another alphabet soup of protocols. Because it is a binary p
【Spark九十五】Spark Shell操作Spark SQL bit1129 shell
在Spark Shell上，通过创建HiveContext可以直接进行Hive操作 1. 操作Hive中已存在的表 [hadoop@hadoop bin]$ ./spark-shell Spark assembly has been built with Hive, including Datanucleus jars on classpath Welcom
F5　往header加入客户端的ip ronin47
when HTTP_RESPONSE {if {[HTTP::is_redirect]}{ HTTP::header replace Location [string map {:port/ /} [HTTP::header value Location]]HTTP::header replace Lo
java-61-在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差. 求所有数对之差的最大值。例如在数组{2, 4, 1, 16, 7, 5, bylijinnan java
思路来自： http://zhedahht.blog.163.com/blog/static/2541117420116135376632/ 写了个java版的 public class GreatestLeftRightDiff { /** * Q61.在数组中，数字减去它右边(注意是右边)的数字得到一个数对之差。 * 求所有数对之差的最大值。例如在数组
mongoDB 索引开窍的石头 mongoDB索引
在这一节中我们讲讲在mongo中如何创建索引得到当前查询的索引信息 db.user.find(_id:12).explain(); cursor: basicCoursor 指的是没有索引 &
[硬件和系统]迎峰度夏 comsci 系统
从这几天的气温来看，今年夏天的高温天气可能会维持在一个比较长的时间内所以，从现在开始准备渡过炎热的夏天。。。。每间房屋要有一个落地电风扇，一个空调(空调的功率和房间的面积有密切的关系) 坐的，躺的地方要有凉垫，床上要有凉席电脑的机箱
基于ThinkPHP开发的公司官网 cuiyadll 行业系统
后端基于ThinkPHP，前端基于jQuery和BootstrapCo.MZ 企业系统轻量级企业网站管理系统运行环境:PHP5.3+, MySQL5.0 系统预览系统下载：http://www.tecmz.com 预览地址：http://co.tecmz.com 各种设备自适应响应式的网站设计能够对用户产生友好度，并且对于
Transaction and redelivery in JMS (JMS的事务和失败消息重发机制) darrenzhu jms 事务承认 MQ acknowledge
JMS Message Delivery Reliability and Acknowledgement Patterns http://wso2.com/library/articles/2013/01/jms-message-delivery-reliability-acknowledgement-patterns/ Transaction and redelivery in
Centos添加硬盘完全教程 dcj3sjt126com linux centos hardware
Linux的硬盘识别: sda 表示第1块SCSI硬盘 hda 表示第1块IDE硬盘 scd0 表示第1个USB光驱一般使用“fdisk -l”命
yii2 restful web服务路由 dcj3sjt126com PHP yii2
路由随着资源和控制器类准备，您可以使用URL如 http://localhost/index.php?r=user/create访问资源，类似于你可以用正常的Web应用程序做法。在实践中，你通常要用美观的URL并采取有优势的HTTP动词。例如，请求POST /users意味着访问user/create动作。这可以很容易地通过配置urlManager应用程序组件来完成如下所示
MongoDB查询(4)——游标和分页[八] eksliang mongodb MongoDB游标 MongoDB深分页
转载请出自出处：http://eksliang.iteye.com/blog/2177567 一、游标数据库使用游标返回find的执行结果。客户端对游标的实现通常能够对最终结果进行有效控制，从shell中定义一个游标非常简单，就是将查询结果分配给一个变量（用var声明的变量就是局部变量），便创建了一个游标，如下所示： > var
Activity的四种启动模式和onNewIntent() gundumw100 android
Android中Activity启动模式详解　　在Android中每个界面都是一个Activity，切换界面操作其实是多个不同Activity之间的实例化操作。在Android中Activity的启动模式决定了Activity的启动运行方式。　　Android总Activity的启动模式分为四种： Activity启动模式设置： <acti
攻城狮送女友的CSS3生日蛋糕 ini html Web html5 css css3
在线预览：http://keleyi.com/keleyi/phtml/html5/29.htm 代码如下： <!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <title>攻城狮送女友的CSS3生日蛋糕-柯乐义<
读源码学Servlet（1）GenericServlet 源码分析 jzinfo tomcat Web servlet 网络应用网络协议
Servlet API的核心就是javax.servlet.Servlet接口，所有的Servlet 类（抽象的或者自己写的）都必须实现这个接口。在Servlet接口中定义了5个方法，其中有3个方法是由Servlet 容器在Servlet的生命周期的不同阶段来调用的特定方法。先看javax.servlet.servlet接口源码： package
JAVA进阶：VO(DTO)与PO(DAO)之间的转换 snoopy7713 java VO Hibernate po
PO即 Persistence Object　　VO即 Value Object 　VO和PO的主要区别在于：　　VO是独立的Java Object。　　PO是由Hibernate纳入其实体容器（Entity Map）的对象，它代表了与数据库中某条记录对应的Hibernate实体，PO的变化在事务提交时将反应到实际数据库中。　实际上，这个VO被用作Data Transfer
mongodb group by date 聚合查询日期统计每天数据（信息量） qiaolevip 每天进步一点点学习永无止境 mongodb 纵观千象
/* 1 */ { "_id" : ObjectId("557ac1e2153c43c320393d9d"), "msgType" : "text", "sendTime" : ISODate("2015-06-12T11:26:26.000Z")
java之18天常用的类(一) Luob. Math Date System Runtime Rundom
System类 import java.util.Properties; /** * System: * out:标准输出,默认是控制台 * in:标准输入,默认是键盘 * * 描述系统的一些信息 * 获取系统的属性信息:Properties getProperties(); * * * */ public class Sy
maven wuai maven
1、安装maven：解压缩、添加M2_HOME、添加环境变量path 2、创建maven_home文件夹，创建项目mvn_ch01,在其下面建立src、pom.xml，在src下面简历main、test、main下面建立java文件夹 3、编写类，在java文件夹下面依照类的包逐层创建文件夹，将此类放入最后一级文件夹 4、进入mvn_ch01 4.1、mvn compile ,执行后会在

Python学习笔记三——文件操作及处理json

你可能感兴趣的:(Python学习笔记三——文件操作及处理json)