有请小发菜

21.Python 操作文件

1. 认识文件和I/O

文件是存储在设备上的一组字符或字节序列，可以包含任何内容，它是数据的集合和抽象。

文件包含两种类型：

文本文件：一般由单一特定编码的字符组成。
二进制文件：直接由二进制0和1组成，文件内部数据的组织格式与文件用途有关。

主要区别在于是否有统一的字符编码；都可以使用文本文件方式和二进制文件方式打开，但打开后的操作不同。采用文本方式打开文件，文件经过编码形成字符串；采用二进制方式打开文件，文件被解析为字节流。

I/O 在计算机中是指 Input/Output，也就是Stream（流）的输入和输出。输入和输出是相对于内存来说的，Input Stream（输入流）是指数据从外（磁盘、网络）流进内存，Output Stream（输出流）是数据从内存流出到外面（磁盘、网络）。当程序运行时，数据都是在内存中驻留，由CPU这个超快的计算核心执行，涉及数据交换的地方就需要I/O接口，如磁盘操作、网络操作等。

文件描述符是读写文件时请求操作系统打开的一个对象，也就是程序中要操作的文件对象。

不同编程语言读写文件的操作步骤大体一样：

打开文件，获取文件描述符。
操作文件描述符，如读/写。
关闭文件。

文件读写操作完成后，应该及时关闭。一方面，文件对象占用操作系统的资源；另一方面，操作系统对同一时间打开的文件描述符的数量时有限制的，如果不及时关闭文件，可能会造成数据丢失。因为将数据写入文件时，操作系统不会立刻把数据写入磁盘，而是先把数据放到缓冲区异步写入磁盘。当调用close()方法时，操作系统保证把没有写入磁盘的数据全部写到磁盘上，否则可能丢失数据。

除了内置函数open()外，还可以通过如下途径对本地文件系统进行操作。

os模块：是一个与操作系统进行交互的接口，可以直接对操作系统进行操作，直接调用操作系统的可执行文件、命令。os模块包含文件系统和进程管理。
os.path模块：提供一些与路径相关的操作函数。
stat模块：能解析os.stat()、os.fstat()、os.lstat()等函数返回的对象的学习，也就是能获取文件的系统状态信息（文件属性）

import os # 导入os模块
from os import path # 从os模块中导入path子模块

2. 打开文件

使用内置函数open()可以打开文件，如果指定文件不存在，则创建文件，如果该文件无法打开，会抛出OSError。

fileObj = open(fileName,mode='r',buffering=-1,encoding=None,
							 errors=None,newline=None,closedfd=True,opener=None)

open()函数共包含8个参数，除了第一个参数fileName必须设置外，其它参数都有默认值，可以省略。

fileName：设置打开的文件名，包含所在路径，也可设置文件句柄。
mode：打开模式，即操作权限，使用字符串表示，‘r’、‘w’、‘x’、‘b’可以和’b’、‘t’、‘+'组合使用，打开模式及其组合说明如下：

文件格式相关参数：可以与其它模式参数组合使用，用于指定打开文件的格式，需要根据文件类型进行选择。

‘t’：文本模式。默认以文本格式打开文件。一般用于文本文件。
‘b’：二进制模式。以二进制格式打开文件。一般用于非文本文件，如图片等。

通用读写模式相关参数：可以与文本格式参数组合使用，用于设置基本读、写操作权限，以及文件指针初始位置。

‘r’：只读模式。默认。以只读方式打开一个文件，文件指针被定位到文件头位置。如果文件不存在会报错。
‘w’：只写模式。打开一个文件只用于写入。如果文件已存在，则打开文件，清空文件内容，并把文件指针定位到文件头位置开始编辑；如果该文件不存在，则创建新文件，打开并编辑。
‘w’：追加模式。打开一个文件用于追加，仅有只写权限，无权读操作。如果该文件已存在，文件指针被定位到文件尾位置。新内容被写入到原内容之后；如果该文件不存在，创建新文件并写入。

特殊读写模式相关参数：

‘+’：更新模式。打开一个文件进行更新，具有可读、可写权限。注意该模式不能单独使用，需要与r、w、a模式组合使用。打开文件后，文件指针的位置由r、w、a组合模式觉得。
‘+’：新写模式。新建一个文件，打开并写入内容，如果该文件已存在则报错。

组合模式：文件格式与通用读写模式可以组合使用，另外，通过组合+模式可以为只读、只写模式增加写、读的权限。

r 模式组合：

‘r+’：文本格式读写。以文本格式打开一个文件用于读、写。文件指针被定位到文件头的位置。新写入的内容被覆盖原有文件部分或全部内容；如果文件不存在则报错。
‘rb’：二进制格式只读。以二进制格式打开一个文件，只能够读取。文件指针被定位到文件头的位置。一般用于非文本文件，如图片等。
‘rb+’：二进制格式读写。以二进制格式打开一个文件用于读、写。文件指针被定位到文件头位置。新写入的内容将覆盖原有文件部分或全部内容；如果文件不存在则报错。一般用于非文本文件。

w 模式组合

‘w+’：文本格式写读。以文本格式打开一个文件用于写、读。如果该文件已存在，则打开文件，清空原有内容，进入编辑模式；如果该文件不存在，则创建新文件，打开并执行写、读操作。
‘w+’：二进制格式只写。以二进制格式打开一个文件，只能够写入。如果该文件已存在，则打开文件，清空原有内容，进入编辑模式；如果该文件不存在，则创建新文件，打开并执行只写操作。一般用于非文本文件。
‘wb+’：二进制格式写读。以二进制格式打开一个文件用于写、读。如果该文件已存在，则打开文件，清空原有内容，进入编辑模式；如果该文件不存在，创建新文件，打开并执行写、读操作。一般用于非文本文件。

a 模式组合

‘a+’：文本格式读写。以文本格式打开一个文件用于读、写。如果文件已存在，则打开文件，文件指针被定位到文件尾位置，新写入的内容添加在原有内容的后面；如果该文件不存在，则创建新文件，打开并执行写、读操作。
‘ab’：二进制格式只写。以二进制格式打开一个文件用于追加写入。如果该文件已存在，则打开文件，文件指针被定位到文件尾位置，新写入的内容在原有内容的后面；如果该文件不存在，创建新文件，打开并执行只写操作。
‘ab+’：二进制格式读写。以二进制格式打开一个文件用于追加写入。如果该文件已存在，则打开文件，文件指针被定位到文件尾位置，新写入的内容在原有内容的后面；如果该文件不存在，创建新文件，打开并执行写、读操作。

buffering：设置缓冲方式。0表示不缓冲，直接写入磁盘；1表示行缓冲，缓冲区碰到\n换行符时写入磁盘；如果为大于1的正整数，则缓冲区文件大小达到该数字大小时写入磁盘；如果为负值，则缓冲区的缓冲大小为系统默认。
encoding：指定文件的编码方式，该参数只在文本模式下使用。
errors：报错级别。
newline：设置换行符（仅适用于文本模式）。
closefd：布尔值，默认为True，表示fileName参数为文件名（字符串型）；如果为False，则fileName参数为文件描述符。
opener：传递可调用对象。

# 新建一个test.txt文件，内容包含‘中国’，执行以下命令以文本文件和二进制文件打开
f = open('test.txt','rt',encoding='utf-8') # t表示文本格式方式
print(f.readline()) # 输出：中国
f.close() # 文件使用结束后要关闭，释放文件的使用授权
f = open('test.txt','rb') # b表示二进制格式方式
print(f.readline()) # 输出：b'\xe4\xb8\xad\xe5\x9b\xbd'
f.close() # 关闭文件

在异常处理语句中打开

使用异常处理机制打开文件的方法：在try语句块中调用open()函数，在except语句块中妥善处理文件操作异常，在finally语句块中关闭文件。

fileName = 'test1.txt' # 创建的文件名
try:
    fp = open(fileName,'w+') # 创建文件，w+ 模式打开文件，如果不存在，则创建，不会抛出异常
    print('%s 文件创建成功'%fileName) # 提示创建成功
except IOError:
    print('文件创建失败，%s 文件不存在'%fileName) # 提示创建失败
finally:
    fp.close() # 关闭文件
# 输出：test1.txt 文件创建成功

fileName = 'test2.txt'
try:
    fp = open(fileName,'r') # r 模式只能打开已存在的文件，当打开不存在的文件时，抛出异常
except IOError:
    print('文件创建失败，%s 文件不存在'%fileName) # 提示创建失败
finally:
    fp.close() # 关闭文件
# 输出：文件创建失败，test2.txt 文件不存在

在上下文管理中打开

with语句时一种上下文管理协议，是文件操作的通用结构。它能简化try…except…finally异常处理机制的流程，语法和示例如下：

'''
with open(文件) as file对象:
		操作file对象
'''
with open('test.txt','r',encoding='utf-8') as file: # 打开文件
    for line in file.readlines(): # 迭代每行字符串
        print(line) # 打印每一行字符串

3.读取文件

使用file对象的readline()、readlines()或read()方法可以读取文件的内容。

file.read(size=-1)：从文件中读取整个文件内容。参数可选，如果给出，读取前size长度的字符串或字节流。
file.readline(size=-1)：从文件中读取一行内容，包含换行符。参数可选，如果给出，读取该行前size长度的字符串或字节流。
file.readlines(hint=-1)：从文件中读取所有行，以每行为元素形成一个列表。参数可选，如果给出，读取hint行。
file.seek(offset[,whence])：改变当前文件操作指针的位置，参数offset表示需要移动偏移的字节数；参数whence表示偏移参照点，默认值为0，表示文件的开头；当值为1时，表示当前位置；当值为2时，表示文件的结尾。

f = open('test.txt','r',encoding='utf-8')
s = f.read()
print(s) # 显示内容
print(f.tell()) # 获取文件对象的当前指针位置
f.seek(0) # 改变指针到文件头位置
print(f.tell()) # 查看指针位置
ls = f.readlines() # 读取
print(ls) # 打印内容，列表存储：['北京\n', '人生苦短，我爱python\n', '我是five']
f.close() # 关闭

file对象内部记录文件指针的位置，以便下次操作。只要file对象没执行close()方法，文件指针就不会释放。

使用for和while循环遍历文件

# for
f = open('test.txt','r',encoding='utf-8')
for line in f:
    print(line)
f.close()
# while
f = open('test.txt','r',encoding='utf-8')
while True: # 执行无限循环
    line = f.readline() # 读取每行文本
    if line: # 如果不是尾行，则显示读取的文本
        print(line)
    else: # 如果时尾行，则跳出循环
        break
f.close() # 关闭

3. 写入文件

使用文件对象的write()和writelines()方法可以为文件写入内容。

f.write(s)：向文件写入一个字符串或字节流，并返回写入的字符长度。
f.writelines(lines)：将一个元素为字符串的列表写入文件。

writelines()方法不会换行写入每个元素，如果换行写入每个元素，就需要手动添加换行符\n。使用该方法写文件的速度更快。如果需要写入文件的字符串非常多，可以使用writelines()方法提高效率；如果只需要写入少量的字符串，直接使用write()方法即可。

ls = [
    ['指标','2014年','2015年','2016年'],
    ['居民消费价格指数','102','101.4','102'],
    ['食品','103.1','102.3','104.6'],
    ['烟酒及用品','994','102.1','101.5'],
    ['衣着','102.4','102.7','101.4'],
    ['家庭设备用品','101.2','101','100.5'],
    ['医疗保健和个人用品','101.3','102','101.1'],
    ['交通和通信','99.9','98.3','98.7'],
    ['游乐教育文化','101.9','101.4','101.6'],
    ['居住','102','100.7','101.6'],
]
f = open('cpi.csv','w',encoding='utf-8') # w 模式，存在文件，则清空内容，不存在则新建
for row in ls:
    f.write(','.join(row)+'\n')
f.close()

逗号分隔的存储格式叫做CSV格式，常见通用的相对简单的文件格式，一维数据保存成CSV格式后，各元素采用逗号分隔，形成一行。二维数据由一维数据组成，每一行时一维数据，整个CSV文件时一个二维数据

# 转换为二维列表对象，再进一步打印成表格形状
f = open('cpi.csv','r') # r 默认打开文本文件
ls = [] # 定义空列表
for line in f:
    ls.append(line.strip('\n').split(',')) # 去除换行符 逗号分隔符分隔
f.close() # 关闭
print(ls) # 打印数据列表
print('-'*100) # 分隔区分
for row in ls: # 遍历列表
    line = '' # 定义空字符串
    for item in row:
        line += '{:10}\t'.format(item) # 指定宽度格式化打印
    print(line) # 遍历打印

4. 删除文件

删除文件需要使用os模块，调用os.remove()方法可以删除指定的文件。

在删除文件之前需要先检测文件是否存在。如果文件不存在，直接进行删除操作，将抛出异常。调用os.path.exists()方法可以检测指定的文件是否存在。

import os # 导入os模块
f = 'test2.txt' # 指定要操作的文件
if os.path.exists(f): # 判断文件是否存在
    os.remove(f) # 存在则删除文件
    print('%s 文件删除成功'% f) # 提示删除成功
else: # 不存在则提示
    print('%s 文件不存在'% f)

5. 复制文件

文件对象没提供直接复制文件的方法，但是可以使用read()和write()方法，可以间接实现复制文件的操作。

music_name = '火车日记.mp3' # 定义文件名
with open(music_name,'rb') as music: # 以字节流方式打开文件，赋予读权限
    new_name = 'a.mp3' # 定义复制后的文件名
    with open(new_name,'wb') as new_music: # 以字节方式打开文件，赋予写权限
        buffer = 1024 # 定义一次读1024字节
        while True: # 循环读取
            content = music.read(buffer) # 读取内容
            if not content: # 当文件读取结束
                break # 跳出循环
            new_music.write(content) # 写内容

shutil 模块是另一个文件、目录的管理接口，提供了一些用于复制文件、目录的方法。其中，copyfile()方法可以实现文件的复制，copyfile(src,dst)，该方法把src指向的文件复制到dst指向的文件。参数src表示源文件的路径，参数dst表示目标文件的路径，两个参数都是字符串类型。

6. 重命名文件

使用os模块的rename()方法可以对文件或目录进行重命名。

'.'表示当前目录，os.listdir()方法能够返回指定目录包含的文件和子目录的名字列表。

import os
path = os.listdir('.') # 获取当前目录下所有文件或文件夹名称列表
print(path) # 显示列表：['a.mp3', 'cpi.csv', 'test1.txt', '火车日记.mp3', 'test.txt', 'open_file.ipynb']
if 'test1.txt' in path: # 如果存在test1.txt
    os.rename('test1.txt','test2.txt') # 将test1.txt改名为test2.txt
elif 'test2.txt' in path: # 如果存在test2.txt
    os.rename('test2.txt','test1.txt') # 将test2.txt改为test1.txt

在实际中，通常需要把某一类文件修改为另一种类型，即修改文件的扩展名。

# 把扩展名为htm的文件修改为html
import os
path = os.listdir('.') # 获取当前目录下所有文件或目录名称列表
for filename in path: # 遍历当前目录下所有文件
    pos = filename .find('.') # 获取文件扩展名前的点号下标位置
    if filename[pos+1:] == 'htm': # 如果文件扩展名为htm
        newname = filename[:pos+1] + 'html' # 定义新的文件名，改扩展名为html
        os.rename(filename,newname) # 重命名文件

7. 文件查找和替换

文件内容的搜索和替换可以结合字符串查找和替换来实现。

# 新建一个文件filtered_words.txt，包含'程序员、北京朝阳、上海'内容
def filterwords(file_name): # 定义敏感词过滤函数
    with open(file_name,'r') as f:
        content = f.read()
        word_list = content.split('\n') # 将文件内容转换成列表格式
        print('脱敏前：',word_list)
        text = input('敏感词过滤：') # 输入测试内容
        new_word_list = [] # 定义一个新列表
        for word in word_list: # 遍历敏感词列表
            if text in word: # 测试内含敏感词
                length = len(text) # 获取敏感词长度
                word = word.replace(text,'*'*length) # 用*替换敏感词
            new_word_list.append(word) # 内容追加
        return '脱敏后：'+str(new_word_list) # 返回脱敏后内容
file = 'filtered_words.txt'
print(filterwords(file))
'''
脱敏前： ['程序员、北京朝阳、上海']
脱敏后：['程序员、**朝阳、上海']
'''

新建一个test3.txt文件，内容如下图，然后从中查找字符串’five’，并统计出现的次数；替换其中的’five’字符串为’python’

# 查找
import re # 导入正则模块
f1 = open('test3.txt','r') # 以只读模式打开文件
count = 0 # 定义计数变量
for s in f1.readlines(): # 读取文件每一行字符串，然后迭代
    li = re.findall('five',s) # 在每行字符串搜索字符串'five'
    if len(li) > 0: # 如果字符串长度大于0，说明存在指定字符串
        count = count + li.count('five') # 累计求和出现次数
print('查找到',str(count),'个five') # 输出显示字符串出现次数
f1.close() # 关闭
# 输出：查找到 9 个five

# 替换
f1 = open('test3.txt')
f2 = open('test4.txt','w')
for i in f1.readlines():
    f2.write(i.replace('five','python')) # 替换
f1.close()
f2.close()

你可能感兴趣的:(Python,python)

Moodle + Websoft9：创新教育的强大组合，助力教学与学习开源软件
Moodle+Websoft9：构建未来课堂的技术基石一、Moodle：开源生态的深度解析•模块化设计：支持超800个官方插件，如H5P交互内容创作、BigBlueButton虚拟课堂，满足个性化教学需求。•学习分析引擎：内置LearningAnalyticsAPI，可集成Python/R语言进行深度学习，预测学生学业风险。•移动优先战略：MoodleApp支持离线学习、扫码签到，2023年新增A
python-flask复习(一) 胖虎是只mao python-web python函数 python python flask
一、Python现阶段三大主流Web框架Django、Tornado、Flask对比Django主要特点是大而全，集成了很多组件（例如Models、Admin、Form等等）,不管你用得到用不到，反正它全都有，属于全能型框架，通常用于大型Web应用，由于内置组件足够强大所以使用Django开发可以一气呵成，优点是大而全，缺点也就暴露出来了，这么多的资源一次性全部加载，肯定会造成一部分的资源浪费；T
python pip报错：Preparing metadata (pyproject.toml) ... error 我有一个魔盒其他 python pip 开发语言
环境：win11（Python3.9.13）原因：想安装低版本python，结果安装成了32位的，但是依赖包基本都是64位的。解决办法：重装64位python（可能还需要VisualStudio内安装“使用C++的桌面开发”）异常报错：Collectingmatplotlib~=3.0(fromgradio)Usingcachedhttps://pypi.tuna.tsinghua.edu.cn/
python安装scipy库出错_解决scipy安装（pip install scipy）失败,以及其他问题 weixin_39663933
解决scipy安装(pipinstallscipy)失败,以及其他问题解决：1.在scipy官方库中并没有适合Windows的python3.6相关版本，故需要在网址http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy下载适合的版本，下载如：scipy‑0.19.1‑cp36‑cp36m‑win32.whl2.Windows中scipy安装成功后，还会存
Python 安装scipy失败 _不二_ python python
在使用pip安装scipy时会报错OSError:[Errno13]Permissiondenied:'/usr/local/lib/python2.7/dist-packages/scipy'网上查了，说是由于墙的原因，但我已经翻了墙的，任然报这个错误，下载速度特别慢，到11%或者27%就挂啦，最后很无赖，直接手动安装吧。先去官网搜索scipy选择合适的版本如下图下载完成后pipinstalls
win7下python3.6通过pip安装scipy报错的解决办法青松一夏 python
一、问题描述通过pip方式安装了numpy和sklearn，但是sklearn需要依赖于scipy，但当通过pip方式安装scipy时，报错：numpy.distutils.system_info.NotFoundError:nolapack/blasresourcesfound按照网上的教程，并没有找到真正的解决办法，后来我是通过如下方式解决的。二、我的解决方案（1）首先卸载numpypipun
聊聊关于Python与人工智能那些事小G-biu- python 人工智能 tensorflow
Python与人工智能：介绍Python在人工智能方面的应用Python是一种广泛使用的编程语言，也是人工智能领域中最受欢迎的语言之一。Python提供了许多用于构建和训练人工智能模型的库和框架。本文将介绍一些常见的人工智能技术以及Python在这些技术中的应用。OpenAIOpenAI是一个非营利组织，旨在推动人工智能的发展并促进其对人类的利益。OpenAI通过开发人工智能技术、研究人工智能的影
numpy学习笔记10：arr *= 2向量化操作性能优化宁宁可可 #机器学习 #Python基础与进阶 numpy 学习笔记
numpy学习笔记10：arr*=2向量化操作性能优化在NumPy中，直接对整个数组进行向量化操作（如arr*=2）的效率远高于显式循环（如foriinrange(len(arr)):arr[i]*=2）。以下是详细的解释：1.性能差异的原理(1)底层实现不同显式循环（错误示范）：Python的for循环是解释执行的，每次迭代需要动态解析变量类型、执行函数调用等操作。对每个元素的操作会触发多次Py
Python前端开发 PITSU 正则表达式 html css3 mysql
Python前端开发1.前端三剑客（HTML，CSS和JavaScript）1.1HTML1.1.1HTML简介HyperTextMark-upLanguage,指的是超文本标记语言；html是开发网页的语言；html中的标签大多数都是成对出现的,格式:1.1.2HTML结构第一行是文档声明部分HTML：分为页头，页身和页脚。标签大部分是成对出现1.1.3第一行文档声明部分HTML在vscode中
AIGC与教育行业的邂逅--其在数学领域的应用与实现想成为高手499 AIGC
引言在数学教学中，教师往往需要大量的时间准备练习题和答案解析，而学生则需要定制化的练习来满足不同的学习需求。AIGC技术可以通过自动生成数学题目、定制化学习内容、即时反馈等方式，极大地提升数学学习的效率与质量。本文将深入探讨AIGC在数学领域的几种应用场景，并通过Python代码展示具体实现方式。1.自动生成数学题目与解析数学题目生成是AIGC在数学教学中的主要应用之一。通过生成不同难度和类型的题
Python在人工智能与机器人开发中的应用与实践一键难忘 python 人工智能机器人
Python在人工智能与机器人开发中的应用与实践Python已经成为人工智能和机器人开发的主要编程语言之一，凭借其简洁的语法、强大的库支持和广泛的社区资源，Python为开发者提供了一个高效且易于学习的平台。在这篇文章中，我们将深入探讨如何使用Python进行人工智能（AI）和机器人开发，并通过实际代码示例展示核心技术和应用。1.Python在人工智能中的应用人工智能（AI）领域的核心任务包括机器
python中strip()，lstrip()，rstrip()函数的讲解使用方法高质量海王哦 python python
在Python中，strip()、lstrip()和rstrip()是用于处理字符串的三个常用方法，它们的作用都是去除字符串两端的空白字符或指定字符，但它们的去除位置有所不同。下面是它们的详细讲解：1.strip()方法strip()方法用于去除字符串两端的空白字符（默认情况下，包括空格、换行符、制表符等），或者去除指定的字符序列。语法：string.strip([chars])chars：可选参
疯狂python讲义学习日志06——异常处理静笃归心方得平和心气 Python学习日志异常处理 python学习 python笔记 python速成
疯狂python讲义学习日志06——异常处理引言1异常处理机制1.1使用try...except处理异常1.2异常类的继承体系1.3多异常捕获1.4访问异常信息1.5else块1.6使用finally回收资源2使用raise处理异常2.1引发异常2.2自定义异常类2.3except和raise同时使用3.python的异常传播轨迹4.异常处理规则4.1不要过度使用异常4.2不要忽略异常引言异常机制
Python 生成数据(使用Pygal模拟掷骰子) 钢铁男儿 Python 从入门到精通 python 开发语言
数据可视化指的是通过可视化表示来探索数据，它与数据挖掘紧密相关，而数据挖掘指的是使用代码来探索数据集的规律和关联。数据集可以是用一行代码就能表示的小型数字列表，也可以是数以吉字节的数据。使用Pygal模拟掷骰子在本节中，我们将使用Python可视化包Pygal来生成可缩放的矢量图形文件。对于需要在尺寸不同的屏幕上显示的图表，这很有用，因为它们将自动缩放，以适合观看者的屏幕。如果你打算以在线方式使用
计算机专业毕业设计题目推荐（新颖选题）本科计算机科学专业相关毕业设计选题大全✅ 会写代码的羊毕设选题课程设计计算机网络毕设选题毕设系统毕设题目计算机科学专业
文章目录前言最新毕设选题（建议收藏起来）本科计算机科学专业相关的毕业设计选题毕设作品推荐前言2025全新毕业设计项目博主介绍：✌全网粉丝10W+,CSDN全栈领域优质创作者，博客之星、掘金/华为云/阿里云等平台优质作者。技术范围：SpringBoot、Vue、SSM、HLMT、Jsp、PHP、Nodejs、Python、爬虫、数据可视化、小程序、大数据、机器学习等设计与开发。主要内容：免费功能设计
Python中 rstrip()、 lstrip（）、 strip() 的用法和区别一只小小的土拨鼠深度学习面试前端 java python 深度学习
目录：题目一：Python中rstrip()、lstrip（）、strip()的用法和区别题目二：python中append（）、expend（）函数的用法和区别题目三：Python中zip()、zip(*zipped)、*zip()函数的用法和区别题目一：Python中rstrip()、lstrip（）、strip()的用法和区别考点这三个函数都是去除头尾字符、空白符的函数strip：用来去除头
Python个人学习笔记（17）：模块（sys、pickle&json） NEET_LH 樵夫老师Python零基础课程个人学习笔记 python 学习笔记
五、sys模块sys.exit()：退出while1:print(123)sys.exit(0)#程序退出，0是正常退出，1是非正常退出，记录在日志中sys.version：得到当前解释器的运行环境sys.platform：运行平台，win32=windows代码：print(sys.version)print(sys.platform)结果：3.13.0(tags/v3.13.0:60403a5
python学习笔记之异常（内置标准异常总结） Molly_DD Python学习笔记 python 软件测试
python异常处理机制异常处理是python的一种高级工具，当异常发生时，程序会停止当前的所有工作，跳转到异常处理部分去执行。异常既可以是程序错误引发的，也可以由代码主动触发。异常处理基本结构try:可能引发异常的代码except异常类型名称：异常处理代码else：没有发生异常时执行的代码异常报错：try：classtest:defgetdata(self):returnself.datay=t
python strip/rstrip/lstrip详细讲解（涵盖许多例子、作用以及复杂行为处理） zilan23 Python python
pythonstrip/rstrip/lstrip详细讲解：在Python中，strip、lstrip、rstrip是用于字符串处理的常用方法，主要功能是去除字符串首尾的指定字符。它们的区别如下：1.strip([chars])作用：删除字符串开头和结尾处所有属于chars的字符，直到遇到不属于chars的字符为止。默认行为：若未提供chars参数，默认去除空白符（空格、换行\n、制表符\t等）。
Python逆向爬取Tik Tok，MsToken,X-Bogus以及signature 才华是浅浅的耐心 python javascript 前端
自5月起，抖音正式开放Web接口，并不断升级风控机制。从最初的_signature参数，到增加滑块验证，再到如今的JSVM混淆处理，以及mstoken和x-bougs等参数的引入。分析发现，部分国内接口仅需提供Cookie即可访问，无需额外验签，而获取Cookie的方式多种多样，其中利用OpenCV识别滑块验证码是一种简单可行的方法。相比之下，TikTok的接口无需Cookie，但对签名的校验更加
Browser-Use WebUI项目启动指南思考在马桶上人工智能 chatgpt 经验分享 python
摘要此前发布《Browser-UseWebUI使用体验》博文后，鉴于部分朋友运行时出现问题，重新运行并整理相关内容。本文详细记录WebUI项目启动全过程，涵盖Python3.11+、Chrome浏览器及APIKeys等环境要求，Python环境检查、依赖安装等环境配置步骤，.env文件中环境变量的设置方法。同时，针对启动中如lxml.html.clean依赖缺失、连接被拒等问题给出解决方案，介绍启
Linux篇1-初识Linux 逃跑的机械工 Linux linux
1.Linux能干什么Linux能够进行各种语言的开发工作，基本主要以后端语言为主C++，JAVA,python;Linux能进行各种指令操作，从而完成各种的文件相关的管理工作2.Linux基本指令2.1ls指令在Linux中，以.开头的文件，叫做隐藏文件；ls-a显示隐藏文件隐藏文件：Linux配置文件，可以隐藏起来，防止误操作，起到保护作用；ls-l列出文件的详细信息-d将目录象文件一样显示，
Python获取tiktok视频数据信息 api 爬虫程序媛了了 python 开发语言
Tiktok通过ID爬取视频信息api采集页面如图：https://www.tiktok.com/@basketwithball2.0/video/7273119444522650912?q=irving&t=1706683319923请求APIhttp://api.xxxx.com/tt/video/info?video_id=7273119444522650912&token=test请求参数
【初学者】用Python语言来解释指针的用例与应用场景 lisw05 python python 开发语言
李升伟整理Python本身并不直接支持指针的概念，因为Python是一种高级语言，内存管理由解释器自动处理。不过，Python提供了一些机制（如引用、可变对象等）来实现类似指针的功能。以下是Python中“指针”的用例和应用场景。1.引用机制（类似指针）在Python中，变量是对对象的引用，而不是直接存储对象的值。这种引用机制类似于指针的概念。示例：a=10#a是对整数对象10的引用b=a#b也引
python、JavaScript 、JAVA等实例代码演示教你如何免费获取股票数据（实时数据、历史数据、CDMA、KDJ等指标数据）配有股票数据API接口说明文档详解参数说明蝶澈乐乐 python javascript java 股票数据接口 api 开发语言
近一两年来，股票量化分析逐渐受到广泛关注。而作为这一领域的初学者，首先需要面对的挑战就是如何获取全面且准确的股票数据。因为无论是实时交易数据、历史交易记录、财务数据还是基本面信息，这些数据都是我们进行量化分析时不可或缺的宝贵资源。我们的核心任务是从这些数据中挖掘出有价值的信息，为我们的投资策略提供有力的支持。在寻找数据的过程中，我尝试了多种途径，包括自编网易股票页面爬虫、申万行业数据爬虫，以及同花
31天Python入门——第7天:集合·字典你真的懂了吗? 安然无虞 Python手把手教程 python 开发语言后端
你好，我是安然无虞。文章目录1.集合1.1集合的定义1.2集合的常用操作1.3集合练习2.字典2.1字典的定义2.2嵌套字典和字典的取值2.3字典的常用操作补充知识:字典的优势是查找值效率高2.4字典推导式2.5字典练习很重要的补充练习:希望你能掌握练习一练习二1.集合在之前的章节中,我们学习了列表,元组,字符串.已经可以覆盖七成的使用场景了.那么为什么还要学习集合类型呢.列表:有序可变,元素可重
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归 OverlordDuke 聚类算法数据可视化爬虫线性回归算法
打造城市二手房分析与可视化系统+聚类分析+58爬虫+线性回归利用数据实现全面分析数据分析与可视化功能创新的聚类分析功能结语在如今房地产市场日益复杂的背景下，对于投资者、购房者和市场分析师来说，了解市场动态并做出明智的决策至关重要。基于此，我们开发了一款基于Python的城市二手房分析与可视化系统，为用户提供了强大的工具，帮助他们深入了解当地房地产市场。利用数据实现全面分析我们的系统利用爬取的58同
centos7输入python -m bitsandbytes报错CUDA Setup failed despite GPU being available. Please run the follo 小太阳，乐向上 python 开发语言
在centos7.9系统中安装gpu驱动及cuda，跑大模型会报错，提示让输入python-mbitsandbytes依然报错：CUDASETUP:Loadingbinary/usr/local/python3/lib/python3.9/site-packages/bitsandbytes/libbitsandbytes_cuda117.so.../lib64/libstdc++.so.6:ve
Linux安装Anaconda和Jupyter 硬水果糖人工智能 Linux linux jupyter 运维
一、了解Anaconda和Jupyter引言：Anaconda是一个流行的开源数据科学平台，广泛用于数据分析、机器学习、人工智能等领域。它是一个集成了大量科学计算和数据科学工具的Python和R编程语言环境。Anaconda的主要目标是简化数据科学和机器学习的开发流程，提供一个易于安装和管理的环境。而预装了大量常用的Python和R库，这些库涵盖了数据科学的各个方面，包括：数据分析：Pandas、
python-56-基于Vue和Flask进行前后端分离的项目开发示例实战皮皮冰燃 python3 python vue.js flask
文章目录1创建Vue前端项目1.1运行demo1.2实现需求2flask部署上述dist(前后端未分离)2.1代码app.py2.2运行访问3nginx部署(前后端分离)3.1nginx前端服务3.3.1windows安装nginx3.3.2修改nginx.conf配置文件3.3.3启动nginx3.3.3停止nginx3.2启动后端服务3.2.1app.py(去除前端渲染)3.2.2启动flas
矩阵求逆（JAVA）初等行变换 qiuwanchi 矩阵求逆（JAVA）
package gaodai.matrix; import gaodai.determinant.DeterminantCalculation; import java.util.ArrayList; import java.util.List; import java.util.Scanner; /** * 矩阵求逆(初等行变换) * @author 邱万迟 *
JDK timer antlove java jdk schedule code timer
1.java.util.Timer.schedule(TimerTask task, long delay)：多长时间（毫秒）后执行任务 2.java.util.Timer.schedule(TimerTask task, Date time)：设定某个时间执行任务 3.java.util.Timer.schedule(TimerTask task, long delay,longperiod
JVM调优总结 -Xms -Xmx -Xmn -Xss coder_xpf jvm 应用服务器
堆大小设置JVM 中最大堆大小有三方面限制：相关操作系统的数据模型（32-bt还是64-bit）限制；系统的可用虚拟内存限制；系统的可用物理内存限制。32位系统下，一般限制在1.5G~2G；64为操作系统对内存无限制。我在Windows Server 2003 系统，3.5G物理内存，JDK5.0下测试，最大可设置为1478m。典型设置： java -Xmx
JDBC连接数据库 Array_06 jdbc
package Util; import java.sql.Connection; import java.sql.DriverManager; import java.sql.ResultSet; import java.sql.SQLException; import java.sql.Statement; public class JDBCUtil { //完
Unsupported major.minor version 51.0（jdk版本错误） oloz java
java.lang.UnsupportedClassVersionError: cn/support/cache/CacheType : Unsupported major.minor version 51.0 (unable to load class cn.support.cache.CacheType) at org.apache.catalina.loader.WebappClassL
用多个线程处理1个List集合 362217990 多线程 thread list 集合
昨天发了一个提问，启动5个线程将一个List中的内容，然后将5个线程的内容拼接起来，由于时间比较急迫，自己就写了一个Demo，希望对菜鸟有参考意义。。 import java.util.ArrayList; import java.util.List; import java.util.concurrent.CountDownLatch; public c
JSP简单访问数据库香水浓 sql mysql jsp
学习使用javaBean，代码很烂，仅为留个脚印 public class DBHelper { private String driverName; private String url; private String user; private String password; private Connection connection; privat
Flex4中使用组件添加柱状图、饼状图等图表 AdyZhang Flex
1.添加一个最简单的柱状图 ? 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 <?xml version= "1.0"&n
Android 5.0 - ProgressBar 进度条无法展示到按钮的前面 aijuans android
在低于SDK < 21 的版本中，ProgressBar 可以展示到按钮前面，并且为之在按钮的中间，但是切换到android 5.0后进度条ProgressBar 展示顺序变化了，按钮再前面，ProgressBar 在后面了我的xml配置文件如下： [html] view plain copy <RelativeLa
查询汇总的sql baalwolf sql
select list.listname, list.createtime,listcount from dream_list as list , (select listid,count(listid) as listcount from dream_list_user group by listid order by count(
Linux du命令和df命令区别 BigBird2012 linux
1，两者区别 du，disk usage,是通过搜索文件来计算每个文件的大小然后累加，du能看到的文件只是一些当前存在的，没有被删除的。他计算的大小就是当前他认为存在的所有文件大小的累加和。
AngularJS中的$apply，用还是不用？ bijian1013 JavaScript AngularJS $apply
在AngularJS开发中，何时应该调用$scope.$apply()，何时不应该调用。下面我们透彻地解释这个问题。但是首先，让我们把$apply转换成一种简化的形式。 scope.$apply就像一个懒惰的工人。它需要按照命
[Zookeeper学习笔记十]Zookeeper源代码分析之ClientCnxn数据序列化和反序列化 bit1129 zookeeper
ClientCnxn是Zookeeper客户端和Zookeeper服务器端进行通信和事件通知处理的主要类，它内部包含两个类，1. SendThread 2. EventThread， SendThread负责客户端和服务器端的数据通信，也包括事件信息的传输，EventThread主要在客户端回调注册的Watchers进行通知处理 ClientCnxn构造方法 &
【Java命令一】jmap bit1129 Java命令
jmap命令的用法： [hadoop@hadoop sbin]$ jmap Usage: jmap [option] <pid> (to connect to running process) jmap [option] <executable <core> (to connect to a
Apache 服务器安全防护及实战 ronin47
此文转自IBM. Apache 服务简介 Web 服务器也称为 WWW 服务器或 HTTP 服务器 (HTTP Server)，它是 Internet 上最常见也是使用最频繁的服务器之一，Web 服务器能够为用户提供网页浏览、论坛访问等等服务。由于用户在通过 Web 浏览器访问信息资源的过程中，无须再关心一些技术性的细节，而且界面非常友好，因而 Web 在 Internet 上一推出就得到
unity 3d实例化位置出现布置？ brotherlamp unity教程 unity unity资料 unity视频 unity自学
问：unity 3d实例化位置出现布置？答：实例化的同时就可以指定被实例化的物体的位置,即 position Instantiate (original : Object, position : Vector3, rotation : Quaternion) : Object 这样你不需要再用Transform.Position了, 如果你省略了第二个参数(
《重构，改善现有代码的设计》第八章 Duplicate Observed Data bylijinnan java 重构
import java.awt.Color; import java.awt.Container; import java.awt.FlowLayout; import java.awt.Label; import java.awt.TextField; import java.awt.event.FocusAdapter; import java.awt.event.FocusE
struts2更改struts.xml配置目录 chiangfai struts.xml
struts2默认是读取classes目录下的配置文件，要更改配置文件目录，比如放在WEB-INF下，路径应该写成../struts.xml(非/WEB-INF/struts.xml) web.xml文件修改如下： <filter> <filter-name>struts2</filter-name> <filter-class&g
redis做缓存时的一点优化 chenchao051 redis hadoop pipeline
最近集群上有个job，其中需要短时间内频繁访问缓存，大概7亿多次。我这边的缓存是使用redis来做的，问题就来了。首先，redis中存的是普通kv，没有考虑使用hash等解结构，那么以为着这个job需要访问7亿多次redis，导致效率低，且出现很多redi
mysql导出数据不输出标题行 daizj mysql 数据导出去掉第一行去掉标题
当想使用数据库中的某些数据，想将其导入到文件中，而想去掉第一行的标题是可以加上-N参数如通过下面命令导出数据： mysql -uuserName -ppasswd -hhost -Pport -Ddatabase -e " select * from tableName" > exportResult.txt 结果为： studentid
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
先下载PHPEXCEL类文件，放在class目录下面，然后新建一个index.php文件，内容如下 <?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('
爱情格言 dcj3sjt126com 格言
1) I love you not because of who you are, but because of who I am when I am with you. 　　我爱你，不是因为你是一个怎样的人，而是因为我喜欢与你在一起时的感觉。 　　2) No man or woman is worth your tears, and the one who is, won‘t
转 Activity 详解——Activity文档翻译 e200702084 android UI sqlite 配置管理网络应用
activity 展现在用户面前的经常是全屏窗口，你也可以将 activity 作为浮动窗口来使用（使用设置了 windowIsFloating 的主题），或者嵌入到其他的 activity （使用 ActivityGroup ）中。当用户离开 activity 时你可以在 onPause() 进行相应的操作。更重要的是，用户做的任何改变都应该在该点上提交 ( 经常提交到 ContentPro
win7安装MongoDB服务 geeksun mongodb
1. 下载MongoDB的windows版本：mongodb-win32-x86_64-2008plus-ssl-3.0.4.zip，Linux版本也在这里下载，下载地址： http://www.mongodb.org/downloads 2. 解压MongoDB在D:\server\mongodb, 在D:\server\mongodb下创建d
Javascript魔法方法:__defineGetter__,__defineSetter__ hongtoushizi js
转载自： http://www.blackglory.me/javascript-magic-method-definegetter-definesetter/ 在javascript的类中,可以用defineGetter和defineSetter_控制成员变量的Get和Set行为例如,在一个图书类中,我们自动为Book加上书名符号: function Book(name){
错误的日期格式可能导致走nginx proxy cache时不能进行304响应 jinnianshilongnian cache
昨天在整合某些系统的nginx配置时，出现了当使用nginx cache时无法返回304响应的情况，出问题的响应头： Content-Type:text/html; charset=gb2312 Date:Mon, 05 Jan 2015 01:58:05 GMT Expires:Mon , 05 Jan 15 02:03:00 GMT Last-Modified:Mon, 05
数据源架构模式之行数据入口 home198979 PHP 架构行数据入口
注：看不懂的请勿踩，此文章非针对java，java爱好者可直接略过。一、概念行数据入口（Row Data Gateway）：充当数据源中单条记录入口的对象，每行一个实例。二、简单实现行数据入口为了方便理解，还是先简单实现： <?php /** * 行数据入口类 */ class OrderGateway { /*定义元数
Linux各个目录的作用及内容 pda158 linux 脚本
1）根目录“/” 　　根目录位于目录结构的最顶层，用斜线（/）表示，类似于 Windows 操作系统的“C:\“，包含Fedora操作系统中所有的目录和文件。　　2）/bin 　　/bin 　　目录又称为二进制目录，包含了那些供系统管理员和普通用户使用的重要 linux命令的二进制映像。该目录存放的内容包括各种可执行文件，还有某些可执行文件的符号连接。常用的命令有：cp、d
ubuntu12.04上编译openjdk7 ol_beta HotSpot jvm jdk OpenJDK
获取源码从openjdk代码仓库获取(比较慢) 安装mercurial Mercurial是一个版本管理工具。 sudo apt-get install mercurial 将以下内容添加到$HOME/.hgrc文件中，如果没有则自己创建一个： [extensions] forest=/home/lichengwu/hgforest-crew/forest.py fe
将数据库字段转换成设计文档所需的字段 vipbooks 设计模式工作正则表达式
哈哈，出差这么久终于回来了，回家的感觉真好！ PowerDesigner的物理数据库一出来，设计文档中要改的字段就多得不计其数，如果要把PowerDesigner中的字段一个个Copy到设计文档中，那将会是一件非常痛苦的事情。