孜孜孜孜不倦

Python超详细基础文件操作（详解版）

一、文件操作

1. 文件打开与关闭

1.1 打开文件

在Python中，你可以使用 open() 函数来打开文件。

以下是一个简单的例子：

# 打开文件（默认为只读模式）
file_path = 'example.txt'
with open(file_path, 'r') as file:
    # 执行文件操作，例如读取文件内容
    file_content = file.read()
    print(file_content)

# 文件在with块结束后会自动关闭，无需显式关闭文件

在上述示例中：

'example.txt' 是文件的路径和名称，你可以根据实际情况修改为你想要打开的文件。
'r' 表示只读模式。如果你想要写入文件，可以使用 'w' 模式，如果想要追加内容，可以使用 'a' 模式等。
with open(...) as file : 是使用上下文管理器的方式，确保文件在使用后被正确关闭，即使在处理文件时发生异常也能保证关闭。

1.2 关闭文件

在 Python 中关闭文件有两种主要的方法：

1.2.1 使用 with 语句

with 语句是一种上下文管理器，当它的代码块执行完毕时，会自动关闭文件。这是推荐的方式，因为它确保文件在使用完毕后被正确关闭，即使发生异常也能保证关闭。

file_path = 'example.txt'
with open(file_path, 'r') as file:
    # 执行文件操作，例如读取文件内容
    file_content = file.read()
    print(file_content)
    # 文件在这里已经被自动关闭

1.2.2 使用 close() 方法：

你可以显式调用文件对象的 close() 方法来关闭文件。这种方法适用于一些特殊情况，但相对来说不如 with 语句简洁和安全。

file_path = 'example.txt'
file = open(file_path, 'r')
try:
    # 执行文件操作，例如读取文件内容
    file_content = file.read()
    print(file_content)
finally:
    file.close()

在使用 with 语句时，不需要显式调用 close() 方法。如果你在代码中打开了文件而没有使用 with，请确保在适当的地方调用 close() 以关闭文件，以避免资源泄漏。

2. 访问模式及说明

访问模式	说明
r	以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
w	打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
a	打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
rb	以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
wb	以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
ab	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。也就是说，新的内容将会被写入到已有内容之后。如果该文件不存在，创建新文件进行写入。
r+	打开一个文件用于读写。文件指针将会放在文件的开头。
w+	打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在，创建新文件。
a+	打开一个文件用于读写，如果该文件已存在，文件指针将会放在文件的结尾。文件打开时会是追加模式。如果改文件不存在，创建新文件用于读写。
rb+	以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头
wb+	以二进制格式打开一个文件用于读写。如果改文件已存在则会覆盖。如果改文件不存在，创建新文件。
ab+	以二进制格式打开一个文件用于追加。如果该文件已存在，文件指针将会放在文件的结尾。如果改文件不存在，创建新文件用于读写。

二、文件读写

1. 写数据（write）

写入数据通常涉及将信息保存到文件、数据库或其他持久性存储介质中。以下是一些常见的数据写入场景的示例：

1.1 写入文本文件

使用内置的 open 函数来打开文件并写入内容。确保使用适当的模式（例如，'w' 表示写入）。

file_path = 'example.txt'

# 写入文件
with open(file_path, 'w') as file:
    file.write("Hello, this is some data.")

1.2 写入CSV文件

使用 csv 模块来写入CSV格式的文件。

import csv

csv_file_path = 'example.csv'

data = [['Name', 'Age', 'Occupation'],
        ['John Doe', 30, 'Engineer'],
        ['Jane Smith', 25, 'Designer']]

with open(csv_file_path, 'w', newline='') as csvfile:
    csv_writer = csv.writer(csvfile)
    csv_writer.writerows(data)

1.3 写入JSON文件

使用内置的 json 模块来写入JSON格式的文件。

import json

json_file_path = 'example.json'

data = {"name": "John Doe", "age": 30, "occupation": "Engineer"}

with open(json_file_path, 'w') as jsonfile:
    json.dump(data, jsonfile)

1.4 写入数据库

使用数据库连接库（如 sqlite3、mysql-connector-python 等）与相应的数据库进行交互。

import sqlite3

# 连接到SQLite数据库（假设有一个名为 example.db 的数据库）
conn = sqlite3.connect('example.db')

# 创建一个游标对象
cursor = conn.cursor()

# 执行SQL插入语句
cursor.execute("INSERT INTO users (name, age, occupation) VALUES (?, ?, ?)", ('John Doe', 30, 'Engineer'))

# 提交更改
conn.commit()

# 关闭连接
conn.close()

2. 读数据（read）

读取数据通常涉及从文件、数据库或其他存储介质中检索信息。以下是一些读取数据的常见示例：

2.1 读取文本文件

使用内置的 open 函数来打开文件并读取内容。

file_path = 'example.txt'

# 读取文件
with open(file_path, 'r') as file:
    data = file.read()
    print(data)

2.2 读取CSV文件

使用 csv 模块来读取CSV格式的文件。

import csv

csv_file_path = 'example.csv'

# 读取CSV文件
with open(csv_file_path, 'r') as csvfile:
    csv_reader = csv.reader(csvfile)
    for row in csv_reader:
        print(row)

2.3 读取JSON文件

使用内置的 json 模块来读取JSON格式的文件。

import json

json_file_path = 'example.json'

# 读取JSON文件
with open(json_file_path, 'r') as jsonfile:
    data = json.load(jsonfile)
    print(data)

2.4 从数据库中读取数据

使用数据库连接库（如 sqlite3、mysql-connector-python 等）与相应的数据库进行交互。

import sqlite3

# 连接到SQLite数据库（假设有一个名为 example.db 的数据库）
conn = sqlite3.connect('example.db')

# 创建一个游标对象
cursor = conn.cursor()

# 执行SQL查询语句
cursor.execute("SELECT * FROM users")

# 检索所有行
rows = cursor.fetchall()

# 打印每一行
for row in rows:
    print(row)

# 关闭连接
conn.close()

2. 读数据（readlines）

readlines 是 Python 中用于读取文件的方法之一，它用于逐行读取文件内容，并将每一行作为字符串存储在一个列表中。下面是对 readlines 方法的详细解释：

使用 readlines 方法的基本语法

with open('file.txt', 'r') as file:
    lines = file.readlines()

解释：

open('file.txt', 'r') : 打开文件 'file.txt' 以供读取。第一个参数是文件名，第二个参数是打开文件的模式。'r' 表示只读模式。
with ... as ... : 使用 with 语句可以确保在读取完成后自动关闭文件，不需要显式调用 file.close()。
lines = file.readlines() : readlines 方法用于读取文件的所有行，并将每一行作为一个字符串存储在列表 lines 中。
每个列表元素对应文件中的一行文本。你可以使用列表索引来访问特定行，例如 lines[0] 表示文件的第一行。

例子：假设 ‘file.txt’ 包含以下内容：

Hello, this is line 1.
This is line 2.   
And this is line 3.

使用 readlines 后：

with open('file.txt', 'r') as file:
    lines = file.readlines()

# lines 现在是一个包含每一行文本的列表
print(lines)
# 输出：
# ['Hello, this is line 1.\n', 'This is line 2.\n', 'And this is line 3.\n']

# 访问特定行
print(lines[0].strip())  # 输出：Hello, this is line 1.

注意事项：

每一行的末尾都包含换行符 \n，你可以使用 strip() 方法去除这些额外的空白字符。
readlines 方法适用于处理包含多行文本的文件，但对于大型文件，可能需要考虑逐行读取而不是将整个文件加载到内存中。这可以通过循环遍历文件对象来实现，而不是使用 readlines。

3. 读数据（readline）

readline 是 Python 中用于读取文件的方法之一，它用于逐行读取文件内容，并返回文件中的一行作为字符串。以下是对 readline 方法的详细解释：
使用 readline 方法的基本语法

with open('file.txt', 'r') as file:
    line = file.readline()

解释：

open('file.txt', 'r') : 打开文件 'file.txt' 以供读取。第一个参数是文件名，第二个参数是打开文件的模式。'r' 表示只读模式。
with ... as ... : 使用 with 语句可以确保在读取完成后自动关闭文件，不需要显式调用 file.close()。
line = file.readline() : readline 方法用于读取文件的一行，并将该行作为一个字符串存储在变量 line 中。

例子：假设 ‘file.txt’ 包含以下内容：

Hello, this is line 1.   
This is line 2.   
And this is line 3.

使用 readline 后：

with open('file.txt', 'r') as file:
    line1 = file.readline()
    line2 = file.readline()
    line3 = file.readline()

print(line1)  # 输出：Hello, this is line 1.
print(line2)  # 输出：This is line 2.
print(line3)  # 输出：And this is line 3.

注意事项：

每个 readline 调用都会读取文件的下一行。
返回的字符串包含行末尾的换行符 \n。如果不需要换行符，可以使用 strip() 方法去除它。
当文件读取完毕后，readline 将返回空字符串 ‘’，因此可以在循环中使用 while line != '' 来逐行读取整个文件。

循环读取整个文件：

with open('file.txt', 'r') as file:
    line = file.readline()
    while line != '':
        print(line.strip())  # 去除换行符
        line = file.readline()

这个循环将逐行读取整个文件，直到文件末尾。

4. readlines 和 readline的区别

readlines 和 readline 是 Python 中用于读取文件的两种不同方法，它们之间有一些重要的区别：

4.1 readlines 方法：

返回类型：readlines 方法返回一个包含文件所有行的列表，其中每个元素都是文件中的一行文本字符串。
使用情况：适用于处理包含多行文本的文件，可以一次性将整个文件加载到内存中。这种方法适用于文件较小，可以完全装入内存的情况。
例子：

with open('file.txt', 'r') as file:
    lines = file.readlines()`

4.2 readline 方法：

返回类型： readline 方法每次调用只返回文件中的一行作为字符串。如果再次调用，将返回下一行。当文件读取完毕后，返回空字符串 ‘’。
使用情况：适用于逐行处理大型文件，可以有效地降低内存使用。因为它一次只读取一行，可以在循环中逐行处理文件，而不必将整个文件加载到内存中。
例子：

  with open('file.txt', 'r') as file:
      line = file.readline()
      while line != '':
          print(line.strip())  # 去除换行符
          line = file.readline()

4.3 区别总结：

readlines 一次性读取整个文件的所有行，并返回一个包含所有行的列表。
readline 逐行读取文件，每次调用返回文件中的一行，适用于处理大型文件，减少内存占用。
readlines 返回包含换行符的每一行，而 readline 返回单独的行，需要手动去除换行符。

选择使用哪个方法取决于文件的大小和处理需求。如果文件较小，可以完全装入内存，使用 readlines；如果文件较大，可以逐行处理，使用 readline。

三、文件的相关操作

1. 文件重命名

Python 文件重命名是文件管理中的一个基本操作，可以通过 Python 的内置库来实现。以下是一个超详细的入门指南，介绍如何使用 Python 重命名文件：

1.2 导入必要的库

首先，您需要导入 Python 的 os 库，它提供了许多与操作系统交互的函数。

import os

1.2 准备文件列表

要重命名文件，您需要先列出指定目录中的所有文件。可以使用 os.listdir() 函数来获取目录中的文件列表。

# 列出指定目录中的所有文件和文件夹   
files = os.listdir('path_to_directory')

1.3 遍历文件列表

接着，您需要遍历文件列表，对每一个文件进行重命名。

for file in files:
    # 获取文件的完整路径
    full_path = os.path.join('path_to_directory', file)
    
    # 检查是否是文件
    if os.path.isfile(full_path):
        # 新的文件名
        new_filename = 'new_name'
        
        # 重命名操作
        os.rename(full_path, os.path.join('path_to_directory', new_filename))
        print(f'Renamed {file} to {new_filename}')

1.4 异常处理

在重命名文件时，可能会出现各种异常，例如目标文件已存在、没有足够权限等。为了确保程序的健壮性，应该添加异常处理。

try:
    for file in files:
        # ...（上面的代码）
except OSError as e:
    print(f'Error occurred: {e}')

1.5 完整的脚本示例

import os
# 指定要重命名文件的目录
directory = 'path_to_directory'
# 列出目录中的所有文件
files = os.listdir(directory)
# 遍历文件列表并进行重命名
for file in files:
    if os.path.isfile(os.path.join(directory, file)):
        # 设定新的文件名
        new_filename = 'new_name'
        
        # 重命名文件
        try:
            os.rename(
                os.path.join(directory, file),
                os.path.join(directory, new_filename)
            )
            print(f'Renamed {file} to {new_filename}')
        except OSError as e:
            print(f'Error renaming {file}: {e}')

1.6 注意安全性和效率

在批量重命名文件时，应确保：

不要同时进行多个重命名操作，以避免潜在的竞争条件。
确保目标目录存在，避免在重命名时创建不存在的目录。
考虑到操作系统对文件重命名的限制，例如在 Windows 中，文件名不能超过 255 个字符，而在 Unix/Linux 中则没有这个限制。

1.7 高级用法

对于更复杂的重命名任务，您可以使用正则表达式或者其他文本处理方法来生成新的文件名。

import os
import re
# 指定目录
directory = 'path_to_directory'
# 列出目录中的所有文件
files = os.listdir(directory)
# 遍历文件列表并进行重命名
for file in files:
    if os.path.isfile(os.path.join(directory, file)):
        # 使用正则表达式匹配文件名模式，并替换为新的模式
        new_filename = re.sub(r'\d+', 'new_prefix', file)
        
        # 重命名文件
        try:
            os.rename(
                os.path.join(directory, file),
                os.path.join(directory, new_filename)
            )
            print(f'Renamed {file} to {new_filename}')
        except OSError as e:
            print(f'Error renaming {file}: {e}')

这个脚本会将指定目录中所有以数字开头的文件重命名为新的前缀。

2. 删除文件

在Python中，删除文件是一个相对简单的操作。我们可以使用os库中的os.remove()函数来实现。以下是一个超详细的入门指南，介绍如何使用Python删除文件：

2.1 导入必要的库

首先，您需要导入Python的 os 库，它提供了许多与操作系统交互的函数。

import os

2.2 准备文件路径

要删除文件，您需要知道要删除的文件的路径。

file_path = 'path_to_file'

2.3 检查文件是否存在

在删除文件之前，最好检查该文件是否存在，以避免错误。

if os.path.isfile(file_path):
    print(f'File {file_path} exists, proceed to delete.')
else:
    print(f'File {file_path} does not exist, skip deletion.')

**2.4 执行删除操作

如果文件存在，您可以使用 os.remove() 函数来删除它。

try:
    os.remove(file_path)
    print(f'File {file_path} deleted successfully.')
except OSError as e:
    print(f'Error occurred: {e}')

2.5 完整的脚本示例

import os
# 指定要删除的文件的目录
file_path = 'path_to_file'
# 检查文件是否存在
if os.path.isfile(file_path):
    print(f'File {file_path} exists, proceed to delete.')
else:
    print(f'File {file_path} does not exist, skip deletion.')
# 执行删除操作
try:
    os.remove(file_path)
    print(f'File {file_path} deleted successfully.')
except OSError as e:
    print(f'Error occurred: {e}')

2.6 注意安全性和效率

在批量删除文件时，应确保：

不要同时进行多个删除操作，以避免潜在的竞争条件。
确保目标目录存在，避免在删除时创建不存在的目录。
考虑到操作系统对文件删除的操作限制，例如在 Windows 中，文件名不能超过 255 个字符，而在 Unix/Linux 中则没有这个限制。

通过以上步骤，您应该能够掌握如何使用Python删除文件。

3. 创建文件

在Python中，创建文件是一个相对简单的操作。我们可以使用 os 库中的 os.open() 函数或者 with 语句来创建文件。以下是一个超详细的入门指南，介绍如何使用Python创建文件：

3.1 导入必要的库

首先，您需要导入Python的 os 库，它提供了许多与操作系统交互的函数。

import os

3.2 准备文件路径

要创建文件，您需要知道要创建的文件的路径。

file_path = 'path_to_file'

3.3 检查文件路径是否存在

在创建文件之前，最好检查该文件路径是否存在，以避免覆盖其他文件。

if not os.path.exists(file_path):
    print(f'File path {file_path} does not exist, proceed to create.')
else:
    print(f'File path {file_path} already exists, skip creation.')

3.4 执行创建操作

如果文件路径不存在，您可以使用 os.open() 函数来创建文件。

try:
    with open(file_path, 'w') as f:
        print(f'File {file_path} created successfully.')
except IOError as e:
    print(f'Error occurred: {e}')

这里，我们使用 with 语句来确保文件在操作完成后会被正确关闭。'w' 参数表示以写入模式打开文件，如果文件不存在，会创建一个新文件。

3.5 完整的脚本示例

import os
# 指定要创建的文件的目录
file_path = 'path_to_file'
# 检查文件路径是否存在
if not os.path.exists(file_path):
    print(f'File path {file_path} does not exist, proceed to create.')
else:
    print(f'File path {file_path} already exists, skip creation.')
# 执行创建操作
try:
    with open(file_path, 'w') as f:
        print(f'File {file_path} created successfully.')
except IOError as e:
    print(f'Error occurred: {e}')

3.6 注意安全性和效率

在创建文件时，应确保：

拥有创建文件的足够权限。
避免在内存不足的情况下创建大型文件。
通过以上步骤，您应该能够掌握如何使用Python创建文件。

4. 获取当前目录

在Python中，我们可以使用 os 库中的 os.getcwd() 函数来获取当前目录的路径。以下是一个示例：

import os
current_directory = os.getcwd()
print(f'Current directory is: {current_directory}')

这将会打印出当前Python脚本所在目录的路径。

四、示例

1. 目录.txt自动清洗

1.1 需要在二级标题所在行最前面空4个格子，一级标题不用

1.2 需要在章和节字的后面加上一个空格

1.3 需要在页码前面加上=>符号

# 获取桌面路径
import os
import re

desktop_path = os.path.join(os.path.expanduser("~"), "Desktop")

# 目标文件路径
file_path = os.path.join(desktop_path, "目录.txt")

# 打开文件并读取内容
with open(file_path, 'r', encoding='utf-8') as file:
    lines = file.readlines()

modified_lines = []
for line in lines:
    # 去除空格
    line = line.replace(" ", "")
    if len(line) == 1:
        continue
    # 使用正则表达式在'章'或'节'后面添加一个空格，仅在后面没有空格的情况下
    line = re.sub(r'(章|节)(?![ ])', r'\1 ', line)
    # 在小数点后添加空格
    line = re.sub(r'(\.\d)', r'\1 ', line)
    if '章' not in line:
        # 二级标题添加4个空格
        line = ' ' * 4 + line
    # 匹配并去除最外层的英文括号
    pattern_en = r'\(([\d\s]+)\)'
    line = re.sub(pattern_en, r'\1', line)
    # 匹配并去除最外层的中文括号及其内部内容（包括除数字和空格以外的字符）
    pattern = r'（([^）]+)）'
    line = re.sub(pattern, r'\1', line)
    # 确保每行只有一个 =>
    if '=>' not in line:
        # 在页码数字前添加 =>（只在行尾）
        line = re.sub(r'(\d+)$', r'=>\1', line)
    # 去除中文汉字和'=>整体符号左边的冗余符号
    pattern = r'([\u4e00-\u9fff]+)[^\w\s]+=>'
    line = re.sub(pattern, r'\1=>', line)
    modified_lines.append(line)
# 将修改后的内容写回文件
with open(file_path, 'w', encoding='utf-8') as file:
    file.writelines(modified_lines)

# 读取文件内容
with open(file_path, 'r', encoding='utf-8') as file:
    content = file.read()
    print(content)

2. 批量修改文件夹下的文件命名

你可以使用 Python 的 os 模块来实现对文件名的批量修改，结合字符串操作来确保文件名中的规定格式。以下是一个示例代码：

import os

# 指定目录路径
directory_path = r'目标文件夹绝对路径'

# 获取目录下所有文件名
files = os.listdir(directory_path)

# 遍历文件
for file_name in files:
    # 构建完整的文件路径
    file_path = os.path.join(directory_path, file_name)

    # 检查文件是否是图片文件，并且文件名中包含下划线
    if file_name.lower().endswith(('.png', '.jpg', '.jpeg', '.gif')) and '_' in file_name:
        # 分割文件名，以下划线为界
        parts = file_name.split('_')

        # 确保分割后的第一部分为'00159231127'
        if parts[0] != '00159231127':
            # 构建新文件名
            new_file_name = '00159231127' + '_' + '_'.join(parts[1:])

            # 构建新文件路径
            new_file_path = os.path.join(directory_path, new_file_name)

            # 重命名文件
            os.rename(file_path, new_file_path)
            print(f'Renamed: {file_name} -> {new_file_name}')

在上述代码中：

1.使用 os.listdir 获取目录下的所有文件名，然后遍历这些文件名。
2.通过 os.path.join 构建完整的文件路径，确保路径的正确性。
3.检查文件是否是图片文件（以 .png, .jpg, .jpeg, .gif 结尾的文件），并且文件名中包含下划线。
4.使用 split('_') 分割文件名，确保分割后的第一部分为'00159231127'。
5.构建新文件名，并使用 os.rename 来重命名文件。

在运行前，请确保备份文件或者在测试环境中运行，以免意外损坏文件。

3. 检测同级目录下是否存在同名文件夹

检测目标路径下的文件夹命名前5位是否存在一样的，如果一样打印出来

你可以使用 Python 来检查指定目录下的文件夹，查找前5位命名相同的文件夹。以下是一个示例代码：

import os

# 指定目录路径
directory_path = r'目标路径'

# 获取目录下所有文件夹名
folders = [folder for folder in os.listdir(directory_path) if os.path.isdir(os.path.join(directory_path, folder))]

# 创建一个空字典，用于存储前5位相同的文件夹名
same_prefix_folders = {}

# 遍历文件夹
for folder in folders:
    # 获取前5位文件夹名
    prefix = folder[:5]

    # 检查前5位文件夹名是否已经在字典中
    if prefix in same_prefix_folders:
        # 将文件夹名添加到对应的键值中
        same_prefix_folders[prefix].append(folder)
    else:
        # 若字典中没有该前5位文件夹名，则创建键值对
        same_prefix_folders[prefix] = [folder]

# 输出前5位相同的文件夹名
for prefix, folders in same_prefix_folders.items():
    if len(folders) &gt; 1:
        print(f"前5位为 '{prefix}' 的文件夹有以下重复命名：")
        print(', '.join(folders))

这段代码执行以下操作：

1.使用 os.listdir 获取指定目录下的所有文件夹名。
2.然后遍历这些文件夹名，提取前 5 位名称，并将具有相同前缀的文件夹放入一个字典中。
3.最后打印出前 5 位相同的文件夹名。Python超详细基础文件操作（详解版）

你可能感兴趣的:(python,服务器,linux)

安装python后如何安装numpy_如何简单安装NumPy与SciPy
2015-12-27回答numpy是一个定义了数值数组和矩阵类型和它们的基本运算的语言扩展。scipy是一种使用numpy来做高等数学、信号处理、优化、统计和许多其它科学任务的语言扩展。学习这两个工具的话，官方有很详细的文档和教程来帮助入门：我是传送门另外，还有一本书《numpyandscipy》，很薄，才67页：我是传送门如何安装numpy和scipy之所以写这篇文章主要是因为scipy官网貌似
#Linux内存管理# 假设使用printf打印指针bufA和bufB指向的地址是一样的，那么在内核中这两块虚拟内存是否“打架”了呢？
不，在内核中这两块虚拟内存不会“打架”。原因在于虚拟内存的工作原理和内核的管理机制。下面我将详细解释，基于你描述的场景：假设在同一个进程或不同进程中，使用printf打印出的bufA和bufB的虚拟地址值相同。关键点：虚拟地址是进程本地的用户空间虚拟地址的含义：printf打印的地址是用户空间的虚拟地址（VirtualAddress）。每个进程都有自己的虚拟地址空间，由操作系统内核通过内存管理单元
#Linux内存管理# vm_normal_page()函数返回的什么样页面的struct page数据结构？为什么内存管理代码中需要这个函数？
vm_normal_page()函数是Linux内核内存管理的一个关键且微妙的函数，其职责和返回结果需要深入理解。下面详细解释：1.vm_normal_page()返回什么样的structpage？vm_normal_page()函数接收一个有效的、已经存在于物理内存中的页表项（PTE）作为输入（即pte_present(pte)必须为true），然后返回一个指向与该PTE所映射的物理页帧相对应的
Python 中 sys 库的全面解析与实战应用二向箔reverse 服务器 python
在Python的众多标准库中，sys库占据着举足轻重的地位。它与Python解释器紧密交互，为开发者提供了访问解释器内部信息和控制解释器行为的强大能力。无论是命令行参数处理、系统环境配置，还是程序退出控制，sys库都能大显身手。本文将带您深入探索sys库的常用功能，通过丰富的实例讲解，助您轻松掌握其使用技巧。sys库的基础认知sys库是Python的内置标准库，无需额外安装，只需通过imports
python环境安装jupyter 爱分享的胖头鱼 02.Python(基础知识)jupyter ide python python虚拟环境
安装完毕之后下一步可以参考：配置jupyter的启动路径-CSDN博客1前提条件：python环境系统：win10python：本地已经有python，可以查看本地的python版本：C:\Users\PC>python--versionPython3.8.102安装jupyter并启动安装jupyterC:\Users\PC>pipinstalljupyternotebookCollecting
KVM中使用桥接模式.运维就业技术教程
在KVM中使用桥接模式可以让虚拟机直接接入物理网络，使其成为局域网中的独立节点。以下是配置和使用桥接模式的详细指南：一、桥接模式原理作用:虚拟机通过宿主机的网桥（如virbr0）直接与物理交换机/路由器通信，获得与宿主机相同的网段IP。特点:虚拟机拥有独立IP，可被局域网内其他设备直接访问。无需NAT转换，网络性能更高。需确保宿主机网桥已正确配置。二、配置步骤1.创建网桥接口大多数Linux发行版
python爬虫之获取渲染代码
获取渲染后的网页代码过get()方法获取浏览器中的网页资源后,浏览器将自动渲染网页源代码内容，并生成渲染后的的时使用page_source()方法即可获取渲染后的网页代码。示例代码:'''获取渲染后的网页代码'''fromseleniumimportwebdriverfromselenium.webdriver.chrome.optionsimportOptionschrome_options=O
学习笔记(66):Python入门教程-datetime模块时间运算顾子宇研发管理 python 编程语言 Python 小猿圈 Python入门教程
立即学习:https://edu.csdn.net/course/play/24459/296363?utm_source=blogtoedudatetime模块：datetime.date：表示日期的类，常用属性有year，month，daydatetime.time：表示时间的类，常用的属性有hour,minute,second,microseconddatetime.datetime：表示日
掌握reStructuredText：编写与格式化文档的技巧
本文还有配套的精品资源，点击获取简介：reStructuredText（rST）是一种轻量级文本标记语言，广泛用于Python社区的文档编写，特别是借助Sphinx文档生成器。本文介绍了rST的基础语法和高级特性，包括段落、标题、强调、代码、列表、引用、链接、图像、表格、章节组织、自定义角色和指令、包含和排除文件以及源代码高亮。同时，探讨了Sphinx与rST结合使用的高级功能，包括扩展、配置和构
[Python] -项目实战5- Python 实现简易学生成绩管理系统踏雪无痕老爷子 Python python 开发语言
一、为什么做这个项目？学习OOP和GUI基础：通过类与对象封装学生信息，熟悉Tkinter构建窗口、表格、按钮等。实用性强：可添加、查询、删除、修改学生记录，是常见管理系统的基本功能。扩展性好：后续可以接入数据库、图表展示、权限控制等功能。二、核心技术与工具tkinter：Python内置的桌面GUI库，用于构建窗口界面、表单和按钮。sqlite3：轻量级关系数据库，适合小型持久化存储，无需部署服
[Python] -项目实战类3- 用Python制作一个记事本应用踏雪无痕老爷子 Python 开发语言 python
一、为什么要自己写记事本？提升GUI编程能力：通过构建窗口、菜单、文本区等组件，理解基本控件的使用。实用工具：自定义功能、更轻量、更符合个人使用习惯。实验与扩展空间大：方便加入特色功能，如自动保存、代码高亮、插件等。二、准备工作✅安装Python（建议Python 3.7+）。无需安装第三方库，tkinter是Python标准库的一部分。用于构建UI界面。sudoaptinstallpython3
[Python] -项目实战4- 利用Python进行Excel批量处理踏雪无痕老爷子 Python python excel 开发语言
一、为什么要批量处理Excel文件？节省时间：人工对数十、数百个Excel文件重复操作不现实，Python批量处理一次搞定。保证一致性：统一格式、统一操作，避免手动误差。易于集成：可嵌入日常自动化流程，支持定时和触发执行。二、常用库及选型建议库作用优势局限pandas读取/清洗/分析Excel数据语法简
Kafka面试问题1 小小少年Boy
1请说明什么是ApacheKafka?Kafka是分布式发布-订阅消息系统。Kafka是一个分布式的，可划分的，冗余备份的持久性的日志服务。它主要用于处理活跃的流式数据。它可以同时用于在线消息数据处理，和离线的数据文件处理。2、请说明什么是传统的消息传递方法?传统的消息传递方法包括两种：排队：在队列中，一组用户可以从服务器中读取消息，每条消息都发送给其中一个人。发布-订阅：在这个模型中，消息被广播
rce漏洞测试
目录什么是RCE？漏洞介绍漏洞分类远程命令执行29关30关31关32~36关37关38关39关40关41关42关43关44关45关46~49关总结什么是RCE？漏洞介绍RCE漏洞，可以让攻击者直接向后台服务器远程注入操作系统命令或者代码，从而控制后台系统。RCE主要指远程代码执行和远程命令执行，CTFHub中将文件包含漏洞也看作RCE漏洞。漏洞分类远程命令执行远程代码执行文件包含漏洞实际上，RCE
python中的keys方法 m0_58134286 python dict
d.keys()1.作用：获取字典d中的所有key值，返回值是一个对象2.例子：dict1=dict（one=1，two=2）print（dict1.keys（））//输出结果为：dict_keys（["one","two"])3.思考：若何将返回值转换成列表print（list(dict1.keys())//输出结果为：["one","two"]
bash方式启动模型训练 BILLY BILLY 深度学习基础开发必备工具自动驾驶
export\PATHPYTHONPATH=/workspace/mmlab/mmdetection/:/workspace/mmlab/mmsegmentation/:/workspace/mmlab/mmdeploy/:${env:PYTHONPATH}\CUDA_VISIBLE_DEVICES=0\DATA_ROOT_1=/mnt/data/…/\DATA_ROOT_2=/mnt/data/
xss漏洞-反射+存储+DOM xiaoheizi安全 XSS漏洞合集 web安全 xss
XSS跨站-反射型&存储型&DOM型等产生原理：服务器没有对用户提交的数据做过滤或者过滤不严谨，直接回显到了用户浏览器，浏览器对其进行了js解析并执行，导致了xss漏洞。攻击原理：攻击者利用网站程序对用户输入过滤不足，输入可以显示在页面上对其他用户造成影响的HTML代码，在用户端注入恶意的可执行脚本，若服务器对用户的输入不进行处理或处理不严，浏览器就会直接执行用户注入的脚本。利用：确认漏洞存在后可
Python基础(十四): 函数作用域伯wen
一、基本概念1、变量的作用域变量的作用范围:可操作范围Python是静态作用域,也就是说在Python中,变量的作用域源于它在代码中的位置,在不同的位置,可能有不同的命名空间2、命名空间命名空间是作用域的体现形式表示变量不同的具体的操作范围3、Python-LEGBL-Local:函数内的命名空间作用范围:当前整个函数体deftest():a=10print(a)test()#打印:10a的作用范
爬虫实战案例（两个） AI 嗯啦爬虫
该博客展示两个简单的爬虫实战案例，一个是从人民邮电出版社上爬取其中一个分类的全部图书信息，另一个是在苏宁易购上爬取某个商品的好评和差评，用两个简单的案例讲解爬虫在实际情况下的运作流程一、获取图书信息需求：统计人民邯电出版社官网中与关键词“python”有关的全部图书，包含图书名、价格、作者名等信息，并将获取的信息写入“Excel图书汇总，txt”文件中。流程：配置浏览器并打开目标网站搜索"Pyth
bash-completion未安装或未启用 teayear bash 开发语言
在Linux系统中，按下Tab键无法触发自动补全或提示的情况，通常是由以下原因导致的。以下是具体分析和解决方案：一、常见原因及解决方案1.bash-completion未安装或未启用原因：bash-completion是提供命令补全功能的核心工具，部分Linux发行版（如CentOS）默认未安装此工具。解决方案：#安装bash-completionsudoyuminstall-ybash-comp
Python高效编程技术大全：从解释器到异步编程竹石文化传播有限公司
本文还有配套的精品资源，点击获取简介：《Python高性能编程技术》旨在指导开发者深入理解Python的性能优化方法。本书涵盖了从解释器机制、数据结构和内置函数的优化，到使用Numpy、Pandas、多线程和多进程进行数值计算和数据处理，再到并发编程和性能分析等全面技术，帮助开发者提升代码执行效率和处理各种性能挑战。1.Python解释器性能分析Python作为一门解释型语言，其性能受到解释器行为
Python day15
@浙大疏锦行Pythonday15.内容：复习日本周主要的内容是一些常见的机器学习流程以及其中的部分内容标签编码以及连续特征的处理：归一化和正态化等。图像的绘制：热力图、Shap图等的绘制超参数优化算法：网格搜索、贝叶斯以及启发式算法模拟退火、遗传算法等不平衡数据集的处理：过采样以及欠采样。
Python Day16 赵英英俊 Python训练 python
@浙大疏锦行Pythonday16内容：numpy数组的创建以及相关操作numpy的索引理解SHAP值代码：importnumpyasnpa=np.array([[1,2],[3,4],[5,6]])b=np.array([[7,8],[9,10],[11,12]])效果：
阿里云服务器e/u1/c7/c7a/c8a/c8y/g7/g7a/g8a/g8ae实例适用场景汇总阿里云最新优惠和活动汇总
2024年通过阿里云活动购买云服务器时，除了轻量应用服务器之外，活动内的云服务器实例规格主要以e/u1/c7/c7a/c8a/c8y/g7/g7a/g8a/g8ae这几种为主，e指的是经济型e实例，u1是指通用算力型u1实例，c7/c7a/c8a/c8y均属于计算型实例，g7/g7a/g8a/g8ae均属于通用型实例，其中经济型e和通用算力型u1是阿里云的新品云服务器实例规格，c7/c7a/g7/
【OCR炼丹】解析HIT-OR3C数据集online部分Python版完整代码
最近开始炼手写体汉字识别方面的丹，网上找了下数据集，主要有：中科院自动化研究所开源的CASIA数据集（下载链接地址）哈工大开源的HIT-OR3C数据集（下载链接地址）这俩数据集的存储形式与之前接触过的一些共有数据集的保存形式有很大的区别，对于C、C++不是很熟用Python较多的我来说踩了不少的坑（还都是CSDN、知乎、Google都搜不到的巨坑），造福下后来人吧。首先，明确一点，由于博主此次研究
Linux 命令：uname hweiyu00 Linux命令 linux 运维服务器
Linuxuname命令详细教程uname（UnixName）是Linux系统中用于获取系统基本信息的基础命令。它能快速展示操作系统、内核、主机名等关键信息，是系统诊断和环境确认的常用工具。资料已经分类整理好：https://pan.quark.cn/s/26d73f7dd8a7一、基本语法uname[选项]核心功能：默认只显示操作系统名称（如Linux）。通过选项可获取更详细的系统信息。二、常用
PHPStorm携手ThinkPHP8：开启高效开发之旅奔跑吧邓邓子项目攻略 phpstorm ThinkPHP ThinkPHP8 php开发
目录一、前期准备1.1开发环境搭建1.2配置Xdebug二、PHPStorm集成ThinkPHP82.1导入ThinkPHP8项目2.2配置PHP解释器2.3配置服务器三、ThinkPHP8项目开发基础3.1项目结构剖析3.2控制器与方法创建3.3视图渲染与数据传递四、数据库操作与模型定义4.1数据库配置4.2模型定义与使用4.3数据库迁移与种子五、高级开发技巧与优化5.1路由优化与管理5.2中间
如何解决AttributeError: ‘NoneType‘ object has no attribute问题
如何解决AttributeError:‘NoneType’objecthasnoattribute问题问题背景与概述在Python项目开发和调试过程中，经常会碰到这样一个异常信息：AttributeError:'NoneType'objecthasnoattribute'foo'这意味着你尝试访问或调用某个对象的属性／方法foo，但此时对象本身是None，从而触发了AttributeError。本
day---python变量的概念小白进阶中 python
变量的概念python是面向对象的，解释型和弱类型。变量：里面盛放的值随时可以发生变化，声明变量实际上是给内存要空间。给你赋什么值就是什么类型*字母数字下划线不能用下划线开头。多个变量需要打印时候用–逗号value表示一个值，sep=“”表示之间用空格分隔，可以自己改成别的。end=“\n”就是转义字符，默认是\n在字符串里面有\n就可以换行。默认的追加。name='小白'age=18gender
Python自动化神器：Faker库生成逼真测试数据的10种高级技巧
Python自动化神器：Faker库生成逼真测试数据的10种高级技巧fromfakerimportFakerimportpandasaspdimportjsonfromdatetimeimportdatetime#创建一个Faker实例fake=Faker('zh_CN')#使用中文本地化#生成基本个人信息defgenerate_user():return{"name":fake.name(),"
ASM系列五利用TreeApi 解析生成Class lijingyao8206 ASM 字节码动态生成 ClassNode TreeAPI
前面CoreApi的介绍部分基本涵盖了ASMCore包下面的主要API及功能，其中还有一部分关于MetaData的解析和生成就不再赘述。这篇开始介绍ASM另一部分主要的Api。TreeApi。这一部分源码是关联的asm-tree-5.0.4的版本。在介绍前，先要知道一点， Tree工程的接口基本可以完
链表树——复合数据结构应用实例 bardo 数据结构树型结构表结构设计链表菜单排序
我们清楚：数据库设计中，表结构设计的好坏，直接影响程序的复杂度。所以，本文就无限级分类（目录）树与链表的复合在表设计中的应用进行探讨。当然，什么是树，什么是链表，这里不作介绍。有兴趣可以去看相关的教材。需求简介：经常遇到这样的需求，我们希望能将保存在数据库中的树结构能够按确定的顺序读出来。比如，多级菜单、组织结构、商品分类。更具体的，我们希望某个二级菜单在这一级别中就是第一个。虽然它是最后
为啥要用位运算代替取模呢 chenchao051 位运算哈希汇编
在hash中查找key的时候，经常会发现用&取代%，先看两段代码吧， JDK6中的HashMap中的indexFor方法： /** * Returns index for hash code h. */ static int indexFor(int h, int length) {
最近的情况麦田的设计者生活感悟计划软考想
今天是2015年4月27号整理一下最近的思绪以及要完成的任务 1、最近在驾校科目二练车，每周四天，练三周。其实做什么都要用心，追求合理的途径解决。为
PHP去掉字符串中最后一个字符的方法 IT独行者 PHP 字符串
今天在PHP项目开发中遇到一个需求，去掉字符串中的最后一个字符原字符串1,2,3,4,5,6, 去掉最后一个字符","，最终结果为1,2,3,4,5,6 代码如下： $str = "1,2,3,4,5,6,"; $newstr = substr($str,0,strlen($str)-1); echo $newstr;
hadoop在linux上单机安装过程 _wy_ linux hadoop
1、安装JDK jdk版本最好是1.6以上，可以使用执行命令java -version查看当前JAVA版本号，如果报命令不存在或版本比较低，则需要安装一个高版本的JDK，并在/etc/profile的文件末尾，根据本机JDK实际的安装位置加上以下几行： export JAVA_HOME=/usr/java/jdk1.7.0_25
JAVA进阶----分布式事务的一种简单处理方法无量多系统交互分布式事务
每个方法都是原子操作：提供第三方服务的系统，要同时提供执行方法和对应的回滚方法 A系统调用B,C,D系统完成分布式事务 =========执行开始======== A.aa(); try { B.bb(); } catch(Exception e) { A.rollbackAa(); } try { C.cc(); } catch(Excep
安墨移动广告：移动DSP厚积薄发引领未来广告业发展命脉矮蛋蛋 hadoop 互联网
　　“谁掌握了强大的DSP技术，谁将引领未来的广告行业发展命脉。”2014年，移动广告行业的热点非移动DSP莫属。各个圈子都在纷纷谈论，认为移动DSP是行业突破点，一时间许多移动广告联盟风起云涌，竞相推出专属移动DSP产品。　　到底什么是移动DSP呢? 　　DSP(Demand-SidePlatform)，就是需求方平台，为解决广告主投放的各种需求，真正实现人群定位的精准广
myelipse设置 alafqq IP
在一个项目的完整的生命周期中，其维护费用，往往是其开发费用的数倍。因此项目的可维护性、可复用性是衡量一个项目好坏的关键。而注释则是可维护性中必不可少的一环。注释模板导入步骤安装方法：打开eclipse/myeclipse 选择 window-->Preferences-->JAVA-->Code-->Code
java数组百合不是茶 java数组
java数组的声明创建初始化； java支持C语言数组中的每个数都有唯一的一个下标一维数组的定义声明： int[] a = new int[3];声明数组中有三个数int[3] int[] a 中有三个数，下标从0开始，可以同过for来遍历数组中的数
javascript读取表单数据 bijian1013 JavaScript
利用javascript读取表单数据，可以利用以下三种方法获取： 1、通过表单ID属性：var a = document.getElementByIdx_x_x("id"); 2、通过表单名称属性：var b = document.getElementsByName("name"); 3、直接通过表单名字获取：var c = form.content.
探索JUnit4扩展：使用Theory bijian1013 java JUnit Theory
理论机制（Theory）一.为什么要引用理论机制（Theory）当今软件开发中，测试驱动开发（TDD — Test-driven development）越发流行。为什么 TDD 会如此流行呢？因为它确实拥有很多优点，它允许开发人员通过简单的例子来指定和表明他们代码的行为意图。 TDD 的优点： &nb
[Spring Data Mongo一]Spring Mongo Template操作MongoDB bit1129 template
什么是Spring Data Mongo Spring Data MongoDB项目对访问MongoDB的Java客户端API进行了封装，这种封装类似于Spring封装Hibernate和JDBC而提供的HibernateTemplate和JDBCTemplate，主要能力包括 1. 封装客户端跟MongoDB的链接管理 2. 文档-对象映射，通过注解:@Document(collectio
【Kafka八】Zookeeper上关于Kafka的配置信息 bit1129 zookeeper
问题： 1. Kafka的哪些信息记录在Zookeeper中 2. Consumer Group消费的每个Partition的Offset信息存放在什么位置 3. Topic的每个Partition存放在哪个Broker上的信息存放在哪里 4. Producer跟Zookeeper究竟有没有关系？没有关系！！！ //consumers、config、brokers、cont
java OOM内存异常的四种类型及异常与解决方案 ronin47 java OOM 内存异常
　OOM异常的四种类型：　　　　　一：　StackOverflowError ：通常因为递归函数引起（死递归，递归太深）。-Xss 128k 一般够用。　二：　out Of memory: PermGen Space：通常是动态类大多，比如web 服务器自动更新部署时引起。-Xmx
java-实现链表反转-递归和非递归实现 bylijinnan java
20120422更新：对链表中部分节点进行反转操作，这些节点相隔k个： 0->1->2->3->4->5->6->7->8->9 k=2 8->1->6->3->4->5->2->7->0->9 注意1 3 5 7 9 位置是不变的。解法：将链表拆成两部分： a.0-&
Netty源码学习-DelimiterBasedFrameDecoder bylijinnan java netty
看DelimiterBasedFrameDecoder的API，有举例：接收到的ChannelBuffer如下： +--------------+ | ABC\nDEF\r\n | +--------------+ 经过DelimiterBasedFrameDecoder(Delimiters.lineDelimiter())之后，得到： +-----+----
linux的一些命令 -查看cc攻击-网口ip统计等 hotsunshine linux
Linux判断CC攻击命令详解 2011年12月23日 ⁄ 安全 ⁄ 暂无评论查看所有80端口的连接数 netstat -nat|grep -i '80'|wc -l 对连接的IP按连接数量进行排序 netstat -ntu | awk '{print $5}' | cut -d: -f1 | sort | uniq -c | sort -n 查看TCP连接状态 n
Spring获取SessionFactory ctrain sessionFactory
String sql = "select sysdate from dual"; WebApplicationContext wac = ContextLoader.getCurrentWebApplicationContext(); String[] names = wac.getBeanDefinitionNames(); for(int i=0; i&
Hive几种导出数据方式 daizj hive 数据导出
Hive几种导出数据方式 1.拷贝文件如果数据文件恰好是用户需要的格式，那么只需要拷贝文件或文件夹就可以。 hadoop fs –cp source_path target_path 2.导出到本地文件系统 --不能使用insert into local directory来导出数据，会报错 --只能使用
编程之美 dcj3sjt126com 编程 PHP 重构
我个人的 PHP 编程经验中，递归调用常常与静态变量使用。静态变量的含义可以参考 PHP 手册。希望下面的代码，会更有利于对递归以及静态变量的理解 header("Content-type: text/plain"); function static_function () { static $i = 0; if ($i++ < 1
Android保存用户名和密码 dcj3sjt126com android
转自：http://www.2cto.com/kf/201401/272336.html 我们不管在开发一个项目或者使用别人的项目，都有用户登录功能，为了让用户的体验效果更好，我们通常会做一个功能，叫做保存用户，这样做的目地就是为了让用户下一次再使用该程序不会重新输入用户名和密码，这里我使用3种方式来存储用户名和密码 1、通过普通的txt文本存储 2、通过properties属性文件进行存
Oracle 复习笔记之同义词 eksliang Oracle 同义词 Oracle synonym
转载请出自出处：http://eksliang.iteye.com/blog/2098861 1.什么是同义词同义词是现有模式对象的一个别名。概念性的东西，什么是模式呢？创建一个用户，就相应的创建了一个模式。模式是指数据库对象，是对用户所创建的数据对象的总称。模式对象包括表、视图、索引、同义词、序列、过
Ajax案例 gongmeitao Ajax jsp
数据库采用Sql Server2005 项目名称为:Ajax_Demo 1.com.demo.conn包 package com.demo.conn; import java.sql.Connection;import java.sql.DriverManager;import java.sql.SQLException; //获取数据库连接的类public class DBConnec
ASP.NET中Request.RawUrl、Request.Url的区别 hvt .net Web C#asp.net hovertree
如果访问的地址是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree%3C&n=myslider#zonemenu那么Request.Url.ToString() 的值是：http://h.keleyi.com/guestbook/addmessage.aspx?key=hovertree<&
SVG 教程（七）SVG 实例，SVG 参考手册天梯梦 svg
SVG 实例在线实例下面的例子是把SVG代码直接嵌入到HTML代码中。谷歌Chrome，火狐，Internet Explorer9，和Safari都支持。注意：下面的例子将不会在Opera运行，即使Opera支持SVG - 它也不支持SVG在HTML代码中直接使用。 SVG 实例 SVG基本形状一个圆矩形不透明矩形一个矩形不透明2 一个带圆角矩
事务管理 luyulong java spring 编程事务
事物管理 spring事物的好处为不同的事物API提供了一致的编程模型支持声明式事务管理提供比大多数事务API更简单更易于使用的编程式事务管理API 整合spring的各种数据访问抽象 TransactionDefinition 定义了事务策略 int getIsolationLevel()得到当前事务的隔离级别 READ_COMMITTED
基础数据结构和算法十一：Red-black binary search tree sunwinner Algorithm Red-black
The insertion algorithm for 2-3 trees just described is not difficult to understand; now, we will see that it is also not difficult to implement. We will consider a simple representation known
centos同步时间 stunizhengjia linux 集群同步时间
做了集群，时间的同步就显得非常必要了。以下是查到的如何做时间同步。在CentOS 5不再区分客户端和服务器，只要配置了NTP，它就会提供NTP服务。 1)确认已经ntp程序包： # yum install ntp 2)配置时间源（默认就行，不需要修改） # vi /etc/ntp.conf server pool.ntp.o
ITeye 9月技术图书有奖试读获奖名单公布 ITeye管理员 ITeye
ITeye携手博文视点举办的9月技术图书有奖试读活动已圆满结束，非常感谢广大用户对本次活动的关注与参与。 9月试读活动回顾：http://webmaster.iteye.com/blog/2118112本次技术图书试读活动的优秀奖获奖名单及相应作品如下（优秀文章有很多，但名额有限，没获奖并不代表不优秀）：《NFC：Arduino、Andro