码界领航

(6) 深入探索Python-Pandas库的核心数据结构：DataFrame全面解析

前言
1. DataFrame 简介
2. DataFrame的特点
3. DataFrame的创建
- 3.1 使用字典创建DataFrame
- 3.2 使用列表的列表（或元组）创建DataFrame
- 3.3 使用NumPy数组创建DataFrame
- 3.4 使用Series构成的字典创建DataFrame
- 3.5 使用字典构成的字典创建DataFrame
4. 从 CSV 文件读取
5. DataFrame的属性和方法
- 5.1 查看 DataFrame
- 5.2 访问数据
- 5.3 修改数据
- 5.4 DataFrame 的属性
- 5.5 DataFrame 的方法

前言

大家好！我是架构筑梦的Cherry，本期跟大家分享的知识是 pandas 数据结构——DataFrame。

作者的【 Python智能工坊】专栏及【少儿编程Python：趣味编程，探索未来】正在火热更新中，如果本文对您有帮助，欢迎大家点赞 + 评论 + 收藏！

1. DataFrame 简介

DataFrame 是 pandas 库中最重要的数据结构之一，它用于存储和操作二维标签化的数据结构（即表格型数据）。它的强大功能、灵活性以及易用性，使其成为数据分析领域的重要工具。
在 DataFrame 中，我们可以拥有行（index）和列（columns），每个单元格可以包含任何数据类型（如整数、浮点数、字符串、Python 对象等）。

2. DataFrame的特点

二维标签化数据结构： DataFrame是一个二维表格型数据结构，具有行和列的标签，允许用户通过索引或列名方便地访问和操作数据。
灵活的数据类型： DataFrame中的每一列可以是不同的数据类型，如整数、浮点数、字符串、布尔值等。这使得DataFrame能够存储和处理复杂的数据集。
丰富的索引功能： DataFrame支持多级索引，可以通过行标签（index）和列标签（columns）进行快速的数据访问。此外，DataFrame还支持基于条件的索引，允许用户根据特定条件筛选和查询数据。
强大的数据处理能力： DataFrame提供了丰富的数据处理功能，包括数据排序、筛选、分组、汇总、连接等。这些功能使得用户能够轻松地对数据进行清洗、转换和分析，以满足不同的数据分析需求。
与其他工具的集成： DataFrame可以与许多其他工具和库（如NumPy、SciPy、Matplotlib等）进行集成，为用户提供更加全面和强大的数据处理和可视化功能。
易于使用和理解： DataFrame的语法和API设计得非常直观和易于理解，使得用户能够快速上手并熟练掌握其使用方法。同时，pandas库还提供了丰富的文档和示例代码，帮助用户更好地理解和应用DataFrame。
高性能和可扩展性： DataFrame在数据处理方面具有很高的性能，能够快速地处理大规模数据集。此外，pandas库还提供了可扩展的接口和工具，允许用户根据自己的需求进行定制和优化。
广泛的应用场景： DataFrame广泛应用于数据分析、数据科学、机器学习等领域。无论是在商业智能、金融分析还是科学研究方面，DataFrame都发挥着重要的作用。

3. DataFrame的创建

在pandas库中，DataFrame的创建可以通过多种方式实现，以下是几种常见且清晰的创建方法：

使用字典创建DataFrame
使用列表的列表（或元组）创建DataFrame
使用NumPy数组创建DataFrame
使用Series构成的字典创建DataFrame
使用字典构成的字典创建DataFrame

pd.DataFrame()是创建DataFrame的常用方法，格式如下：

pd.DataFrame(data=None, index=None, columns=None, dtype=None, copy=False)

参数说明：

data：用于创建 DataFrame 的数据，可以是二维数组、列表的列表、字典等。
index：指定 DataFrame 的行标签，默认为整数序列。
columns：指定 DataFrame 的列标签，如果数据中包含列名则无需指定。
dtype：指定 DataFrame 中列的数据类型。
copy：是否复制输入数据，默认为 False。

以下是一些关于 DataFrame 的实例：

3.1 使用字典创建DataFrame

这是最直观和常用的创建方式之一。当已经有一组数据并且明确了每列的数据和列名时，可以使用字典来创建DataFrame。

import pandas as pd

# 使用字典列表创建
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': ['p', 'q', 'r']
}
df = pd.DataFrame(data)
print(df)

输出：

3.2 使用列表的列表（或元组）创建DataFrame

当数据已经以记录方式（即每条记录是一个列表或元组）组织好，并且只需要添加列名时，可以使用此方法。

import pandas as pd
 
# 使用列表的列表创建DataFrame
data = [['Alice', 25, 'New York'], ['Bob', 30, 'Paris'], ['Charlie', 35, 'London']]
 
# 创建DataFrame，并指定列名
df = pd.DataFrame(data, columns=['Name', 'Age', 'City'])
print(df)

输出：

      Name  Age      City
0    Alice   25  New York
1      Bob   30     Paris
2  Charlie   35    London

3.3 使用NumPy数组创建DataFrame

如果已经有NumPy数组，并且想将其转换为DataFrame，可以这样做。

import pandas as pd
import numpy as np
 
# 创建NumPy数组
nums = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
 
# 创建DataFrame，并指定列名和索引
df = pd.DataFrame(nums, columns=['A', 'B', 'C'], index=['row1', 'row2', 'row3'])
 
print(df)

输出：

      A  B  C
row1  1  2  3
row2  4  5  6
row3  7  8  9

3.4 使用Series构成的字典创建DataFrame

当数据是pandas的Series对象时，也可以将其组合成字典来创建DataFrame。

import pandas as pd
import numpy as np
 
# 创建Series对象
s1 = pd.Series([1, 2, 3], name='A')
s2 = pd.Series([4, 5, 6], name='B')
 
# 创建DataFrame
df = pd.DataFrame({'A': s1, 'B': s2})
print(df)

输出：

3.5 使用字典构成的字典创建DataFrame

此方法适用于数据是嵌套的字典结构，外层的字典键作为列名，内层的字典键作为行索引。

import pandas as pd
 
# 嵌套字典数据
data = {
    'a': {'一': 1, '二': 2},
    'b': {'一': 10, '二': 20},
    'c': {'一': 100, '二': 200}
}
 
# 创建DataFrame
df = pd.DataFrame(data)
print(df)

输出：

      a   b    c
一  1  10  100
二  2  20  200

这些方法是创建DataFrame的常见方式，可以根据具体的数据结构和需求选择最适合的方法。

4. 从 CSV 文件读取

在pandas库中，从CSV（Comma Separated Values）文件读取数据以创建DataFrame是非常常见的操作。这可以通过pd.read_csv()函数来实现。以下是一些使用pd.read_csv()函数的基本示例和参数说明：

import pandas as pd
 
# 读取CSV文件
df = pd.read_csv('file.csv')
 
# 显示DataFrame内容
print(df)

pd.read_csv()函数有很多参数可以定制读取行为，以下是一些常用的参数：

filepath_or_buffer：文件路径或类似文件的对象。这是必须的参数。
sep 或 delimiter：字段分隔符，默认为,。如果你的CSV文件使用其他分隔符（如制表符\t），你需要更改这个参数。
header：用作列名的行号。默认为0（即第一行）。如果CSV文件没有标题行，可以设置为None，并使用names参数手动指定列名。
names：如果数据不包含列标题，则可以使用此参数指定列名列表。
index_col：用作行索引的列编号或列名。如果未指定，则使用默认的整数索引。
usecols：返回列的子集。可以是列名的列表，也可以是列编号的列表。
dtype：列的数据类型。可以是单个类型，也可以是为每列指定的字典。
nrows：要读取的行数。这对于大文件特别有用，因为可以只读取前几行进行快速测试。
skiprows：要跳过的行数（从文件开始处计算）。
encoding：用于文件解码的字符编码。例如，‘utf-8’。
parse_dates：尝试将数据解析为日期。可以是布尔值，表示是否尝试解析所有列，也可以是列名的列表或解析指令的列表。
keep_default_na：如果指定了na_values参数，并且keep_default_na为False，则忽略默认的NaN值（如空字符串）。
na_values：识别为NaN或None的附加字符串列表。
thousands：用于解析数字的千位分隔符，如’,‘或’.'。
skipinitialspace：跳过字段中前导的空白字符。
comment：标记要忽略的行。任何包含此行标记的行都将被忽略。

5. DataFrame的属性和方法

5.1 查看 DataFrame

* 使用 `print(df)` 或直接在 Jupyter Notebook 中查看
* 使用 `df.head(n)` 查看前 n 行（默认为 5 行）
* 使用 `df.tail(n)` 查看后 n 行

示例 1: 使用 print(df) 或直接在 Jupyter Notebook 中查看
在Jupyter Notebook中，通常不需要显式调用print(df)来显示DataFrame。您只需将变量df（在这里它引用了您的DataFrame）作为一个独立的表达式或作为最后一行写入一个代码单元格，然后运行该单元格。Jupyter Notebook将自动显示df的内容。

import pandas as pd
 
# 假设我们有一个名为'example.csv'的CSV文件
df = pd.read_csv('example.csv')
 
# 在Jupyter Notebook中，只需运行以下行（无需print）
df

注意：如果您在标准的Python脚本或交互式环境中工作，则需要使用print(df)来显示DataFrame的内容。

示例 2: 使用 df.head(n) 查看前 n 行（默认为 5 行）
df.head(n)函数允许您查看DataFrame的前n行。如果未指定n，则默认显示前5行。

import pandas as pd
 
# 假设我们有一个名为'example.csv'的CSV文件
df = pd.read_csv('example.csv')

# 显示前5行（默认）
print(df.head())
 
# 显示前10行
print(df.head(10))

示例 3: 使用 df.tail(n) 查看后 n 行
类似地，df.tail(n)函数允许您查看DataFrame的最后n行。如果未指定n，则默认显示最后5行。

import pandas as pd
 
# 假设我们有一个名为'example.csv'的CSV文件
df = pd.read_csv('example.csv')

# 显示最后5行（默认）
print(df.tail())
 
# 显示最后10行
print(df.tail(10))

5.2 访问数据

* 通过列名访问整列数据：`df['A']`
* 通过位置访问列：`df.iloc[:, 0]` (等价于 `df['A']` 但基于位置)
* 通过标签访问列：`df.loc[:, 'A']` (也等价于 `df['A']` 但基于标签)
* 访问单个元素：`df.at[row_label, 'A']` 或 `df.iat[row_position, 0]`
* 访问多行多列：使用切片或布尔索引

示例1：通过列名访问整列数据

# 假设我们有一个DataFrame df，它有一个名为'A'的列
col_a = df['A']

示例2：通过位置访问列

# 使用iloc基于整数位置索引访问第一列（位置为0的列）
# 注意这不一定等同于df['A']，除非'A'确实是第一列
col_by_position = df.iloc[:, 0]

示例3：通过标签访问列

# 使用loc基于标签索引访问名为'A'的列
# 这与df['A']等效
col_by_label = df.loc[:, 'A']

示例4：访问单个元素
有两种主要方式访问单个元素：

使用.at[]基于标签：

# 假设我们想要访问标签为'row_label'的行和名为'A'的列中的元素
element_at = df.at['row_label', 'A']

使用.iat[]基于整数位置：

# 假设我们想要访问第一行（位置为0）和第一列（位置为0）中的元素
# 注意这通常不会直接对应于'A'列，除非'A'是第一列，且'row_label'是第一行的标签
element_iat = df.iat[0, 0]
# 但如果你知道'A'是第n列，可以这样访问：
n = df.columns.get_loc('A')  # 获取'A'列的整数位置
row_position = 0  # 假设要访问第一行
element_specific_iat = df.iat[row_position, n]

示例5：访问多行多列
– 使用切片

# 访问前两行和前两列（基于位置）
subset_by_slice = df.iloc[:2, :2]

# 访问名为'A'和'B'的列（基于标签）
subset_by_slice_label = df.loc[:, ['A', 'B']]

– 使用布尔索引

# 假设我们有一个条件来选择某些行（例如，'A'列的值大于10）
mask = df['A'] > 10
# 选择满足条件的行和所有列
subset_by_condition = df[mask]
 
# 或者，选择满足条件的行和特定的列（例如，'B'和'C'列）
subset_by_condition_and_columns = df.loc[mask, ['B', 'C']]

5.3 修改数据

* 直接修改列的值：`df['A'] = [10, 20, 30]`
* 添加新列：`df['D'] = [100, 200, 300]`
* 删除列：`del df['A']` 或 `df = df.drop(columns=['A'])`
* 删除行：`df = df.drop(index=[0, 1])` （注意这会改变原始的 index）

示例1：直接修改列的值

import pandas as pd
 
# 创建一个简单的 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}
df = pd.DataFrame(data)

df['A'] = [10, 20, 30]
print("\n修改列 'A' 后的 DataFrame:")
print(df)

输出：

    A  B  C
0  10  4  7
1  20  5  8
2  30  6  9

示例2：添加新列

df['D'] = [100, 200, 300]
print("\n添加新列 'D' 后的 DataFrame:")
print(df)

输出：

    A  B  C    D
0  10  4  7  100
1  20  5  8  200
2  30  6  9  300

示例3：删除列

del df['A']
print("\n使用 del 删除列 'A' 后的 DataFrame:")
print(df)

输出：

   B  C    D
0  4  7  100
1  5  8  200
2  6  9  300

示例4：使用 drop 方法

df = df.drop(columns=['B'])
print("\n使用 drop 方法删除列 'B' 后的 DataFrame:")
print(df)

输出：

示例5：删除行

df = df.drop(index=[0, 1])
print("\n删除索引为 0 和 1 的行后的 DataFrame:")
print(df)

输出：

   C    D
2  9  300

注意：在删除行或列后，原始的 index 可能会被改变（取决于你是否重置了 index）。如果你希望保留原始的 index 值（即使行被删除），你可能需要使用 reset_index 方法并设置 drop=True 来避免旧的 index 成为 DataFrame 的一部分。

5.4 DataFrame 的属性

* `df.shape`：返回 DataFrame 的形状（行数，列数）
* `df.dtypes`：返回每列的数据类型
* `df.index`：返回行标签
* `df.columns`：返回列标签
* `df.values`：返回 DataFrame 的 ndarray 表示

示例：

import pandas as pd
 
# 创建一个简单的 DataFrame
data = {
    'A': [1, 2, 3],
    'B': [4.0, 5.0, 6.0],
    'C': ['foo', 'bar', 'baz'],
    'D': pd.date_range(start='2023-01-01', periods=3)
}
df = pd.DataFrame(data)

# 获取 DataFrame 的形状（行数，列数）
print("Shape of DataFrame:", df.shape) # 输出：Shape of DataFrame: (3, 4)
 
# 获取每列的数据类型
print("Data types of columns:", df.dtypes) # 输出：Data types of columns: A             int64
												# B           float64
												# C            object
												# D    datetime64[ns]
												# dtype: object
 
# 获取行标签
print("Row labels (index):", df.index) # 输出：Row labels (index): RangeIndex(start=0, stop=3, step=1)
 
# 获取列标签
print("Column labels:", df.columns) # 输出：Column labels: Index(['A', 'B', 'C', 'D'], dtype='object')
 
# 获取 DataFrame 的 ndarray 表示
print("NumPy ndarray representation:", df.values)
# 输出：
# NumPy ndarray representation: [[1 4.0 'foo' Timestamp('2023-01-01 00:00:00')]
#  [2 5.0 'bar' Timestamp('2023-01-02 00:00:00')]
#  [3 6.0 'baz' Timestamp('2023-01-03 00:00:00')]]

5.5 DataFrame 的方法

* `df.describe()`：提供 DataFrame 的统计摘要
* `df.sort_values(by='column_name')`：按指定列的值排序
* `df.groupby('column_name')`：按指定列的值进行分组
* `df.merge(other_df, on='column_name')`：基于指定列合并两个 DataFrame
* `df.pivot(index='column1', columns='column2', values='column3')`：将数据重塑为表格格式

当然，以下是您给出的 pandas DataFrame 操作的示例：

示例1：df.describe() ：提供 DataFrame 的统计摘要

import pandas as pd

# 创建一个简单的 DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [10, 20, 30, 20, 15],
    'C': [100, 200, 50, 30, 20]
}
df = pd.DataFrame(data)

# 提供 DataFrame 的统计摘要
print(df.describe())

输出：

              A          B           C
count  5.000000   5.000000    5.000000
mean   3.000000  19.000000   80.000000
std    1.581139   7.416198   73.824115
min    1.000000  10.000000   20.000000
25%    2.000000  15.000000   30.000000
50%    3.000000  20.000000   50.000000
75%    4.000000  20.000000  100.000000
max    5.000000  30.000000  200.000000

这将输出每列的基本统计信息，如计数、均值、标准差、最小值、25%分位数、中位数、75%分位数和最大值。

示例2：df.sort_values(by=‘column_name’)：按指定列的值排序

# 按列 'B' 的值排序
sorted_df = df.sort_values(by='B')
print(sorted_df)

这将按 ‘B’ 列的值对 DataFrame 进行排序。
输出：

   A   B    C
0  1  10  100
4  5  15   20
3  4  20   30
1  2  20  200
2  3  30   50

示例3：df.groupby(‘column_name’)：按指定列的值进行分组

# 按列 'B' 的值进行分组，并计算每组的 'A' 列的均值
grouped = df.groupby('B')['A'].mean()
print(grouped)

这将根据 ‘B’ 列的值对 DataFrame 进行分组，并计算每个组中 ‘A’ 列的均值。
输出：

B
10    1.0
15    5.0
20    3.0
30    3.0
Name: A, dtype: float64

示例4：df.merge(other_df, on=‘column_name’)：基于指定列合并两个 DataFrame

# 创建另一个 DataFrame
other_data = {
    'B': [20, 15, 30, 20],
    'D': ['x', 'y', 'z', 'w']
}
other_df = pd.DataFrame(other_data)

# 基于 'B' 列合并两个 DataFrame
merged_df = df.merge(other_df, on='B')
print(merged_df)

这将基于 ‘B’ 列的值将两个 DataFrame 合并为一个新的 DataFrame。
输出：

   A   B    C  D
0  2  20  200  x
1  2  20  200  w
2  3  30   50  z
3  4  20   30  x
4  4  20   30  w
5  5  15   20  y

示例5：df.pivot(index=‘column1’, columns=‘column2’, values=‘column3’)：将数据重塑为表格格式

# 假设我们有一个如下的 DataFrame
pivot_data = {
    'year': [2020, 2020, 2021, 2021],
    'product': ['A', 'B', 'A', 'B'],
    'sales': [100, 200, 150, 300]
}
pivot_df = pd.DataFrame(pivot_data)

# 使用 pivot 方法将数据重塑为表格格式
pivoted_df = pivot_df.pivot(index='year', columns='product', values='sales')
print(pivoted_df)

这将根据 ‘year’ 列的值创建行，根据 ‘product’ 列的值创建列，并将 ‘sales’ 列的值填入对应的单元格中。如果数据不能唯一地确定每个单元格的值（即存在重复的行/列组合），则 pivot 方法会抛出错误。在这种情况下，可以使用 pivot_table 方法，它允许进行聚合操作。
输出：

product    A    B
year
2020     100  200
2021     150  300

你可能感兴趣的:(pandas,数据结构,python,numpy)

Python标准库之OS库星浩前进中 #金融量化 python 开发语言
目录一、介绍二、目录操作1、获取当前工作目录2、删除目录(空目录)2.1、删除当前目录2.2、递归删除目录3、删除目录(非空目录)4、创建目录5、递归创建目录6、判断是否为目录7、改变当前目录到指定目录三、文件操作1、创建文件2、删除文件3、文件重命名4、判断是否为文件5、获取文件信息四、其他操作1、判断路径对象是否存在2、获取路径下所有的文件和目录3、深层遍历指定路径下的所有子文件夹、文件4、路
用数组实现栈(java) JD_LONG 算法数据结构 java 栈
数据结构与算法学习(java)-栈题目一:用数组实现栈要求:*用数组形式实栈的基本功能,入栈,出栈及显示栈元素功能思路:1.准备一个数组int[]stack;需要变量maxSize表示栈的大小2.入栈(push):需要一个变量(top)来表示栈顶,初始化为-1;当有数据入栈时,top增加,同时将数据传递给stack[top].3.出栈(pop):需要定义变量来接住stack[top],然后top减
python+postgresql+psycopg2实现自动化数据库生成（数据库迁移） bao1771148504 数据库 postgresql 自动化 python
python+pgsql+psycopg2实现一键数据库生成1.tipsNavcat转储sql文件，存在主键自增，加入下面代码。CREATESEQUENCEIFNOTEXISTSt表名_id_seqSTART1000;手动导入表不全时，也请检查主键自增情况，加入上面代码。importpsycopg2frompsycopg2.extensionsimportISOLATION_LEVEL_AUTOC
python异常处理链与自定义异常体系设计懒大王爱吃狼 python python 开发语言 linux 数据库 python学习 Python基础
在Python中，异常处理链和自定义异常体系是两个重要的概念，它们有助于更好地管理程序中的错误和异常情况。异常处理链异常处理链指的是在捕获一个异常后，能够将其信息保留并传递给另一个异常或日志系统。这在多层调用或复杂系统中尤其有用，因为它允许你追踪异常最初发生的位置，同时也可以在每一层添加额外的上下文信息。Python本身并不直接支持异常链的某些高级特性（如Java中的initCause方法），但你
Python正则懒大王爱吃狼 python python 开发语言 Python基础学习 python学习
正则表达式（RegularExpressions，简称regex）是一种强大的文本处理工具，可以用于搜索、替换和解析字符串。Python的re模块提供了对正则表达式的支持。以下是一些基本用法和示例：导入re模块首先，你需要导入Python的re模块：importre基本匹配匹配单个字符.匹配除换行符以外的任意单个字符。[]匹配括号内的任意一个字符。例如[abc]匹配a、b或c。[^...]匹配不在
Python网络编程懒大王爱吃狼 python python 网络开发语言 pycharm Python基础 pycharm安装
Python网络编程涉及使用Python语言来创建网络应用程序，这些应用程序可以在网络上与其他计算机进行通信。Python提供了多个库和框架来简化网络编程的过程，其中一些最常用的包括socket库、http.server模块、asyncio库以及第三方库如requests、Twisted和aiohttp等。以下是一些Python网络编程的基本概念和使用示例：1.套接字编程（SocketProgra
Python+DeepSeek，奔跑吧大模型 Bj陈默 python 开发语言
在当今数字化浪潮中，人工智能与编程语言的融合正以前所未有的速度重塑着技术生态。Python作为最受欢迎的编程语言之一，以其简洁易读的语法、丰富的库和广泛的应用场景，成为了无数开发者的首选。而DeepSeek，作为人工智能领域的一颗新星，凭借其强大的大模型能力，为开发者们打开了一扇通往全新世界的大门。当Python遇上DeepSeek，一场技术的盛宴就此拉开帷幕。一、为什么选择Python与Deep
线性代数导引：张量与张量空间 AI大模型应用之禅 DeepSeek R1 &AI大模型与大数据计算科学神经计算深度学习神经网络大数据人工智能大型语言模型 AI AGI LLM Java Python 架构设计 Agent RPA
线性代数，张量，张量空间，深度学习，机器学习，人工智能1.背景介绍在现代人工智能领域，深度学习和机器学习算法的蓬勃发展，使得对数据的高效处理和表示能力提出了更高的要求。线性代数作为数学基础，为理解和构建这些算法提供了坚实的基础。而张量，作为一种高维数组的表示形式，成为了深度学习和机器学习的核心数据结构。本篇文章将从线性代数的角度出发，深入探讨张量与张量空间的概念，并阐述其在深度学习和机器学习中的重
第五章序列 MPCTHU python python
在数学领域里，序列也称为数列，是一列有序的数。在程序设计中，序列是一类数据结构，用来存储一组有序排列的元素，并提供各种读写操作接口。5.1认识序列在python中，序列主要包括列表list，元组tuple，对象range、字符串str、字节串bytes、字节数组bytearray。大多数序列类型，包括可变类型和不可变类型支持下表的通用操作5.2操作序列5.2.1索引序列是以非负整数作为索引的有限有
【Python】Python与C的区别（超详细总结） Reese_Cool Python python c语言 java
文章目录语句结束符代码块表示变量声明函数定义注释格式Python的标识符数据输入input()函数数据输出print()函数语句结束符C语言C语言中每条语句必须以分号;结束。例如，inta=10;、printf("Hello,World!");。分号是语句的一部分，用于告诉编译器一条语句在哪里结束。如果忘记添加分号，编译器会报错，提示语法错误。Python语言Python语句一般不需要特定的结束符
Selenium 对页面元素的操作动作及其语法静静在思考 #Selenium selenium 测试工具
Selenium提供了丰富的操作动作，用于模拟用户在浏览器中的各种交互行为。以下为你详细介绍常见操作动作及其语法，并结合百度网站为例给出Python代码示例。1.打开网页语法：使用driver.get(url)方法，其中driver是浏览器驱动实例，url是要打开的网页地址。示例代码：fromseleniumimportwebdriverdriver=webdriver.Chrome()drive
Python教学-最常用的标准库之一——OS库懒大王爱吃狼 python python 服务器开发语言 Python基础 python学习 python爬虫
os库是Python标准库中的一个模块，它提供了一种方便的方式来使用操作系统相关的功能。os模块提供了很多函数，可以用来处理文件和目录、访问环境变量、执行系统命令等。以下是一些常用的os模块的功能和示例：1.文件和目录操作1.1当前工作目录os.getcwd()：获取当前工作目录。os.chdir(path)：改变当前工作目录。importoscurrent_dir=os.getcwd()prin
LeetCode--------接雨水python newica LeetCode
题目不重述了。小菜一枚，思路还是比较欠缺，按照leetcode题解的精选，用python写了一下。加深理解吧。按行接雨水：思路：首先寻找数组的最大值，即最多一共有几行。然后分别求每一行的雨水量。从第一行开始，第一种情况是遇到比第一行低的块，可以存到一方水；第二种情况是遇到和第一行一样高或者比第一行要高的块，重新开始计算雨水量。直到最高行，雨水量计算完毕。思路比较清晰，可以看力扣官网题解精选有图。p
python tkinter 自制文本编辑器 ocean35 tkinter python 文本编辑器 tkinter python
成品如图：代码fromtkinterimport*fromtkinterimportfiledialogfromtkinterimportmessageboximporttimedefnodefined():pass#打开文件函数defopenfile():filename=filedialog.askopenfilename()f=open(filename,'r')f2=f.read()f.c
【Perl脚本】第三部分：Perl数据结构今天你芯动了吗 perl 数据结构 scala
系列文章目录文章目录系列文章目录标量数组散列Perl有且只有3种变量类型：标量（saclar）、数组（array）和散列（hash）标量使用my来声明标量，变量存储的内容可以是字符串，数字，引用，文件句柄等等，而且同一个标量可以先存储数字，然后存储字符串。注意：Perl的一些内建变量由全大写字母组成，所以我们最好避免创建全大写字母的变量名变量区分大小写，$abc和$Abc是两个变量标量赋值使用等号
Java 基于 SpringBoot+Vue 的动漫平台（附源码，文档）程序员徐师兄 java spring boot vue.js 动漫平台动漫网站
博主介绍：✌程序员徐师兄、8年大厂程序员经历。全网粉丝12w+、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战*✌文末获取源码联系精彩专栏推荐订阅不然下次找不到哟2022-2024年最全的计算机软件毕业设计选题大全：1000个热门选题推荐✅Java项目精品实战案例《500套》Java微信小程序项目实战《200套》Python项目实战《200套
学习笔记分享-数据结构与算法-图-Dijkstra（算法描述、算法实现） 2301_81243975 算法学习笔记
前言图片上面的personal表示只有图片上面的一行语句是解释图片内容的、local表示这个图片所在标题下的所有语句都是解释图片内容的、global表示有多个标题下的所有语句都是解释图片内容的我是一名大二的学生，学了差不多一年java技术栈了，想记录一下自己对知识点的心得，目前还是个小白，期望大佬们可以指出我笔记中的不足之处、对知识点的认知错误、笔记结构的混乱等这些图片内容都是在观看黑马课程时的视
数据结构2.2：顺序表的实现 weixin_43979650 数据结构
实现一个顺序表函数classSequencelist():def__init__(self):self.SeqList=[]defCreatSequenceList(self):print('***********************')print('*请输入数据后按回车键确认，若想结束按“#”')print('***********************')Element=input("清
python Kivy SDL2报错: Unable to load image 岁月缱绻浮半生
pythonKivySDL2报错:Unabletoloadimage国内玩kivy的真的很少，教程也少。断断续续弄了两天，终于弄好了首先看一下我的报错[INFO][Logger]RecordloginC:\Users\AlucaRd\.kivy\logs\kivy_20-12-15_11.txt[INFO][deps]Successfullyimported"kivy_deps.gstreamer
成功解决 python+kivy的raise Exception(‘SDL2: Unable to load image‘) Unable to get a Window, abort. projectnone2019 python 开发语言后端
运行python+kivy一个小程序出错，代码如下：fromkivy.appimportAppfromkivy.uix.floatlayoutimportFloatLayoutclassSizeFloat(FloatLayout):def__init__(self,**kwargs):super().__init__(**kwargs)classSizeApp(App):defbuild(self
pytorch环境配置过程中遇到的那些坑枕绵 pytorch 人工智能 python conda
基本命令查看conda版本conda--version查看conda环境配置condaconfig--show创建虚拟环境condacreate-nenvNamepython=3.8查看虚拟环境的个数详情condaenvlist激活虚拟环境condaactivateenvName删除虚拟环境condaremove--nameenvName--all下载pytorchpip3installtorch
数据结构单链表 ZY-JIMMY 算法与数据结构精析带头结点的单链表线性表的链式存储结构
目录线性表的链式存储结构1、链接存储方法2、结点结构3、头指针head和终端结点线性表链式存储结构的建立单链表的基本操作1、初始化单链表2、得到一个结点3、头插法4、尾插法5、pos位置插入6、是否为空7、查找key的前驱8、删除data域为key的结点9、摧毁函数10、求单链表的长度11、打印单链表completecode线性表的链式存储结构单链表是一种链式存取的数据结构，用一组地址任意的存储单
GAN网络 Wzongming pycharm python
"""ModuleimplementingGANwhichwillbetrainedusingtheProgressivegrowingtechnique->https://arxiv.org/abs/1710.10196"""importdatetimeimportosimporttimeimporttimeitimportnumpyasnpimporttorchasthclassGenerat
全面了解 Node.js、npm、yarn、node-gyp、Python、Visual Studio 和 Electron 的关联性古木12345 node.js npm python electron yarn
好的，以下是一个全面且深入的详细解析，针对Electron桌面开发工具链及其相关依赖，包含每个关键模块（Node.js、npm、yarn、Python、node-gyp、VisualStudio、Electron）及其实现原理、功能、关联性和使用示例，确保您能完整理解这些工具的用途和关联性。一、基础工具链模块详细介绍1.Node.js1.1功能概述Node.js是一个运行时环境，它允许开发者在服务
数据结构：单链表（Single Linked List）及其实现 y.Ghost 数据结构数据结构单链表任务管理系统 c语言算法
什么是单链表？单链表是一种最简单的链表结构，它就像一列火车，每节车厢（节点）都通过挂钩（指针）连接到下一节车厢。单链表中的每个节点都包含两部分：数据：存储实际的数据（比如数字、字符串等）。指针：指向下一个节点的地址。单链表的特点是：数据在内存中不是连续存储的，而是通过指针连接起来的。正因为如此，单链表可以动态地增加或删除节点，而不需要像数组那样移动大量数据。单链表的原理单链表的每个节点都是一个独立
多线程并发模拟实现与分析：基于Scapy的TCP SYN洪水攻击实验研究键盘侠伍十七 tcp/ip 网络协议网络网络安全 python syn flood
简介实现基于Python实现的多线程TCPSYN洪水攻击。该实例利用Scapy库构造并发送TCPSYN数据包，通过多线程技术模拟并发的网络攻击行为。实现原理SYNFlood攻击是一种经典的分布式拒绝服务（DDoS）攻击方式，利用了TCP协议握手过程中的弱点。TCP三次握手过程在正常情况下，TCP建立连接需要经过以下三个步骤的交互：客户端发送SYN：客户端向服务器发送一个同步（SYN）段，其中包含客
python的scapy解读pcap包 AI拉呱 python高级编程工具封装 python 开发语言
好的，下面是一个使用Python和scapy库来解读pcap文件的示例代码。scapy是一个非常强大的网络数据包处理库，可以用来捕获、解读和生成网络数据包。首先，确保你已经安装了scapy：pipinstallscapy然后，创建一个Python文件（例如read_pcap.py），在其中编写以下代码：fromscapy.allimportrdpcapdefread_pcap(file_path)
数据结构--双向链表，双向循环链表 \＆会飞的鱼_ 数据结构链表
双向链表的头插，尾插，头删，尾删头文件：（head.h）#include#includetypedefchardatatype;typedefstructnode{datatypedata;structnode*next;structnode*prev;}*Doublelink;DoublelinkCreate_node();Doublelinkinsert(Doublelinkhead,data
Python：基于Scapy的深度包分析与网络攻击防御方案 Lethehong Python在手 bug溜走！码农的快乐你不懂～python scapy syn dns
嗨，我是Lethehong！立志在坚不欲说，成功在久不在速欢迎关注：点赞⬆️留言收藏欢迎使用：小智初学计算机网页AI感谢这位博主提出的问题，如果在以后的文章中，大家有其他相关的问题，也可以积极的在评论区评论出来，博主我会的，我会积极的收纳问题，并及时的做出回应！目录1.环境准备2.基础流量捕获3.深度协议解析4.异常流量检测逻辑4.1SYNFlood检测4.2DNS放大攻击检测5.高级分析技术5.
Python之json模块的序列化和反序列化如梦@_@ python基础
序列化：可以理解为压缩反序列化：可以理解为解压Python中序列化和反序列化其实就是一个正反两个过程。序列化就是将Python对象转化为json格式，因为Python对象只有Python语言能够识别，如果想把数据发给Java代码写的程序，那么就识别不了，所以就有一个中间的格式：json，Java中也是一样，就是将Java的数据类型转换成json格式。反序列化就是，Python接收数据的应该是Pyt
Hadoop(一) 朱辉辉33 hadoop linux
今天在诺基亚第一天开始培训大数据，因为之前没接触过Linux，所以这次一起学了，任务量还是蛮大的。首先下载安装了Xshell软件，然后公司给了账号密码连接上了河南郑州那边的服务器，接下来开始按照给的资料学习，全英文的，头也不讲解，说锻炼我们的学习能力，然后就开始跌跌撞撞的自学。这里写部分已经运行成功的代码吧. 在hdfs下，运行hadoop fs -mkdir /u
maven An error occurred while filtering resources blackproof maven 报错
转：http://stackoverflow.com/questions/18145774/eclipse-an-error-occurred-while-filtering-resources maven报错： maven An error occurred while filtering resources Maven -> Update Proje
jdk常用故障排查命令 daysinsun jvm
linux下常见定位命令： 1、jps 输出Java进程 -q 只输出进程ID的名称，省略主类的名称； -m 输出进程启动时传递给main函数的参数； &nb
java 位移运算与乘法运算周凡杨 java 位移运算乘法
对于 JAVA 编程中，适当的采用位移运算，会减少代码的运行时间，提高项目的运行效率。这个可以从一道面试题说起：问题：用最有效率的方法算出2 乘以8 等於几?” 答案：2 << 3 由此就引发了我的思考，为什么位移运算会比乘法运算更快呢？其实简单的想想，计算机的内存是用由 0 和 1 组成的二
java中的枚举(enmu) g21121 java
从jdk1.5开始，java增加了enum(枚举)这个类型，但是大家在平时运用中还是比较少用到枚举的，而且很多人和我一样对枚举一知半解，下面就跟大家一起学习下enmu枚举。先看一个最简单的枚举类型，一个返回类型的枚举： public enum ResultType { /** * 成功 */ SUCCESS, /** * 失败 */ FAIL,
MQ初级学习 510888780 activemq
1.下载ActiveMQ 去官方网站下载：http://activemq.apache.org/ 2.运行ActiveMQ 解压缩apache-activemq-5.9.0-bin.zip到C盘，然后双击apache-activemq-5.9.0-\bin\activemq-admin.bat运行ActiveMQ程序。启动ActiveMQ以后，登陆：http://localhos
Spring_Transactional_Propagation 布衣凌宇 spring transactional
//事务传播属性 @Transactional(propagation=Propagation.REQUIRED)//如果有事务，那么加入事务，没有的话新创建一个 @Transactional(propagation=Propagation.NOT_SUPPORTED)//这个方法不开启事务 @Transactional(propagation=Propagation.REQUIREDS_N
我的spring学习笔记12-idref与ref的区别 aijuans spring
idref用来将容器内其他bean的id传给<constructor-arg>/<property>元素，同时提供错误验证功能。例如： <bean id ="theTargetBean" class="..." /> <bean id ="theClientBean" class=&quo
Jqplot之折线图 antlove js jquery Web timeseries jqplot
timeseriesChart.html <script type="text/javascript" src="jslib/jquery.min.js"></script> <script type="text/javascript" src="jslib/excanvas.min.js&
JDBC中事务处理应用百合不是茶 java JDBC编程事务控制语句
解释事务的概念; 事务控制是sql语句中的核心之一;事务控制的作用就是保证数据的正常执行与异常之后可以恢复事务常用命令: Commit提交
[转]ConcurrentHashMap Collections.synchronizedMap和Hashtable讨论 bijian1013 java 多线程线程安全 HashMap
在Java类库中出现的第一个关联的集合类是Hashtable，它是JDK1.0的一部分。 Hashtable提供了一种易于使用的、线程安全的、关联的map功能，这当然也是方便的。然而，线程安全性是凭代价换来的――Hashtable的所有方法都是同步的。此时，无竞争的同步会导致可观的性能代价。Hashtable的后继者HashMap是作为JDK1.2中的集合框架的一部分出现的，它通过提供一个不同步的
ng-if与ng-show、ng-hide指令的区别和注意事项 bijian1013 JavaScript AngularJS
angularJS中的ng-show、ng-hide、ng-if指令都可以用来控制dom元素的显示或隐藏。ng-show和ng-hide根据所给表达式的值来显示或隐藏HTML元素。当赋值给ng-show指令的值为false时元素会被隐藏，值为true时元素会显示。ng-hide功能类似，使用方式相反。元素的显示或
【持久化框架MyBatis3七】MyBatis3定义typeHandler bit1129 TypeHandler
什么是typeHandler? typeHandler用于将某个类型的数据映射到表的某一列上，以完成MyBatis列跟某个属性的映射内置typeHandler MyBatis内置了很多typeHandler，这写typeHandler通过org.apache.ibatis.type.TypeHandlerRegistry进行注册，比如对于日期型数据的typeHandler，
上传下载文件rz,sz命令 bitcarter linux命令rz
刚开始使用rz上传和sz下载命令：因为我们是通过secureCRT终端工具进行使用的所以会有上传下载这样的需求：我遇到的问题： sz下载A文件10M左右，没有问题但是将这个文件A再传到另一天服务器上时就出现传不上去，甚至出现乱码，死掉现象，具体问题解决方法：上传命令改为;rz -ybe 下载命令改为：sz -be filename 如果还是有问题：那就是文
通过ngx-lua来统计nginx上的虚拟主机性能数据 ronin47 ngx-lua　统计解禁ip
介绍以前我们为nginx做统计,都是通过对日志的分析来完成.比较麻烦,现在基于ngx_lua插件,开发了实时统计站点状态的脚本,解放生产力.项目主页: https://github.com/skyeydemon/ngx-lua-stats 功能支持分不同虚拟主机统计, 同一个虚拟主机下可以分不同的location统计. 可以统计与query-times request-time
java-68-把数组排成最小的数。一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的。例如输入数组{32, 321}，则输出32132 bylijinnan java
import java.util.Arrays; import java.util.Comparator; public class MinNumFromIntArray { /** * Q68输入一个正整数数组，将它们连接起来排成一个数，输出能排出的所有数字中最小的一个。 * 例如输入数组{32, 321}，则输出这两个能排成的最小数字32132。请给出解决问题
Oracle基本操作 ccii Oracle SQL总结 Oracle SQL语法 Oracle基本操作 Oracle SQL
一、表操作 1. 常用数据类型 NUMBER(p,s)：可变长度的数字。p表示整数加小数的最大位数，s为最大小数位数。支持最大精度为38位 NVARCHAR2(size)：变长字符串，最大长度为4000字节（以字符数为单位） VARCHAR2(size)：变长字符串，最大长度为4000字节（以字节数为单位） CHAR(size)：定长字符串，最大长度为2000字节，最小为1字节，默认
[强人工智能]实现强人工智能的路线图 comsci 人工智能
1：创建一个用于记录拓扑网络连接的矩阵数据表 2:自动构造或者人工复制一个包含10万个连接(1000*1000)的流程图 3：将这个流程图导入到矩阵数据表中 4：在矩阵的每个有意义的节点中嵌入一段简单的
给Tomcat，Apache配置gzip压缩(HTTP压缩)功能 cwqcwqmax9 apache
背景： HTTP 压缩可以大大提高浏览网站的速度，它的原理是，在客户端请求网页后，从服务器端将网页文件压缩，再下载到客户端，由客户端的浏览器负责解压缩并浏览。相对于普通的浏览过程HTML ,CSS,Javascript , Text ，它可以节省40%左右的流量。更为重要的是，它可以对动态生成的，包括CGI、PHP , JSP , ASP , Servlet,SHTML等输出的网页也能进行压缩，
SpringMVC and Struts2 dashuaifu struts2 springMVC
SpringMVC VS Struts2 1: spring3开发效率高于struts 2: spring3 mvc可以认为已经100%零配置 3: struts2是类级别的拦截，一个类对应一个request上下文， springmvc是方法级别的拦截，一个方法对应一个request上下文，而方法同时又跟一个url对应所以说从架构本身上 spring3 mvc就容易实现r
windows常用命令行命令 dcj3sjt126com windows cmd command
在windows系统中，点击开始－运行，可以直接输入命令行，快速打开一些原本需要多次点击图标才能打开的界面，如常用的输入cmd打开dos命令行，输入taskmgr打开任务管理器。此处列出了网上搜集到的一些常用命令。winver 检查windows版本 wmimgmt.msc 打开windows管理体系结构(wmi) wupdmgr windows更新程序 wscrip
再看知名应用背后的第三方开源项目 dcj3sjt126com ios
知名应用程序的设计和技术一直都是开发者需要学习的，同样这些应用所使用的开源框架也是不可忽视的一部分。此前《 iOS第三方开源库的吐槽和备忘》中作者ibireme列举了国内多款知名应用所使用的开源框架，并对其中一些框架进行了分析，同样国外开发者 @iOSCowboy也在博客中给我们列出了国外多款知名应用使用的开源框架。另外txx's blog中详细介绍了 Facebook Paper使用的第三
Objective-c单例模式的正确写法 jsntghf 单例 ios iPhone
一般情况下，可能我们写的单例模式是这样的： #import <Foundation/Foundation.h> @interface Downloader : NSObject + (instancetype)sharedDownloader; @end #import "Downloader.h" @implementation
jquery easyui datagrid 加载成功，选中某一行 hae jquery easyui datagrid 数据加载
1.首先你需要设置datagrid的onLoadSuccess $( '#dg' ).datagrid({onLoadSuccess : function (data){ $( '#dg' ).datagrid( 'selectRow' ,3); }}); 2.onL
jQuery用户数字打分评价效果 ini JavaScript html jquery Web css
效果体验：http://hovertree.com/texiao/jquery/5.htmHTML文件代码： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>jQuery用户数字打分评分代码 - HoverTree</
mybatis的paramType kerryg DAO sql
MyBatis传多个参数： 1、采用#{0},#{1}获得参数： Dao层函数方法： public User selectUser(String name,String area); 对应的Mapper.xml <select id="selectUser" result
centos 7安装mysql5.5 MrLee23 centos
首先centos7 已经不支持mysql，因为收费了你懂得，所以内部集成了mariadb，而安装mysql的话会和mariadb的文件冲突，所以需要先卸载掉mariadb，以下为卸载mariadb，安装mysql的步骤。 #列出所有被安装的rpm package rpm -qa | grep mariadb #卸载 rpm -e mariadb-libs-5.
利用thrift来实现消息群发 qifeifei thrift
Thrift项目一般用来做内部项目接偶用的，还有能跨不同语言的功能，非常方便，一般前端系统和后台server线上都是3个节点，然后前端通过获取client来访问后台server，那么如果是多太server，就是有一个负载均衡的方法，然后最后访问其中一个节点。那么换个思路，能不能发送给所有节点的server呢，如果能就
实现一个sizeof获取Java对象大小 teasp java HotSpot 内存对象大小 sizeof
由于Java的设计者不想让程序员管理和了解内存的使用，我们想要知道一个对象在内存中的大小变得比较困难了。本文提供了可以获取对象的大小的方法，但是由于各个虚拟机在内存使用上可能存在不同，因此该方法不能在各虚拟机上都适用，而是仅在hotspot 32位虚拟机上，或者其它内存管理方式与hotspot 32位虚拟机相同的虚拟机上适用。
SVN错误及处理 xiangqian0505 SVN提交文件时服务器强行关闭
在SVN服务控制台打开资源库“SVN无法读取current” ---摘自网络写道 SVN无法读取current修复方法 Can't read file : End of file found 文件：repository/db/txn_current、repository/db/current 其中current记录当前最新版本号，txn_current记录版本库中版本