NumPy 高级教程——结构化数组

Python NumPy 高级教程:结构化数组

在 NumPy 中,结构化数组允许我们创建具有复杂数据类型的数组,类似于表格或数据库中的行。这对于处理异质数据集非常有用。在本篇博客中,我们将深入介绍 NumPy 中的结构化数组,并通过实例演示如何创建、访问和操作结构化数组。

1. 创建结构化数组

结构化数组可以通过指定每个字段的名称和数据类型来创建。

import numpy as np

# 定义数据类型
dtype = np.dtype([('name', 'S10'), ('age', int), ('height', float)])

# 创建结构化数组
data = np.array([('Alice', 25, 5.6), ('Bob', 30, 6.0)], dtype=dtype)
print(data)

2. 访问结构化数组的字段

可以通过字段名称访问结构化数组的各个字段。

# 访问结构化数组的字段
print(data['name'])    # 输出:['Alice' 'Bob']
print(data['age'])     # 输出:[25 30]
print(data['height'])  # 输出:[5.6 6. ]

3. 修改结构化数组的值

通过索引和字段名称,可以修改结构化数组的各个字段的值。

# 修改结构化数组的值
data['age'][0] = 26
data['height'][1] = 6.2
print(data)

4. 多维结构化数组

结构化数组可以是多维的,每个维度可以有不同的数据类型。

# 多维结构化数组
dtype_multi = np.dtype([('matrix', [('row', int), ('column', int)]), ('value', float)])
data_multi = np.array([((1, 2), 3.5), ((3, 4), 1.2)], dtype=dtype_multi)
print(data_multi)

5. 使用嵌套字段

结构化数组支持嵌套字段,可以方便地处理嵌套结构。

# 使用嵌套字段
dtype_nested = np.dtype([('info', [('name', 'S10'), ('age', int)]), ('height', float)])
data_nested = np.array([(('Alice', 25), 5.6), (('Bob', 30), 6.0)], dtype=dtype_nested)
print(data_nested)

6. 结构化数组的排序

可以使用 np.sort 函数对结构化数组进行排序。

# 结构化数组的排序
sorted_data = np.sort(data, order='age')
print(sorted_data)

7. 结构化数组的条件筛选

可以使用条件来筛选结构化数组中的数据。

# 结构化数组的条件筛选
filtered_data = data[data['age'] > 26]
print(filtered_data)

8. 结构化数组与 Pandas DataFrame 的转换

结构化数组可以方便地与 Pandas DataFrame 进行转换。

import pandas as pd

# 结构化数组转为 DataFrame
df = pd.DataFrame(data)
print(df)

9. 总结

结构化数组是 NumPy 中用于处理异质数据的重要工具,通过定义复杂的数据类型,我们可以创建具有不同字段的数组,类似于表格或数据库中的行。结构化数组提供了访问、修改、排序和条件筛选数据的灵活性,同时也方便与 Pandas DataFrame 进行交互。希望本篇博客能够帮助你更好地理解和运用 NumPy 中的结构化数组功能。

你可能感兴趣的:(python爬虫及数据可视化,Python,笔记,numpy)