提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
Python是一种高级编程语言, 数据分析库如Numpy、Pandas、Matplotlib等,使得Python成为了数据科学领域的主流工具。
PyCharm是由JetBrains公司开发的一款专门为Python语言开发的集成开发环境(IDE),它是一个功能强大、易于使用的编辑器,支持很多先进的功能和工具以提高Python的开发效率。
PyCharm提供了代码自动完成、错误检查、重构、调试和版本控制等功能,支持Django、Flask、Pyramid等常用的Web框架,能够帮助开发人员更快、更容易地撰写高质量的Python代码。
此外,PyCharm还有很多插件和定制设置,可以更好地满足用户的各种需求。总之,PyCharm是Python开发者不可或缺的开发工具之一。
1.NumPy:处理数值计算的库,支持多维数组和矩阵计算。
2.Pandas:用于数据处理、分析和清洗的库,可以轻松地对数据进行操作、处理和统计。
3.Pandas:用于数据处理、分析和清洗的库,可以轻松地对数据进行操作、处理和统计。
4.SciPy:一个基于 NumPy 的科学计算库,包括统计学、优化、数值积分和线性代数等子库。
5.Scikit-learn: 机器学习的库,包括分类、回归、聚类、降维和模型选择等功能。
6.TensorFlow:一个用于构建和训练神经网络的库,由 Google 开发。
7.PyTorch:一个用于构建深度神经网络的库,由 Facebook 开发。
属性名称 | 属性说明 |
---|---|
ndim | 返回int。表示数组的维数 |
shape | 返回tuple。表示数组形状,对于n行m列的矩阵,形状为(n,m) |
size | 返回 int。表示数组的元素总数,等于数组形状中各元素的积 |
dtype | 返回data-type。表示数组中元素的数据类型 |
itemsize | 返回int。表示数组的每个元素的存储空间(以B为单位)。例如,一个元素类型为float64的数组的itemsize属性值为8(float64占用64bit,1B为 8bit,所以float64,占用8B一个元素类型为complex32的数组的 itemsize属性值为4 |
参数名称 | 属性说明 |
---|---|
object | 接收array _like。表示所需创建的数组对象。无默认值 |
dtype | 接收 data-type。表示数组所需的数据类型,如果未给定,那么选择保存对象所需的 |
ndmin | 接收int。用于指定生成数组应该具有的最小维数。默认为0 |
import numpy as np # 导入NumPy库
arr1 = np.array([1, 2, 3, 4]) # 创建一维数组
print(' 创建的数组为: ', arr1)
# 创建二维数组
arr2 = np.array([[1, 2, 3, 4],[4, 5, 6, 7], [7, 8, 9, 10]])
print('创建的数组为:\n', arr2)
print('数组维度为:', arr2.shape) # 查看数组结构
print('数组类型为:', arr2.dtype) # 查看数组类型
print('数组元素个数为:', arr2.size) # 查看数组元素个数
print('数组每个元素大小为:', arr2.itemsize) # 查看数组每个元素大小
1.重新设置数组的shape属性。
arr2.shape = 4,3 # 重新设置shape
print('重新设置shape 后的arr2 为:\n', arr2)
2.arange函数创建数组。
print('使用arange函数创建的数组为:\n', np.arange(0,1,0.1))
3.logspace函数创建等比数列
print('使用logspace函数创建的数组为:\n', np.logspace(0, 2, 20))
4.zeros函数创建数组
print('使用zeros函数创建的数组为:\n', np.zeros((2,3)))
5.eye函数创建数组
print('使用eye函数创建的数组为:\n', np.eye(3))
类型 | 描述 |
---|---|
bool | 用1位存储的布尔值(值为 True或False ) |
inti | 表示由所在平台决定其精度的教数(-船为int32或int64) |
int8 | 表示整数,范围为-128~127 |
int16 | 表示整数,范围为-32768~32767 |
int32 | 表示整数,范围为-23~23-1 |
int64 | 表示整数,范围为-263~2 63-1 |
uint8 | 表示无符号整数,范围为0~255 |
uint16 | 表示无符号整数,范围为0~65535 |
uint32 | 表示无符号整数,范围为0~232-1 |
uint64 | 表示无符号整数,范围为0~24-1 |
1.转换类型是我们数据分析的最基础的,为了更好的帮助理解数据类型。
print('转换结果为:', np.float64(42)) # 整型转换为浮点型
print('转换结果为:', np.int8(42.0)) # 浮点型转换为整型
print('转换结果为:', np.bool(42)) # 整型转换为布尔型
print('转换结果为:', np.bool(0)) # 整型转换为布尔型
print('转换结果为:', np.float(True)) # 布尔型转换为浮点型
print('转换结果为:', np.float(False)) # 布尔型转换为浮点型
arr = np.arange(10)
print('索引结果为:', arr[5]) # 用整数作为下标可以获取数组中的某个元素
# 用范围作为下标获取数组的一个切片,包括arr[3]不包括arr[5]
print('索引结果为:', arr[3:5])
print('索引结果为:', arr[:5]) # 省略开始下标,表示从arr[0]开始
# 下标可以使用负数,-1表示从数组后往前数的第一个元素
print('索引结果为:', arr[-1])
arr[2:4] = 100,101
print('索引结果为:', arr) # 下标还可以用来修改元素的值
# 范围中的第三个参数表示步长,2表示隔一个元素取一个元素
print('索引结果为:', arr[1:-1:2])
print('索引结果为:', arr[5:1:-2]) # 步长为负数时,开始下标必须大于结束下标
arr = np.array([[1, 2, 3, 4, 5],[4, 5, 6, 7, 8], [7, 8, 9, 10, 11]])
print('创建的二维数组为:\n', arr)
print('索引结果为:', arr[0,3:5]) # 索引第0行中第3和第4列的元素
# 索引第2和第3行中第3列、第4列和第5列的元素
print('索引结果为:\n', arr[1:,2:])
print('索引结果为:', arr[:,2]) # 索引第2列的元素
# 从两个序列的对应位置取出两个整数组成下标:arr[0,1], arr[1,2], arr[2,3]
print('索引结果为:', arr[[(0, 1, 2), (1, 2, 3)]])
print('索引结果为:', arr[1:, (0, 2, 3)]) # 索引第2、3行中第0、2、3列的元素
mask = np.array([1, 0, 1], dtype = np.bool)
# mask是一个布尔数组,它索引第1、3行中第2列的元素
print('索引结果为:', arr[mask, 2])
链接:https://pan.baidu.com/s/1RJWYJfN5SFSzIzn3eB8mYw?pwd=hwl6
提取码:hwl6
这只是部分python数据分析的基础知识,要多次手动尝试去学习才能够进阶的了解python学习内容。
今天就分享到这里,谢谢大[添加链接描述