import numpy as np
my_list = [
[1,2,3,4],
[5,6,7,8],
[9,10,11,12],
[13,14,15,16]
]
#先将my_list二维数组元素强转为float型,然后是用该数组创建二维ndarray数组
my_ndarray = np.array(my_list,float,ndmin=2)
print(my_ndarray)
#1.引用机制(指针)
my_ndarray_copy = my_ndarray
print('my_ndarray的内存地址:',id(my_ndarray))
print('my_ndarray_copy的内存地址:',id(my_ndarray_copy))
#2.拷贝机制
my_ndarray_copy = np.array(my_ndarray)
print('my_ndarray的内存地址:',id(my_ndarray))
print('my_ndarray_copy的内存地址:',id(my_ndarray_copy))
a = np.arange(10,20,2,dtype=float)
print(a)
等差数列在线性回归经常用作样本集
#创建起始值为0,终止值为100,样本数量为11的等差数列数组
b = np.linspace(0,100,11,dtype=int)
print(b)
#首先将1-5区间均匀取3个数X(1,3,5),然后创建int型等比数列,元素值为X^base(起始值为1^2,终止值为5^2)
c = np.logspace(1,5,3,base=2,dtype=int)
print(c)
'''
第一个参数:
(a)表示a个元素的一维数组
(a,b)表示a行b列的二维数组
(a,b,c)表示a块,每块b行c列的三维数组
'''
#创建2行2列的全0数组
d = np.zeros((2,2),dtype=int)
print(d)
参数同全0
'''
第一个参数:
(a)表示a个元素的一维数组
(a,b)表示a行b列的二维数组
(a,b,c)表示a块,每块b行c列的三维数组
'''
#创建2行2列的全1数组
e = np.ones((2,2),dtype=int)
print(e)
返回调整维度后的副本,而不改变原ndarray
f = np.arange(20).reshape(4,5)
print(f)
::
解释
a1 = np.arange(10)
print(a1)
#切片操作(注意是引用,a1、a2实际上指向同一片内存空间)
a2 = a1[2:7:2]
print(a2)
#理解引用机制,并理解索引=数组下标=位序-1,
a2[1]=888
print(a1)
print(a2)
::
解释
[2]
将返回一维数组[2][2]
将返回特定元素[2:7]
将返回两个索引之间的一维数组集,即返回一个二维数组,不包括停止索引[2:]
表示从该索引开始以后的所有一维数组集,即返回一个二维数组都将被提取[:7]
表示该索引之前的所有一维数组集,即返回一个二维数组都将被提取[...][1]
表示[…]先取所有行即取所有元素,[1]再取所有行的第二行一维数组[2,2]
将返回特定元素[...,1]或[:,1]
返回第二列元素,组成一个一维数组返回x[...,1:]
返回第二列之后的所有列,组成一个二维数组返回x = np.array([
[1,2],
[3,4],
[5,6]
])
#[0,0,2]是行索引,[0,1,1]是列索引,表示取[0,0]、[0,1]、[2,1]的元素,组成一维数组返回
y = x[[0,0,2],[0,1,1]]
y
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
#行索引
r = np.array([0,0,0,2])
#列索引
c = np.array([0,1,2,2])
#x[r,c]根据索引获取一维数组,reshape(2,2)将返回的4*1一维数组转为2*2的二维数组
s = x[r,c].reshape(2,2)
s
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
#行取2行3行,列取2列3列
y = x[1:3,1:3]
y
#取1,3行、1,3,4列所有元素
x = np.array([
[1,2,3,4],
[4,5,6,7],
[7,8,9,10]
])
#先取1,3行,:可以换成...
temp = x[[0,2],:]
#再根据上一步结果取1,3,4列,:可以换成...
temp[:,[0,2,3]]
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
#
x[x>6]
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
#将数组中所有奇数置为-1(x[x%2!=0]获取奇数,=-1赋值)
x[x%2!=0] = -1
x
x = np.array([
[1,2,3,4],
[4,5,6,7],
[7,8,9,10]
])
row = np.array([False,False,True])
print(x[row,...])
column = np.array([True,False,True,False])
x = np.array([
[1,2,3,4],
[4,5,6,7],
[7,8,9,10]
])
print(x[...,column])
相乘
。相加
。x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
#计算所有元素平均值
print(x.mean())
#从上至下计算每列平均值,返回一维数组
print(x.mean(axis=0))
#从左至右计算每行平均值,返回一维数组
print(x.mean(axis=1))
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.median(x)
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.std(x)
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.var(x)
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.max(x)
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.min(x)
x = np.array([
[1,2,3],
[4,5,6],
[7,8,9]
])
np.average(x)
#创建结构体
teacher = np.dtype([
#(变量名称,变量数据类型->"数据类型别名+所占字节数")
("name","U8"),
("age","i1"),
("salary","f4")
])
#创建数组,数组元素为teacher类型
b = np.array(
[
("clh",20,30000),
("ccc",18,10000)
],dtype = teacher
)
print("数组b内容为:",b)
print("数组中所有name:",b["name"])
注意:skiprows不忽略注释行和空白行,从文档第一行跳过
data = np.loadtxt("data.txt",dtype=np.int32)
data = np.loadtxt("data.csv",dtype=np.int32,delimiter=",")
#1.定义结构体
user_info = np.dtype(
[
("name","U10"),
("age","i1"),
("gender","U1"),
("height","i2")
]
)
#2.用结构体类型接数据,并且使用skiprows跳过第一行不读
data = np.loadtxt("data.txt",dtype=user_info,skiprows=1,encoding="utf-8")
#使用异常机制
def parse_age(age):
try:
return int(age)
except:
return 0
#converters调用自定义函数进行空数据处理
data = np.loadtxt("data.csv",delimiter=",",usecols=1,converters={1:parse_age})
'''
(a)表示a个元素的一维数组
(a,b)表示a行b列的二维数组
(a,b,c)表示a块,每块b行c列的三维数组
'''
#创建[0,1)内给定维度的随机数组,该组元素符合正态分布
np.random.rand(3,3)
#返回5*5个[1,5)内的随机整数
np.random.randint(1,5,size=(5,5))
#元素不够时使用原数组数据补齐
a = np.array([1,2,3,4,5,6,7,8,9])
np.resize(a,(4,4))
#元素不够时使用0补齐
a = np.array([1,2,3,4,5,6,7,8,9])
a.resize((4,4),refcheck=False)
a
#去重+排序,返回去重后的数组+元素所在原数组的索引+各元素重复次数
a = np.array([2,3,4,5,6,1,2,3])
b,indices,nums = np.unique(a,return_index=True,return_counts=True)
print(b)
print(indices)
print(nums)
#结构体
teacher = np.dtype([
#(变量名称,变量数据类型)
("name","U8"),
("age","i1"),
("salary","f4")
])
#创建数组,数组元素为teacher类型
b = np.array(
[
("clh",20,30000),
("ccc",18,10000)
],dtype = teacher
)
#按年龄排序
np.sort(b,order="age")