numpy 数组运算机制浅探

文章目录

  • 前言
  • 实验

前言

numpy 数组直接与一个标量运算就能实现按元素运算,很简洁,但是如果这个标量也是用函数求的,怎么写更高效呢?比如做归一化,数组 / 数组和,是直接/np.sum(数组)还是先得到数组和再运算呢?

实验

方式a就是/np.sum(数组),方式b是先得到数组和再运算,由于数组大小有限制,这里为了拉大差距进行了多次迭代:

import numpy as np
import time


def timer(start, name):
    duration = time.time() - start
    time_list = [0, 0, 0]
    time_list[0] = duration // 3600
    time_list[1] = (duration % 3600) // 60
    time_list[2] = round(duration % 60, 2)
    print(name + '用时:' + str(time_list[0]) + ' 时 ' + str(time_list[1]) + '分' + str(time_list[2]) + '秒')


def a(nums):
    nums = nums / np.sum(nums)


def b(nums):
    sum_ = np.sum(nums)
    nums = nums / sum_


x = np.random.randn(500000000)
iter = 100

s = time.time()
for _ in range(iter):
    a(x)
timer(s, 'a')

s = time.time()
for _ in range(iter):
    b(x)
timer(s, 'b')

输出:

a用时:0.0 时 3.0分34.98秒
b用时:0.0 时 3.0分11.88秒

可以看出先求和再运算是要快一点。

由于我没搜到numpy的实现机制,所以通过实验来观察,有朋友懂其中机制的话请不吝赐教。

你可能感兴趣的:(杂文,numpy,python,机器学习)