1. NumPy Basics: Arrays and Vectorized Computation

来自：http://pda.readthedocs.org/en/latest/chp4.html

NumPy 是 Numerical Python 的简称，是高性能计算和数据分析的基础包。本书中几乎所有高级工具都是建立在它的基础之上，下面是它所能做的一些事情：

ndarray，快速和节省空间的多维数组，提供数组化的算术运算和高级的广播功能。

使用标准数学函数对整个数组的数据进行快速运算，而不需要编写循环。

读取/写入磁盘上的阵列数据和操作存储器映像文件的工具。

线性代数，随机数生成，和傅里叶变换的能力。

集成C，C++，Fortran代码的工具。

从生态系统的角度看，最后一点是最为重要的。因为NumPy 提供了易用的C API，它可以很容易的将数据传递到使用低级语言编写的外部库，也可以使外部库返回NumPy数组数据到Python。这一特性使得Python成为包装传统的C/C++/Fortran代码库，并给它们一个动态的、易于使用的接口的首选语言。

虽然NumPy本身并没有提供非常高级的数据分析功能，但是了解NumPy的数组和面向数组的计算将会帮助你高效的使用类似于pandas这样的工具。如果你是Python新手，并且只希望使用pandas来处理你手边的数据，随时可以略过这一章。更多的NumPy的特性例如广播，请见第12章。

对于大多数的数据分析应用来说，我关注的主要功能是：

快速的矢量化数组操作：数据切割和清除，子集和过滤，转化和任何其它类型的计算

通用的数组算法，例如：sorting，unique和set操作

有效的描述性统计和聚集/汇总数据

数据对齐、关系数据的合并操作、异构数据的拼接操作

使用数组表达式来表示条件逻辑，而不是用带有 if-elif-else 分支的循环来表示

组间数据的操作（聚合，转换，功能应用）。关于这一点详见第5章

虽然NumPy提供了这些操作的计算功能，但你或许希望使用pandas作为大多数数据分析的基础（特别是结构化或表格数据），因为它提供了一个丰富的，高级的接口使得常见的数据任务非常简洁和简单。 pandas也提供了更多的一些特定领域的功能，如时间数组操作，这是NumPy所没有的。

在本章和全书，我始终使用 import numpy as np 。当然，你喜欢在代码中使用 from numpy import * 来避免写 np ，但我要提醒你反对这种习惯。

1.1. NumPy ndarray：多维数组对象

NumPy的一个关键特性是它的N维数组对象(ndarray)，它在Python中是一个大型数据集的快速的，灵活的容器。数组使你能够在整个数据块上进行数学运算，且与对应的纯量元素间操作有相似的语法：

In [8]: data
Out[8]:
array([[ 0.9526, -0.246 , -0.8856],
       [ 0.5639, 0.2379, 0.9104]])
In [9]: data * 10                           In [10]: data + data
Out[9]:                                     Out[10]:
array([[ 9.5256, -2.4601, -8.8565],         array([[ 1.9051, -0.492 , -1.7713],
       [ 5.6385, 2.3794, 9.104 ]])                 [ 1.1277, 0.4759, 1.8208]])

ndarray是一个同种类数据的多维容器，也就是说，它的所有元素都是同类型的。每一个数组都有一个 shape（表示它每一维大小的元组）和 dtype （一个描述数组数据类型的对象）：

In [11]: data.shape
Out[11]: (2, 3)
In [12]: data.dtype
Out[12]: dtype('float64')

本章将介绍ndarray的基础知识，并足以应对本书剩下的部分。虽然对于许多的数据分析应用来说不必要对NumPy有深入的理解，但是精通面向数组编程和思想是成为一名科学的Python大师的关键一步。

每当你在正文中看见“array”, “NumPy array”, or “ndarray”，除了很少的列外之外，它们都指的是同一个东西：ndarray对象。

1.1.1. 创建ndarray

最简单的创建数组的方式是使用 array 函数。它接受任何数组对象（包括其它数组），产生一个包含所传递的数据的新NumPy数组。例如，列表就是一个很好的用于转换的候选：

In [13]: data1 = [6, 7.5, 8, 0, 1]
In [14]: arr1 = np.array(data1)
In [15]: arr1
Out[15]: array([ 6. , 7.5, 8. , 0. , 1. ])

嵌套序列，如等长列表的列表，将会转化为一个多维数组：

In [16]: data2 = [[1, 2, 3, 4], [5, 6, 7, 8]]
In [17]: arr2 = np.array(data2)
In [18]: arr2
Out[18]:
array([[1, 2, 3, 4],
[5, 6, 7, 8]])
In [19]: arr2.ndim
Out[19]: 2
In [20]: arr2.shape
Out[20]: (2, 4)

除非明确指定（在此以后会更多）， np.array 试图推断一个好的数据类型给它所创建的数组。数据类型存储在一个特定的 dtype 的对象中；例如，在上面的两个例子中，我们有：

In [21]: arr1.dtype
Out[21]: dtype('float64')
In [22]: arr2.dtype
Out[22]: dtype('int64')

除 np.array 之外，还有许多函数来创建新的数组。例如， zeros 和 ones 使用给定的长度或形状分别的创建0^‘s 和 1^‘s数组。 empty 会创建一个没有使用特定值来初始化的数组。给这些方法传递一个元组作为形状来创建高维数组：

In [23]: np.zeros(10)
Out[23]: array([ 0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])
In [24]: np.zeros((3, 6))
Out[24]:
array([[ 0., 0., 0., 0., 0., 0.],
       [ 0., 0., 0., 0., 0., 0.],
       [ 0., 0., 0., 0., 0., 0.]])
In [25]: np.empty((2, 3, 2))
Out[25]:
array([[[ 4.94065646e-324, 4.94065646e-324],
        [ 3.87491056e-297, 2.46845796e-130],
        [ 4.94065646e-324, 4.94065646e-324]],
       [[ 1.90723115e+083, 5.73293533e-053],
        [ -2.33568637e+124, -6.70608105e-012],
        [ 4.42786966e+160, 1.27100354e+025]]])

假定 np.array 会返回一个全零的数组是不安全的。在许多情况下，如前所示，它将返回未初始化的垃圾值。

arange 是Python内建 range 函数的数组版本：

In [26]: np.arange(15)
Out[26]: array([ 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14])

表格4-1 是一个用于构建数组的标准函数的清单。

数组构建函数
函数	描述
array	转换输入数据（列表，数组或其它序列类型）到一个ndarray，可以推断一个dtype或明确的设置一个dtype。默认拷贝输入数据。
asarray	转换输入为一个ndarray，当输入已经是一个ndarray时就不拷贝。
arange	同内建的range函数，但不返回列表而是一个ndarray
ones, ones_like	根据提供的shape和dtype产生一个全1的数组。ones_like使用另一歌数组为入参，产生一个shape和dtype都相同的数组。
zeros, zeros_like	同ones和ones_like，但是生成全0的数组
empty, enpty_like	通过分配新内存来构造新的数组，但不同与ones 和 zeros，不初始任何值。
eye, identity	生成一个NxN的单位方阵（对角线上为1，其它地方为0）

1.1.2. ndarray的数据类型

数据类型或dtype是一个特别的对象，保存了ndarray如何解释一块内存为特定类型数据的信息：

In [27]: arr1 = np.array([1, 2, 3], dtype=np.float64)
In [28]: arr2 = np.array([1, 2, 3], dtype=np.int32)
In [29]: arr1.dtype
Out[29]: dtype('float64')
In [30]: arr2.dtype
Out[30]: dtype('int32')

Dtypes是使NumPy如此强大和灵活的一部分。在大多数情况下，它们直接映射到底层的机器表示，这是的很容易地读取和写入二进制流到磁盘上，也能链接低级语言，如C 或Fortran编写的代码。数值表示的dtypes以相同的方式命名：一个类型名，如 folt 或 int ，后面跟着一个表示数字有多少位的数字。一个标准的双精度浮点值（它是Python的 float 对象的底层表示）占据8字节或64位。因此，这一类型在NumPy中被认为是float64 。见表格4-2 是一个NumPy支持的全部数据类型的清单。

不要为了记忆NumPy的dtypes而烦恼，尤其你是一个新用户。通常只需要关心你所处理数据的普通类型（浮点、复数、整形、布尔型、字符窜或一般的Python对象）。当你需要更多的控制数据如何存储到内存和磁盘，特别是大的数据集，知道你所控制的存储类型是很好的。

NumPy数据类型
类型	类型码	描述
类型	类型码	描述
int8, uint8	i1, u1	有符号和无符号8位（1字节）整数类型
int16, uint16	i2, u2	有符号和无符号16位整数类型
int32, uint32	i4, u4	有符号和无符号32位整数类型
int64, uint64	i8, u8	有符号和无符号64位整数类型
float16	f2	半精度浮点类型
float32	f4 or f	标准精度浮点。与C的 float 兼容
float64, float128	f8 or d	标准双精度浮点。与C的 double 和Python 的 folat 对象兼容
float128	f16 or g	扩展精度浮点
complex64, complex128, complex256	c8, c16, c32	分别使用两个32，64，128位浮点表示的复数
bool	?	布尔值，存储 True 和 False
object	O	Python对象类型
string_	S	定长字符窜类型（每字符一字节）。例如，为了生成长度为10的字符窜，使用 ‘S10’
unicode_	f16 or g	扩展精度浮点（字节书依赖平台）。同 string_ 有相同的语义规范（例如：``U10`` ）

你可以使用ndarray的 astype 方法显示的把一个数组的dtype转换或投射到另外的类型：

In [31]: arr = np.array([1, 2, 3, 4, 5])
In [32]: arr.dtype
Out[32]: dtype('int64')
In [33]: float_arr = arr.astype(np.float64)
In [34]: float_arr.dtype
Out[34]: dtype('float64')

在这个例子中，整形被转换到浮点型。如果把浮点数转换到整形dtype，小数部分将会被截断：

In [35]: arr = np.array([3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
In [36]: arr
Out[36]: array([ 3.7, -1.2, -2.6, 0.5, 12.9, 10.1])
In [37]: arr.astype(np.int32)
Out[37]: array([ 3, -1, -2, 0, 12, 10], dtype=int32)

你可能有一个字符窜数组表示的数字，可以使用 astype 把它们转换到数字的形式：

In [38]: numeric_strings = np.array(['1.25', '-9.6', '42'], dtype=np.string_)
In [39]: numeric_strings.astype(float)
Out[39]: array([ 1.25, -9.6 , 42. ])

如果因为某些原因（如一个字符窜不能转换到 float64 ）转换失败了，将会引起一个 TypeError 。正如你所看见的，我有一些懒，使用 float 而不是 np.float64 ；NumPy会足够聪明的把Python的类型对应到等价的dtypes。

你也可以使用dtype的另一个属性：

In [40]: int_array = np.arange(10)
In [41]: calibers = np.array([.22, .270, .357, .380, .44, .50], dtype=np.float64)
In [42]: int_array.astype(calibers.dtype)
Out[42]: array([ 0., 1., 2., 3., 4., 5., 6., 7., 8., 9.])

你也可以使用速记的类型码字符窜来指定一个dtype：

In [43]: empty_uint32 = np.empty(8, dtype='u4')
In [44]: empty_uint32
Out[44]:
array([ 0, 0, 65904672, 0, 64856792, 0,
        39438163, 0], dtype=uint32)

调用 astype 总是会创建一个新的数组（原数据的拷贝），即使是新的dtype和原来的dtype相同。

值得牢记的是浮点数，如那些是 float64 和 float32 的数组，是唯一能够接近分数的。在复杂的计算中，可能会产生浮点错误，计较时到了一定的小数位数时才有效。

1.1.3. 数组和纯量间的操作

数组非常重要，因为它们使你不使用循环就可以在数据上进行一系列操作。这通常被叫做矢量化。相同大小的数组间的算术运算，其操作作用在对应的元素上：

In [45]: arr = np.array([[1., 2., 3.], [4., 5., 6.]])

In [46]: arr
Out[46]:
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.]])

In [47]: arr * arr                 In [48]:arr - arr
Out[47]:                           Out[48]:
array([[  1.,   4.,   9.],        array([[ 0., 0., 0.],
       [ 16.,  25.,  36.]])              [ 0., 0., 0.]])

纯量的算术操作正如你期望的一样，把操作值作用于每一个元素：

In [49]: 1 / arr                        In [50]: arr ** 0.5
Out[49]:                                Out[50]:
array([[ 1. , 0.5 , 0.3333],            array([[ 1. , 1.4142, 1.7321],
       [ 0.25 , 0.2 , 0.1667]])                [ 2. , 2.2361, 2.4495]])

在不同大小的数组见的操作被叫做 broadcasting ，将在第12章详细讨论。深入的了解broadcasting在本书的多数地方是不必要的。

1.1.4. 基本的索引和切片

NumPy的索引是一个内容丰富的主题，因为有许多方法可以使你在你的数据中选取一个子集或单个元素。一维的数组很简单，表面上它们的行为类似于Python的列表：

In [51]: arr = np.arange(10)
In [52]: arr
Out[52]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
In [53]: arr[5]
Out[53]: 5
In [54]: arr[5:8]
Out[54]: array([5, 6, 7])
In [55]: arr[5:8] = 12
In [56]: arr
Out[56]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

如你所见，当你给一个切片赋一纯量值，如 arr[5:8] = 12 所示，该值被传送（或传播）到整个选择区域。与列表的第一个重要的区别是数组的切片在原来的数组上（不生成新的数组）。这意味着数据不会被拷贝，且对切片的任何修改都会影响源数组：

In [57]: arr_slice = arr[5:8]
In [58]: arr_slice[1] = 12345
In [59]: arr
Out[59]: array([ 0, 1, 2, 3, 4, 12, 12345, 12, 8, 9])
In [60]: arr_slice[:] = 64
In [61]: arr
Out[61]: array([ 0, 1, 2, 3, 4, 64, 64, 64, 8, 9])

如果你是使用NumPy的新手，这一点回事你感到惊讶，尤其当你使用过其它数组编程语言，它们非常热衷于拷贝数据。请记住，NumPy是设计用来处理大数据的情况，你可以想象如果NumPy坚持使用拷贝数据将会出现的性能和内存问题。

如果你想有数组切片的一个拷贝，你需要明显的拷贝数组；例如 arr[5:8].copy() 。

对于高维数组，你会有更多选项。在两维的数组，每一个索引的元素将不再是一个纯量，而是一个一维数组：

In [62]: arr2d = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
In [63]: arr2d[2]
Out[63]: array([7, 8, 9])

因此，单个元素可以递归的访问，但是这会做多一点的工作。不过，你可以使用一个逗号分隔的索引列表来选择单个元素。因此，下面的操作是等价的：

In [64]: arr2d[0][2]
Out[64]: 3
In [65]: arr2d[0, 2]
Out[65]: 3

见 NumPy数组的索引，是在二维数组上的索引图例。

1. NumPy Basics: Arrays and Vectorized Computation_第1张图片

NumPy数组的索引

在多维数组中，如果你省略了后面的索引，返回的对象将会是一个较低维的ndarray，它包括较高维度的所有数据。因此，在 2*2*3 的数组 arr3d 中

In [66]: arr3d = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])
In [67]: arr3d
Out[67]:
array([[[ 1, 2, 3],
        [ 4, 5, 6]],
       [[ 7, 8, 9],
        [10, 11, 12]]])

arr3d[0] 是一个 2*3 的数组：

In [68]: arr3d[0]
Out[68]:
array([[1, 2, 3],
       [4, 5, 6]])

纯量值和数组都可以给 arr3d[0] 赋值：

In [69]: old_values = arr3d[0].copy()
In [70]: arr3d[0] = 42

In [71]: arr3d
Out[71]:
array([[[42, 42, 42],
        [42, 42, 42]],
       [[ 7, 8, 9],
        [10, 11, 12]]])

In [72]: arr3d[0] = old_values

In [73]: arr3d
Out[73]:
array([[[ 1, 2, 3],
        [ 4, 5, 6]],
       [[ 7, 8, 9],
        [10, 11, 12]]])

类似的， arr3d[1, 0] 给你那些索引以 (1, 0) 开始的值，形成了一个1维数组：

In [74]: arr3d[1, 0]
Out[74]: array([7, 8, 9])

请注意，在所有的情况下，被选中的子节返回的数组总是数组视窗。

1.1.4.1. 带切片的索引

如同一维对象，例如Python的列表，ndarrys可以使用熟悉的语法来切片：

In [75]: arr[1:6]
Out[75]: array([ 1, 2, 3, 4, 64])

较高维的对象给你更多的选择，你可以切割一个或多个坐标坐标轴，并且可以混合整数。对上面的2维数组，arr2d ，对它的切片有些不同：

In [76]: arr2d              In [77]: arr2d[:2]
Out[76]:                    Out[77]:
array([[1, 2, 3],           array([[1, 2, 3],
       [4, 5, 6],                  [4, 5, 6]])
       [7, 8, 9]])

正如你所见，它沿着 0 坐标坐标轴（第一个坐标坐标轴）切片。因此，一个切片沿着一个坐标坐标轴向选择一个范围的元素。你可以传递多个切片，就像你传递多个索引一样：

In [78]: arr2d[:2, 1:]
Out[78]:
array([[2, 3],
       [5, 6]])

象这样切片时，你得到的总是相同维数的数组视窗。通过混合整形索引和切片，你可以得到较低维的切片：

In [79]: arr2d[1, :2]             In [80]: arr2d[2, :1]
Out[79]: array([4, 5])            Out[80]: array([7])

见两维数组切片图解。注意，一个单一的冒号意味着取整个坐标/坐标轴，因此，你可以只切割更高维的坐标轴，做法如下：

In [81]: arr2d[:, :1]
Out[81]:
array([[1],
       [4],
       [7]])

当然，给一个切片表达式赋值会对整个选择赋值：

In [82]: arr2d[:2, 1:] = 0

两维数组切片

1.1.5. 布尔索引

让我们来考虑一个例子，我们有一些数据在一个数组中和一个有重复名字的数组。我将会在这使用numpy.random 中的 randn 函数来产生一些随机的正态分布的数据：

In [83]: names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
In [84]: data = randn(7, 4)
In [85]: names
Out[85]:
array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'],
      dtype='|S4')
In [86]: data
Out[86]:
array([[-0.048 , 0.5433, -0.2349, 1.2792],
       [-0.268 , 0.5465, 0.0939, -2.0445],
       [-0.047 , -2.026 , 0.7719, 0.3103],
       [ 2.1452, 0.8799, -0.0523, 0.0672],
       [-1.0023, -0.1698, 1.1503, 1.7289],
       [ 0.1913, 0.4544, 0.4519, 0.5535],
       [ 0.5994, 0.8174, -0.9297, -1.2564]])

假设每一个名字都和 data 数组中的一行对应。如果我们想要选择与 ‘Bob’ 名字对应的所有行。象算术运算一样，数组的比较操作（例如 == ）也可以矢量化。因此， names 和 Bob 字符窜的比较会产生一个布尔数组：

In [87]: names == 'Bob'
Out[87]: array([ True, False, False, True, False, False, False], dtype=bool)

当索引数组时可以传递这一布尔数组：

In [88]: data[names == 'Bob']
Out[88]:
array([[-0.048 , 0.5433, -0.2349, 1.2792],
       [ 2.1452, 0.8799, -0.0523, 0.0672]])

布尔数组必须和它索引的坐标轴的长度相同。你甚至可以把布尔数组和切片或整数（或者整数序列，关于这一点后面会更多介绍）混合和匹配起来：

In [89]: data[names == 'Bob', 2:]
Out[89]:
array([[-0.2349, 1.2792],
       [-0.0523, 0.0672]])
In [90]: data[names == 'Bob', 3]
Out[90]: array([ 1.2792, 0.0672])

为了选择除了 ‘Bob’ 之外的所有东西，你可以使用！= 或用 - 对条件表达式取反：

In [91]: names != 'Bob'
Out[91]: array([False, True, True, False, True, True, True], dtype=bool)

In [92]: data[-(names == 'Bob')]
Out[92]:
array([[-0.268 , 0.5465, 0.0939, -2.0445],
       [-0.047 , -2.026 , 0.7719, 0.3103],
       [-1.0023, -0.1698, 1.1503, 1.7289],
       [ 0.1913, 0.4544, 0.4519, 0.5535],
       [ 0.5994, 0.8174, -0.9297, -1.2564]])

使用布尔算术操作符如 & （and）和 | （or）来结合多个布尔条件，下面是从三个名字中选取两个的操作：

In [93]: mask = (names == 'Bob') | (names == 'Will')
In [94]: mask
Out[94]: array([True, False, True, True, True, False, False], dtype=bool)
In [95]: data[mask]
Out[95]:
array([[-0.048 , 0.5433, -0.2349, 1.2792],
       [-0.047 , -2.026 , 0.7719, 0.3103],
       [ 2.1452, 0.8799, -0.0523, 0.0672],
       [-1.0023, -0.1698, 1.1503, 1.7289]])

通过布尔索引从一个数组中选取数据总是会创建数据的一份拷贝，即使是返回的数组没有改变。

Python的 and 和 or 关键字不能与布尔数组一起工作。

通过布尔数组设置值工作于一种种常识性的方式。为了设置 data 中所有的负值为0，我们只需要：

In [96]: data[data < 0] = 0
In [97]: data
Out[97]:
array([[ 0. , 0.5433, 0. , 1.2792],
       [ 0. , 0.5465, 0.0939, 0. ],
       [ 0. , 0. , 0.7719, 0.3103],
       [ 2.1452, 0.8799, 0. , 0.0672],
       [ 0. , 0. , 1.1503, 1.7289],
       [ 0.1913, 0.4544, 0.4519, 0.5535],
       [ 0.5994, 0.8174, 0. , 0. ]])

使用一维布尔数组设置整行或列也非常简单：

In [98]: data[names != 'Joe'] = 7
In [99]: data
Out[99]:
array([[ 7. , 7. , 7. , 7. ],
       [ 0. , 0.5465, 0.0939, 0. ],
       [ 7. , 7. , 7. , 7. ],
       [ 7. , 7. , 7. , 7. ],
       [ 7. , 7. , 7. , 7. ],
       [ 0.1913, 0.4544, 0.4519, 0.5535],
       [ 0.5994, 0.8174, 0. , 0. ]])

1.1.6. Fancy索引

Fancy 索引是一个术语，被NumPy用来描述使用整形数组索引。假如我们有一个 8*4 的数组：

In [100]: arr = np.empty((8, 4))
In [101]: for i in range(8):
   .....:     arr[i] = i
In [102]: arr
Out[102]:
array([[ 0., 0., 0., 0.],
       [ 1., 1., 1., 1.],
       [ 2., 2., 2., 2.],
       [ 3., 3., 3., 3.],
       [ 4., 4., 4., 4.],
       [ 5., 5., 5., 5.],
       [ 6., 6., 6., 6.],
       [ 7., 7., 7., 7.]])

为了选出一个有特定顺序行的子集，你可以传递一个列表或整形ndarray来指定想要的顺序：

In [103]: arr[[4, 3, 0, 6]]
Out[103]:
array([[ 4., 4., 4., 4.],
       [ 3., 3., 3., 3.],
       [ 0., 0., 0., 0.],
       [ 6., 6., 6., 6.]])

很庆幸这个代码做了你所期望的！使用负的索引从结尾选择行：

In [104]: arr[[-3, -5, -7]]
Out[104]:
array([[ 5., 5., 5., 5.],
       [ 3., 3., 3., 3.],
       [ 1., 1., 1., 1.]])

传递多个索引数组有些微的不同；它选取一个一维数组，元素对应与索引的每一个元组：

# 关于reshape在第12章会跟多介绍
In [105]: arr = np.arange(32).reshape((8, 4))
In [106]: arr
Out[106]:
array([[ 0, 1, 2, 3],
       [ 4, 5, 6, 7],
       [ 8, 9, 10, 11],
       [12, 13, 14, 15],
       [16, 17, 18, 19],
       [20, 21, 22, 23],
       [24, 25, 26, 27],
       [28, 29, 30, 31]])
In [107]: arr[[1, 5, 7, 2], [0, 3, 1, 2]]
Out[107]: array([ 4, 23, 29, 10])

花一点儿时间来看看刚刚发生了什么：元素 (1, 0), (5, 3), (7, 1), 和(2, 2)被选择了。 fancy索引的行为与一些用户（也包括我自己）可能期望的有所不同，它因该是一个矩形区域，由选取的矩形的行和列组成。这里有一个方法来得到它：

In [108]: arr[[1, 5, 7, 2]][:, [0, 3, 1, 2]]
Out[108]:
array([[ 4, 7, 5, 6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11, 9, 10]])

另一种方法是使用 np.ix_ 函数，将两个以为整形数组转换为位标，来选取一个正方形区域：

In [109]: arr[np.ix_([1, 5, 7, 2], [0, 3, 1, 2])]
Out[109]:
array([[ 4, 7, 5, 6],
       [20, 23, 21, 22],
       [28, 31, 29, 30],
       [ 8, 11, 9, 10]])

注意，fancy索引，不像切片，它总是拷贝数据到一个新的数组。

1.1.7. 转置数组和交换坐标轴

转置是一种特殊形式的变形，类似的它会返回基础数据的一个视窗，而不会拷贝任何东西。数组有transpose 方法和专门的 T 属性：

In [110]: arr = np.arange(15).reshape((3, 5))
In [111]: arr                          In [112]: arr.T
Out[111]:                              Out[112]:
array([[ 0, 1, 2, 3, 4],               array([[ 0, 5, 10],
       [ 5, 6, 7, 8, 9],                      [ 1, 6, 11],
       [10, 11, 12, 13, 14]])                 [ 2, 7, 12],
                                              [ 3, 8, 13],
                                              [ 4, 9, 14]])

当进行矩阵运算时，你常常会这样做，像下面的例子一样，使用 np.dot 计算内部矩阵来产生 X_TX` ：

In [113]: arr = np.random.randn(6, 3)
In [114]: np.dot(arr.T, arr)
Out[114]:
array([[ 2.584 , 1.8753, 0.8888],
       [ 1.8753, 6.6636, 0.3884],
       [ 0.8888, 0.3884, 3.9781]])

对于更高维的数组， transpose 接受用于转置的坐标轴的号码的一个元组（for extra mind bending）：

In [115]: arr = np.arange(16).reshape((2, 2, 4))
In [116]: arr
Out[116]:
array([[[ 0, 1, 2, 3],
        [ 4, 5, 6, 7]],
       [[ 8, 9, 10, 11],
        [12, 13, 14, 15]]])

In [117]: arr.transpose((1, 0, 2))
Out[117]:
array([[[ 0, 1, 2, 3],
        [ 8, 9, 10, 11]],
       [[ 4, 5, 6, 7],
        [12, 13, 14, 15]]])

使用 .T 的转置，仅仅是交换坐标轴的一个特殊的情况：

In [118]: arr                             In [119]: arr.swapaxes(1, 2)
Out[118]:                                 Out[119]:
array([[[ 0, 1, 2, 3],                    array([[[ 0, 4],
        [ 4, 5, 6, 7]],                           [ 1, 5],
                                                  [ 2, 6],
       [[ 8, 9, 10, 11],                          [ 3, 7]],
        [12, 13, 14, 15]]])
                                                 [[ 8, 12],
                                                 [ 9, 13],
                                                 [10, 14],
                                                 [11, 15]]])

类似的 swapaxes 返回在数据上的一个视窗，而不进行拷贝。

1.2. 通用函数：快速的基于元素的数组函数

一个通用的函数，或者 ufunc ，是一个在ndarrays的数据上进行基于元素的操作的函数。你可以认为它们是对简单函数的一个快速矢量化封装，它们接受一个或多个标量值并产生一个或多个标量值。

许多 ufuncs 都是基于元素的简单变换，像 sqrt 或 exp ：

In [120]: arr = np.arange(10)
In [121]: np.sqrt(arr)
Out[121]:
array([ 0. , 1. , 1.4142, 1.7321, 2. , 2.2361, 2.4495,
        2.6458, 2.8284, 3. ])
In [122]: np.exp(arr)
Out[122]:
array([ 1. , 2.7183, 7.3891, 20.0855, 54.5982,
       148.4132, 403.4288, 1096.6332, 2980.958 , 8103.0839])

这些归诸于 unary ufuncs。其它的，例如 add 或 maximum ，接受两个数组（因此，叫做 binary ufuncs）且返回一个数组：

In [123]: x = randn(8)
In [124]: y = randn(8)
In [125]: x
Out[125]:
array([ 0.0749, 0.0974, 0.2002, -0.2551, 0.4655, 0.9222, 0.446 ,
       -0.9337])
In [126]: y
Out[126]:
array([ 0.267 , -1.1131, -0.3361, 0.6117, -1.2323, 0.4788, 0.4315,
       -0.7147])
In [127]: np.maximum(x, y) # element-wise maximum
Out[127]:
array([ 0.267 , 0.0974, 0.2002, 0.6117, 0.4655, 0.9222, 0.446 ,
       -0.7147])

虽然不常见，一个ufunc可以返回多个数组。 nodf 就是一个例子，它是Python内建 divmod 的矢量化的版本：它返回一个副点数数组的分数和整数部分：

In [128]: arr = randn(7) * 5
In [129]: np.modf(arr)
Out[129]:
(array([-0.6808, 0.0636, -0.386 , 0.1393, -0.8806, 0.9363, -0.883 ]),
 array([-2., 4., -3., 5., -3., 3., -6.]))

见表格4-3 和表格4-4 是可用的ufuncs的清单。

Unary ufuncs
函数	描述
abs, fabs	计算基于元素的整形，浮点或复数的绝对值。fabs对于没有复数数据的快速版本
sqrt	计算每个元素的平方根。等价于 arr ** 0.5
square	计算每个元素的平方。等价于 arr ** 2
exp	计算每个元素的指数。
log, log10, log2, log1p	自然对数（基于e），基于10的对数，基于2的对数和 log(1 + x)
sign	计算每个元素的符号：1(positive)，0(zero)， -1(negative)
ceil	计算每个元素的天花板，即大于或等于每个元素的最小值
floor	计算每个元素的地板，即小于或等于每个元素的最大值
rint	圆整每个元素到最近的整数，保留dtype
modf	分别返回分数和整数部分的数组
isnan	返回布尔数组标识哪些元素是 NaN （不是一个数）
isfinite, isinf	分别返回布尔数组标识哪些元素是有限的（non-inf, non-NaN）或无限的
cos, cosh, sin sinh, tan, tanh	regular 和 hyperbolic 三角函数
arccos, arccosh, arcsin, arcsinh, arctan, arctanh	反三角函数
logical_not	计算基于元素的非x的真值。等价于 -arr

Binary universal funcitons
函数	描述
add	在数组中添加相应的元素
substract	在第一个数组中减去第二个数组
multiply	对数组元素相乘
divide, floor_divide	除和地板除（去掉余数）
power	使用第二个数组作为指数提升第一个数组中的元素
maximum, fmax	基于元素的最大值。 fmax 忽略 NaN
minimum, fmin	基于元素的最小值。 fmin 忽略 NaN
mod	基于元素的模（取余）
copysign	拷贝第二个参数的符号到第一个参数
greater, greater_equal, less, less_equal, not_equal	基于元素的比较，产生布尔数组。等价于中缀操作符 >, >=, <, <=,==, !=
logical_and, logical_or, logical_xor	计算各个元素逻辑操作的真值。等价于中缀操作符 &, \|, ^

1.3. 使用数组进行数据处理

使用NumPy可以是你能够使用简明的数组表达式而不是编写循环表达许多种类的数据处理任务。这种使用数组表达式代替显示循环通常被成为“矢量化”。在一般情况下，矢量化数组操作比与之等价的纯Python操作数度快一到两（或更多）个等级，这对任何种类的数值计算有最大的影响。稍后，在chp12index中，我会讲解broadcasting ，一个矢量化计算的强大方法。

作为一个简单示例，假如我们希望研究函数 sqrt(x\ :sup:`^`\ 2 + \ :sup:`^`\ 2) 穿过一个网格数据。np.meshgrid 函数接受两个一维数组并产生两个二维矩阵，其值对于两个数组的所有 (x, y) 对：

In [130]: points = np.arange(-5, 5, 0.01) # 1000个等间隔点
In [131]: xs, ys = np.meshgrid(points, points)
In [132]: ys
Out[132]:
array([[-5. , -5. , -5. , ..., -5. , -5. , -5. ],
       [-4.99, -4.99, -4.99, ..., -4.99, -4.99, -4.99],
       [-4.98, -4.98, -4.98, ..., -4.98, -4.98, -4.98],
       ...,
       [ 4.97, 4.97, 4.97, ..., 4.97, 4.97, 4.97],
       [ 4.98, 4.98, 4.98, ..., 4.98, 4.98, 4.98],
       [ 4.99, 4.99, 4.99, ..., 4.99, 4.99, 4.99]])

现在，研究这个函数是一个简单的事情，编写与你可能写过的相同的表达式：

In [134]: import matplotlib.pyplot as plt
In [135]: z = np.sqrt(xs ** 2 + ys ** 2)
In [136]: z
Out[136]:
array([[ 7.0711, 7.064 , 7.0569, ..., 7.0499, 7.0569, 7.064 ],
       [ 7.064 , 7.0569, 7.0499, ..., 7.0428, 7.0499, 7.0569],
       [ 7.0569, 7.0499, 7.0428, ..., 7.0357, 7.0428, 7.0499],
       ...,
       [ 7.0499, 7.0428, 7.0357, ..., 7.0286, 7.0357, 7.0428],
       [ 7.0569, 7.0499, 7.0428, ..., 7.0357, 7.0428, 7.0499],
       [ 7.064 , 7.0569, 7.0499, ..., 7.0428, 7.0499, 7.0569]])
In [137]: plt.imshow(z, cmap=plt.cm.gray); plt.colorbar()
Out[137]: <matplotlib.colorbar.Colorbar instance at 0x4e46d40>
In [138]: plt.title("Image plot of $\sqrt{x^2 + y^2}$ for a grid of values")
Out[138]: <matplotlib.text.Text at 0x4565790>

见绘制在网格上的函数，我使用 matplotlib 函数 imshow 创建一个了一个图像，数据来源于上面的函数生成的二维数组。

1. NumPy Basics: Arrays and Vectorized Computation_第2张图片

绘制在网格上的函数

1.3.1. 用数组操作来表达条件逻辑

函数 numpy.where 是三元表达式 x if condition else y 的矢量化版本。假如我们有一个布尔数组和两个值数组：

In [140]: xarr = np.array([1.1, 1.2, 1.3, 1.4, 1.5])
In [141]: yarr = np.array([2.1, 2.2, 2.3, 2.4, 2.5])
In [142]: cond = np.array([True, False, True, True, False])

假如我们想要当对应的 cond 值为 True 时，从 xarr 中获取一个值，否则从 yarr 中获取值。使用列表推到来做这件事，可能会像这样：

In [143]: result = [(x if c else y)
   .....: for x, y, c in zip(xarr, yarr, cond)]
In [144]: result
Out[144]: [1.1000000000000001, 2.2000000000000002, 1.3, 1.3999999999999999, 2.5]

这样做会有许多问题。首先，对于大的数组，它不会很快（因为所有的工作都是有纯Python来做的）。其次，对于多维数组，它不能工作。使用 np.where 你可以像这样非常简洁的编写：

In [145]: result = np.where(cond, xarr, yarr)
In [146]: result
Out[146]: array([ 1.1, 2.2, 1.3, 1.4, 2.5])

np.where 的第一个和第二个参数不需要是数组；它们中的一个或两个可以是纯量。在数据分析中 where的典型使用是生成一个新的数组，其值基于另一个数组。假如你有一个矩阵，其数据是随机生成的，你想要把其中的正值替换为2，负值替换为-2，使用 np.where 非常容易：

In [147]: arr = randn(4, 4)
In [148]: arr
Out[148]:
array([[ 0.6372, 2.2043, 1.7904, 0.0752],
       [-1.5926, -1.1536, 0.4413, 0.3483],
       [-0.1798, 0.3299, 0.7827, -0.7585],
       [ 0.5857, 0.1619, 1.3583, -1.3865]])
In [149]: np.where(arr > 0, 2, -2)
Out[149]:
array([[ 2, 2, 2, 2],
       [-2, -2, 2, 2],
       [-2, 2, 2, -2],
       [ 2, 2, 2, -2]])

In [150]: np.where(arr > 0, 2, arr) # 仅设置正值为 2
Out[150]:
array([[ 2. , 2. , 2. , 2. ],
       [-1.5926, -1.1536, 2. , 2. ],
       [-0.1798, 2. , 2. , -0.7585],
       [ 2. , 2. , 2. , -1.3865]])

传递到 where 的数组不仅仅只是大小相等的数组或纯量。

使用一些小聪明，你可以使用 where 来表达更复杂的逻辑；考虑这个例子，我有两个布尔数组， cond1 和cond2 ，并想根据4种布尔值来赋值：

result = []
for i in range(n):
    if cond1[i] and cond2[i]:
        result.append(0)
    elif cond1[i]:
        result.append(1)
    elif cond2[i]:
        result.append(2)
    else:
        result.append(3)

也许可能不会很明显，这个 for 循环可以转换成一个嵌套的 where 表达式：

np.where(cond1 & cond2, 0,
         np.where(cond1, 1,
                  np.where(cond2, 2, 3)))

在这个特殊的例子中，我们还可以利用布尔表达式在计算中被当作0或1这一事实，因此可以使用算术运算来表达：

result = 1 * cond1 + 2 * cond2 + 3 * -(cond1 | cond2)

1.3.2. 数学和统计方法

一组数学函数，计算整个数组或一个轴向上数据的统计，和数组函数一样是容易访问的。聚合（通常被称为reductions ），如 sun ， mean ，标准偏差 std 可以使用数组实例的方法，也可以使用顶层NumPy的函数：

In [151]: arr = np.random.randn(5, 4) # 正态分布数据
In [152]: arr.mean()
Out[152]: 0.062814911084854597
In [153]: np.mean(arr)
Out[153]: 0.062814911084854597
In [154]: arr.sum()
Out[154]: 1.2562982216970919

像 mean 和 sun 函数可以有一个可选的 axis 参数，它对给定坐标轴进行统计，结果数组将会减少一个维度：

In [155]: arr.mean(axis=1)
Out[155]: array([-1.2833, 0.2844, 0.6574, 0.6743, -0.0187])
In [156]: arr.sum(0)
Out[156]: array([-3.1003, -1.6189, 1.4044, 4.5712])

像 cumsum 和 cumprod 这些函数并不聚集，而是产生一个 intermediate results 的数组：

In [157]: arr = np.array([[0, 1, 2], [3, 4, 5], [6, 7, 8]])
In [158]: arr.cumsum(0)         In [159]: arr.cumprod(1)
Out[158]:                       Out[159]:
array([[ 0, 1, 2],              array([[ 0, 0, 0],
[ 3, 5, 7],                            [ 3, 12, 60],
[ 9, 12, 15]])                         [ 6, 42, 336]])

表格4-5 是一个完整的清单。我们将在稍后的章节中看见关于这些函数的大量例子。

数组构建函数
方法	描述
sum	对数组的所有或一个轴向上的元素求和。零长度的数组的和为灵。
mean	算术平均值。灵长度的数组的均值为NaN。
std, var	标准差和方差，有可选的调整自由度（默认值为n）。
min, max	最大值和最小值
argmin, argmax	索引最小和最大元素。
cumsum	从0元素开始的累计和。
cumprod	从1元素开始的累计乘。

1.3.3. 布尔数组的方法

在上面的方法中布尔值被强制为1( True )和0a( False )。因此， sum 经常被用来作为对一个布尔数组中的True 计数的手段：

In [160]: arr = randn(100)
In [161]: (arr > 0).sum() # 正值的个数
Out[161]: 44

有两个额外的方法， any 和 all ，对布尔数组尤其有用。 any 用来测试一个数组中是否有一个或更多的True ，而 all 用来测试所有的值是否为 True ：

In [162]: bools = np.array([False, False, True, False])
In [163]: bools.any()
Out[163]: True
In [164]: bools.all()
Out[164]: False

这些方法这些方法也可以工作在非不而数组上，非零元素作为 True 。

1.3.4. 排序

像Python的内建列表一样，NumPy数组也可以使用 sort 方法就地排序：

In [165]: arr = randn(8)
In [166]: arr
Out[166]:
array([ 0.6903, 0.4678, 0.0968, -0.1349, 0.9879, 0.0185, -1.3147,
       -0.5425])
In [167]: arr.sort()
In [168]: arr
Out[168]:
array([-1.3147, -0.5425, -0.1349, 0.0185, 0.0968, 0.4678, 0.6903,
        0.9879])

多维数组可以通过传递一个坐标轴数到 sort ，对一维截面上的数据进行就地排序：

In [169]: arr = randn(5, 3)
In [170]: arr
Out[170]:
array([[-0.7139, -1.6331, -0.4959],
       [ 0.8236, -1.3132, -0.1935],
       [-1.6748, 3.0336, -0.863 ],
       [-0.3161, 0.5362, -2.468 ],
       [ 0.9058, 1.1184, -1.0516]])
In [171]: arr.sort(1)
In [172]: arr
Out[172]:
array([[-1.6331, -0.7139, -0.4959],
       [-1.3132, -0.1935, 0.8236],
       [-1.6748, -0.863 , 3.0336],
       [-2.468 , -0.3161, 0.5362],
       [-1.0516, 0.9058, 1.1184]])

顶层的 np.sort 函数返回一个经过排序后的数组拷贝，而不是就地修改。一个快速和肮脏的计算一个数组的位数是对它排序并选择一个特定阶层值：

In [173]: large_arr = randn(1000)
In [174]: large_arr.sort()
In [175]: large_arr[int(0.05 * len(large_arr))] # 5% quantile
Out[175]: -1.5791023260896004

关于使用NumPy的排序方法和更高级的技术，如间接排序，请见第12章。其它几种有关排序的数据操作（例如，通过一列或多列对数据表排序）也会在 pandas 中找到。

1.3.5. Unique 和其它集合逻辑

Numpy有一些基本的针对一维ndarrays的集合操作。最常使用的一个可能是 np.unique ，它返回一个数组的经过排序的 unique 值：

In [176]: names = np.array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'])
In [177]: np.unique(names)
Out[177]:
array(['Bob', 'Joe', 'Will'],
      dtype='|S4')
In [178]: ints = np.array([3, 3, 3, 2, 2, 1, 1, 4, 4])
In [179]: np.unique(ints)
Out[179]: array([1, 2, 3, 4])

np.unique 与纯Python版本比较：

In [180]: sorted(set(names))
Out[180]: ['Bob', 'Joe', 'Will']

另一个函数 np.in1d ，测试一个数组的值和另一个的关系，返回一个布尔数组：

In [181]: values = np.array([6, 0, 0, 3, 2, 5, 6])
In [182]: np.in1d(values, [2, 3, 6])
Out[182]: array([ True, False, False, True, True, False, True], dtype=bool)

见表格4-6 是关于集合函数的清单。

数组集合操作
unique(x)	计算x单一的元素，并对结果排序
intersect1d(x, y)	计算x和y相同的元素，并对结果排序
union1d	结合x和y的元素，并对结果排序
in1d(x, y)	得到一个布尔数组指示x中的每个元素是否在y中
setdiff1d(x, y)	差集，在x中但不再y中的集合
setxor1d(x, y)	对称差集，不同时在两个数组中的元素

1.4. 关于数组的文件输入和输出

NumPy能够保存数据到磁盘和从磁盘加载数据，不论数据是文本或二进制的。在后面的章节你可以学到使用pandas提供的工具来加载表格化的数据到内存。

1.4.1. 对磁盘上的二进制格式数组排序

np.save 和 np.load 是两个主力功能，有效的保存和加载磁盘数据。数组默认保存为未经过压缩的原始二进制数据，文件扩展名为 .npy ：

In [183]: arr = np.arange(10)
In [184]: np.save('some_array', arr)

如果文件路进并不是以 .npy 结尾，扩展名将会被自动加上。在磁盘上的数组可以使用 np.load 加载：

In [185]: np.load('some_array.npy')
Out[185]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

你可以使用 np.savez 并以关键字参数传递数组来保存多个数组到一个zip的归档文件中：

In [186]: np.savez('array_archive.npz', a=arr, b=arr)

当你加载一个 .npz 文件时，会得到一个字典对象，它懒洋洋的加载单个数组：

In [187]: arch = np.load('array_archive.npz')
In [188]: arch['b']
Out[188]: array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

1.4.2. 保存和加载文本文件

从文件加载文本是一个相当标准的任务。对一个新人来说，Python的文件加读取和写入函数的景象可能有一点儿混乱，因此我将主要集中在pandas的 read_csv 和 read_table 函数上。有时使用 np.loadtxt 或更专门的 np.genfromtxt 对于加载数据到 vanilla NumPy 数组是很有用的。

这些函数有许多选项，允许你指定不同的分割副，特定列的转换函数，跳过某些行，和其它的事情。以这样一个逗号分割文件(CSV)作为一个简单的例子：

In [191]: !cat array_ex.txt
0.580052,0.186730,1.040717,1.134411
0.194163,-0.636917,-0.938659,0.124094
-0.126410,0.268607,-0.695724,0.047428
-1.484413,0.004176,-0.744203,0.005487
2.302869,0.200131,1.670238,-1.881090
-0.193230,1.047233,0.482803,0.960334

它可以像这样被加载到一个二维数组：

In [192]: arr = np.loadtxt('array_ex.txt', delimiter=',')
In [193]: arr
Out[193]:
array([[ 0.5801, 0.1867, 1.0407, 1.1344],
[ 0.1942, -0.6369, -0.9387, 0.1241],
[-0.1264, 0.2686, -0.6957, 0.0474],
[-1.4844, 0.0042, -0.7442, 0.0055],
[ 2.3029, 0.2001, 1.6702, -1.8811],
[-0.1932, 1.0472, 0.4828, 0.9603]])

np.savatxt 执行相反的操作：写入数组到一个界定文本文件中。 genfromtxt 与 loadtxt 相似，但是她是面向结构数组和缺失数据处理的；更多关于结构数组请见第12章。

更多有关读取和写入，特别是表格式的或类电子表格的数据，见后面涉及到pandas和DataFrame对象的章节。

1.5. 线性代数

线性代数，如矩阵乘法，分解，行列式和其它的方阵数学，对任何一个数组库来说都是重要的部分。不像一些语言，如 MATLAB ，使用 * 来乘两个二维数组是基于元素的乘法，而不是矩阵点积。因此，有一个 dot 函数，是数组的一个方法和 numpy 命名空间中的一个函数，用来进行矩阵乘法运算：

In [194]: x = np.array([[1., 2., 3.], [4., 5., 6.]])
In [195]: y = np.array([[6., 23.], [-1, 7], [8, 9]])
In [196]: x                In [197]: y
Out[196]:                  Out[197]:
array([[ 1., 2., 3.],      array([[ 6., 23.],
       [ 4., 5., 6.]])            [ -1., 7.],
                                  [ 8., 9.]])
In [198]: x.dot(y) # equivalently np.dot(x, y)
Out[198]:
array([[ 28., 64.],
       [ 67., 181.]])

在一个二维数组和合适大小的一维数组间的矩阵乘积的结果是一个一维数组：

In [199]: np.dot(x, np.ones(3))
Out[199]: array([ 6., 15.])

numpy.linalg 有一个关于矩阵分解和像转置和行列式等的一个标准集合。它们和其它语言（如： MATLAB和 R ）一样都是基于行业标准的 Fortran 库，如 BLSA ， LAPACK ，或可能的 Intel MKL （依赖于你的NumPy的编译）实现的：

In [201]: from numpy.linalg import inv, qr
In [202]: X = randn(5, 5)
In [203]: mat = X.T.dot(X)
In [204]: inv(mat)
Out[204]:
array([[ 3.0361, -0.1808, -0.6878, -2.8285, -1.1911],
       [-0.1808, 0.5035, 0.1215, 0.6702, 0.0956],
       [-0.6878, 0.1215, 0.2904, 0.8081, 0.3049],
       [-2.8285, 0.6702, 0.8081, 3.4152, 1.1557],
       [-1.1911, 0.0956, 0.3049, 1.1557, 0.6051]])
In [205]: mat.dot(inv(mat))
Out[205]:
array([[ 1., 0., 0., 0., -0.],
       [ 0., 1., -0., 0., 0.],
       [ 0., -0., 1., 0., 0.],
       [ 0., -0., -0., 1., -0.],
       [ 0., 0., 0., 0., 1.]])
In [206]: q, r = qr(mat)
In [207]: r
Out[207]:
array([[ -6.9271, 7.389 , 6.1227, -7.1163, -4.9215],
       [ 0. , -3.9735, -0.8671, 2.9747, -5.7402],
       [ 0. , 0. , -10.2681, 1.8909, 1.6079],
       [ 0. , 0. , 0. , -1.2996, 3.3577],
       [ 0. , 0. , 0. , 0. , 0.5571]])

表格4-7 是一些常用的线性代数常用的函数清单。

科学Python社区希望有一天可以实现矩阵乘法的中缀操作符，提供一个语法上更好的使用 np.dot 的替代。但是现在只能这样做。

常用 numpy.linglg 函数
函数	描述
diag	返回一个方阵的对角线（或非对角线）元素为一个一维数组，或者转换一个一维数组到一个方阵（非对角线元素为零）
dot	矩阵乘积
trace	计算对角线上元素的和
det	计算矩阵行列式
eig	计算方阵的特征值和特征向量
inv	计算方阵转置
pinv	计算方阵 Moore-Penrose pseudo-inverse 的转置
qr	计算 QR 分解
svd	计算奇异值分解（SVD）
solve	求解线性系统方程 Ax = b 的x，其中A是一个方阵
lstsq	计算 y = Xb 的最小二乘解

1.6. 示例：随机游走

这是一个利用数组操作来模拟随机游走的示例程序。让我们先来看一个简单的随机游走的例子，从0开始，步长为1和-1，且以相等的概率出现。一个纯Python方式来实现一个单一的有1000步的随机游走的方式是使用内建的 random 模块：

import random
position = 0
walk = [position]
steps = 1000
for i in xrange(steps):
    step = 1 if random.randint(0, 1) else -1
    position += step
    walk.append(position)

一个简单的随机游走是使用这些随机游走的前100个值的例图。

1. NumPy Basics: Arrays and Vectorized Computation_第3张图片

一个简单的随机游走

你可能会发现 walk 简单的把随机步长累积起来并且可以可以使用一个数组表达式来计算。因此，我用np.random 模块去1000次硬币翻转，设置它们为1和-1，并计算累计和：

In [215]: nsteps = 1000
In [216]: draws = np.random.randint(0, 2, size=nsteps)
In [217]: steps = np.where(draws > 0, 1, -1)
In [218]: walk = steps.cumsum()

从这，我们可以开始沿着游走轨迹来提取如最小或做大值的统计信息：

In [219]: walk.min() In [220]: walk.max()
Out[219]: -3 Out[220]: 31

一个更复杂的统计数据是第一交叉时间，随机游走达到一个特定值的步值。这里，我们可能想要知道过了多长时间的随机游走，从任一个方向到达距离原点0至少10步之遥。 ** np.ads(walk) >= 10 ** 会给我们一个布尔数组指示在哪儿游走到达了或超过了10，但是我需要的是第一个10或-10的索引。可以使用 argmax 来计算，它返回布尔数组（最大值为 True）中第一个最大值的索引：

In [221]: (np.abs(walk) >= 10).argmax()
Out[221]: 37

注意在这使用 ragmax 并不是总是高效的，因为它总是对数组做全扫描。在这一特殊情况下，一旦一个 True出现了，我们就知道它是一个最大值。

1.6.1. 一次模拟许多随机游走

如果你的目标是模拟许多随机游走，如5000个，你可以对上面的代码稍作修改来生成所有的随机游动。numpy.random 函数，如果通过一个2元组，将产生一个二维数组绘制，我们可以跨越行一次计算5000个随机游动的累计和：

In [222]: nwalks = 5000
In [223]: nsteps = 1000
In [224]: draws = np.random.randint(0, 2, size=(nwalks, nsteps)) # 0 or 1
In [225]: steps = np.where(draws > 0, 1, -1)
In [226]: walks = steps.cumsum(1)
In [227]: walks
Out[227]:
array([[ 1, 0, 1, ..., 8, 7, 8],
       [ 1, 0, -1, ..., 34, 33, 32],
       [ 1, 0, -1, ..., 4, 5, 4],
       ...,
       [ 1, 2, 1, ..., 24, 25, 26],
       [ 1, 2, 3, ..., 14, 13, 14],
       [ -1, -2, -3, ..., -24, -23, -22]])

现在，我们可以获得所有游走的最大和最小值：

In [228]: walks.max() In [229]: walks.min()
Out[228]: 138 Out[229]: -133

在这些游走中，让我们来计算到达30或-30的最短时间。这有一点儿狡猾，因为不是所有的5000个游走都能到达30。我们可以使用 any 方法来检测：

In [230]: hits30 = (np.abs(walks) >= 30).any(1)
In [231]: hits30
Out[231]: array([False, True, False, ..., False, True, False], dtype=bool)
In [232]: hits30.sum() # 30或-30的个数
Out[232]: 3410

我们可以使用这个布尔数组来选择这些游走中跨过绝对30的行，并调用 argmax 来取得坐标轴1的交叉时间：

In [233]: crossing_times = (np.abs(walks[hits30]) >= 30).argmax(1)
In [234]: crossing_times.mean()
Out[234]: 498.88973607038122

可以大胆的试验其它的分布的步长，而不是相等大小的硬币翻转。你只需要使用一个不同的随机数生成函数，如 normal 来产生相同均值和标准偏差的正态分布：

In [235]: steps = np.random.normal(loc=0, scale=0.25,
   .....: size=(nwalks, nsteps))

你可能感兴趣的:(1. NumPy Basics: Arrays and Vectorized Computation)

3/31总结静心第一
今日总结：1.上午体验课以及反馈2.p1专注力上课3.情绪精品营上课4.燕子营队辅营以及前台值班5.活动室带孩子接待带到访今日反思：1.合理安排体力2.对于准客户记得跟进3.不要放过每一次成交的机会（这个精品营转发有点失败，后期需调整）今日感受：1.为了效果，后期课程一定想方设法布置家庭，给予一个好的支持系统2.上到下午的课程感觉特别特别的累3.晚上在做辅营一个孩子大声叫喊，后来单独出去沟通，其实
Flink中的SQL Client和SQL Gateway BigDataMLApplication flink flink sql gateway
Flink中的SQLClient和SQLGateway对比目录定义基本原理适用场景主要区别常用运维命令示例官方链接正文1.定义SQLClient：FlinkSQLClient是一种用于提交和执行FlinkSQL语句的命令行界面或图形界面工具。SQLGateway：FlinkSQLGateway是一个独立的服务，它允许客户端通过RESTfulAPI将SQL查询提交到Flink集群。2.基本原理SQL
通俗易懂：MySQL中如何设置只读实例并确保数据一致性？大龄下岗程序员 mysql java mysql spring
在MySQL中设置只读实例主要应用于构建高可用性和扩展性的数据库环境，通常是为了分担读取负载或者用于备份和灾难恢复。以下是创建MySQL只读实例并确保数据一致性的基本步骤：1.创建并配置只读实例-主从复制设置-首先，你需要有一个主数据库实例（Master）负责接收所有的写操作。-创建一个或多个从数据库实例（Slave），并将它们配置为主数据库的复制品。这通常通过设置主从复制（Replication
word字号和mathtype磅值关系及批量修改小铁匠-Ma office小技巧经验分享
word字号和mathtype磅值关系及批量修改1.字号与磅值关系字号「八号」对应磅值5字号「七号」对应磅值5.5字号「小六」对应磅值6.5字号「六号」对应磅值7.5字号「小五」对应磅值9字号「五号」对应磅值10.5字号「小四」对应磅值12字号「四号」对应磅值14字号「小三」对应磅值15字号「三号」对应磅值16字号「小二」对应磅值18字号「二号」对应磅值22字号「小一」对应磅值24字号「一号」对应
学习JavaEE的日子 Day32 线程池 A 北枝学习JavaEE 学习 java-ee java 线程池
Day32线程池1.引入一个线程完成一项任务所需时间为：创建线程时间-Time1线程中执行任务的时间-Time2销毁线程时间-Time32.为什么需要线程池(重要)线程池技术正是关注如何缩短或调整Time1和Time3的时间，从而提高程序的性能。项目中可以把Time1，T3分别安排在项目的启动和结束的时间段或者一些空闲的时间段线程池不仅调整Time1，Time3产生的时间段，而且它还显著减少了创建
感恩日志圆施
张新丽2019年8月16日感恩日志：1.感恩天地滋养万物；感恩国家恩惠护佑；感恩父母养育深恩。2.感恩尊重为平台源头付出的所有人事物。3.感恩红斌、孙萍清晨7点开车来接我和小姨去安宁渠采摘。4.感恩小姨和小姨夫亲自采摘还带我们去瓜地品尝，第一次这么吃好甜啊，忘掉了炎热消了暑，拍下了瞬间，分享着快乐，带给大家。4.感恩整理收拾好小姨给大家利用午休蒸苞米。5.感恩去接爸妈参加沙龙。6.感恩祝福两位伙伴
1.计算机处理器架构+嵌入式处理器架构及知识 vv 啊 arm-linux学习 linux 系统架构
目录一：x86-64处理器架构二：Intel80386处理器（i386）1.i3862.i686三：嵌入式Linux知识：1.MinGW2.GNU计划2.1GNU工具链概述此次只分享英特尔和ADM处理器有关于x86的架构，至于嵌入式处理器架构请查看https://en.wikipedia.org/wiki/List_of_ARM_processors一：x86-64处理器架构x86-64，也称为x
心赏（2018.10.8）六一节_3928
1.上班第一天，同事彤休完产假，回来上班，给我带了酸奶和水果。她生小孩时，我给她发了一个小红包贺喜，哪知她就记在心里了。心赏这个有心的90后。2.女儿放学回来，说自己当了小组长。一边说不想当，一边得意的样子。心赏老师给了孩子这个锻炼的机会。3.老妈今天做了"蚂蚁上树"的菜，得到女儿的高度肯定。心赏老妈还在不断学习。
2021.12.13 自律日记夏舒帅然a
深感时光转瞬即逝，如指缝流金！自律、习惯养成、执行力提高迫在眉睫！今天是什么日子：平日艳阳天起床：7：50任务清单（明日）1.起床：7:302.就寝：10：103.读书30分钟4.打两套太极5.两次静坐（每次15分钟）昨日完成的任务情况，最重要的三件事一.读书30分。未完成二.就寝10：00完成三.起床7：30未完成四.打两套太极未完成五.两次静坐（每次15分钟）未完成习惯养成：早睡早起、每日读书
2019.11.28感恩日记 afab5b74f713
1.感谢真我守护，一觉到天明，谢谢谢谢谢谢！2.感谢一大早，橘子就甩来4800的大红包，谢谢谢谢谢谢！3.感谢今天代理宝宝们疯狂加单，钱宝宝流入小十万，太牛了你们，有你们真好，谢谢谢谢谢谢！4.感谢自己拥有钱宝宝，可以去群里给宝宝们发红包，表达我的爱，谢谢谢谢谢谢钱宝宝爱我！5.感谢自己的细胞宝宝们，让我保持健康与活力，可以自由活动，活力满满，谢谢谢谢谢谢！6.感谢芬姐甩来订单，谢谢谢谢谢谢钱宝宝
2022-2-13晨间日记越亮也打烊
今天是什么日子起床：7:00就寝：12:08天气：晴心情：糟糕纪念日：无任务清单昨日完成的任务，最重要的三件事：寒假作业，网课，画画改进：作业时间剪短习惯养成：网课不逃～周目标·完成进度数学卷子100％学习·信息·阅读《傅雷家书》《钢铁是怎样炼成的》健康·饮食·锻炼我终于不喝饮料啦，喝茶～人际·家人·朋友邝姐姐带我吃火锅工作·思考啥时候开学，我还有几天赶完作业最美好的三件事1.卷子写完了2.我有冰
中国大学：你站起来！立恒语文
我们先来看看中国大学对外国留学生的“奇葩”待遇。近日，有网友曝出吉林大学有要求中国学生起床后须叫醒外国留学生的服务。看完之后，真是让人大跌眼镜。有网友就直接质问：吉大是大学，还是酒店？中国学生是学生，还是服务员？外国留学生是来求学的，还是享受的？这不仅让人联想到最近一段时间以来网上频频曝出的许多中国大学对外国留学生的一些“奇葩”待遇，这里举几个比较有名的事例，以飨读者。1.山东大学的“三陪”制度，
通俗易懂：什么是Java虚拟机（JVM）？它的主要作用是什么？大龄下岗程序员 mysql java mysql spring
Java虚拟机（JavaVirtualMachine,JVM）是一种软件实现的抽象计算机，它负责执行Java字节码（Bytecode）。Java程序并不是直接在物理计算机上运行，而是先由Java编译器将源代码编译成与平台无关的字节码，然后由JVM负责读取字节码并在实际硬件架构上运行。JVM的主要作用包括以下几个方面：1.跨平台性-JVM是Java语言“一次编写，到处运行”（WriteOnce,Ru
4.24 使用计算命令制作图像合成艺术效果 [Ps教程] 互动教程网
1.本节课程将为您演示，如何使用[计算]命令，将两张示例图片，制作成超酷的图像合成特效。首先点击顶部的文档标签，切换至另一张示例图片。image2.接着依次点击[图像>计算]命令，弹出[计算]窗口。image3.[计算]命令，用于混合两个来自一个或多个源图像的单个通道。然后可以将结果应用到新图像、新通道或当前图像的选区中。image4.在弹出的计算窗口中，点击下拉箭头，选择[计算]命令的源图片。i
#D174-读书会作业-《财务自由之路》3 白洲笔记
最近沉迷于写作营，一直就没时间去弄读书会的作业，书的第二遍也就看了个开头，趁着日更的时间，赶紧把作业做了，这次是15到21课。【1.印象最深刻的部分】(本周所读内容中印象最深刻的部分)*活在未来，最正确的方法是什么？用正确的方法做正确的事情，判断什么是正确的？逻辑。学会思考。"作对事情"永远比“把事情作对“重要的多。”长远思考，耐心验证，小心总结提炼“证明自己正确并不是学习的任务和目标，时刻成长，
石墨烯薄膜行业调研报告（一）方象知产研究院
01石墨烯类别（一）按厚度1.单碳层石墨烯（singlelayergraphene）：由单个碳原子层构成的大平面共轭结构材料，目前石墨烯的大多数奇特性质都是基于此材料2.多层石墨烯或少数碳层石墨烯（afewlayergraphene）：厚度在2~10碳层的石墨薄片材料，研究表明，其层内电子运动行为有别于石墨烯材料3.石墨烯微片（graphenenonaplatelets）：厚度在10~100纳米厚
flutter boost 如何从native跳转到flutter页面 Icarus_ flutter flutter
FlutterBoost是一个Flutter插件，它可以帮助开发者在原生应用和Flutter应用之间无缝跳转。以下是一些基本步骤，展示了如何使用FlutterBoost从原生（Native）页面跳转到Flutter页面。1.配置FlutterBoost在你的Flutter项目中集成FlutterBoost插件。这通常涉及到修改`pubspec.yaml`文件来添加依赖项，并根据FlutterBoo
掌握Flutter底部导航栏：畅游导航之旅繁依Fanyi xml json sql flutter 开发语言前端 git
1.引言在移动应用开发中，底部导航栏是一种常见且非常实用的用户界面元素。它提供了快速导航至不同功能模块或页面的便捷方式，使用户可以轻松访问应用程序的各个部分。在Flutter中，底部导航栏也是一项强大的功能，开发者可以利用Flutter框架提供的丰富组件和灵活性，轻松实现各种样式和交互效果的底部导航栏。本文将深入探讨Flutter中底部导航栏的实现方法，从基础的结构搭建到高级功能的应用，带领读者逐
Jenkins安装 lettger
1.第一步sudowget-O/etc/yum.repos.d/jenkins.repohttps://pkg.jenkins.io/redhat/jenkins.reposudorpm--importhttps://pkg.jenkins.io/redhat/jenkins.io.key2.第二步sudoyuminstalljenkins3.第三步servicejenkinsstatus|sta
排序算法太多？常用排序都在这了，一篇文章总结和实现所有面试会考的排序算法（基于Python实现）宇宙之一粟不归路之Python #IT面试题收集与总结数据结构与算法算法数据结构排序算法 python java
文章目录排序算法1.常见的排序算法1.1选择排序1.1.1思想1.1.2实现**1.1.3选择排序分析**1.2冒泡排序**1.2.1思想****1.2.2实现****1.2.3冒泡排序分析**1.3插入排序**1.3.1思想****1.3.2实现****1.3.3插入排序分析**1.4归并排序☆☆★**1.4.1思想****1.4.2实现****1.4.3归并排序分析**1.5快速排序☆★★**
如何成为思维的高手？明安包装闫慧玲
六项精进训练营Day2复盘20210112湖北荆州学习靠氛围，成长靠圈子1.关于金钱认知金句：1.当今世界，非钱不行2.有钱能使鬼推磨3.金钱是万恶之本4.时间就是金钱5.金钱不是万能的，但是没有钱是万万不能的6.谈钱伤感情，谈感情伤钱道德系统→好人→美德→回流利益系统→好好生活天下熙熙皆为利来，天下攘攘皆为利往出自西汉著名史学家、文学家司马迁《史记》的第一百二十九章“货殖列传”。这句话意思是说天
VGG16滤镜可视化和类激活图 LIjin_1006 人工智能神经网络深度学习 cnn
这个用keras2.2.4+tensorflow1.15.0importkeraskeras.__version__fromkeras.applicationsimportVGG16fromkerasimportbackendasKimportnumpyasnpfromkerasimportmodelsimportmatplotlib.pyplotaspltimporttensorflowastf
ruoyi使用笔记万变不离其宗_8 项目笔记代码参考笔记笔记 java 前端
1.限流处理@RateLimiter@PostMapping("/createOrder")@ApiOperation("创建充值订单")@RateLimiter(key=CacheConstants.REPEAT_SUBMIT_KEY,time=10,count=1,limitType=LimitType.IP)publicRcreateOrder(@RequestBodyFormform){/
Numpy、Pandas库的使用貮叁量化投资分析 python python 数据分析
目录Numpy1、概述2、基础操作2.1生成一个numpy的array数组：2.2自定义一个新的数据类型：np.dtype()3、并行化思想4、量化分析应用4.1索引选取和切片选择4.2数据转换与规整4.3逻辑条件进行数据筛选4.4通用序列函数4.5文件保存与读取Pandas1、简介2、Series和DataFrame的使用2.1Series2.2DataFrame3、量化分析应用3.1形成一个p
项目管理工具最佳实践水岩
各个公司的最佳实践去哪儿jira自定义使用1.jira编号对应git分支命名，后台增加监控程序，新增一个分支，自动解析分支中的jira编号，自动落地到数据库，完成映射2.各个发布系统间信息同步，消息中心（IC）+数据中心（DC）,广播消息加一站式查询，持续集成，推进代码检查质量，分钟级反馈质量检查反思：1.项目管好：针对一线研发人员，简单易用，而不是满足管理层的“统计度量”（...）简化分类字段，
六项精进2018-11-24 倪力
泰优汇六项精进第一组打卡记录倪力【日精进打卡第180天】一、学习与实践1.付出不亚于任何人的努力2.要谦虚，不要骄傲3.要每天反省4.活着，就要感谢5.积善行，思利他6.不要有感性的烦恼二、今日分享反省：要让思考成为一种习惯！
Element-UI中el-time-picker时间选择器无法选择爱健身的小刘同学 bug Element Vue系列 javascript 前端 elementui
前言前几天开发时，在做一个时间选择时，遇到了无法选中时间的问题在网络上找了解决方法，特此记录一下解决方法我的代码结构营业时间时间选择不上的原因是因为初始值问题很有可能是最开始赋值为空数组了所以有3个解决方法1.设置为nullbusinessTimeInfo:null2.设置当前时间businessTimeInfo:[newDate(newDate()),newDate(newDate())]（默认
小红书打广告引流小红书引流招式大全九千营销
随着社交媒体的不断发展，越来越多的品牌开始在小红书上进行推广和引流。小红书是一个以用户分享购物心得和生活方式为主要内容的社交平台，拥有超过1亿的用户，尤其是女性用户占比极高。那么如何在小红书上打广告引流呢？以下提供一些实用的方法：防失联【xhs1.net】业务全能，有需求请联系微：jiu991144，jiu994455Q：74146394928110454【tg：jiuke1】1.与网红合作小红书
static静态变量的简略解释及其练习 JS-JiMao java 开发语言
1.当static修饰一个变量时，说白了，就是让该变量的值不能改变，即第二次调用我们不能改变它的值，它的值在第一次就已经确定下来了packagewww.mmm;classStudent{privateStringname;privateintage;privateStringgender;publicstaticStringteachername;publicStudent(){}publicSt
php 快速入门（六）王依硕 PHP php 开发语言
一、前后台交互1.1$_GET用来获取浏览器通过GET方法提交的数据GET方法它是通过把参数数据加在提交表单的action属性所指的URL中，值和表单内每个字段一一对应，然后在URL中可以看到，但是有如下缺点1.安全性不好，在URL中可以看得到2.传送数据量较小，不能大于2KB1.2$_POST用来获取浏览器通过POST方法提交的数据。POST方法它是通过HTTPPOST机制，将表单的各个字段放置
解读Servlet原理篇二---GenericServlet与HttpServlet 周凡杨 java HttpServlet 源理 GenericService 源码
在上一篇《解读Servlet原理篇一》中提到，要实现javax.servlet.Servlet接口（即写自己的Servlet应用），你可以写一个继承自javax.servlet.GenericServletr的generic Servlet ，也可以写一个继承自java.servlet.http.HttpServlet的HTTP Servlet（这就是为什么我们自定义的Servlet通常是exte
MySQL性能优化 bijian1013 数据库 mysql
性能优化是通过某些有效的方法来提高MySQL的运行速度，减少占用的磁盘空间。性能优化包含很多方面，例如优化查询速度，优化更新速度和优化MySQL服务器等。本文介绍方法的主要有： a.优化查询 b.优化数据库结构
ThreadPool定时重试 dai_lm java ThreadPool thread timer timertask
项目需要当某事件触发时，执行http请求任务，失败时需要有重试机制，并根据失败次数的增加，重试间隔也相应增加，任务可能并发。由于是耗时任务，首先考虑的就是用线程来实现，并且为了节约资源，因而选择线程池。为了解决不定间隔的重试，选择Timer和TimerTask来完成 package threadpool; public class ThreadPoolTest {
Oracle 查看数据库的连接情况周凡杨 sql oracle 连接
首先要说的是，不同版本数据库提供的系统表会有不同，你可以根据数据字典查看该版本数据库所提供的表。 select * from dict where table_name like '%SESSION%'; 就可以查出一些表，然后根据这些表就可以获得会话信息 select sid,serial#,status,username,schemaname,osuser,terminal,ma
类的继承朱辉辉33 java
类的继承可以提高代码的重用行，减少冗余代码；还能提高代码的扩展性。Java继承的关键字是extends 格式:public class 类名（子类）extends 类名（父类）{ } 子类可以继承到父类所有的属性和普通方法，但不能继承构造方法。且子类可以直接使用父类的public和 protected属性，但要使用private属性仍需通过调用。子类的方法可以重写，但必须和父类的返回值类
android 悬浮窗特效肆无忌惮_ android
最近在开发项目的时候需要做一个悬浮层的动画，类似于支付宝掉钱动画。但是区别在于，需求是浮出一个窗口，之后边缩放边位移至屏幕右下角标签处。效果图如下：一开始考虑用自定义View来做。后来发现开线程让其移动很卡，ListView+动画也没法精确定位到目标点。后来想利用Dialog的dismiss动画来完成。自定义一个Dialog后，在styl
hadoop伪分布式搭建林鹤霄 hadoop
要修改4个文件 1: vim hadoop-env.sh 第九行 2: vim core-site.xml <configuration> &n
gdb调试命令 aigo gdb
原文：http://blog.csdn.net/hanchaoman/article/details/5517362 一、GDB常用命令简介 r run 运行.程序还没有运行前使用 c cuntinue
Socket编程的HelloWorld实例 alleni123 socket
public class Client { public static void main(String[] args) { Client c=new Client(); c.receiveMessage(); } public void receiveMessage(){ Socket s=null; BufferedRea
线程同步和异步百合不是茶线程同步异步
多线程和同步 : 如进程、线程同步，可理解为进程或线程A和B一块配合，A执行到一定程度时要依靠B的某个结果，于是停下来，示意B运行；B依言执行，再将结果给A；A再继续操作。所谓同步，就是在发出一个功能调用时，在没有得到结果之前，该调用就不返回，同时其它线程也不能调用这个方法多线程和异步:多线程可以做不同的事情,涉及到线程通知 &
JSP中文乱码分析 bijian1013 java jsp 中文乱码
在JSP的开发过程中，经常出现中文乱码的问题。首先了解一下Java中文问题的由来： Java的内核和class文件是基于unicode的，这使Java程序具有良好的跨平台性，但也带来了一些中文乱码问题的麻烦。原因主要有两方面，
js实现页面跳转重定向的几种方式 bijian1013 JavaScript 重定向
js实现页面跳转重定向有如下几种方式：一.window.location.href <script language="javascript"type="text/javascript"> window.location.href="http://www.baidu.c
【Struts2三】Struts2 Action转发类型 bit1129 struts2
在【Struts2一】 Struts Hello World http://bit1129.iteye.com/blog/2109365中配置了一个简单的Action，配置如下 <!DOCTYPE struts PUBLIC "-//Apache Software Foundation//DTD Struts Configurat
【HBase十一】Java API操作HBase bit1129 hbase
Admin类的主要方法注释： 1. 创建表 /** * Creates a new table. Synchronous operation. * * @param desc table descriptor for table * @throws IllegalArgumentException if the table name is res
nginx gzip ronin47 nginx gzip
Nginx GZip 压缩 Nginx GZip 模块文档详见：http://wiki.nginx.org/HttpGzipModule 常用配置片段如下： gzip on; gzip_comp_level 2; # 压缩比例，比例越大，压缩时间越长。默认是1 gzip_types text/css text/javascript; # 哪些文件可以被压缩 gzip_disable &q
java-7.微软亚院之编程判断俩个链表是否相交给出俩个单向链表的头指针，比如 h1 ， h2 ，判断这俩个链表是否相交 bylijinnan java
public class LinkListTest { /** * we deal with two main missions: * * A. * 1.we create two joined-List(both have no loop) * 2.whether list1 and list2 join * 3.print the join
Spring源码学习-JdbcTemplate batchUpdate批量操作 bylijinnan java spring
Spring JdbcTemplate的batch操作最后还是利用了JDBC提供的方法，Spring只是做了一下改造和封装 JDBC的batch操作： String sql = "INSERT INTO CUSTOMER " + "(CUST_ID, NAME, AGE) VALUES (?, ?, ?)";
[JWFD开源工作流]大规模拓扑矩阵存储结构最新进展 comsci 工作流
生成和创建类已经完成,构造一个100万个元素的矩阵模型,存储空间只有11M大,请大家参考我在博客园上面的文档"构造下一代工作流存储结构的尝试",更加相信的设计和代码将陆续推出......... 竞争对手的能力也很强.......,我相信..你们一定能够先于我们推出大规模拓扑扫描和分析系统的....
base64编码和url编码 cuityang base64 url
import java.io.BufferedReader; import java.io.IOException; import java.io.InputStreamReader; import java.io.PrintWriter; import java.io.StringWriter; import java.io.UnsupportedEncodingException;
web应用集群Session保持 dalan_123 session
关于使用 memcached 或redis 存储 session ，以及使用 terracotta 服务器共享。建议使用 redis，不仅仅因为它可以将缓存的内容持久化，还因为它支持的单个对象比较大，而且数据类型丰富，不只是缓存 session，还可以做其他用途，一举几得啊。1、使用 filter 方法存储这种方法比较推荐，因为它的服务器使用范围比较多，不仅限于tomcat ，而且实现的原理比较简
Yii 框架里数据库操作详解-[增加、查询、更新、删除的方法 'AR模式'] dcj3sjt126com 数据库
public function getMinLimit () { $sql = "..."; $result = yii::app()->db->createCo
solr StatsComponent（聚合统计） eksliang solr聚合查询 solr stats
StatsComponent 转载请出自出处：http://eksliang.iteye.com/blog/2169134 http://eksliang.iteye.com/ 一、概述 Solr可以利用StatsComponent 实现数据库的聚合统计查询，也就是min、max、avg、count、sum的功能二、参数
百度一道面试题 greemranqq 位运算百度面试寻找奇数算法 bitmap 算法
那天看朋友提了一个百度面试的题目：怎么找出{1,1,2,3,3,4,4,4,5,5,5,5} 找出出现次数为奇数的数字. 我这里复制的是原话，当然顺序是不一定的，很多拿到题目第一反应就是用map,当然可以解决，但是效率不高。还有人觉得应该用算法xxx,我是没想到用啥算法好...！还有觉得应该先排序... 还有觉
Spring之在开发中使用SpringJDBC ihuning spring
在实际开发中使用SpringJDBC有两种方式： 1. 在Dao中添加属性JdbcTemplate并用Spring注入； JdbcTemplate类被设计成为线程安全的，所以可以在IOC 容器中声明它的单个实例，并将这个实例注入到所有的 DAO 实例中。JdbcTemplate也利用了Java 1.5 的特定(自动装箱，泛型，可变长度
JSON API 1.0 核心开发者自述 | 你所不知道的那些技术细节 justjavac json
2013年5月，Yehuda Katz 完成了JSON API(英文，中文) 技术规范的初稿。事情就发生在 RailsConf 之后，在那次会议上他和 Steve Klabnik 就 JSON 雏形的技术细节相聊甚欢。在沟通单一 Rails 服务器库—— ActiveModel::Serializers 和单一 JavaScript 客户端库——&
网站项目建设流程概述 macroli 工作
一.概念网站项目管理就是根据特定的规范、在预算范围内、按时完成的网站开发任务。二.需求分析项目立项　　我们接到客户的业务咨询，经过双方不断的接洽和了解，并通过基本的可行性讨论够，初步达成制作协议，这时就需要将项目立项。较好的做法是成立一个专门的项目小组，小组成员包括：项目经理，网页设计，程序员，测试员，编辑/文档等必须人员。项目实行项目经理制。客户的需求说明书　　第一步是需
AngularJs 三目运算表达式判断 qiaolevip 每天进步一点点学习永无止境众观千象 AngularJS
事件回顾：由于需要修改同一个模板，里面包含2个不同的内容，第一个里面使用的时间差和第二个里面名称不一样，其他过滤器，内容都大同小异。希望杜绝If这样比较傻的来判断if-show or not，继续追究其源码。 var b = "{{", a = "}}"; this.startSymbol = function(a) {
Spark算子：统计RDD分区中的元素及数量 superlxw1234 spark spark算子 Spark RDD分区元素
关键字：Spark算子、Spark RDD分区、Spark RDD分区元素数量 Spark RDD是被分区的，在生成RDD时候，一般可以指定分区的数量，如果不指定分区数量，当RDD从集合创建时候，则默认为该程序所分配到的资源的CPU核数，如果是从HDFS文件创建，默认为文件的Block数。可以利用RDD的mapPartitionsWithInd
Spring 3.2.x将于2016年12月31日停止支持 wiselyman Spring 3
Spring 团队公布在2016年12月31日停止对Spring Framework 3.2.x（包含tomcat 6.x）的支持。在此之前spring团队将持续发布3.2.x的维护版本。请大家及时准备及时升级到Spring
fis纯前端解决方案fis-pure zccst JavaScript
作者：zccst FIS通过插件扩展可以完美的支持模块化的前端开发方案，我们通过FIS的二次封装能力，封装了一个功能完备的纯前端模块化方案pure。 1，fis-pure的安装 $ fis install -g fis-pure $ pure -v 0.1.4 2，下载demo到本地 git clone https://github.com/hefangshi/f