man_world

8、NumPy 基础：N维数组和通用函数

文章目录

一、NumPy 简介

1、NumPy 最重要的特点及功能
2、与 TensorFlow 以及 Pytorch 等的区别

二、ndarray：单一数据类型的多维数组

1. ndarray 的创建
2. ndarray 的访问
3. ndarray 的常用属性和方法

`a、常用属性`
`b、常用方法`

4. ndarray 的轴（Axes）和广播机制（Broadcasting）

a、轴（Axes）
b、广播机制（Broadcasting）

5. ndarrary 的内存结构
6. ndarrary 的常用函数

a、数组随机打乱、选择
b、数组组合
c、数组分割
d、数组复制
e、数组分段

三、通用函数(ufunc): 元素级运算

1. 常用的通用函数
2. 常用的统计方法
3. 操作数组和文本文件

一、NumPy 简介

1、NumPy 最重要的特点及功能

具有两种基本对象：ndarray & ufunc
- N 维数组对象(ndarray)：该对象是存储单一数据类型的多维数组（可表示标量、向量、矩阵或张量等）
- 通用函数(ufunc)：具有用于对整组数据进行快速运算的标准数学函数(无需编写循环)
具有矢量运算和复杂广播能力，内存使用效率高
具有线性代数、随机数生成以及傅里叶变换功能

2、与 TensorFlow 以及 Pytorch 等的区别

Numpy 定位是各种各样的科学计算，其在 CPU 上比较快
TF 和 Pytorch 等的定位是机器学习，它们在 Numpy 的基础上做了扩展，使其支持 GPU 编程、分布式编程、自动微分等特性

二、ndarray：单一数据类型的多维数组

1. ndarray 的创建

通过构造函数 np.array(collection, dtype=None, copy=True) 创建：
- collection 为 python 列表(list of list)、元组、数组或其它序列类型
通过内置函数创建：
- np.zeros(shape, dtype=None)、np.ones(shape)、np.empty(shape)、np.full(shape, fill_value)：shape 为 int(1dim) or tuple of ints(>=2dim)
- np.zeros_like(arr)、np.ones_like(arr)、np.empty_like(arr)、np.full_like(arr, fill_value) ：以另一个数组为参数，并根据其形状和dtype创建一个全 0、1、空等的数组
- np.eye(scalar)：创建一个形状为 scalar*scalar 的单位矩阵
通过随机数函数创建：
- np.random.uniform(low=0.0, high=1.0, size=None)：默认产生[0, 1)之间，形状为 size 的均匀分布(注意要带上参数)；np.random.rand(3, 4) 是其特例(注意 tuple 不用加括号)
- np.random.normal(loc=0.0, scale=1.0, size=None)：默认产生形状为 size 的标准正态分布 $(\mu, \sigma^2) = (0, 1)$ (注意要带上参数)；np.random.randn(3, 4) 是其特例(注意 tuple 不用加括号)
- np.random.randint(low=0, high=None, size=None)：Return random integers from low (inclusive) to high (exclusive)
  - 注意：使用时要带上参数
  - 0.5 的概率: if np.random.randint(2): do something
  - 0.5 的概率: if np.random.choice([0,1]): do something
- np.random.seed(integer)：随机数种子，固定后可用于重现某一实验结果
- Note： size 为 int or tuple of ints
通过序列函数创建：
- np.arange(start, stop, step)创建：和 range 的区别是它返回的是数组而不是列表（不包括 stop）
- np.linspace(start, stop, N, endpoint=True)：产生N个等距分布在[start, stop]间元素组成的数组，包括start & stop，步长为 $(s t o p - s t a r t) / (N - 1)$
- np.logspace(start, stop, N, endpoint=True)：产生N个对数等距分布的数组，包括start & stop，基数默认以 10 为底数，可以通过 base 参数指定（另外可通过 endpoint 指定是否包含 stop）

2. ndarray 的访问

索引（View）

一维数组的索引：和列表类似(可以逆序索引(arr[ : : -1])和负索引arr[-3])
二维数组的索引： arr[i, j] == arr[i][j]
多维数组的索引：如果省略了后面的索引，则返回的对象会是一个维度低一点的ndarray(但它含有高一级维度上的某条轴上的所有数据)

条件索引：arr[conditon] # conditon 可以使用 & | 进行多条件组合，应返回 ndarray

布尔数组索引：仅返回结果的一维数组，无论原数组是否是多维数组
整数数组索引：仅返回结果的一维数组，无论原数组是否是多维数组

Masked Array：numpy.ma.masked_where(condition, a, copy=True)[source],用于处理瑕疵数据

>>> a
array([1, 8, 4, 9, 6, 7, 2, 5, 0, 3])

# 布尔数组索引
>>> a > 5
array([False,  True, False,  True,  True,  True, False, False, False, False])
>>> a[a>5]
array([8, 9, 6, 7])

# 整数数组索引
>>> np.where(a>5)
(array([1, 3, 4, 5]),)
>>> a[np.where(a>5)]
array([8, 9, 6, 7])

# Mask an array where a condition is met
>>> b = ma.masked_where(a<=5, a)
masked_array(data=[--, 8, --, 9, 6, 7, --, --, --, --], mask=[ True, False,  True, False, False, False,  True,  True, True,  True], fill_value=999999)

>>> b.mean() = 7.5  # 加了mask，只处理没被 mask 的数据
>>> a.mean() = 4.5

>>> b.set_fill_value(-1)
>>> b.filled()  # 注意 b.data == a, 并没有改变，只是结合 mask 使用
array([-1,  8, -1,  9,  6,  7, -1, -1, -1, -1])

np.where(condition, x=None, y=None)：矢量版本的三元表达式x if condition else y

If only condition is given, return the tuple condition.nonzero(), the indices where condition is True

# 1、一维数据
x = np.arange(5)
array([0, 1, 2, 3, 4])

np.where(x>2)
# 返回一个 tuple，第一个元素对应索引的坐标
(array([3, 4]),)

# 2、二维数据
x = np.arange(9.).reshape(3, 3)
array([[0., 1., 2.],
       [3., 4., 5.],
       [6., 7., 8.]])

np.where( x > 5 )
# 返回一个 tuple，第一个元素对应索引的 x 坐标，第二个元素对应索引 的 y 坐标
(array([2, 2, 2]), array([0, 1, 2]))

If both x and y are specified, the output array contains elements of x where condition is True, and elements from y elsewhere.

# 1、一维数据
y = np.arange(5)
array([0, 1, 2, 3, 4])

np.where(x > 2， x, -1)
array([-1, -1, -1,  3,  4])  # 返回一个一维的 array


# 2、二维数据
x = np.arange(9.).reshape(3, 3)
np.where(x < 5, x, -1)               # Note: broadcasting.
array([[ 0.,  1.,  2.],              # 返回一个二维的 array
       [ 3.,  4., -1.],
       [-1., -1., -1.]])

使用 ndarray/list 索引 ndarray

import numpy as np

# 产生一个一组数组，使用数组/列表来索引出需要的元素(数组本身并不改变)
x = np.arange(10, 1, -1)
>>> array([10,  9,  8,  7,  6,  5,  4,  3,  2])

x[np.array([3, 3, -3, 8])]         # 使用数组索引数组
>>> array([7, 7, 4, 2])

x[[8, 7, 6, 5, 4, 3, 2, 1, 0]]     # 使用列表索引数组
>>> array([ 2,  3,  4,  5,  6,  7,  8,  9, 10])

# 注意：这一点和 list 不同
lst = [10,  9,  8,  7,  6,  5,  4,  3,  2]
lst[[3, 3, -3, 8]]
>>> TypeError: list indices must be integers or slices, not list

切片（View）
- 一维数组的切片：和列表类似
- 二维数组的切片：arr[r1:r2, c1:c2:step] # 也可指定 step 进行切片，尽量不要使用 arr[][]这种形式的切片，因为后面括号是基于前面括号的结果，而只使用一个大括号则是共同考虑，没有先后顺序

3. ndarray 的常用属性和方法

`a、常用属性`

ndim 属性：表示数组的维度个数
shape 属性：表示数组各个维度的大小（返回一个 tuple），各个维度相乘之积即为 size 属性
dtype 属性：表示数组中各数据类型（默认 np.int64, np.float64 or 'int64', 'float64'），可通过astype函数转换数组的数据类型
strides 属性：保存的是当每个轴的下标增加 1 时，数据存储区中的指针所增加的字节数，eg：(40, 8)
nbytes 属性：表示数组占多少个字节
Note： 所有元素必须是相同类型(和 list 的区别)

`b、常用方法`

数组拷贝方法
- copy() 方法：拷贝一份数组，开辟新内存，不影响原始数组
改变数组形状的方法
- reshape() 方法：
  - 改变数组的维度大小(可以把一个一维的向量转换成一个二维的矩阵)，返回原始数组的视图
- transpose() 方法：
  - 一维数组的转置：不起作用(这和线代不同)，可以先 reshape 到二维再转置
  - 二维数组的转置：可用 arr.T or arr.transpose() or np.transpose(arr, axes=None) ，返回原始数组的视图
  - 高维数组的转置：需要得到一个由编号(0, 1, 2，…)组成的元组才能对这些轴进行转置，本质是轴对换，arr.transpose(2, 1, 0) or np.transpose(arr, axes=(2, 1, 0)) or np.swapaxes(arr, 0, 2)，返回原始数组的视图
- flatten() 和 ravel() 方法：
  - 将多维数组转换为一维数组，可用arr.reshape(-1), np.reshape(arr, -1) # 注意并没有np.flatten()函数
  - arr.flatten() 返回原始数组的拷贝，对拷贝所做的修改不会影响原始矩阵，而 arr.ravel() 返回的是视图（view），会影响原始矩阵
- np.expand_dims(a, axis) 方法：
  - Insert a new axis that will appear at the axis position in the expanded array shape
- np.squeeze(a, axis=None) 方法：
  - 剔除所有长度为 1 的轴，也可指定剔除哪个轴
数组(数据类型)转换的方法
- tolist() 方法：将数组转换成列表（针对一维数组也可使用 list(arr)）
- tostring()==tobytes() 方法：根据数组的数据类型将其转换成不同长度的字符串(1bytes=8bits)
- astype(dtype) 方法：转换数组的数据类型，dtype 为 str 或 dtype
  - eg：a = a.astype('float32') or a = a.astype(np.float32) # str 不加 np or 加 np 不加引号
  - 整型在 64 位操作系统中默认数据类型为 int64
  - 浮点型在 64 位操作系统中默认数据类型为 float64

4. ndarray 的轴（Axes）和广播机制（Broadcasting）

a、轴（Axes）

多维数组做统计时要指定统计的维度(eg: np.mean(x, axis=1, keepdims=False))，否则默认是在全部维度上做统计
- keepdims=True：axis 是几，那就表明哪一维度被压缩成 1 维
- keepdims=False：axis 是几，那就表明哪一维度被干掉了，新数组的形状由剩余的维度组成的
Note： 在内存上的排列是一维存储的，只是我们显示的视图不同而已（遵循行优先原则，先横轴再纵轴）

b、广播机制（Broadcasting）

shape 相同数组间的任何算术运算都会将运算应用到 元素级
shape 不相同的两个数组会间进行如下的广播 (broadcasting) 处理：
- 让所有输入数组都向其中 shape 最长的数组看齐，shape 中不足的部分都通过在前面加 1 补齐
- 输出数组的 shape 是输入数组 shape 的各个轴上的最大值
- 如果输入数组的某个轴和输出数组的对应轴的长度相同或者其长度为 1 时，这个数组能够用来计算，否则出错
- 当输入数组的某个轴的长度为 1 时，沿着此轴运算时都用此轴上的第一组值

5. ndarrary 的内存结构

ndarray 对象的内存组成：
- rawdata：内存上一维连续的二进制流
- metadata：用于解读二进制流的数据
  - data 属性：存放的是 rawdata 的首地址
  - strides 属性: 保存的是当每个轴的下标增加 1 时，数据存储区中的指针所增加的字节数
  - dtype 属性：如何将元素的二进制数据转换为可用的值
- Indexing schema（不同视图下的解读）：
  - 根据 data 指针找到 ndarray 二进制流在内存上的位置
  - 根据 strides 将二进制流切分成数据块
  - 根据 dtype 将数据块解读成数据元素（注意 dtype 大小端问题）
不同的视图(View)下 metadata 不同(id 不同)，但共享 rawdata，只是对内存的展示方式不同而已：
- 引用：
  - b = a，id 不会变，因为 metadata 不用改变
  - b=a.reshape((3,4))，id 会变，因为 metadata 中的 ndim shape strides 等都改变了
  - 和 a 共享一块内存，不同的视图
- 拷贝：b = a.copy()，开辟一块新内存
- 赋值：a[:] = -1
- ndarray 设计哲学：让绝大多数的多维数组的操作仅需要改变其 metadata 部分即可
创建 ndarray 以及解读 ndarray 时的 Index order 问题：
- Matrix-Oriented：先横轴再纵轴（行优先），Numpy 里基本遵循此习惯
- Image-Oriented：先纵轴再横轴（列优先）
- list(np.nditer(arr))：nditer 的迭代 基于内存上的结构

>>> np.arange(9).reshape((3,3),order='C')
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
   >>> b = np.arange(9).reshape((3,3),order='F')
   >>> b.ravel()
   array([0, 3, 6, 1, 4, 7, 2, 5, 8])
# list(np.nditer(a)) == list(np.nditer(b)), 内存上都是 0,1,2,3,4,5,6,7,8 这样排列的，只是不同的 View

# C++ 中 BGR 图像（HWC）在内存中的排列顺序(BGRBGRBGR...)-->C-->W-->H
for (i=0; i<h; i++)
	for (j=0, j<w; j++)
		for (k=0, k<c; k++)  

# C++ 中 RGB 图像（CHW）在内存中的排列顺序(RRR...GGG...BBB...)-->W-->H-->C
for (i=0; i<c; i++)
	for (j=0, j<h; j++)
		for (k=0, k<w; k++)

6. ndarrary 的常用函数

a、数组随机打乱、选择

np.random.permutation(x) :

If x is an integer, randomly permute np.arange(x).

If x is an array, make a copy and shuffle the elements randomly. Return a permuted sequence(ndarray)

>>> nr.permutation(6)
array([4, 5, 2, 3, 1, 0])

>>> nr.permutation(np.arange(-3,7,2))
array([ 3, -3, -1,  1,  5])

>>> nr.permutation(np.arange(6).reshape((2,3))) # only shuffled along its first index.
array([[3, 4, 5],
       [0, 1, 2]])

多个数组(ndarray)以相同顺序打乱

import numpy as np

# 多个数组(ndarray，存放在 lst 中)以相同顺序打乱
def shuffle_seqs(lst):
	# lst[1] 中存放的是 label
	random_order = np.random.permutation(len(lst[1]))
	
    permuted_lst = []
	for arr in lst:
		permuted_lst.append(arr[random_order])  # 以数组索引数组
	
	return permuted_lst

    
X = np.array( [[0, 0], [0, 1], [1, 0], [1, 1]], dtype='int32')  # 训练数据
Y = np.array([0, 1, 1, 0] , dtype='int32')  # label

epoch = 1000
for i in range(epoch):
	# shuffle per epoch
	X, Y = shuffle_seqs([X, Y])
	print(X)
	print(Y)

>>> [[1 1]
	 [0 0]
	 [0 1]
	 [1 0]]
>>> [0 0 1 1]

np.random.shuffle(arr)：

Modify a sequence in-place by shuffling its contents

This function only shuffles the array along the first axis of a multi-dimensional array

# shuffle in the same way
def shuffle_in_unison_scary(a, b):
    rng_state = np.random.get_state()
    np.random.shuffle(a)
    np.random.set_state(rng_state)
    np.random.shuffle(b)

split trainval and test datasets(shuffle first)

# -*- coding: utf-8 -*-

import os
import codecs
import numpy as np


def split_datasets(xml_dir, trainval_path, test_path):
    xml_prefix = [i[:-4] + '\n' for i in os.listdir(xml_dir)]
    np.random.shuffle(xml_prefix)

    xml_num = len(xml_prefix)
    test_num = int(xml_num * 0.2)  # 0.2/0.8
    test_xml_prefix = xml_prefix[:test_num]
    trainval_xml_prefix = xml_prefix[test_num:]

    with codecs.open(trainval_path, 'w', encoding='utf-8') as f1:
        f1.writelines(trainval_xml_prefix)
    with codecs.open(test_path, 'w', encoding='utf-8') as f2:
        f2.writelines(test_xml_prefix)


if __name__ == '__main__':
    XML_DIR = 'data/plate_devkit/plate/Annotations'
    TRAIN_VAL_PATH = 'data/plate_devkit/plate/ImageSets/Main/trainval.txt'
    TEST_PATH = 'data/plate_devkit/plate/ImageSets/Main/test.txt'
    split_datasets(XML_DIR, TRAIN_VAL_PATH, TEST_PATH)
    print('job done!')

np.random.choice(a, size=None, replace=True, p=None):

Generates a random sample from a given 1-D array

可用于 data shuffle & augmentation (通过设置 replace=True)

# Parameters:	
a : 1-D array-like or int
# If an ndarray, a random sample is generated from its elements. If an int, the random sample is generated as if a were np.arange(a)

size : int or tuple of ints, optional
# Output shape. If the given shape is, e.g., (m, n, k), then m * n * k samples are drawn. Default is None, in which case a single value is returned.

replace : 决定采样中是否有重复值, True 表示可以重复，默认是 True 

p : 1-D array-like, optional
# The probabilities associated with each entry in a. If not given the sample assumes a uniform distribution over all entries in a.

# Returns:	
single item or ndarray，the generated random samples

# eg:
# 1、随机取 0 或 1，0.5 的概率
if np.random.choice([0,1]): do something

# 2、Generate a uniform random sample from np.arange(5) of size 3 without replacement
# this is equivalent to np.random.permutation(np.arange(5))[:3]
np.random.choice(5, 3, replace=False) ---> array([3, 1, 0])

# 3、Generate a non-uniform random sample from np.arange(5) of size 3
np.random.choice(5, 3, p=[0.1, 0, 0.3, 0.6, 0]) ---> array([3, 3, 0])

# 4、Generate a 2 dim array
>>>np.random.choice(6, (3,2), replace=False)
array([[2, 0], 
       [5, 4], 
       [3, 1]])

np.take(a=params, indices=indices, axis=0) or arr[indices]：indices 为 list 或 ndarray，若不指定 axis 则按展平的顺序取

>>> a = np.array([4, 3, 5, 7, 6, 8])
>>> indices = [0, 1, 4]
>>> np.take(a, indices)
array([4, 3, 6])

>>> a[indices]
array([4, 3, 6])

>>>b = np.arange(9).reshape(3, 3)
array([[0, 1, 2],
       [3, 4, 5],
       [6, 7, 8]])
       
>>>np.take(b, indices=[[0, 1], [2, 3]])
# If indices is not one dimensional, the output also has these dimensions
array([[0, 1],
       [2, 3]])
       
>>>np.take(b, indices=[0, 1, 2, 3])
array([0, 1, 2, 3])

>>>np.take(b, axis=1, indices=[0,2])
array([[0, 2],
       [3, 5],
       [6, 8]])

b、数组组合

Vertical stacking(row wise)
- 格式：np.vstack(tup)
- Equivalent to np.concatenate(tup, axis=0) if tup contains arrays that are at least 2-dimensional
- 注意：元组必须带括号，新数组第 0 维为所有数组的第 0 维之 和
- 作用：可以用于两个数组 batch 维度的拼接
Horizontal stacking(column wise)
- 格式：np.hstack(tup)
- Equivalent to np.concatenate(tup, axis=1)
- 注意：元组必须带括号，新数组第 1 维为所有数组的第 1 维之 和
Depth stacking(depth wise/along third dimension)
- 格式：np.dstack(tup)
- Equivalent to np.concatenate(tup, axis=2)
- 注意：元组必须带括号，新数组第 2 维为所有数组的第 2 维之 和
增加 batch 维度的做法：
- 使用 np.expand_dims(a, axis=0) 方法，然后 concat
- 创建一个目标维度的全零向量，然后赋值

ndarrary 中添加多行或列数组的方法

Column stacking：np.column_stack(tup)
Row stacking：np.row_stack(tup)
np.insert() 方法

np.c_[] && np.r_[]

# 一维数组的 stacking
a = np.array([1, 2, 3])
b = np.array([4, 5, 6])

np.vstack((a,b))  # 一维变二维，和 concat 的区别(一维情况下不能在 axis=1 下进行 concat)
array([[1, 2, 3],
       [4, 5, 6]])

np.hstack((a,b))  # 还是一维
array([1, 2, 3, 4, 5, 6])

np.dstack((a,b))  # 一维变三维
array([[[1, 4],
        [2, 5],
        [3, 6]]])


# 二维数组的 stacking
c = np.array([[1, 2, 3],
              [4, 5, 6],
              [7, 8, 9]])

d = np.array([[ 2,  4,  6],
	          [ 8, 10, 12],
	          [14, 16, 18]])

np.vstack((c, d))  # 相当于 np.concatenate((c, d), axis=0)
array([[ 1,  2,  3],
       [ 4,  5,  6],
       [ 7,  8,  9],
       [ 2,  4,  6],
       [ 8, 10, 12],
       [14, 16, 18]])

np.hstack((c, d))  # 相当于 np.concatenate((c, d), axis=1)
array([[ 1,  2,  3,  2,  4,  6],
       [ 4,  5,  6,  8, 10, 12],
       [ 7,  8,  9, 14, 16, 18]])

np.dstack((c, d))  # 和 concat 的区别(二维情况下不能在 axis=2 下进行 concat)
array([[[ 1,  2],
        [ 2,  4],
        [ 3,  6]],

       [[ 4,  8],
        [ 5, 10],
        [ 6, 12]],

       [[ 7, 14],
        [ 8, 16],
        [ 9, 18]]])




# 1.使用 np.c_[] 和 np.r_[] 分别添加行和列 
e = np.array([[1, 2, 3], [4, 5, 6], [7 , 8 ,9]])
f = np.eye(3)

np.c_[e,f]  # 添加某列时 b 可以是低一维的数据 
array([[ 1.,  2.,  3.,  1.,  0.,  0.],
       [ 4.,  5.,  6.,  0.,  1.,  0.],
       [ 7.,  8.,  9.,  0.,  0.,  1.]])

np.r_[e, f] # 添加某行时 a, b 必须维度相同 
array([[ 1.,  2.,  3.],
       [ 4.,  5.,  6.],
       [ 7.,  8.,  9.],
       [ 1.,  0.,  0.],
       [ 0.,  1.,  0.],
       [ 0.,  0.,  1.]])


# 2.使用 np.insert() 方法添加行和列
np.insert(e, 3, values=f, axis=1)  # 3代表 b 插入的位置，axis 表示那个轴，在此表示y轴(列)
array([[1, 2, 3, 1, 0, 0],
       [4, 5, 6, 0, 1, 0],
       [7, 8, 9, 0, 0, 1]])

np.insert(e, 3, values=f, axis=0)
array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9],
       [1, 0, 0],
       [0, 1, 0],
       [0, 0, 1]])


# 3. 使用 np.pad() 进行补零操作
Z = np.ones((5,5))
Z = np.pad(Z, pad_width=1, mode='constant', constant_values=0)
array([[0., 0., 0., 0., 0., 0., 0.],
       [0., 1., 1., 1., 1., 1., 0.],
       [0., 1., 1., 1., 1., 1., 0.],
       [0., 1., 1., 1., 1., 1., 0.],
       [0., 1., 1., 1., 1., 1., 0.],
       [0., 1., 1., 1., 1., 1., 0.],
       [0., 0., 0., 0., 0., 0., 0.]])

c、数组分割

np.split(ary, indices_or_sections, axis=0)
- ary : Array to be divided into sub-arrays.
- indices_or_sections : int or 1-D array
  - If indices_or_sections is an integer, N, the array will be divided into N equal arrays along axis. If such a split is not possible， an error is raised.
  - If indices_or_sections is a 1-D array of sorted integers, the entries indicate where along axis the array is split；For example, [2, 3] would, for axis=0, result in [ary[:2], ary[2:3], ary[3:]]按上面的区间分成三份，If an index exceeds the dimension of the array along axis, an empty sub-array is returned correspondingly.
- 一维情形示例：
```
>>> x = np.arange(9.0)
>>> np.split(x, 3)
[array([0.,  1.,  2.]), array([3.,  4.,  5.]), array([6.,  7.,  8.])]

>>> x = np.arange(8.0)
>>> np.split(x, [3, 5, 6, 10])
[array([0.,  1.,  2.]),
 array([3.,  4.]),
 array([5.]),
 array([6.,  7.]),
 array([], dtype=float64)]
```
- 二维情形示例：

d、数组复制

np.repeat(a, repeats, axis=None) ：对数组中的每个元素进行连续重复复制

# Parameters:	
a : array_like, Input array.

repeats :  int or array of ints
# The number of repetitions for each element.  `repeats` is broadcasted to fit the shape of the given axis.

axis : int, optional
# The axis along which to repeat values.  By default, use the flattened input array, and return a flat output array.

# Returns：ndarray

Examples
--------
# 一维数据情况
x = 3
np.repeat(x, 4)
array([3, 3, 3, 3])

# 二维数据情况，对每一个数据 repeat，然后 flatten
x = np.array([[1,2],[3,4]])
np.repeat(x, 2)
array([1, 1, 2, 2, 3, 3, 4, 4])

# 沿着水平坐标轴对每一个数据进行 repeat，不进行 flatten
np.repeat(x, 3, axis=1)
array([[1, 1, 1, 2, 2, 2],
       [3, 3, 3, 4, 4, 4]])
       
# 沿着垂直坐标轴对每一个元素（这里是【1，2】和 【3，4】）进行 repeat，不进行 flatten
np.repeat(x, [1, 2], axis=0)
array([[1, 2],
       [3, 4],
       [3, 4]])

np.tile(A, reps) ：对整个数组进行复制拼接

# Parameters:	
A : array_like, Input array.

reps :  array_like
# The number of repetitions of `A` along each axis.

# Returns:	
If `reps` has length `d`, the result will have dimension of
   `max(d, A.ndim)`.

Examples
--------
# 一维数据的情况
>>> a = np.array([0, 1, 2])
>>> np.tile(a, 2)
array([0, 1, 2, 0, 1, 2])

>>> np.tile(a, (2, 2))     # 构建一个 2*2 的 copy
array([[0, 1, 2, 0, 1, 2],
       [0, 1, 2, 0, 1, 2]])
          

# 二维数据的情况
>>> b = np.array([[1, 2], [3, 4]])
>>> np.tile(b, 2)
array([[1, 2, 1, 2],
       [3, 4, 3, 4]])

e、数组分段

函数：np.piecewise(x, condlist, funclist)

>>> x = np.arange(-2,3)
>>> x
array([-2, -1,  0,  1,  2])
>>> np.piecewise(x, [x < 0, x >= 0], [lambda x:0, lambda x:x])
array([0, 0, 0, 1, 2])
>>> np.piecewise(x, [x < 0, x >= 0], [-1, 1])
array([-1, -1, 1,  1,  1])

三、通用函数(ufunc): 元素级运算

1. 常用的通用函数

一元通用函数
- np.ceil()：取向上最接近的整数
- np.floor()：取向下最接近的整数
- np.rint()：四舍五入
- np.fix()： Round an array of floats element-wise to nearest integer towards zero
- np.isnan()：判断元素是否为 NaN(Not a Number)
- np.abs()：计算整数、浮点数或复数的绝对值
- np.exp()：计算各元素的指数
- np.sqrt()：计算各元素的平方根
- np.square()：计算各元素的平方
- np.log()、np.log10()：分别为以 e 和 10 为底的元素级对数运算
- np.tan()、np.tanh()、np.sin()、np.cos()：三角函数的元素级运算
- np.logical_not()：取反，返回布尔型值
二元通用函数
- np.add(x1, x2)、np.subtract(x1, x2)、np.multiply(x1, x2)、np.divide(x1, x2)、np.mod(x1, x2)、np.power(x1, exp)：
  - 元素级加减乘除、取余及指数运算，当第二个数为标量时，将进行 broadcast 运算
- np.matmul(x1, x2)：使用此函数实现矩阵乘积
- np.maximum(x1, x2)、np.minimum(x1, x2)：
  - 逐元素比较取其大/小者，当第二个数为标量时，将进行 broadcast 运算
  - x1, x2 可以为 n 维 array，此时将逐元素比较取大者或小者a = np.array([1,3]); b = np.array([2,4]); np.maximum(a,b)=array([2, 4])
- np.equal(x1, x2)、np.not_equal(x1, x2)、np.greater(x1, x2)、np.greater_equal(x1, x2)、np.less(x1, x2)、np.less_equal(x1, x2)：
  - 元素级比较元素，返回布尔型值
- np.logical_and(x1, x2)、np.logical_or(x1, x2)、np.logical_xor(x1, x2)：
  - 元素级逻辑运算，返回布尔型值

2. 常用的统计方法

多维数组做统计时要指定统计的维度(eg: np.mean(x, axis=1, keepdims=False))，否则默认是在全部维度上做统计

keepdims=True：axis 是几，那就表明哪一维度被压缩成 1 维

keepdims=False：axis 是几，那就表明哪一维度被干掉了，新数组的形状由剩余的维度组成的

np.mean()，np.sum()：取均值和累积和
np.std()，np.var()：标准差和方差
np.max()，np.min()：返回原数组的最大值和最小值
np.sort()：从小到大排序，返回原数组的 copy
np.product()：求所有元素或某一轴上所有元素的乘积
np.argmax()，np.argmin()：最大和最小元素的索引
np.argsort(x)，np.argsort(-x)：取得从小到大或从大到小排序的索引
np.argwhere(condition)：找出符合条件元素的索引
np.cumsum()：所有元素的累加和
np.cumprod()：所有元素的累计积
np.all(a, axis=None)：全部满足条件
np.any(a, axis=None)：Test whether any array element along a given axis evaluates to True.
np.unique()：找到唯一值并返回排序结果

3. 操作数组和文本文件

NumPy 能够读写磁盘上的文本数据或二进制数据
np.load & np.save 是读写磁盘数组数据的两个主要函数

将数组以二进制格式保存到磁盘

# np.save
# 默认情况下，数组是以未压缩的原始二进制格式保存在扩展名为.npy的文件中的
# 如果文件路径末尾没有扩展名.npy, 则该扩展名会被自动加上
arr = np.arrange(10)
np.save('some_array', arr)

# np.load
np.load('some_array.npy')              # load 的时候要加上后缀名
array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

存取文本文件

# loadtxt
filename = './presidential_polls.csv'
data_array = np.loadtxt(filename,        # 文件名
                        delimiter=',',   # 分隔符
                        dtype=str,       # 数据类型
                        usecols=(0,2,3)) # 指定读取的列索引号
print data_array, data_array.shape
[['cycle' 'type' 'matchup']
 ['2016' '"polls-plus"' '"Clinton vs. Trump vs. Johnson"']
 ['2016' '"polls-plus"' '"Clinton vs. Trump vs. Johnson"']
 ..., 
 ['2016' '"polls-only"' '"Clinton vs. Trump vs. Johnson"']
 ['2016' '"polls-only"' '"Clinton vs. Trump vs. Johnson"']
 ['2016' '"polls-only"' '"Clinton vs. Trump vs. Johnson"']] (10237L, 3L)


# loadtxt, 明确指定每列数据的类型
filename = './presidential_polls.csv'
data_array = np.loadtxt(filename,      # 文件名
                        delimiter=',', # 分隔符
                        skiprows=1,
                        dtype={'names':('cycle', 'type', 'matchup'),
                               'formats':('i4', 'S15', 'S50')},     # 数据类型
                        usecols=(0,2,3)) # 指定读取的列索引号

print data_array, data_array.shape # 读取的结果是一维的数组，每个元素是一个元组
[(2016, '"polls-plus"', '"Clinton vs. Trump vs. Johnson"')
 (2016, '"polls-plus"', '"Clinton vs. Trump vs. Johnson"')
 (2016, '"polls-plus"', '"Clinton vs. Trump vs. Johnson"') ...,
 (2016, '"polls-only"', '"Clinton vs. Trump vs. Johnson"')
 (2016, '"polls-only"', '"Clinton vs. Trump vs. Johnson"')
 (2016, '"polls-only"', '"Clinton vs. Trump vs. Johnson"')] (10236L,)

# 保存文本文件：np.savetxt
# 文本读写主要用 pandas 实现，这里就不介绍啦

你可能感兴趣的:(Python)

用python设计一个表白灯牌噔噔噔噔@ python pygame
表白灯牌可以通过控制LED灯的颜色和亮度来实现。你可以使用树莓派或者Arduino这样的硬件平台，结合Python编程语言来控制LED灯的状态。下面是一个简单的示例代码，可以实现一个表白灯牌效果：importRPi.GPIOasGPIOimporttime#设置GPIO引脚编号模式GPIO.setmode(GPIO.BCM)#设置LED引脚编号red_pin=17green_pin=18#设置GP
数据挖掘|关联分析与Apriori算法详解皖山文武数据挖掘商务智能数据挖掘关联分析 Apriori算法机器学习
数据挖掘|关联分析与Apriori算法1.关联分析2.关联规则相关概念2.1项目2.2事务2.3项目集2.4频繁项目集2.5支持度2.6置信度2.7提升度2.8强关联规则2.9关联规则的分类3.Apriori算法3.1Apriori算法的Python实现3.2基于mlxtend库的Apriori算法的Python实现1.关联分析关联规则分析（Association-rulesAnalysis）是数
时间序列预测之移动平均法预测模型皖山文武数据挖掘商务智能数据挖掘 python 时间序列移动平均
时间序列预测之移动平均法预测模型1.时间序列预测法概述1.1时间序列的基本特征1.2时间序列的分类1.3时间序列的影响因素分析2移动平均数预测模型2.1一次移动平均法2.2二次移动平均法2.3基于Python的移动平均法预测模型1.时间序列预测法概述时间序列，也称为时间数列、历史复数或动态数列。它是将某种统计的指标数值按照时间先后顺序排列所形成的数列。根据时间序列所反映出来的发展过程、方向和趋势，
人工智能混合编程实践：C++调用Python ONNX进行YOLOv8推理 FriendshipT 人工智能混合编程实践人工智能 c++python YOLO ONNX 目标检测
人工智能混合编程实践：C++调用PythonONNX进行YOLOv8推理前言相关介绍Python简介C++简介ONNX简介YOLOv8简介前提条件实验环境项目结构C++调用PythonONNX进行YOLOv8推理C++调用Python的相关dll代码framework.hpch.hcxx_pythonModule.hdllmain.cpppch.cppcxx_pythonModule.cppC++
PyQt有哪些主要组件？ 2301_78316786 python pyqt
这是一个非常强大的跨平台GUI库，可以让你用Python语言创建美观且功能强大的桌面应用程序。让我们先来了解一下它的主要组件。首先，我们要介绍的是窗口。窗口是PyQt应用程序的基本元素，所有的GUI元素都放置在窗口中。你可以创建主窗口、模态对话框、无模式对话框和自定义窗口。下面是一个创建主窗口的例子：fromPyQt5.QtWidgetsimportQApplication,QMainWindow
基于Python的新闻网站内容爬取与分析：从数据获取到文本挖掘的完整指南 Python爬虫项目 2025年爬虫实战项目 python 开发语言人工智能爬虫 oracle 数据挖掘
引言在当今信息化社会，新闻成为我们获取世界信息的重要途径。通过新闻网站，用户能够快速了解时事热点、政治、经济、娱乐等各类信息。随着技术的发展，获取新闻数据已经变得越来越简单。我们可以利用Python编写爬虫程序，自动化地从新闻网站上抓取最新的新闻内容，并进行进一步的分析，如情感分析、关键词提取、热点话题分析等。本篇博客将为你详细介绍如何使用Python爬虫技术从新闻网站抓取最新新闻，并进行分析。我
正则表达式（1）林深的林正则表达式
正则表达式概述正则表达式，又称正规表示法、常规表示法（英语：RegularExpression，在代码中常简写为regex、regexp或RE），计算机科学的一个概念。正则表达式使用单个字符串来描述、匹配一系列符合某个句法规则的字符串。正则表达式类似于JSON,是一种通用的标准,被各种开发语言所支持,包括但不限于:Java,JavaScript,C,C++,C#,Python,SQL等等;因为在J
27.2:Python的Django框架优点和缺点是什么？小兔子平安 Python完整学习全解答 python django 后端
课程概述①易于学习和使用②高度可定制③强大的安全性④性能问题——举例分析（博客应用程序，包括博客文章、评论和标签等功能）——举例分析（电子商务网站，包括商品、购物车和订单等功能）课程总结课程概述Python作为一种强大而又易于学习的编程语言，已经被广泛应用于各种领域，尤其是Web开发领域。而Django框架作为PythonWeb开发的一个重要组成部分，具有一些独特的优点和缺点，需要开发人员在使用时
批量图片水印添加工具木木黄木木 python
批量图片水印添加工具这是一个可以批量给图片添加水印的Python程序。程序会根据原始图片的分辨率自动调整水印大小，确保水印效果美观。这里写目录标题批量图片水印添加工具功能特点运行说明注意事项下载地址功能特点支持批量处理多个图片自动根据原图尺寸调整水印大小支持PNG格式的透明水印水印位置固定在右下角支持JPG、JPEG、PNG、BMP等格式的图片运行说明准备文件：将需要添加水印的图片放入input文
PythonWeb——Django框架 Error_exception_worn Python基础数据库 Python django
框架介绍1.什么是框架?框架就是程序的骨架，主体结构，也是个半成品。2.框架的优缺点可重用、成熟,稳健、易扩展、易维护3.Python中常见的框架大包大揽Django被官方称之为完美主义者的Web框架。力求精简web.py和Tornado新生代微框架Flask和Bottle4.Web框架中的一些概念MVC（模型-视图-控制器）和MVT（模型-视图-模板）Django框架介绍Django是一个高级的
【报错】zipfile.BadZipFile: File is not a zip file Jude_lennon 报错 python
pythonpd.read_excel(excel_path,sheet_name='Sheet1',engine='openpyxl',header=None)出现报错zipfile.BadZipFile:Fileisnotazipfile原代码：data_list=[load_graph_data(file)forfileindata_directory.glob("*.xlsx")]经过de
Python实现链表反转：迭代与递归双解法详解达不溜先生 ୧⍢⃝୨ python 数据结构链表算法 leetcode
目录一、问题描述二、核心代码实现2.1迭代法实现迭代法中的prev初始值是None的原因：关键步骤图解2.2递归法实现递归法中要设置head.next=None的原因递归过程拆解三、方法对比与选择建议一、问题描述链表反转是数据结构中的基础算法问题，常见于面试和算法题库（如LeetCode#206）。要求将单向链表的节点顺序完全倒置二、核心代码实现2.1迭代法实现时间复杂度：O(n)空间复杂度：O(
Python机器学习实战：使用Flask构建机器学习API AI天才研究院 DeepSeek R1 &大数据AI人工智能大模型 AI大模型企业级应用开发实战大厂Offer收割机面试题简历程序员读书硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM Java Python 架构设计 Agent 程序员实现财富自由
Python机器学习实战：使用Flask构建机器学习API作者：禅与计算机程序设计艺术/ZenandtheArtofComputerProgramming1.背景介绍1.1问题的由来在数据科学和机器学习领域，模型训练和部署一直是重要的挑战。传统的机器学习项目往往采用独立的脚本或复杂的流程，难以实现模型的自动化、可视化和复现。为了解决这一问题，将机器学习模型封装成可访问的API变得越来越流行。Fla
Django框架的全面指南：从入门到高级步入烟尘 Python超入门指南全册 django sqlite 数据库
本文已收录于《Python超入门指南全册》本专栏专门针对零基础和需要进阶提升的同学所准备的一套完整教学，从基础到精通不断进阶深入，后续还有实战项目，轻松应对面试，专栏订阅地址：https://blog.csdn.net/mrdeam/category_12647587.html优点：订阅限时19.9付费专栏，私信博主还可进入全栈VIP答疑群，作者优先解答机会（代码指导、远程服务），群里大佬众多可以
Sijia_y的个人经历以及计算机行业发展 Sijia_y python
如今互联网发展的速度甚是快，以至于技术都在更新迭代。稍有不注意可能就会被淘汰甚至是替代。作为一名中专生，我的成绩也是很差。因为高中考不上的缘故，来到了江苏上学。计算机行业我了解的并不是很多，当时只是听说工资高，铁饭碗。我是一个很懒的人，也是很贪玩。并没有学习很高的兴趣。我接触编程语言，完全是因为我的朋友。因为他是自学C语言的，后面他参加比赛得奖了。我就觉得非常厉害。我就开始学习Python，学会一
为什么Python使用者远远大于perl perlpython
不认为两者的语法差异是造成如此局面的主要原因.perl的语法虽然比较特立独行,但也不是很难.总结如下原因:library(或者叫package)的使用如果是本语言原生的library,那没有问题.如果是需要调用外部函数/过程的package的话,那么就会有巨大的差异.python是预编译然后从pypi上下载python(pip)将package下载到本地然后解压后将package内容安装到不同的指
AI 问答系统实战：用 Python + Flask + LLM 打造你的智能对话机器人！ Leaton Lee 人工智能 python flask
开篇互动：你是否想拥属于自己的AI问答机器人？“你是否想过拥有一个可以随时为你解答问题、提供建议的AI助手？”随着大语言模型（LLM）的快速发展，打造一个智能问答系统已经成为可能！本文将手把手教你如何利用Python和Flask快速搭建一个属于自己的AI问答系统，并集成强大的语言模型（如OpenAI的GPT-3.5或HuggingFace的LLaMA）。无论是技术小白还是有一定经验的开发者，都能轻
入坑 Python 全能实战小白训练营，470 集干货 12.9G 大揭秘！七七知享 Python python 开发语言 pandas numpy matplotlib java php
家人们，我最近挖到了一个Python学习的宝藏——Python全能实战小白训练营。整整470集，内容超丰富，资源包有12.9G，完全就是为咱们这些想系统学习Python的小白量身定制的。接下来就给大家好好唠唠。随着课程深入，会涉及到Python的各种高级特性，比如面向对象编程、模块与包的使用。在讲面向对象编程时，老师通过打造一个小型游戏角色系统，把类、对象、继承、多态这些抽象概念诠释得生动形象，让
PyCharm 对接 DeepSeek 大模型的详细操作流程程之编 pycharm ide python
以下是使用PyCharm对接DeepSeek大模型的详细操作流程，基于Python开发环境。假设你已具备DeepSeekAPI的访问权限（需提前申请APIKey）：步骤1：PyCharm环境准备创建新项目打开PyCharm→NewProject→选择纯Python项目→指定项目路径→创建虚拟环境（建议选Virtualenv）。安装依赖库打开终端（Terminal）执行以下命令：pipinstall
量子计算如何颠覆能源优化领域：从理论到实践 Echo_Wish 人工智能前沿技术量子计算能源
量子计算如何颠覆能源优化领域：从理论到实践大家好，我是Echo_Wish，一个热爱探索前沿技术的人工智能与Python领域的技术分享者。今天，我们将深入探讨一个激动人心的话题——量子计算在能源优化中的应用。这不仅是科技领域的全新趋势，也可能为全人类的能源利用效率带来革命性突破。从理论模型到实际应用，量子计算已经在一些能源相关领域崭露头角，例如电网优化、可再生能源分配和物流节能规划。以下，让我们一步
Kibana 单机与集群部署教程闲人编程大数据集群部署教程大数据集群单机部署 Kibana 日志分析数据可视化
目录Kibana单机与集群部署教程第一部分：Kibana概述第二部分：Kibana单机部署教程1.安装Kibana1.1安装依赖项1.2下载和安装Kibana1.3启动Kibana2.单机案例代码实现（Python）3.常见问题及解决方法3.1无法启动Kibana服务3.2Kibana无法连接到Elasticsearch第三部分：Kibana集群部署教程1.配置集群节点1.1配置Elasticse
INCA二次开发GUI实例化智海行舟 python 个人开发
【摘要】本文基于ETASINCA二次开发实践，深入探讨如何构建完整的自动化测试GUI系统。通过Python语言结合COM接口技术，实现从软件架构设计到功能模块开发的完整闭环，为汽车电子领域工程师提供可复用的开发范式。一、INCA二次开发技术背景1.1行业应用需求在汽车电子开发领域，ETASINCA作为行业标准标定工具，其自动化测试需求日益增长。传统的手动操作模式存在以下痛点：重复性操作耗时严重（单
如何通过API用Python获取北向资金流向数据？量化问财量化软件 QMT 量化交易 Python 量化炒股 PTrade QMT 量化交易量化软件 deepseek
推荐阅读：《【最全攻略】免费的量化软件有哪些？券商的交易接口怎么获取？》如何通过API用Python获取北向资金流向数据？北向资金指的是通过沪港通和深港通渠道，从香港市场流入A股市场的资金。对于投资者来说，了解北向资金流向对于把握市场趋势和投资决策具有重要意义。本文将介绍如何通过API用Python获取北向资金流向数据。理解北向资金流向数据北向资金流向数据主要包括以下几个方面：资金流入量：指通过沪
go执行java -jar 完成DSA私钥解析并签名 DavidSoCool java jar golang
起因，最近使用go对接百度联盟api需要使用到DSA私钥完成签名过程，在百度提供的代码示例里面没有go代码的支持，示例中仅有php、python2和3、java的代码，网上找了半天发现go中对DSA私钥解析支持不友好，然后决定使用在java中完成签名计算过程，生成可执行jar后由外部传入参数获取签名数据。百度联盟api文档说明：1）权限开通后，登录百度联盟媒体平台（union.baidu.com）
【30天玩转python】项目实战：从零开始开发一个Python项目爱技术的小伙子 30天玩转python linux 运维服务器
项目实战：从零开始开发一个Python项目在学习Python的过程中，开发一个完整的项目是非常重要的实战练习。它不仅能够帮助你巩固所学的知识，还能提高实际编程能力。本文将带领你从零开始开发一个Python项目，介绍从项目规划、环境搭建、代码实现到项目发布的完整过程。我们将以一个简单的“任务管理系统”为例，逐步讲解如何构建、测试和优化这个项目。1.项目规划1.1项目简介我们将开发一个基于命令行的任务
Python从0到100（七十六）：计算机视觉-直方图和自适应直方图均衡化是Dream呀 python 计算机视觉开发语言
前言：零基础学Python：Python从0到100最新最全教程。想做这件事情很久了，这次我更新了自己所写过的所有博客，汇集成了Python从0到100，共一百节课，帮助大家一个月时间里从零基础到学习Python基础语法、Python爬虫、Web开发、计算机视觉、机器学习、神经网络以及人工智能相关知识，成为学习学习和学业的先行者！欢迎大家订阅专栏：零基础学Python：Python从0到100最新
python递推法_如何使用Python递归函数中的递推？热茶走 python递推法
我们大家都知道，一个函数可能存在多种不同的用法，很少是有函数只针对一个方式，那么基于一种函数，我们肯定要了解多个方式，今日针对递归函数里的递推内容给大家介绍哦~递归是什么？是指函数/过程/子程序在运行过程序中直接或间接调用自身而产生的重入现象。下面是个人理解：递归就是在函数内部调用自己的函数被称之为递归。实例：#直接调用自己：deffunc:print('fromfunc')funcFunc#间接
python递推式_Python 递推式构造列表(List Comprehensions) man One python递推式
你需要构造一个新的列表,列表中的元素是从一个已知列表中的元素计算而得到的.比如你要创建一个列表,里面的元素是另一个列表中的元素加23后得到的.使用递推式构造列表是最理想的方法:thenewlist=[x+23forxintheoldlist]如果你希望用一个列表中大于5的元素构造一个新的列表,使用递推式也是很方便的:thenewlist=[xforxintheoldlistifx>5]如果你希望将
Dash 简介 tankusa dash
Dash是一个基于Python的开源框架，专门用于构建数据分析和数据可视化的Web应用程序。Dash由Plotly团队开发，旨在帮助数据分析师、数据科学家和开发人员快速创建交互式的、基于数据的Web应用，而无需深入掌握前端技术（如HTML、CSS和JavaScript）。Dash的核心优势在于其简单易用性和强大的功能。通过Dash，用户可以使用纯Python代码来构建复杂的Web应用，而无需编写繁
视频下载插件：yt-dlp 小怪兽长大啦 python
Yt-dlp插件使用下载方法方法一：Python插件下载使用pip工具安装即可:pipinstallyt-dlp.Python已经配置过环境变量，下载yt-dlp时不需要配置。方法二：直接下载EXE可执行文件网上下载yt-dlp应用程序：https://github.com/yt-dlp/yt-dlp/releases配置环境变量。常用使用命令（配置好环境变量后，控制台下输入命令即可）直接下载视频
java Illegal overloaded getter method with ambiguous type for propert的解决 zwllxs java jdk
好久不来iteye,今天又来看看，哈哈,今天碰到在编码时，反射中会抛出 Illegal overloaded getter method with ambiguous type for propert这么个东东，从字面意思看，是反射在获取getter时迷惑了，然后回想起java在boolean值在生成getter时，分别有is和getter，也许我们的反射对象中就有is开头的方法迷惑了jdk，
IT人应当知道的10个行业小内幕 beijingjava 工作互联网
10. 虽然IT业的薪酬比其他很多行业要好，但有公司因此视你为其“佣人”。　　尽管IT人士的薪水没有互联网泡沫之前要好，但和其他行业人士比较，IT人的薪资还算好点。在接下的几十年中，科技在商业和社会发展中所占分量会一直增加，所以我们完全有理由相信，IT专业人才的需求量也不会减少。　　然而，正因为IT人士的薪水普遍较高，所以有些公司认为给了你这么多钱，就把你看成是公司的“佣人”，拥有你的支配
java 实现自定义链表 CrazyMizzz java 数据结构
1.链表结构链表是链式的结构 2.链表的组成链表是由头节点，中间节点和尾节点组成节点是由两个部分组成： 1.数据域 2.引用域 3.链表的实现 &nbs
web项目发布到服务器后图片过一会儿消失麦田的设计者 struts2 上传图片永久保存
作为一名学习了android和j2ee的程序员，我们必须要意识到，客服端和服务器端的交互是很有必要的，比如你用eclipse写了一个web工程，并且发布到了服务器（tomcat）上，这时你在webapps目录下看到了你发布的web工程，你可以打开电脑的浏览器输入http://localhost:8080/工程/路径访问里面的资源。但是，有时你会突然的发现之前用struts2上传的图片
CodeIgniter框架Cart类 name 不能设置中文的解决方法 IT独行者 CodeIgniter Cart 框架　
今天试用了一下CodeIgniter的Cart类时遇到了个小问题，发现当name的值为中文时，就写入不了session。在这里特别提醒一下。在CI手册里也有说明，如下： $data = array( 'id' => 'sku_123ABC', 'qty' => 1, '
linux回收站 _wy_ linux 回收站
今天一不小心在ubuntu下把一个文件移动到了回收站，我并不想删，手误了。我急忙到Nautilus下的回收站中准备恢复它，但是里面居然什么都没有。后来我发现这是由于我删文件的地方不在HOME所在的分区，而是在另一个独立的Linux分区下，这是我专门用于开发的分区。而我删除的东东在分区根目录下的.Trash-1000/file目录下，相关的删除信息（删除时间和文件所在
jquery回到页面顶端知了ing html jquery css
html代码： <h1 id="anchor">页面标题</h1> <div id="container">页面内容</div> <p><a href="#anchor" class="topLink">回到顶端</a><
B树、B-树、B+树、B*树矮蛋蛋 B树
原文地址： http://www.cnblogs.com/oldhorse/archive/2009/11/16/1604009.html B树即二叉搜索树： 1.所有非叶子结点至多拥有两个儿子（Left和Right）； &nb
数据库连接池 alafqq 数据库连接池
http://www.cnblogs.com/xdp-gacl/p/4002804.html @Anthor:孤傲苍狼数据库连接池用MySQLv5版本的数据库驱动没有问题，使用MySQLv6和Oracle的数据库驱动时候报如下错误： java.lang.ClassCastException: $Proxy0 cannot be cast to java.sql.Connec
java泛型百合不是茶 java泛型
泛型在Java SE 1.5之前，没有泛型的情况的下，通过对类型Object的引用来实现参数的“任意化”，任意化的缺点就是要实行强制转换，这种强制转换可能会带来不安全的隐患泛型的特点：消除强制转换确保类型安全向后兼容简单泛型的定义：泛型：就是在类中将其模糊化，在创建对象的时候再具体定义 class fan
javascript闭包[两个小测试例子] bijian1013 JavaScript JavaScript
一.程序一 <script> var name = "The Window"; var Object_a = { 　　name : "My Object", 　　getNameFunc : function(){ var that = this; 　　　　return function(){ 　　　　
探索JUnit4扩展：假设机制（Assumption） bijian1013 java Assumption JUnit 单元测试
一.假设机制（Assumption）概述理想情况下，写测试用例的开发人员可以明确的知道所有导致他们所写的测试用例不通过的地方，但是有的时候，这些导致测试用例不通过的地方并不是很容易的被发现，可能隐藏得很深，从而导致开发人员在写测试用例时很难预测到这些因素，而且往往这些因素并不是开发人员当初设计测试用例时真正目的，
【Gson四】范型POJO的反序列化 bit1129 POJO
在下面这个例子中，POJO(Data类)是一个范型类，在Tests中，指定范型类为PieceData，POJO初始化完成后，通过 String str = new Gson().toJson(data); 得到范型化的POJO序列化得到的JSON串，然后将这个JSON串反序列化为POJO import com.google.gson.Gson; import java.
【Spark八十五】Spark Streaming分析结果落地到MySQL bit1129 Stream
几点总结： 1. DStream.foreachRDD是一个Output Operation，类似于RDD的action，会触发Job的提交。DStream.foreachRDD是数据落地很常用的方法 2. 获取MySQL Connection的操作应该放在foreachRDD的参数（是一个RDD[T]=>Unit的函数类型)，这样，当foreachRDD方法在每个Worker上执行时，
NGINX + LUA实现复杂的控制 ronin47 nginx lua
安装lua_nginx_module 模块 lua_nginx_module 可以一步步的安装，也可以直接用淘宝的OpenResty Centos和debian的安装就简单了。。这里说下freebsd的安装： fetch http://www.lua.org/ftp/lua-5.1.4.tar.gz tar zxvf lua-5.1.4.tar.gz cd lua-5.1.4 ma
java-递归判断数组是否升序 bylijinnan java
public class IsAccendListRecursive { /*递归判断数组是否升序 * if a Integer array is ascending,return true * use recursion */ public static void main(String[] args){ IsAccendListRecursiv
Netty源码学习-DefaultChannelPipeline2 bylijinnan java netty
Netty3的API http://docs.jboss.org/netty/3.2/api/org/jboss/netty/channel/ChannelPipeline.html 里面提到ChannelPipeline的一个“pitfall”：如果ChannelPipeline只有一个handler（假设为handlerA）且希望用另一handler（假设为handlerB）来
Java工具之JPS chinrui java
JPS使用熟悉Linux的朋友们都知道，Linux下有一个常用的命令叫做ps（Process Status)，是用来查看Linux环境下进程信息的。同样的，在Java Virtual Machine里面也提供了类似的工具供广大Java开发人员使用，它就是jps（Java Process Status)，它可以用来
window.print分页打印 ctrain window
function init() { var tt = document.getElementById("tt"); var childNodes = tt.childNodes[0].childNodes; var level = 0; for (var i = 0; i < childNodes.length; i++) {
安装hadoop时执行jps命令Error occurred during initialization of VM daizj jdk hadoop jps
在安装hadoop时，执行JPS出现下面错误 [slave16][email protected]:/tmp/hsperfdata_hdfs# jps Error occurred during initialization of VM java.lang.Error: Properties init: Could not determine current working
PHP开发大型项目的一点经验 dcj3sjt126com PHP 重构
一、变量最好是把所有的变量存储在一个数组中，这样在程序的开发中可以带来很多的方便，特别是当程序很大的时候。变量的命名就当适合自己的习惯，不管是用拼音还是英语，至少应当有一定的意义，以便适合记忆。变量的命名尽量规范化，不要与PHP中的关键字相冲突。二、函数 PHP自带了很多函数，这给我们程序的编写带来了很多的方便。当然，在大型程序中我们往往自己要定义许多个函数，几十
android笔记之--向网络发送GET/POST请求参数 dcj3sjt126com android
使用GET方法发送请求 private static boolean sendGETRequest (String path, Map<String, String> params) throws Exception{ //发送地http://192.168.100.91:8080/videoServi
linux复习笔记之bash shell (3) 通配符 eksliang linux 通配符 linux通配符
转载请出自出处： http://eksliang.iteye.com/blog/2104387 在bash的操作环境中有一个非常有用的功能，那就是通配符。下面列出一些常用的通配符，如下表所示符号意义 * 万用字符，代表0个到无穷个任意字符 ? 万用字符，代表一定有一个任意字符 [] 代表一定有一个在中括号内的字符。例如：[abcd]代表一定有一个字符，可能是a、b、c
Android关于短信加密 gqdy365 android
关于Android短信加密功能，我初步了解的如下（只在Android应用层试验）： 1、因为Android有短信收发接口，可以调用接口完成短信收发；发送过程：APP（基于短信应用修改）接受用户输入号码、内容——>APP对短信内容加密——>调用短信发送方法Sm
asp.net在网站根目录下创建文件夹 hvt .net C#hovertree asp.net Web Forms
假设要在asp.net网站的根目录下建立文件夹hovertree,C#代码如下： string m_keleyiFolderName = Server.MapPath("/hovertree"); if (Directory.Exists(m_keleyiFolderName)) { //文件夹已经存在 return; } else { try { D
一个合格的程序员应该读过哪些书 justjavac 程序员书籍
编者按：2008年8月4日，StackOverflow 网友 Bert F 发帖提问：哪本最具影响力的书，是每个程序员都应该读的？ “如果能时光倒流，回到过去，作为一个开发人员，你可以告诉自己在职业生涯初期应该读一本，你会选择哪本书呢？我希望这个书单列表内容丰富，可以涵盖很多东西。” 很多程序员响应，他们在推荐时也写下自己的评语。以前就有国内网友介绍这个程序员书单，不过都是推荐数
单实例实践跑龙套_az 单例
1、内部类 public class Singleton { private static class SingletonHolder { public static Singleton singleton = new Singleton(); } public Singleton getRes
PO VO BEAN 理解 q137681467 VO DTO po
PO：全称是 persistant object持久对象最形象的理解就是一个PO就是数据库中的一条记录。好处是可以把一条记录作为一个对象处理，可以方便的转为其它对象。 BO：全称是 business object:业务对象主要作用是把业务逻辑封装为一个对象。这个对
战胜惰性，暗自努力金笛子努力
偶然看到一句很贴近生活的话：“别人都在你看不到的地方暗自努力，在你看得到的地方，他们也和你一样显得吊儿郎当，和你一样会抱怨，而只有你自己相信这些都是真的，最后也只有你一人继续不思进取。”很多句子总在不经意中就会戳中一部分人的软肋，我想我们每个人的周围总是有那么些表现得“吊儿郎当”的存在，是否你就真的相信他们如此不思进取，而开始放松了对自己的要求随波逐流呢？我有个朋友是搞技术的，平时嘻嘻哈哈，以
NDK/JNI二维数组多维数组传递 wenzongliang 二维数组 jni NDK
多维数组和对象数组一样处理，例如二维数组里的每个元素还是一个数组用jArray表示，直到数组变为一维的，且里面元素为基本类型，去获得一维数组指针。给大家提供个例子。已经测试通过。 Java_cn_wzl_FiveChessView_checkWin( JNIEnv* env,jobject thiz,jobjectArray qizidata) { jint i,j; int s