清风微泫

Numpy

系列文章目录

第一章 python数据挖掘基础环境安装和使用
第二章 Matplotlib

文章目录

系列文章目录
一、介绍
- ndarray
- 优势
- 属性
- 使用
二、ndarray的形状
三、ndarray的类型
四、创建数组的时候指定类型
五、基本操作
- 生成数组的方法
- - 生成0和1的数组
  - 从现有数组生成
  - 生成固定范围的数组
  - 生成随机数组
- 案例：随机生成8只股票2周的交易日涨幅数据
- - 数组的索引、切片
  - 形状修改
  - 类型修改
  - - ndarray序列化到本地
  - 数组的去重
六、ndarray运算
- 6.1 逻辑运算
- - 运算符
  - 通用判断函数
  - 三元运算符
- 6.2 统计运算
- - 统计指标函数
  - 返回最大值、最小值的位置
- 6.3 数组间运算
- - 数组与数的运算
  - 数组与数组的运算
  - - 广播机制
  - 矩阵运算
  - - 矩阵乘法运算
- 6.4 合并、分割
- 6.5 IO 操作与数据处理
- - Numpy读取数据

一、介绍

Numpy 高效的运算工具

num = numerical 数值化的
py = python

Numpy (Numerical Python) 是一个开源的 Python 科学计算库，用于快速处理任意维度的数组。

Numpy 支持常见的数组和矩阵操作。对于同样的数值计算任务，使用 Numpy 比直接使用 Python 要简洁的多。

Numpy 使用 ndarray 对象来处理多维数组，该对象是一个快速而灵活的大数据容器。

ndarray

n = 任意个
d = dimension 维度
array = 数组

NumPy 提供了一个 N 维数组类型 ndarray，它描述了相同类型的"items"的集合

优势

存储风格
- ndarray - 相同类型数据 - 通用性不强
- list - 不同类型 - 通用性很强
并行化运算
- ndarray 支持向量化运算
底层语言
- Python多线程其实并不是真正的多线程，是受到GIL的限制的，由于Numpy 底层使用 C 语言编写，内部解除了 GIL（全局解释器锁），当如果我们用多线程的时候，它也是支持多线程的，其对数组的操作速度不受 Python 解释器的限制，效率远高于纯 Python 代码。

属性

属性名字	属性解释
ndarray.`shape`	数组维度的元组, `形状`
ndarray.ndim	数组维数, 维度
ndarray.size	数组中的元素数量
ndarray.itemsize	一个数组元素的长度（字节）
ndarray.`dtype`	数组元素的`类型`

在创建 ndarray 的时候，如果没有指定类型，默认：整数 int64/int32 浮点数 float64/float32

使用

import numpy as np
score = np.array([[80, 89, 86, 67, 79],
[78, 97, 89, 67, 81],
[90, 94, 78, 67, 74],
[91, 91, 90, 67, 69],
[76, 87, 75, 67, 86],
[70, 79, 84, 67, 84],
[94, 92, 93, 67, 64],
[86, 85, 83, 67, 80]])
print(type(score)) # 
print(score.shape) # (8, 5)
print(score.dtype) # int32

二、ndarray的形状

a = np.array([[1,2,3],[4,5,6]])
b = np.array([1,2,3,4])
c = np.array([[[1,2,3],[4,5,6]],[[1,2,3],[4,5,6]]])

a # 形状 (2,3) 2行3列   二维数组
b # (4,) 一维数组
c # (2,2,3) 三维数组

ndarray.shape，返回一个元组，里面几个数字代表几个维度

三、ndarray的类型

type(a.dtype)

# 结果 numpy.dtypes.Int32DType

dtype是numpy.dtype类型，先看看对于数组来说都有哪些类型

名称	描述	简写
np.bool	用一个字节存储的布尔类型 (True或False)	‘b’
np.int8	一个字节大小，-128 至127	‘i’
np.int16	整数，-32768至32767	‘i2’
`np.int32`	整数，-2 31次方至 2 31次方 -1	‘i4’
`np.int64`	整数，-2 63次方至 2 63次方 -1	‘i8’
`np.uint8`	无符号整数，0至255	‘u’
np.uint16	无符号整数，0至65535	‘u2’
np.uint32	无符号整数，0至2 ** 32 -1	‘u4’
np.uint64	无符号整数，0至2 ** 64 -1	‘u8’
np.float16	半精度浮点数: 16位，正负号1位，指数5位，精度10位	‘f2’
`np.float32`	单精度浮点数: 32位，正负号1位，指数8位，精度23位	‘f4’
`np.float64`	双精度浮点数: 64位，正负号1位，指数11位，精度52位	‘f8’
np.complex64	复数，分别用两个32位浮点数表示实部和虚部	‘c8’
np.complex128	复数，分别用两个64位浮点数表示实部和虚部	‘c16’
np.object_	python对象	‘O’
np.string_	字符串	‘S’
np.unicode_	unicode类型	‘U’

我的电脑整数默认是int32，浮点型默认是float64

四、创建数组的时候指定类型

a = np.array([[1,2,3],[4,5,6]], dtype=np.float64)
a.dtype

arr = np.array(["qingfeng", "yun", "yijing"], dtype=np.string_)# 不常用
arr

若不指定类型，按默认

Numpy是一个高效的运算工具，在处理字符串的时候，Numpy并不是十分的具有优势

五、基本操作

ndarray.方法()
numpy.函数名()
- numpy.array()

生成数组的方法

生成0和1的数组

empty(shape[, dtype, order]) empty_like(a[, dtype, order, subok])
eye(N[, M, k, dtype, order])
identity(n[, dtype])
ones(shape[, dtype, order])
ones_like(a[, dtype, order, subok])
zeros(shape[, dtype, order]) zeros_like(a[, dtype, order, subok])
full(shape, fill_value[, dtype, order])
full_like(a, fill_value[, dtype, order, subok])

记两个就好了

import numpy as np
np.zeros(shape=(3,4),dtype="float32")
np.ones(shape=[2,3],dtype=np.int32)

我们想要指定形状shape既可以是元组()又可以是列表[ ]

从现有数组生成

array(object[, dtype, copy, order, subok, ndmin])深拷贝
asarray(a[,dtype, order])浅拷贝
asanyarray(a[, dtype, order]) ascontiguousarray(a[, dtype])
asmatrix(data[, dtype])
copy(a[, order])深拷贝

a = np.array([[1,2,3],[4,5,6]])
#  从现有的数据当中创建
a1 = np.array(a)
#  相当于索引的形式，并没有真正的创建一个新的
a2 = np.asarray(a)

a3 = np.copy(a)

看起来是没有什么变化，但实际上我们可以去修改原始现有的数组。

a[1,2] # 找到第二行第三列的数据
a[1,2] = 66666666 # 修改第二行第三列的数据

修改数据后，得出结论：（他们的不同点）
np.array() 、 np.copy() 是深拷贝
np.asarray() 是浅拷贝

生成固定范围的数组

np.linspace(start,stop,num,endpoint,retstep,dtype)
生成等间隔的序列（左闭右闭区间）

start 序列的起始值
stop 序列的终止值
如果endpoint为true，该值包含于序列中
num 要生成的等间隔样例数量，默认为50
endpoint 序列中是否包含stop值，默认为ture
retstep 如果为true，返回样例,
以及连续数字之间的步长
dtype输出ndarray的数据类型

np.linspace(-1,1,1000)
# 生成-1到1之间 等距离 的生成一千个元素
#  [-1,...,1] 左闭右闭区间

np.arange( a, b, c)
[a,b) 左闭右开区间，c是步长
- 跟 range() 相似
  range(a,b,c) [a,b) 左闭右开区间，c是步长
np.logspace(start, stop, num=50,endpoint=True, base=10.0, dtype=None)
- 对数等比数列
- start=开始值，stop=结束值，num=元素个数，base=指定对数的底, endpoint=是否包含结束值
- https://numpy.org/devdocs/reference/generated/numpy.logspace.html#numpy.logspace

生成随机数组

np.random模块
- 均匀分布
  - np.random.rand(d0, d1, …, dn)
    返回 [ 0.0, 1.0)内的一组均匀分布的数。
  - np.random.uniform(low=0.0, high=1.0, size=None)
    功能:从一个均匀分布 [ low,high) 中随机采样，注意定义域是左闭右开，即包含low，不包含high。
    参数介绍:
    low: 采样下界，float类型，默认值为0;
    high: 采样上界，float类型，默认值为1;
    size: 输出样本数目，为int或元组(tuple)类型，例如，size=(m,n,k), 则输出mnk个样本，缺省时输出1个值。
    返回值: ndarray类型，其形状和参数size中描述一致。
  - np.random.randint(low, high=None, size=None, dtype=‘I’)
    从一个均匀分布中随机采样，生成一个整数或N维整数数组，取数范围: 若high不为None时, 取 [low,high)之间随机整数，否则取值[0,low)之间随机整数。

均匀分布(Uniform Distribution) 是概率统计中的重要分布之一。顾名思义，均匀，表示可能性相等的含义。均匀分布在自然情况下极为罕见，而人工栽培的有一定株行距的植物群落即是均匀分布。

data = np.random.uniform(low=-1, high=1.0, size=100000)
data

import matplotlib.pyplot as plt
# 1. 创建画布
plt.figure(figsize=(20,8),dpi=80)

# 2. 绘制直方图
plt.hist(data,1000)# 1000组
# 3. 显示图像
plt.show()

第一行代码 np.random.uniform(low, high=, size=100000) 的size参数设的更大这个图会更加平。

正态分布
- np.random.randn(d0, d1, …, dn)
  功能: 从标准正态分布中返回一个或多个样本值
- np.random.normal(loc=0.0, scale=1.0, size=None)
  loc: float
  此概率分布的均值(对应着整个分布的中心centre)
  scale: float
  此概率分布的标准差(对应于分布的宽度，scale越大越矮胖，scale越小，越瘦高)
  size: int or tuple of ints
  输出的shape，默认为None，只输出一个值
np.random.standard_normal(size=None)
返回指定形状的标准正态分布的数组。

import numpy as np
# 生成正态分布的一组数，loc：均值；scale：标准差
data2 = np.random.normal(loc=1.75, scale=0.1, size=1000000)
import matplotlib.pyplot as plt
# 1. 创建画布
plt.figure(figsize=(20,8),dpi=80)

# 2. 绘制直方图
plt.hist(data2,1000)# 1000组
# 3. 显示图像
plt.show()

补充：正态分布 (理解)
正态分布是一种概率分布。正态分布是具有两个参数μ和σ的连续型随机变量的分布，第一参数μ是服从正态分布的随机变量的均值，第二个参数σ是此随机变量的标准差，所以正态分布记作N(μ，σ)。σ平方是方差

生活、生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。

正态分布特点
μ决定了其位置，其标准差σ。决定了分布的幅度（或者波动程度、集中程度、稳定性）。当 μ=0, σ=1时的正态分布是标准正态分布。

方差
在概率论和统计学中衡量一组数据离散程度的度量

其中M为平均值，n为数据总个数，S为标准差，S^2可以理解一个整体为方差。

方差、标准差越小，证明这个稳定性越好；而方差、标准差越大，波动程度越大或者稳定性越差

案例：随机生成8只股票2周的交易日涨幅数据

8只股票，两周(10天) 的涨跌幅数据，如何获取?
- 两周的交易日数量为: 2X5=10
- 随机生成涨跌幅在某个正态分布内，比如均值0，方差1

import numpy as np
stock_change = np.random.normal(loc=0, scale=1, size=(8,10))# 8只股票，两周10天交易日
stock_change

返回结果：

array([[-0.36667531, -1.13903035,  0.4784379 ,  1.53073633,  0.91670121,
        -0.10350913,  1.99079752, -0.14177123, -0.96660077,  0.81775223],
       [-1.71483356, -0.75371119, -0.46216504, -0.0300214 , -0.08352358,
         0.07012395, -0.32508192, -0.95563982, -0.67952454, -2.34651391],
       [ 0.0483106 ,  0.49960887, -0.51479725, -0.11741516, -0.56064551,
        -1.10703553, -0.36689492, -0.45247859,  0.36211534, -0.01616913],
       [-0.86345178,  0.50887156,  1.54648113, -0.78605471,  0.23232971,
         0.0196267 , -0.63385226, -0.61201315, -1.31778512, -0.74808621],
       [-0.93646108,  1.02844702,  0.70762638, -1.10396096, -0.14237001,
         1.55326396, -0.07842413, -1.49910403, -1.01194549,  1.31681139],
       [ 1.89151096,  0.12276531,  0.98818101,  2.27713536, -0.41012269,
         2.0600995 ,  0.76081549,  1.32616142,  1.01333746, -1.0480584 ],
       [ 0.37474226, -1.12586255, -0.23056892,  0.41170971,  0.06305395,
        -1.11060202, -0.41773649,  1.19974127,  0.67841274, -0.36691069],
       [-2.1010863 ,  1.05177172, -1.72547563, -0.27451417,  1.28503123,
         0.24951152, -1.14881235,  1.86966196, -0.16858585, -0.60438892]])

数组的索引、切片

获取第一只股票的前3个交易日的涨跌幅数据

二维数组

stock_change[0,:3]
或者stock_change[0,0:3]

返回结果：

array([-0.36667531, -1.13903035,  0.4784379 ])

三维数组

形状修改

需求:让刚才的股票行、列数据反过来，进行一个反转

ndarray.reshape(shape)
ndarray.reshape((a,b))
只是对数据进行重新分割，排列顺序没有改变，只是修改了形状
返回新的ndarray，原始数据没有改变
- ndarray.reshape( (-1,b) )
  自动计算的功能，如果我们只想指定生成4列的数组，剩下的我就不想自己计算了，就把另一个位置写成-1
ndarray.resize(shape)
只是对数据进行重新分割，排列顺序没有改变，只是修改了形状（与reshape一样，唯一的不同是resize会修改原数据）
没有返回值，对原始的ndarray进行了修改
ndarray.T
数组的转置，行变成列，列变成行
原始数据没有改变

类型修改

ndarray.astype(type)

import numpy as np
stock_change = np.random.normal(loc=0, scale=1, size=(8,10))

stock_change

stock_change.dtype

stock_change.astype("int64")

ndarray序列化到本地

ndarray.tostring([order]) 或者 ndarray.tobytes([order]) Construct Python bytes containing the raw data bytes in the array.

就需要先将他写成byte类型，ndarray.tostring() 现在已经被弃用了，现在用ndarray.tobytes()

如果遇到：

IOPub data rate exceeded.
	The notebook server will temporarily stop sending output
	to the client in order to avoid crashing it.
	To change this limit, set the config variable
	`--NotebookApp.iopub_data_rate_limit'.

这个问题是在jupyer当中对输出的字节数有限制，需要去修改配置文件

创建配置文件

jupyter notebook --generate-config
vi ~/.jupyter/jupyter_notebook_config.py

取消注释，多增加

## (bytes/sec) Maximum rate at which messages can be sent on iopub before they
# are limited.
c.NotebookApp.iopub_data_rate_limit = 10000000

但是不建议这样去修改，jupyter输出太大会崩溃

数组的去重

ndarray.unique

temp = np.array([[1, 2, 3, 4,5],[3, 4, 5, 6,5]])
np.unique(temp)

结果 :

array([1, 2, 3, 4, 5, 6])

如果想要用set()
可以先把这个数组变成一维数组 ndarray.flatten()
temp.flatten()
set(temp.flatten())

六、ndarray运算

6.1 逻辑运算

运算符

import numpy as np
stock_change = np.random.normal(loc=0, scale=1, size=(8,10))
stock_change

# 逻辑判断, 如果涨跌幅大于0.5就标记为True 否则为False
stock_change > 0.5

stock_change[stock_change > 0.5] = 1.1 # 布尔索引
stock_change

布尔索引

通用判断函数

np.all(一组布尔值)
只要有一个false就返回false，只有全部是true才返回 true

# 判断stock_change[0:2, 0:5]是否全是上涨的
np.all(stock_change[0:2, 0:5] > 0)

np.any(一组布尔值)
只要有一个true就返回true，只有全部是false才返回 false

# 判断前5只股票这段期间是否有上涨的
np.any(stock_change[:5, :] > 0)

三元运算符

np.where(布尔值，True的位置的值，False的位置的值)

import numpy as np
stock_change = np.random.normal(loc=0, scale=1, size=(8,10))# 8只股票，两周10天交易日
# 判断前四个股票前四天的涨跌幅 大于0的置为1，否则为0
temp = stock_change[:4, :4]

temp
#  返回结果：array([[-0.39816959, -0.60027098, -0.8698318 ,  0.05142684],
#       [-0.88684009,  1.03198298,  0.03543764, -1.2045695 ],
#       [ 0.56317106, -0.28580609, -0.13242459,  0.79477531],
#       [-1.36364381, -1.42141649, -3.78067491, -0.32461608]])
       
np.where(temp > 0, 1, 0)
#返回结果：array([[0, 0, 0, 1],
#       [0, 1, 1, 0],
#       [1, 0, 0, 1],
#       [0, 0, 0, 0]])

temp > 0
#返回结果：array([[False, False, False,  True],
#       [False,  True,  True, False],
#       [ True, False, False,  True],
#       [False, False, False, False]])

# 一个效果
np.where([[False, False, False,  True],
       [False,  True,  True, False],
       [ True, False, False,  True],
       [False, False, False, False]], 1, 0)
#返回结果：array([[0, 0, 0, 1],
#       [0, 1, 1, 0],
#       [1, 0, 0, 1],
#       [0, 0, 0, 0]])

复合逻辑需要结合np.logical_and和np.logical_or使用

# 大于0.5且小于1
np.where(np.logical_and(temp > 0.5, temp < 1), 1, 0)
# 大于0.5或小于-0.5
np.where(np.logical_or(temp > 0.5, temp < -0.5), 11, 3)

6.2 统计运算

统计指标函数

min（最小值）, max（最大值）, mean(平均值), median(中位数),var(方差), std(标准差)

股票涨跌幅统计运算

进行统计的时候，axis 轴的取值并不一定，Numpy中不同的API轴的值都不一样，在这里，axis 0代表列，axis 1代表行 去进行统计

stock_change = np.random.normal(loc=0, scale=1, size=(8,10))# 8只股票，两周10天交易日
temp = stock_change[:4, :4]

temp.max(axis=0)
np.max(temp, axis=1)

技巧：temp 的形状是（4行,4列），(4,4) 元组索引是 0 、1 ，其中索引 -1 和 1是一样的。
所以 np.max(temp, axis=1)和np.max(temp, axis=-1) 是一个效果

返回最大值、最小值的位置

np.argmax(tem,axis=)
np.argmin(tem,axis=)

axis 0代表列，axis 1代表行

如果需要统计出哪一只股票在某个交易日的涨幅最大或者最小?

np.argmax(temp, axis=1)

6.3 数组间运算

数组与数的运算

import numpy as np
arr = np.array([[1, 2, 3, 2, 1, 4], [5, 6, 1, 2, 3, 1]])

arr / 10

返回结果：

array([[0.1, 0.2, 0.3, 0.2, 0.1, 0.4],
       [0.5, 0.6, 0.1, 0.2, 0.3, 0.1]])

数组与数组的运算

广播机制

执行 broadcast 的前提在于，两个 nadarray 执行的是 element-wise 的运算，Broadcast 机制的功能是为了方便不同形状的 ndarray(numpy 库的核心数据结构)进行数学运算。

当操作两个数组时，numpy 会逐个比较它们的 shape(构成的元组 tuple)，只有在下述情况下，两个数组才能够进行数组与数组的运算。

维度相等
shape（其中相对应的一个地方为 1）

简单点就是：两个数组的同维度元素数量，要么相等要么其中一个为1

例如：这些都是可以运算的。 Result 是运算结果的形状，最终的每个维度都是取最大的。

Image (3d array): 256 x 256 x 3			第一个数组
Scale (1d array):             3			第二个数组
Result(3d array): 256 x 256 x 3

这里第一个数组是三维数组，这个三维数组的形状是（256 , 256 , 3 ）。第二个是一维数组，有三个元素。形状从右往左依次排开，可以这么理解，因为最后维度是3，想象成三列，Scale 里面的每一个元素与Image的每一列进行运算。

形状从右往左依次排开，每个对应的地方要么相等要么是1，不满足就不能运算。

Result (4d array) ： 9 8(1和8比较) 7(7和1比较) 5(1和5比较)

如果刚刚好全都是4，那么就按照顺序一一对应去计算就行了，如果是1的话，它就可以将这一份分别去跟别人的多份去进行计算，如果是2或者其他的话，那么它就没办法这样计算。

下面是不能运算的

维度要么相等要么为1

思考：下面两个ndarray是否能够进行运算?

arr1 = np.array([[1,2,3,2,1,4],[5,6,1,2,3,1]])
arr2 = np.array([[1],[3]])

维度要么相等要么为1，所以 arr1 可以和 arr2 进行运算

我是这么理解的，维度如果是1的话，可以把他当做一个数，数组与数的运算，单个数分别与数组中的数进行运算

矩阵运算

英文 matrix，和 array 的区别是矩阵必须是 2 维的 (二维数组)，但是 array 可以是多维的。

矩阵存储在计算机当中是二维数组的，但是二维数组不一定是矩阵，矩阵和二维数组的区别？

两种方法存储矩阵
1）ndarray 二维数组

矩阵乘法
- np.matmul
- 扩展： ndarray @ ndarray 也能实现相同的效果，了解即可

2）matrix 数据结构

np.mat() 将数组转换成矩阵类型, 返回值是matrix
矩阵乘法
- np.dot
- matrix * matrix

下面是学生成绩数据 [左边平时成绩，右边期末成绩]
(8,2) 8行2列

import numpy as np
# ndarray  存储矩阵  [左边平时成绩，右边期末成绩]
data = np.array([[80,86],
                [80,82],
                [85,78],
                [90,90],
                [86,82],
                [82,90],
                [78,80],
                [92,94]])

# matrix  存储矩阵
data_mat = np.mat([[80,86],
                [80,82],
                [85,78],
                [90,90],
                [86,82],
                [82,90],
                [78,80],
                [92,94]])

矩阵乘法运算

矩阵乘法的两个关键:

形状改变
运算规则

形状改变：（M 行,N 列）x (N 行,L 列) = (M 行,L 列)

运算规则：

要想最终能进行矩阵运算，所以第二个是 (2, ?) 2行随便几列都可以，因为我们只想要一个成绩, 所以是一列。

（8,2）x (2,1) = (8,1)

import numpy as np
# ndarray  存储矩阵  [左边平时成绩，右边期末成绩]
data = np.array([[80,86],
                [80,82],
                [85,78],
                [90,90],
                [86,82],
                [82,90],
                [78,80],
                [92,94]])

# matrix  存储矩阵
data_mat = np.mat([[80,86],
                [80,82],
                [85,78],
                [90,90],
                [86,82],
                [82,90],
                [78,80],
                [92,94]])
weights = np.array([[0.3],[0.7]])  # 平时成绩占30%，期末成绩占70%
weights_mat = np.mat([[0.3],[0.7]])

np.matmul(data,weights) # 总成绩=平时成绩*30%+期末成绩*70%
np.dot(data_mat,weights_mat)
data_mat * weights_mat # 也是一样的结果
data @ weights  # 也是一样的结果

ndarray @ ndarray 和 matrix * matrix 也可以达到相同的效果

矩阵和二维数组的区别：矩阵是用二维数组存储的，二维数组不一定是矩阵。

因为data 和 weights 都是ndarray 是普通的数组，data * weights 是数组间的运算，要看他是否满足广播机制，data 形状是（8,2）、weights形状是（2,1），他们维度不满足广播机制，不能进行运算，所以会报错。

6.4 合并、分割

合并

numpy.hstack 水平拼接

import numpy as np
a = np.array( (1,2,3) )
b = np.array( (2,3,4,5) )
np.hstack((a,b))
# 返回结果：array([1, 2, 3, 2, 3, 4, 5])
a = np.array( [ [1],[2],[3] ] )
b = np.array( [[2],[3],[4]] )
np.hstack((a,b))
# 返回结果：array([[1, 2],
#       [2, 3],
#       [3, 4]])

水平拼接可以这么理解:
1.

[1,2,3] [2,3,4,5]

[[1], [[2],
[2], [3],
[3]] [4]]

numpy.vstack 竖拼接

a = np.array( [1,2,3] )
b = np.array( [2,3,4] )
np.vstack((a,b))
# 返回结果：array([[1, 2, 3],
#			   [2, 3, 4]])
a = np.array( [ [1],[2],[3] ] )
b = np.array( [[2],[3],[4],[5]] )
np.vstack((a,b))
# 返回结果：array([[1],
#   			 [2],
#   			 [3],
#   			 [2],
#   			 [3],
#   			 [4],
#   			 [5]])

numpy.concatenate((a1,a2),axis=0) 水平|竖拼接

通过指定维度或者说轴（axis）的方式来指定到底是水平还是竖直拼接。
1 水平
0 竖直

a = np.array( [[1,2],[3,4]] )
b = np.array( [[5,6] ])
np.concatenate((a,b),axis=0)
# array([[1, 2],
#       [3, 4],
#       [5, 6]]) 

b.T # 数组转置，行变成列，列变成行  array([[5], [6]])
np.concatenate((a,b.T),axis=1)
# array([[1, 2, 5],
#       [3, 4, 6]])

分割

numpy.split

用到查文档

x = np.arange(9.0)
x # array([0., 1., 2., 3., 4., 5., 6., 7., 8.])
np.split(x,3)
x = np.arange(8.0)
x # array([0., 1., 2., 3., 4., 5., 6., 7.])
np.split(x,[3,5,6,10])

6.5 IO 操作与数据处理

Numpy读取数据

np.genfromtxt(路径, delimiter=分隔符)

新建一个test.csv文件，内容：

id, value1, value2,value3
1,123,1.4,23
2,110,,18
3,,2.1,19

data = np.genfromtxt("test.csv", delimiter=",") # 会有问题，读不出字符串

我们发现本来第一行字段应该读成字符串的，但是却读成了nan（Not a Number），我们把缺失值记作nan。

什么是缺失值？
什么时候numpy中会出现nan: 当我们读取本地的文件为float的时候，如果有缺失(或者为None)，就会出现nan。nan是float64类型, nan == nan 结果是False。

如何处理缺失值

两种思路：

直接删除含有缺失值的样本（那一行或者那一列），在pandas中介绍

替换/插补（补入平均值或中位数）

处理逻辑：

def fill_nan_by_column_mean(t):
    for i in range(t.shape[1]):
        # 计算nan的个数
        nan_num = np.count_nonzero(t[:,i][ t[:,i] != t[:,i] ])
        if nan_num > 0:
            now_col = t[:,i]
            # 求和
            now_col_not_nan = now_col[np.isnan(now_col) == False].sum()# 和/个数
            now_col_mean = now_col_not_nan / (t.shape[0] - nan_num)
            # 赋值给now_col
            now_col[np.isnan(now_col)] = now_col_mean
            # 赋值给t，即更新t的当前列
            t[:, i] = now_col
    return t


fill_nan_by_column_mean(data)

看了上面的处理过程，非常麻烦，别担心，之后我们会介绍强大的Pandas工具进行处理! 其实Pandas里面也是集成了Numpy。

你可能感兴趣的:(#,Python数据挖掘基础,numpy,python,数据挖掘,开发语言)

系统学习Python——并发模型和异步编程：进程、线程和GIL
分类目录：《系统学习Python》总目录在文章《并发模型和异步编程：基础知识》我们简单介绍了Python中的进程、线程和协程。本文就着重介绍Python中的进程、线程和GIL的关系。Python解释器的每个实例都是一个进程。使用multiprocessing或concurrent.futures库可以启动额外的Python进程。Python的subprocess库用于启动运行外部程序（不管使用何种
C++11堆操作深度解析：std::is_heap与std::is_heap_until原理解析与实践
文章目录堆结构基础与函数接口堆的核心性质函数签名与核心接口std::is_heapstd::is_heap_until实现原理深度剖析std::is_heap的验证逻辑std::is_heap_until的定位策略算法优化细节代码实践与案例分析基础用法演示自定义比较器实现最小堆检查边缘情况处理性能分析与实际应用时间复杂度对比典型应用场景与手动实现的对比注意事项与最佳实践迭代器要求比较器设计C++标
Flask框架入门：快速搭建轻量级Python网页应用「已注销」 python-AI python基础网站网络 python flask 后端
转载：Flask框架入门：快速搭建轻量级Python网页应用1.Flask基础Flask是一个使用Python编写的轻量级Web应用框架。它的设计目标是让Web开发变得快速简单，同时保持应用的灵活性。Flask依赖于两个外部库：Werkzeug和Jinja2，Werkzeug作为WSGI工具包处理Web服务的底层细节，Jinja2作为模板引擎渲染模板。安装Flask非常简单，可以使用pip安装命令
Python Flask 框架入门：快速搭建 Web 应用的秘诀 Python编程之道 Python人工智能与大数据 Python编程之道 python flask 前端 ai
PythonFlask框架入门：快速搭建Web应用的秘诀关键词Flask、微框架、路由系统、Jinja2模板、请求处理、WSGI、Web开发摘要想快速用Python搭建一个灵活的Web应用？Flask作为“微框架”代表，凭借轻量、可扩展的特性，成为初学者和小型项目的首选。本文将从Flask的核心概念出发，结合生活化比喻、代码示例和实战案例，带你一步步掌握：如何用Flask搭建第一个Web应用？路由
C++ 11 Lambda表达式和min_element()与max_element()的使用_c++ lamda函数 min_element((1) 2401_84976182 程序员 c语言 c++学习
既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上CC++开发知识点，真正体系化！由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新如果你需要这些资料，可以戳这里获取#include#include#includeusingnamespacestd;boolcmp(int
冒泡、选择、插入排序：三大基础排序算法深度解析（C语言实现） xienda 算法排序算法数据结构
在算法学习道路上，排序算法是每位程序员必须掌握的基石。本文将深入解析冒泡排序、选择排序和插入排序这三种基础排序算法，通过C语言代码实现和对比分析，帮助读者彻底理解它们的差异与应用场景。算法原理与代码实现1.冒泡排序（BubbleSort）工作原理：通过重复比较相邻元素，将较大元素逐步"冒泡"到数组末尾。voidbubbleSort(intarr[],intn){ for(inti=0;iarr[
python_虚拟环境阿_焦 python
第一、配置虚拟环境：virtualenv（1）pipvirtualenv>安装虚拟环境包（2）pipinstallvirtualenvwrapper-win>安装虚拟环境依赖包（3）c盘创建虚拟目录>C:\virtualenv>配置环境变量【了解一下】：（1）如何使用virtualenv创建虚拟环境a、cd到C:\virtualenv目录下：b、mkvirtualenvname>创建虚拟环境nam
PyTorch & TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）阿牛的药铺算法移植部署 pytorch tensorflow fpga开发
PyTorch&TensorFlow速成复习：从基础语法到模型部署实战（附FPGA移植衔接）引言：为什么算法移植工程师必须掌握框架基础？针对光学类产品算法FPGA移植岗位需求（如可见光/红外图像处理），深度学习框架是算法落地的"桥梁"——既要用PyTorch/TensorFlow验证算法可行性，又要将训练好的模型（如CNN、目标检测）转换为FPGA可部署的格式（ONNX、TFLite）。本文采用"
Python爱心光波
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
Python流星雨 Want595 python 开发语言
文章目录系列文章写在前面技术需求完整代码代码分析1.模块导入2.画布设置3.画笔设置4.颜色列表5.流星类(Star)6.流星对象创建7.主循环8.流星运动逻辑9.视觉效果10.总结写在后面系列文章序号直达链接表白系列1Python制作一个无法拒绝的表白界面2Python满屏飘字表白代码3Python无限弹窗满屏表白代码4Python李峋同款可写字版跳动的爱心5Python流星雨代码6Python
Python之七彩花朵代码实现 PlutoZuo Python python 开发语言
Python之七彩花朵代码实现文章目录Python之七彩花朵代码实现下面是一个简单的使用Python的七彩花朵。这个示例只是一个简单的版本，没有很多高级功能，但它可以作为一个起点，你可以在此基础上添加更多功能。importturtleastuimportrandomasraimportmathtu.setup(1.0,1.0)t=tu.Pen()t.ht()colors=['red','skybl
Python 脚本最佳实践2025版
前文可以直接把这篇文章喂给AI,可以放到AI角色设定里,也可以直接作为提示词.这样,你只管提需求,写脚本就让AI来.概述追求简洁和清晰：脚本应简单明了。使用函数(functions)、常量(constants)和适当的导入(import)实践来有逻辑地组织你的Python脚本。使用枚举(enumerations)和数据类(dataclasses)等数据结构高效管理脚本状态。通过命令行参数增强交互性
（Python基础篇）了解和使用分支结构 EternityArt 基础篇 python
目录一、引言二、Python分支结构的类型与语法（一）if语句（单分支）（二）if-else语句（双分支）（三）if-elif-else语句（多分支）三、分支结构的应用场景（一）提示用户输入用户名，然后再提示输入密码，如果用户名是“admin”并且密码是“88888”则提示正确，否则，如果用户名不是admin还提示用户用户名不存在,（二）提示用户输入用户名，然后再提示输入密码，如果用户名是“adm
（Python基础篇）循环结构 EternityArt 基础篇 python
一、什么是Python循环结构？循环结构是编程中重复执行代码块的机制。在Python中，循环允许你：1.迭代处理数据：遍历列表、字典、文件内容等。2.自动化重复任务：如批量处理数据、生成序列等。3.控制执行流程：根据条件决定是否继续或终止循环。二、为什么需要循环结构？假设你需要打印1到100的所有偶数：没有循环：需手动编写100行print()语句。print(0)print(2)print(4)
（Python基础篇）字典的操作 EternityArt 基础篇 python 开发语言
一、引言在Python编程中，字典（Dictionary）是一种极具灵活性的数据结构，它通过“键-值对”（key-valuepair）的形式存储数据，如同现实生活中的字典——通过“词语（键）”快速查找“释义（值）”。相较于列表和元组的有序索引访问，字典的优势在于基于键的快速查找，这使得它在处理需要频繁通过唯一标识获取数据的场景中极为高效。掌握字典的操作，能让我们更高效地组织和管理复杂数据，是Pyt
Python七彩花朵 Want595 python 开发语言
系列文章序号直达链接Tkinter1Python李峋同款可写字版跳动的爱心2Python跳动的双爱心3Python蓝色跳动的爱心4Python动漫烟花5Python粒子烟花Turtle1Python满屏飘字2Python蓝色流星雨3Python金色流星雨4Python漂浮爱心5Python爱心光波①6Python爱心光波②7Python满天繁星8Python五彩气球9Python白色飘雪10Pyt
基于架构的软件设计（Architecture-Based Software Design，ABSD）是一种以架构为核心的软件开发方法
ABSD方法与生命周期基于架构的软件设计（Architecture-BasedSoftwareDesign，ABSD）是一种以架构为核心的软件开发方法，强调在开发的各个阶段都要以架构为中心，确保系统的整体结构和质量属性得到有效管理。ABSD方法是一个自顶向下、递归细化的过程，软件系统的架构通过该方法得到细化，直到能产生软件构件和类。ABSD方法的三个基础功能的分解：使用基于模块的内聚和耦合技术，将
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（Spring Boot、MyBatis、Kafka、Redis、AI等）来旺 Java场景面试宝典 Java Spring Boot MyBatis Kafka Redis 微服务 AI
Java大厂面试故事：谢飞机的互联网音视频场景技术面试全纪录（SpringBoot、MyBatis、Kafka、Redis、AI等）互联网大厂技术面试不仅考察技术深度，更注重业务场景与系统设计能力。本篇以严肃面试官与“水货”程序员谢飞机的对话，带你体验音视频业务场景下的Java面试全过程，涵盖主流技术栈，并附详细答案解析，助你面试无忧。故事场景设定谢飞机是一名有趣但技术基础略显薄弱的程序员，这次应
用OpenCV标定相机内参应用示例（C++和Python）
下面是一个完整的使用OpenCV进行相机内参标定（CameraCalibration）的示例，包括C++和Python两个版本，基于棋盘格图案标定。一、目标：相机标定通过拍摄多张带有棋盘格图案的图像，估计相机的内参：相机矩阵（内参）K畸变系数distCoeffs可选外参（R,T）标定精度指标（如重投影误差）二、棋盘格参数设置（根据自己的棋盘格设置）：棋盘格角点数：9x6（内角点，9列×6行）；每个
Anaconda 详细下载与安装教程
Anaconda详细下载与安装教程1.简介Anaconda是一个用于科学计算的开源发行版，包含了Python和R的众多常用库。它还包括了conda包管理器，可以方便地安装、更新和管理各种软件包。2.下载Anaconda2.1访问官方网站首先，打开浏览器，访问Anaconda官方网站。2.2选择适合的版本在页面中，你会看到两个主要的下载选项：AnacondaIndividualEdition：适用于
python中 @注解及内置注解的使用方法总结以及完整示例慧一居士 Python python
在Python中，装饰器（Decorator）使用@符号实现，是一种修改函数/类行为的语法糖。它本质上是一个高阶函数，接受目标函数作为参数并返回包装后的函数。Python也提供了多个内置装饰器，如@property、@staticmethod、@classmethod等。一、核心概念装饰器本质：@decorator等价于func=decorator(func)执行时机：在函数/类定义时立即执行装饰
Python中的静态方法和类方法详解
在Python中，`@staticmethod`和`@classmethod`是两种装饰器，它们用于定义类中的方法，但是它们的行为和用途有所不同。###@staticmethod`@staticmethod`装饰器用于定义一个静态方法。静态方法不接收类或实例的引用作为第一个参数，因此它不能访问类的状态或实例的状态。静态方法可以看作是与类关联的普通函数，但它们可以通过类名直接调用。classMath
Python中类静态方法：@classmethod/@staticmethod详解和实战示例
在Python中，类方法(@classmethod)和静态方法(@staticmethod)是类作用域下的两种特殊方法。它们使用装饰器定义，并且与实例方法(deffunc(self))的行为有所不同。1.三种方法的对比概览方法类型是否访问实例(self)是否访问类(cls)典型用途实例方法✅是❌否访问对象属性类方法@classmethod❌否✅是创建类的替代构造器，访问类变量等静态方法@stati
Python多版本管理与pip升级全攻略：解决冲突与高效实践码界奇点 Python python pip 开发语言 python3.11 源代码管理虚拟现实依赖倒置原则
引言Python作为最流行的编程语言之一，其版本迭代速度与生态碎片化给开发者带来了巨大挑战。据统计，超过60%的Python开发者需要同时维护基于Python3.6+和Python2.7的项目。本文将系统解决以下核心痛点：如何安全地在同一台机器上管理多个Python版本pip依赖冲突的根治方案符合PEP标准的生产环境最佳实践第一部分：Python多版本管理核心方案1.1系统级多版本共存方案Wind
基于Python的健身数据分析工具的搭建流程day1 weixin_45677320 python 开发语言数据挖掘爬虫
基于Python的健身数据分析工具的搭建流程分数据挖掘、数据存储和数据分析三个步骤。本文主要介绍利用Python实现健身数据分析工具的数据挖掘部分。第一步：加载库加载本文需要的库，如下代码所示。若库未安装，请按照python如何安装各种库（保姆级教程）_python安装库-CSDN博客https://blog.csdn.net/aobulaien001/article/details/133298
利用技术分享提升个人影响力 AI天才研究院计算 AI人工智能与大数据 AI大模型企业级应用开发实战 java python javascript kotlin golang 架构人工智能大厂程序员硅基计算碳基计算认知计算生物计算深度学习神经网络大数据 AIGC AGI LLM 系统架构设计软件哲学 Agent 程序员实现财富自由
《利用技术分享提升个人影响力》关键词：技术分享、个人品牌、影响力、内容创作、互动反馈、持续成长摘要：本文将深入探讨技术分享在个人发展中的重要作用，通过详细分析技术分享的意义、平台选择、内容创作、互动反馈及个人影响力提升策略，帮助读者掌握利用技术分享提升个人影响力的实用方法。第一部分：引言与基础第1章：技术分享的意义与价值1.1.1技术分享的历史与发展技术分享作为一种知识传播的方式，其历史可以追溯到
RocketMQ 基础教程-应用篇-死信队列码炫课堂-码哥 rocketmq专题 rocketmq java
作者简介：大家好，我是smart哥，前中兴通讯、美团架构师，现某互联网公司CTO联系qq：184480602，加我进群，大家一起学习，一起进步，一起对抗互联网寒冬学习必须往深处挖，挖的越深，基础越扎实！阶段1、深入多线程阶段2、深入多线程设计模式阶段3、深入juc源码解析阶段4、深入jdk其余源码解析
ssrf漏洞复现 ξ流ぁ星ぷ132 安全
目录基础环境查看phpinfo发现线索探测端口+gopher协议基础环境这里发现一些基础协议呗过滤掉了。但是有个提示的info，于是先看看查看phpinfo发现线索发现这台主机的地址了，于是猜测这个网段应该还有其他主机，试了一下172.21.0.1:80172.21.0.3:80果然如下（0.1是陷阱就不浪费时间了，）探测端口+gopher协议然后对这个172.21.0.3这个主机探测端口发现63
seaborn又一个扩展heatmapz qq_21478261 #Python可视化 matplotlib
推荐阅读：Pythonmatplotlib保姆级教程嫌Matplotlib繁琐？试试Seaborn！
NGS测序基础梳理01-文库构建（Library Preparation） qq_21478261 #生物信息生物学
本文介绍Illumina测序平台文库构建（LibraryPreparation）步骤，文库结构。写作时间：2020.05。推荐阅读：10W字《Python可视化教程1.0》来了！一份由公众号「pythonic生物人」精心制作的PythonMatplotlib可视化系统教程，105页PDFhttps://mp.weixin.qq.com/s/QaSmucuVsS_DR-klfpE3-Q10W字《Rg
java工厂模式 3213213333332132 java 抽象工厂
工厂模式有 1、工厂方法 2、抽象工厂方法。下面我的实现是抽象工厂方法, 给所有具体的产品类定一个通用的接口。 package 工厂模式; /** * 航天飞行接口 * * @Description * @author FuJianyong * 2015-7-14下午02:42:05 */ public interface SpaceF
nginx频率限制+python测试 ronin47 nginx 频率 python
部分内容参考：http://www.abc3210.com/2013/web_04/82.shtml 首先说一下遇到这个问题是因为网站被攻击，阿里云报警，想到要限制一下访问频率，而不是限制ip（限制ip的方案稍后给出）。nginx连接资源被吃空返回状态码是502，添加本方案限制后返回599，与正常状态码区别开。步骤如下：
java线程和线程池的使用 dyy_gusi ThreadPool thread Runnable timer
java线程和线程池一、创建多线程的方式 java多线程很常见，如何使用多线程，如何创建线程，java中有两种方式，第一种是让自己的类实现Runnable接口，第二种是让自己的类继承Thread类。其实Thread类自己也是实现了Runnable接口。具体使用实例如下： 1、通过实现Runnable接口方式 1 2
Linux 171815164 linux
ubuntu kernel http://kernel.ubuntu.com/~kernel-ppa/mainline/v4.1.2-unstable/ 安卓sdk代理 mirrors.neusoft.edu.cn 80 输入法和jdk sudo apt-get install fcitx su
Tomcat JDBC Connection Pool g21121 Connection
Tomcat7 抛弃了以往的DBCP 采用了新的Tomcat Jdbc Pool 作为数据库连接组件，事实上DBCP已经被Hibernate 所抛弃，因为他存在很多问题，诸如：更新缓慢，bug较多，编译问题，代码复杂等等。 Tomcat Jdbc P
敲代码的一点想法永夜-极光 java 随笔感想
入门学习java编程已经半年了,一路敲代码下来,现在也才1w+行代码量,也就菜鸟水准吧,但是在整个学习过程中,我一直在想,为什么很多培训老师,网上的文章都是要我们背一些代码?比如学习Arraylist的时候,教师就让我们先参考源代码写一遍,然
jvm指令集程序员是怎么炼成的 jvm 指令集
转自：http://blog.csdn.net/hudashi/article/details/7062675#comments 将值推送至栈顶时 const ldc push load指令 const系列该系列命令主要负责把简单的数值类型送到栈顶。(从常量池或者局部变量push到栈顶时均使用) 0x02 &nbs
Oracle字符集的查看查询和Oracle字符集的设置修改 aijuans oracle
本文主要讨论以下几个部分：如何查看查询oracle字符集、修改设置字符集以及常见的oracle utf8字符集和oracle exp 字符集问题。一、什么是Oracle字符集 Oracle字符集是一个字节数据的解释的符号集合,有大小之分,有相互的包容关系。ORACLE 支持国家语言的体系结构允许你使用本地化语言来存储，处理，检索数据。它使数据库工具，错误消息，排序次序，日期，时间，货
png在Ie6下透明度处理方法 antonyup_2006 css 浏览器 Firebug IE
由于之前到深圳现场支撑上线，当时为了解决个控件下载，我机器上的IE8老报个错，不得以把ie8卸载掉，换个Ie6,问题解决了，今天出差回来，用ie6登入另一个正在开发的系统，遇到了Png图片的问题，当然升级到ie8(ie8自带的开发人员工具调试前端页面JS之类的还是比较方便的，和FireBug一样，呵呵)，这个问题就解决了，但稍微做了下这个问题的处理。我们知道PNG是图像文件存储格式，查询资
表查询常用命令高级查询方法(二) 百合不是茶 oracle 分页查询分组查询联合查询
----------------------------------------------------分组查询 group by having --平均工资和最高工资 select avg(sal)平均工资,max(sal) from emp ; --每个部门的平均工资和最高工资
uploadify3.1版本参数使用详解 bijian1013 JavaScript uploadify3.1
使用：绑定的界面元素<input id='gallery'type='file'/>$("#gallery").uploadify({设置参数，参数如下}); 设置的属性： id: jQuery(this).attr('id'),//绑定的input的ID langFile: 'http://ww
精通Oracle10编程SQL(17)使用ORACLE系统包 bijian1013 oracle 数据库 plsql
/* *使用ORACLE系统包 */ --1.DBMS_OUTPUT --ENABLE:用于激活过程PUT,PUT_LINE,NEW_LINE,GET_LINE和GET_LINES的调用 --语法：DBMS_OUTPUT.enable(buffer_size in integer default 20000); --DISABLE:用于禁止对过程PUT,PUT_LINE,NEW
【JVM一】JVM垃圾回收日志 bit1129 垃圾回收
将JVM垃圾回收的日志记录下来，对于分析垃圾回收的运行状态，进而调整内存分配(年轻代，老年代，永久代的内存分配)等是很有意义的。JVM与垃圾回收日志相关的参数包括： -XX:+PrintGC -XX:+PrintGCDetails -XX:+PrintGCTimeStamps -XX:+PrintGCDateStamps -Xloggc -XX:+PrintGC 通
Toast使用白糖_ toast
Android中的Toast是一种简易的消息提示框，toast提示框不能被用户点击，toast会根据用户设置的显示时间后自动消失。创建Toast 两个方法创建Toast makeText(Context context, int resId, int duration) 参数：context是toast显示在
angular.identity boyitech AngularJS AngularJS API
angular.identiy 描述: 返回它第一参数的函数. 此函数多用于函数是编程. 使用方法: angular.identity(value); 参数详解: Param Type Details value * to be returned. 返回值: 传入的value 实例代码: <!DOCTYPE HTML>
java-两整数相除，求循环节 bylijinnan java
import java.util.ArrayList; import java.util.List; public class CircleDigitsInDivision { /** * 题目：求循环节，若整除则返回NULL，否则返回char*指向循环节。先写思路。函数原型：char*get_circle_digits(unsigned k,unsigned j)
Java 日期周年 Chen.H java C++c C#
/** * java日期操作(月末、周末等的日期操作) * * @author * */ public class DateUtil { /** */ /** * 取得某天相加(减)後的那一天 * * @param date * @param num *
[高考与专业]欢迎广大高中毕业生加入自动控制与计算机应用专业 comsci 计算机
不知道现在的高校还设置这个宽口径专业没有,自动控制与计算机应用专业,我就是这个专业毕业的,这个专业的课程非常多,既要学习自动控制方面的课程,也要学习计算机专业的课程,对数学也要求比较高.....如果有这个专业,欢迎大家报考...毕业出来之后,就业的途径非常广..... 以后
分层查询（Hierarchical Queries） daizj oracle 递归查询层次查询
Hierarchical Queries If a table contains hierarchical data, then you can select rows in a hierarchical order using the hierarchical query clause: hierarchical_query_clause::= start with condi
数据迁移 daysinsun 数据迁移
最近公司在重构一个医疗系统，原来的系统是两个.Net系统，现需要重构到java中。数据库分别为SQL Server和Mysql，现需要将数据库统一为Hana数据库，发现了几个问题，但最后通过努力都解决了。 1、原本通过Hana的数据迁移工具把数据是可以迁移过去的，在MySQl里面的字段为TEXT类型的到Hana里面就存储不了了，最后不得不更改为clob。 2、在数据插入的时候有些字段特别长
C语言学习二进制的表示示例 dcj3sjt126com c basic
进制的表示示例 # include <stdio.h> int main(void) { int i = 0x32C; printf("i = %d\n", i); /* printf的用法 %d表示以十进制输出 %x或%X表示以十六进制的输出 %o表示以八进制输出 */ return 0; }
NsTimer 和 UITableViewCell 之间的控制 dcj3sjt126com ios
情况是这样的: 一个UITableView, 每个Cell的内容是我自定义的 viewA viewA上面有很多的动画, 我需要添加NSTimer来做动画, 由于TableView的复用机制, 我添加的动画会不断开启, 没有停止, 动画会执行越来越多. 解决办法: 在配置cell的时候开始动画, 然后在cell结束显示的时候停止动画查找cell结束显示的代理
MySql中case when then 的使用 fanxiaolong casewhenthenend
select "主键", "项目编号", "项目名称","项目创建时间", "项目状态","部门名称","创建人" union (select pp.id as "主键", pp.project_number as &
Ehcache（01）——简介、基本操作 234390216 cache ehcache 简介 CacheManager crud
Ehcache简介目录 1 CacheManager 1.1 构造方法构建 1.2 静态方法构建 2 Cache 2.1&
最容易懂的javascript闭包学习入门 jackyrong JavaScript
http://www.ruanyifeng.com/blog/2009/08/learning_javascript_closures.html 闭包（closure）是Javascript语言的一个难点，也是它的特色，很多高级应用都要依靠闭包实现。下面就是我的学习笔记，对于Javascript初学者应该是很有用的。一、变量的作用域要理解闭包，首先必须理解Javascript特殊
提升网站转化率的四步优化方案 php教程分享数据结构 PHP 数据挖掘 Google 活动
网站开发完成后,我们在进行网站优化最关键的问题就是如何提高整体的转化率，这也是营销策略里最最重要的方面之一，并且也是网站综合运营实例的结果。文中分享了四大优化策略：调查、研究、优化、评估，这四大策略可以很好地帮助用户设计出高效的优化方案。 PHP开发的网站优化一个网站最关键和棘手的是，如何提高整体的转化率，这是任何营销策略里最重要的方面之一，而提升网站转化率是网站综合运营实力的结果。今天，我就分
web开发里什么是HTML5的WebSocket？ naruto1990 Web html5 浏览器 socket
当前火起来的HTML5语言里面，很多学者们都还没有完全了解这语言的效果情况，我最喜欢的Web开发技术就是正迅速变得流行的 WebSocket API。WebSocket 提供了一个受欢迎的技术，以替代我们过去几年一直在用的Ajax技术。这个新的API提供了一个方法，从客户端使用简单的语法有效地推动消息到服务器。让我们看一看6个HTML5教程介绍里的 WebSocket API：它可用于客户端、服
Socket初步编程——简单实现群聊 Everyday都不同 socket 网络编程初步认识
初次接触到socket网络编程，也参考了网络上众前辈的文章。尝试自己也写了一下，记录下过程吧：服务端：（接收客户端消息并把它们打印出来） public class SocketServer { private List<Socket> socketList = new ArrayList<Socket>(); public s
面试：Hashtable与HashMap的区别（结合线程） toknowme
昨天去了某钱公司面试，面试过程中被问道 Hashtable与HashMap的区别？当时就是回答了一点，Hashtable是线程安全的，HashMap是线程不安全的，说白了，就是Hashtable是的同步的，HashMap不是同步的，需要额外的处理一下。今天就动手写了一个例子，直接看代码吧 package com.learn.lesson001; import java
MVC设计模式的总结 xp9802 设计模式 mvc 框架 IOC
随着Web应用的商业逻辑包含逐渐复杂的公式分析计算、决策支持等，使客户机越来越不堪重负，因此将系统的商业分离出来。单独形成一部分，这样三层结构产生了。其中‘层’是逻辑上的划分。三层体系结构是将整个系统划分为如图2.1所示的结构[3] （1）表现层（Presentation layer）：包含表示代码、用户交互GUI、数据验证。该层用于向客户端用户提供GUI交互，它允许用户