一个研究文本关键词提取的同学,最近在用自动编码器和word2vec以及pagerank三者结合时,想把中间产生的矩阵保存下来,结果直接报错TypeError: Mismatch between array dtype (‘float64’) and format specifier (‘%.18e %.18e’),然后另一个问题时把多维数组变成list的小数组,我后来搜了下才逐渐找到解决办法。
参考链接:
1、https://www.91r.net/ask/36552858.html
2、http://stackoverflow.com/questions/36552858/saving-numpy-array-to-csv-produces-typeerror-mismatch
3、http://blog.csdn.net/sunny2038/article/details/9002531
1、保存numpy数组时,如果是多维(>=2)的话直接保存就容易出错,有的是数据格式错误,有的是维度太大(>=3)没法直接保存,我遇到的是后者。
2、针对维度太大,比如三维,可以先降成二维再保存,然后再次加载时在转换成三维,好吧,是有点麻烦。或者是三维时,一个个读取二维的再保存,代码如下:
import numpy
example = numpy.array([[[i for i in range(0, 5)],[0 for j in range(0, 5)]] for k in range(0, 10)])
f = open('exampleData.csv', 'ab')
for i in example:
numpy.savetxt(f, i, fmt='%i',delimiter=',')
1、首先要知道多维数组和一维数组的很大区别:
>>> import numpy as np
>>> x=np.random.randn(3)
>>> x
array([-2.11348325, 1.0385824 , 0.63850123])
>>> x.shape
(3,)
再看看三维的:
>>> y=np.random.randn(3,2)
>>> y
array([[ 1.57254639, 1.25326786],
[-0.28991739, 0.93332943],
[ 0.89652907, -1.33680267]])
>>> y.shape
(3, 2)
>>>
那么当我想把一维或者多维变成list时,再看看区别是:
>>> list(x)
[-2.1134832519169735, 1.038582401341315, 0.6385012344173483]
>>> list(y)
[array([ 1.57254639, 1.25326786]), array([-0.28991739, 0.93332943]), array([ 0.89652907, -1.33680267])]
>>>
如果有同学想获得下面这种数据时,可以试试list(多维数组)。
[array([ 1.57254639, 1.25326786]), array([-0.28991739, 0.93332943]), array([ 0.89652907, -1.33680267])]
参考的链接是:
http://blog.csdn.net/lanchunhui/article/details/50127857