现在t-sne已经集成在sklearn里面了非常好用,下面是自己的一个降维可视化的例子。
所需要的文件 fdata 大致如下
12 23 3
23 45 6
4 5 7
6 23 5
ftarget大致如下
1
1
2
4
这样就可以使用了【其实就是要符合numpy loadtxt的数据格式】
#!/usr/bin/python
# encoding=utf-8
# -*- coding:utf-8 -*
# 切换工作路径
import os
import sys
os.chdir( os.path.split( os.path.realpath( sys.argv[0] ) )[0] )
import numpy
from numpy import *
import numpy as np
from sklearn.manifold import TSNE
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
import matplotlib.pyplot as plt
class chj_data(object):
def __init__(self,data,target):
self.data=data
self.target=target
def chj_load_file(fdata,ftarget):
data=numpy.loadtxt(fdata, dtype=float32)
target=numpy.loadtxt(ftarget, dtype=int32)
print(data.shape)
print(target.shape)
# pexit()
res=chj_data(data,target)
return res
fdata="data/3.txt"
ftarget="data/4.txt"
#iris = load_iris() # 使用sklearn自带的测试文件
iris = chj_load_file(fdata,ftarget)
#print(iris.data)
#print(iris.target)
#exit()
X_tsne = TSNE(n_components=2,learning_rate=100).fit_transform(iris.data)
#X_pca = PCA().fit_transform(iris.data)
print("finishe!")
plt.figure(figsize=(12, 6))
#plt.subplot(121)
plt.scatter(X_tsne[:, 0], X_tsne[:, 1], c=iris.target)
#plt.subplot(122)
#plt.scatter(X_pca[:, 0], X_pca[:, 1], c=iris.target)
plt.colorbar()
plt.show()
参考网址
http://blog.sina.com.cn/s/blog_92d2c5e10102w4si.html
http://scikit-learn.org/stable/modules/generated/sklearn.manifold.TSNE.html