diffuse(diffusionMap)
diffuse()所属R语言包:diffusionMap
Compute diffusion map coordinates from pair-wise distances.
图坐标计算扩散成对的距离。
译者:生物统计家园网 机器人LoveR
描述----------Description----------
Uses the pair-wise distance matrix for a data set to compute the diffusion map coefficients. Computes the Markov transition probability matrix, and its eigenvalues and left & right eigenvectors. Returns a 'dmap' object.
使用成对的距离矩阵为一个数据集来计算扩散映射系数。计算马尔可夫转移概率矩阵,其特征值和左,右特征向量。返回的“DMAP对象。
用法----------Usage----------
diffuse(D, eps.val = epsilonCompute(D), neigen = NULL, t = 0, maxdim = 50, delta=10^-5)
参数----------Arguments----------
参数:D
n-by-n pairwise distance matrix for a data set with n points, or alternatively output from the dist() function.
N-和-n成对的距离矩阵与n个点,或者输出的dist()函数的数据集。
参数:eps.val
epsilon parameter for the diffusion weight matrix, exp(-D$^2$/(eps.val)). Default is to use the epsilon corresponding to the median distance to the 0.01*n nearest neighbor
小量的扩散权重矩阵参数,exp(-D $ ^ 2元/(eps.val))。默认值是使用0.01 * n个最近邻中位数的距离对应的ε
参数:neigen
number of dimensions of final diffusion map representation. Default uses number of dimensions corresponding to a 95% drop-off in eigenvalue multiplier.
最终扩散图表示的维数。默认情况下使用的维数对应的特征值乘的95%落客。
参数:t
optional time-scale parameter in the diffusion map. The (recommended) default uses multiscale geometry.
可选的时间尺度参数的扩散图。 (推荐)默认情况下使用的多尺度几何。
参数:maxdim
the maximum number of diffusion map dimensions returned if 95% drop-off is not attained.
返回的最大数量的扩散图尺寸,如果没有达到95%的落客。
参数:delta
sparsity cut-off for the symmetric graph Laplacian. Default of 10^-5 is used. Higher value induces more sparsity in Laplacian (and faster computations)
稀疏截止的对称图形拉普拉斯算子。默认为10 ^ -5。价值较高的导致更多的稀疏拉普拉斯算子(和更快的计算)
Details
详细信息----------Details----------
Diffusion map is a powerful tool for data parametrization that exploits the natural geometry of a data set. Diffusion map uses local interactions between data points, propogated to larger scales, to construct a global representation of the data.
的数据参数化的数据集,利用自然的几何扩散图是一个功能强大的工具。扩散图使用本地数据点之间的相互作用,传播到更大的规模,构建一个全球的数据表示。
The parameter eps.val controls the degree of localness in the diffusion weight matrix. For most statisitical inference problems using diffusion map, results should be optimized over eps.val. Generally a good starting point is to pick eps.val as $2*$med.knn$^2$, where med.knn is the median distance to the kth nearest neighbor, and k is chosen 1-2% of n. The default uses 1% of n.
的的参数eps.val控制中的扩散程度的局部性权重矩阵。对于大多数计量引文推断问题扩散图,结果应超过eps.val优化。一般一个很好的起点是挑eps.val的为$ 2 * $ med.knn $ ^ 2 $,,在那里med.knn是位到第k个最近邻的距离,k是选择了1-2%的正。默认情况下使用1%的正。
Computation of the diffusion map coordinates requires singular value decomposition of the normalized graph Laplacian. This operation is optimized for speed by exploiting the sparseness of the graph Laplacian and by using ARPACK for fast matrix decomposition. Increasing the sparseness parameter, delta, will speed up the algorithm.
扩散图坐标需要计算的归一化的曲线图拉普拉斯算子的奇异值分解。此操作进行了速度优化,通过利用图的拉普拉斯算子的稀疏和使用ARPACK快速矩阵分解。增加的的稀疏参数,Delta,将加速算法。
值----------Value----------
The returned value is an object of 'class' 'dmap'.
返回的值是一个对象的“类”,“DMAP。
The function 'plot' is used to plot the diffusion coordinates in 1, 2, or 3 dimensions. The function 'print' displays the computed eigen-multipliers and the value of epsilon used.
函数图被使用来绘制的扩散在1,2,或3维坐标。 打印功能显示计算的特征乘数和使用的ε值。
An object of class 'dmap' is a list containing the following components:
一个对象类的DMAP是一个列表,其中包含以下组件:
X | matrix of n diffusion map coordinates, entered column-wise (does not include the trivial coordinate) |
phi0 | trivial left eigenvector of Markov matrix (stationary distribution of Markov random walk) in diffusion map construction |
eigenvals | eigen-values of the svd of the symmetric graph Laplacian |
eigenmult | eigen-multipliers of the diffusion map |
psi | right eigenvectors of the Markov matrix (first row is the trivial right eigenvector) |
phi | left eigenvectors of the Markov matrix (first row is the trivial left eigenvector) |
neigen | number of diffusion map dimensions used |
epsilon | the value of epsilon used |
X TD> | 矩阵的n型扩散图上的坐标,输入列上(不包括琐碎的坐标) TD> TR> |
phi0 TD> | 平凡的左特征向量的马氏矩阵(固定分布的马尔可夫随机漫步)扩散图谱的构建 TD> TR> |
eigenvals TD> | 特征值拉普拉斯算子的奇异值分解的对称图形 TD> TR> |
eigenmult TD> | 特征乘数的扩散图 TD> TR> |
psi TD> | 右特征向量的马氏矩阵(第一行是微不足道的右特征向量) TD> TR> |
phi TD> | 左特征向量的马氏矩阵(第一行是微不足道的左特征向量) TD> TR> |
neigen TD> | 扩散的图尺寸 TD> TR> |
epsilon TD> | 的ε值 TD> < / TR> TABLE> (作者)----------Author(s)---------- Joseph Richards [email protected] 参考文献----------References---------- Coifman, R. R., \& Lafon, S., (2006), Appl. Comput. Harmon. Anal., 21, 5 Lafon, S., \& Lee, A., (2006), IEEE Trans. Pattern Anal. and Mach. Intel., 28, 1393 Richards, J. W., Freeman, P. E., Lee, A. B., Schafer, C. M., (2009), ApJ, 691, 32 参见----------See Also---------- plot.dmap,print.dmap plot.dmap,print.dmap 实例----------Examples---------- ## example with noisy spiral[#例如,嘈杂的螺旋] n=2000 t=runif(n)^.7*10 al=.15;bet=.5; x1=bet*exp(al*t)*cos(t)+rnorm(n,0,.1) y1=bet*exp(al*t)*sin(t)+rnorm(n,0,.1) plot(x1,y1,pch=20,main="Noisy spiral") D = dist(cbind(x1,y1)) dmap = diffuse(D,neigen=10) # compute diffusion map[计算扩散图] par(mfrow=c(2,1)) plot(t,dmap$X[,1],pch=20,axes=FALSE,xlab="spiral parameter",ylab="1st diffusion coefficient") box() plot(1:10,dmap$eigenmult,typ='h',xlab="diffusion map dimension",ylab="eigen-multipliers") ## example with annulus data set[#例如,环比数据集] data(annulus) plot(annulus,main="Annulus Data",pch=20,cex=.7) D = dist(annulus) # use Euclidean distance[使用欧氏距离] dmap = diffuse(D,eps.val=.1) # compute diffusion map & plot[计算扩散图及图] print(dmap) plot(dmap) 转载请注明:出自 生物统计家园网(http://www.biostatistic.net)。 注: 注1:为了方便大家学习,本文档为生物统计家园网机器人LoveR翻译而成,仅供个人R语言学习参考使用,生物统计家园保留版权。 注2:由于是机器人自动翻译,难免有不准确之处,使用时仔细对照中、英文内容进行反复理解,可以帮助R语言的学习。 注3:如遇到不准确之处,请在本贴的后面进行回帖,我们会逐渐进行修订。 |