Network Lasso: Clustering and Optimization in Large Graphs

这篇文章提出了一个新的Convex optimization 的方法。传统的凸优化问题是数据分析的基础,这种方法提供了一个通过机器学习或者数据挖掘来定义和解决问题的框架。但是这种凸优化方法不能有效的大规模使用,大规模使用的又只能解决很小一部分问题。因此,需要一个简单的,可扩展的算法以便于解决更普遍的问题,在这个文章,作者提出了network lasso方法,一个一般的聚类lasso方法对一个网络集合,可以同时在图上进行聚类和优化。我们提出了一个算法基于ADMM(Alternating Direction Method of Multipilers 可交换方向的乘)用于解决一个分布的大规模方法。我们同时检测了这种方法在non-convex扩展集合上面的应用。作者强调了很多的问题可以通过这个框架进行表示。并在实践中对三个方向的内容进行了强调: 二分类、房价预测、基于时间序列的事件监测,通过与baseline的比较,表明这种方法在解决大规模优化问题的时候又快又准。

文章的形式化,定向了一个图中的边和节点的 效用函数,去最小化边和节点的这个效用函数。

一个通用的设置中,这些可以吧一个网络lasso问题是一个范数问题,但不是一个二范数问题。可以把问题打散进行处理

而在对房价的预测中,传统的是利用线性回归,但是由于学区、地铁的关系,同样的房子在不同的地段的价格相差很大。在作者的研究中,把相邻的房子和房子之间的邻居进行了分类,建立了一个以房子为节点的网络。之后每一个房子都有一个自己的定价模型。我们通过网络尽量使得相邻的房子共享相同的参数。并且向周围的房子的定价进行获取信息。每一个房子都共享了一个模型在他的聚类里面,不需要被其他地区的房价所干扰。

总的说作者的贡献包含以下:

1.形式化定义了network lasso

2.提出了一个快速、可拓展、分布式的解决方案。这个方法同样可以解决对参数的选择

3.通过研究证明更广泛和有效的工作可以被

你可能感兴趣的:(设计模式学习,数据挖掘)