数据降维

     伴随ICT(通信与信息技术)和互联网技术的不断发展与更新,人们收集和获得数据的能力越来越强。而这些数据已呈现出维数高、规模大和结构复杂等特性。如何利用这些数据,发挥其价值,引起很多人的关注和研究。这些人包括科研人员,工程技术人员,管理层领导等。

    人们想利用这些大数据(维数大、规模大、复杂大),挖掘其里有意义的知识和内容以指导实际生产和具体应用,数据的降维就显得尤为重要了。数据降维,又称为维数约简。顾名思义,就是降低数据的维数。为什么要降低数据的维数?如何有效地降低数据的维数?由此问题引发了广泛的研究和应用。

     数据降维,一方面可以解决“维数灾难”,缓解“信息丰富、知识贫乏”现状,降低复杂度;另一方面可以更好地认识和理解数据。

    截止到目前,数据降维的方法很多。从不同的角度入手可以有着不同的分类,主要分类方法有根据数据的特性可以划分为线性降维和非线性降维,根据是否考虑和利用数据的监督信息可以划分为无监督降维、有监督降维和半监督降维,根据保持数据的结构可以划分为全局保持降维、局部保持降维和全局与局部保持一致降维等。

    总之,数据降维意义重大,数据降维方法众多,很多时候需要根据特定问题选用合适的数据降维方法。

你可能感兴趣的:(互联网,技术人)