随笔系列之- 数据的类型(Categorical(Nominal),Ordinal,Internal)

几个数据类型:Categorical Type,Ordinal Type,Interval Type介绍

  • 在机器学习或者数据处理的任务中,我们遇到的数据类型往往是多种多样的,对于不同的数据类型,我们的处理方式/分析方法会有所不同,因此了解不同的数据类型是有必要的.下面简单的介绍一下这几种数据类型,也便于自己以后参考,不足之处,日后修正.

Categorical Type

什么是categorical Type?不知道确切的英文翻译,但是可以按照字面意思来也就是分类数据,比如皮肤的颜色,可以分为黄色,白色,黑色等等,但是这些数据的均值以及数值计算比如加减的结果是没有意义的;但是我们可以将不同的数据分为这几类,在比如人类的性别,男女也属于categorical 类别; 英文中欧冠也可以称之为Nominal Data.

Ordinal Type

从字面意思上看,顾名思义:可以排序的数据,有顺序的数据类型;比如我们的编程能力:初级,中级,高级,超高级 等等,教育水平:小学low level,中学high level,大学 college 等等;这些数据是可以排序的,有着实际的意义但是categorical 类型就没有排序的意义了!的那是Ordinal类型的数据取平均,加减等,也没有实际意义.

Interval Type

间隔数据,其本质就是数据之间的间隔,空间space是相同的,或者说一致的,比如我们的工资,年龄,等等,都可以分为Interval类型,他们的均值是有意义的,加减也有实际意义,因此我们可以作不同的分析和应用..

  • 不同的数据类型的划分,可以让我们更好的理解和分析数据,在做特征工程的时候观察数据的属性等等都尤为重要.

你可能感兴趣的:(machine,learning,随笔系列,data,science)