Alphabetical order of Data Type

Boolean:
a form of data with only two possible values (usually "true" and "false")

Categorical
Categorical variables represent types of data which may be divided into groups. Examples of categorical variables are race, sex, age group, and educational level.

Connection

Continuous
统计学中变量可以分为定量变量(或数值变量,quantitative or numeric variable)
e.g 这些变量是一些数值,可以数数或者测量出来

或者 分类的定性的变量(或分类变量/属性变量,qualitative, categorical or attribute variable
e.g 比如男和女,汉族、蒙古族等,白色肤色、黄色肤色、黑色肤色等

定性变量中 分为 无序变量(unordered-qualitative variable)
e.g 性别、种族、肤色、血型、颜色这种类型的变量的信息之间没有等级区分,如并不能说性别男大于女,也不能给种族拍个优先顺序,所以这些变量是无序的,只作为分类

有序变量(ordered-qualitative bariable)
e.g 这类变量可以进行等级划分,进行排序比较,比如喜欢的程度可以分为高中低,高中的年级可以是高一、高二、高三,学历可以分为小学、中学、高中、大学、研究生等

定量变量中也存在着一些规律,有些变量是离散的不能够连续的,称为离散变量(或非连续性变量,discrete or uncontinuous variable)
e.g 这这类型的变量只能取到的是某些特定的值,而且这些值之间存在着一些“间隔/间隙”。比如,休假的日期只可以是4天、5天、7天等,一天每小时到达北京火车站的火车的数量等。

连续变量(continuous variable),是在给定的范围内,可以取到任何的数值的变量,其实也就是可以有小数点的变量
e.g 体重可能是50.3kg,也可能是50.33kg,这个体重就是一个连续变量

  • Date
    YYYY-MM-DD

  • Data/Time
    YYYY-MM-DD HH:mm:ss

  • Dimension

  • Discrete
    Dimensions (mostly discrete)

  • Geographic
    (地理数据类型)

  • Hierarchical

  • INTERVAL
    用数字定量地描述变量程度上的差异。比如温度,20℃比10℃高10℃,和30℃与20℃之间的温差是一样的。这种情况下二者的差(interval)有意义的,而计数零点的选择是无关紧要的。选择不同的参考温度作为0℃,那么同一温度会有不同的示数。但不影响两个温度之间的差。

  • Level of detail

  • Link

  • Measure
    Measures (mostly continuous)

  • Nominal
    定类 定类变量值只是分类,如性别变量的男女

  • Numerical
    (数值变量)

  • Observation

  • Ordinal
    定序 比如年龄有少年、中年、老年
    即不同种类之间是有大小顺序关系的
    也是反映对象属于哪一类,但各类之间有程度上的区别。比如 收入(高/中/低),顾客满意度(满意/一般/不满意)等

  • Population

  • Qualitative
    定性数据 定性数据说明的是事物的品质特征,是不能用数值表示的,通常表现为类别.

  • Quantitative
    定量数据
    定量数据说明的是现象的数量特征,是必须用数值来表现的.
    分为离散数据(Discrete data)和连续数据 (Continuous numerical data) .

  • Ratio
    比 interval data更进一步,计数零点是有意义的,或者说不光变量之间的差有意义,而且变量本身就具有意义。比如长度,质量,在物理上有明确的定义:一米有多长,一千克有多少量。这样如果我们说0.5米我们就知道有多长。计数零点0米也是明确的,而不是可以任意选择的。

  • Referential
    Context in which measurements were made
    – Three kinds of ‘backdrop’ • Time
    • Space
    • Population

  • Spatial

  • Text

  • Time

Ps: Ratio定比数据 INTERVAL 定距数据 二者区别是 true zero是否存在 比如 身高为0 那么就意味着没有身高 因此身高是 Ratio 比如温度为0 意味着是有温度的 且温度为0度 因此温度是INTERVAL类型.

你可能感兴趣的:(Alphabetical order of Data Type)