关于标准那些事——第十篇 分类标准

        最近要赶一个极其重要的CANS认证项目,这会是全中国第一个完全数字化CNAS认证的实验室项目,内容分享进度会比较慢。其实,大多数情况也并不是没有时间,俗话说:时间嘛,挤挤总是有的!其实影响进度更重要的是心情,特别是写东西,没时间往往只是给自己个借口,心不静,自然是写不了东西的。无论是搞技术,还是搞文艺,相信都是会有这个感觉的。

        分类标准相对简单些,实际工作中写得也不多,毕竟产品的分类的变更会是一个长周期,低频发生的事情。

首先我们来看一下分类标准的结构:

  • 分类标准的必备要素包括:封面、前言、标准名称、范围。
  • 根据具体情况,在特定的分类标准中应至少包括“分类”和“编码”两个要素中的一个。
  • 分类标准中要素的典型编排以及每个要素所允许的表述形式见表1。

    关于标准那些事——第十篇 分类标准_第1张图片

关于标准那些事——第十篇 分类标准_第2张图片
    

  • 分类标准还可视情况包含表1之外的其他规范性技术要素。

二、分类标准的规范性引用文件

  • GB/T 1.1 标准化工作导则第1部分:标准的结构和编写
  • GB/T7027一2002信息分类和编码的基本原则与方法
  • GB/T10113 分类与编码通用术语
  • GB/T20000.1标准化工作指南第1部分:标准化和相关活动的通用术语

        引用的标准不多,但是这些关于分类的定义和方法在目前的数字化应用中是值得借鉴的,数据的分类和定义是否科学,直接关系到未来数据共享和交易的可行性。

三、分类标准的要素起草

        无论是什么标准,核心要素的起草都是重头戏。

1、标准名称

  • 分类标准的名称应含有分类的对象和分类的内容两个必备的要素,分类的内容宜包含文字“分类”或“编码”。
  • 如果标准中仅包含“分类方法”,并未给出分类的具体结构和类目,则宜使用“.…分类方法”作为标准名称(见示例1)。如果标准中包含了“分类方法”和“命名”,则宜使用“…分类与命名”作为标准名称(见示例2)。

  • 如果标准中包含了“分类”中的全部内容,则宜使用“…分类”作为标准名称(见示例3)。
  • 如果标准中仅包含“编码方法”,并未给出代码,则宜使用“…编码方法”作为标准名称。
  • 如果标准中包含了“编码方法”和“代码”,则宜使用“…编码及代码”作为标准名称。
  • 如果标准中包含了“编码”中的全部内容,则宜使用“…编码”作为标准名称。
  • 如果标准中包含了“分类方法”、“命名”、“编码方法”、“代码”、代码表等内容,则宜使用“…分类与编码”“…分类、编码及代码”“分类与代码”作为标准名称(见示例1和示例2)。

    

2、标准范围

  • 范围应指出分类对象、说明分类的内容。必要时应说明使用该分类的限制。
  • 范围还应说明分类标准适用的对象。

3、分类方法

(1) 线分类法
    线分类法是将分类对象按所选定的若干属性逐次地分成相应的若干层级的类目和/或项目,并形成一个逐渐展开的分类体系。该方法通常用于划分层级类目和/或项目的分类对象。
    在这个分类体系中,被划分的类目称为上位类,划分出的类目称为下位类,上位类与下位类类目之间存在着隶属关系或整体与部分的关系。由一个类目直接划分出来的下一级各类目,彼此称为同位类, 同位类类目之间存在着并列关系。
    线分类法应满足以下要求:
        a) 分类应从上位到下位依次进行,不宜有空层;
        b)上位类类目划分成若干个下位类类目时,应按同一属性来划分;
        c)上位类划分出的下位类类目的总范围应与该上位类类目范围相等;
        d) 同位类类目彼此所覆盖的范围不交叉、不重复。

(2)面分类法

        面分类法是将所选定的分类对象的若干属性视为若干个独立的“面”,每个“面”中又可分成彼此独立的若干个项目。该方法通常用于划分非层级类目和/或项目的分类对象,划分出的各个类目和/或项目之间是序列关系或主题关系(或实用关系)。序列关系主要有空间(位置)关系、时间关系、因果关系、发展关系;主题关系(或实用关系)主要有前提一结论关系、形式一内容关系、结构一功能关系、行为一动机(目的)关系等。
面分类法应满足以下要求
    a) 按照实际需要选择“面”;
    b)每个“面”或项目在分类体系中有固定的位置;
    c)“面”彼此所覆盖的范围不交叉、不重复,项目彼此所覆盖的范围不交叉、不重复。

(3)混合分类法

        混合分类法是将线分类法和面分类法组合使用,以其中一种分类法为主,另一种做补充的分类方法。

(4)分类方法的表述

        分类标准中应指明每一次划分所依据的属性,给出基于属性对分类对象进行系统划分的类目和/或项目,宜指出上位类、下位类之间的层级关系或“面”之间以及项目之间彼此独立的非层级关系。

4、分类命名

(1)类目名称
    类目名称是对划分出的每个层级的层级统称。应对划分出的每个类目进行命名。如可用“…门”“…目”“…种”“…类”“…型”“…式”“…级”“…省”等作为类目名称。
(2)项目名称
    项目名称是对每个层级内具体个体的命名,具有惟一性。项目名称通常包含了上位类的类目名称。
    根据具体情况,可对每个类目中划分出的具体项目命名。项目名称的命名规则应保持一致。每个具体项目宜选用现行标准中界定的术语,如不存在这样的术语,则应使用规范化词语命名。

5、分类结果的表述

 (1)分类结果可用条文或表格形式(即分类表)予以表述。
(2)分类表通常用来展示分类体系,它由类目和/或项目名称栏和说明栏组成,见以下示例。如无需进行说明,可省略说明栏。根据具体情况,表头名称可进行相应调整(见附录A中的示例2)。
    关于标准那些事——第十篇 分类标准_第3张图片
(3)分类表中的类目和/或项目名称栏和说明栏的编写细则见附录B。

6、分类标准编码方法

  • 6.4.1.1 如果对分类的结果进行编码,应指明编码方法以及表示编码结果的字符。
  • 6.4.1.2 根据具体情况,线分类法通常采用层次编码方法予以编码,面分类法通常采用并置编码方法或组合编码方法予以编码,混合分类法通常采用组合编码方法予以编码。层次编码方法、并置编码方法、组合编码方法应符合GB/T7027一2002的8.2.4、8.2.6、8.2.7的规定。
  • 6.4.1.3编码应充分考虑所划分出的各类目的先后次序或关系以及各类目所划分出的具体项目的先后次序或关系,或者已经确定的分类体系中类目的先后次序或关系。

7、编码方法的表述

  • 应指明所采用的编码方法,给出编码位数或编码结构、每个码位所代表的含义以及每个码位上所使用的代码字符。

    

  • 适宜时,可给出编码结构图。在采用层次编码方法的情况下,编码结构图中的码位基于所划分出的类目之间的层级关系排列。在采用并置编码方法的情况下,编码结构图中的码位根据实际需要排列。在采用组合编码方法的情况下,编码结构图中的码位根据实际需要以及类目之间的关系予以排列。
  • 编码的先后次序与类目和/或项目名称可能不一致。
  • 每个码位上所使用的代码位数可根据需要设定。
  • 采用顺序码时,代码应等长,如用001~999,而不用1~999。采用层次码时,同一层次上的代码位数应等长。

8、分类标准代码

  • 代码宜全部使用阿拉伯数字或全部使用拉丁字母。如果使用拉丁字母、阿拉伯数字混用的形式,则拉丁字母或阿拉伯数字宜在特殊位置(如首位或末位),不宜在随机的位置。
  • 代码字符不应是语法表述或数学运算中可能用到的字符,如问号(?)、冒号(:)、加号(十)等,也不应是形相近的字符,如字母“I”和数字“1”、字母“O”和数字“0”等。
  • 收容类目所使用的代码宜为代码序列中的最末位字符,如单个阿拉伯数字序列的“9”、拉丁字母序列的“Z”。
  • 为了便于读写,各层次的代码之间可使用空格、“-”等分隔。例如,“754623”可写成“754-623”或“754623”。
  • 如果对类目和/或项目名称进行编码,应使用代码表的形式列出分类体系。
  • 代码表一般由代码栏、类目和/或项目名称栏、说明栏组成,见以下示例。如无需进行说明,可省略说明栏。根据具体情况,表头名称可进行相应调整(见附录A中的示例2)。
  • 当表格内容比较简单时,为了减少篇幅,可以在一页中排两列以上的表格。
  • 当说明栏的内容很多时,可同时列出两个表,一个表只列出代码栏以及类目和/或项目名称栏, 以便于直观了解分类体系;另一个表再增加说明栏的内容。
  • 代码表中代码栏、类目和/或项目名称栏和说明栏的编写见附录B。

9、分类标准索引

        若编码对象较多,可编写代码索引。代码索引可采用以下三种方式排序:
    按编码对象的汉语拼音字母顺序;
    按编码对象名称的英文对应词字母顺序;
    按有关的其他关系

写到这里有一个重要的事情需要阐明:关于标准起草的这些内容,都是摘自白殿一、刘慎斋等老师编著的《标准化文件的起草》一书,我们还依此内容编写了一个数字化的起草工具,和国标委推荐的编写工具只规范了标准格式不同,我们的编写辅助系统还包含了标准数字化结构的内容,目前全国文具体育用品标准化技术委员会的标准辅助编写和制修订审批流程已经正式启用。


关注“实验元”老李,共享质量数字化成果,让一切变得简单!http://www.latteinfo.com 

你可能感兴趣的:(分类,数据挖掘,人工智能)