数据稀疏问题(data sparseness)

模式匹配: 这个模型最早是针对机器的模式识别而提出来的,后来被用来解释人的模式识别。它的核心思想是认 为在人的长时记忆中,贮存着许多各式各样的过去在生活中形成的外部模式的袖珍复本。这些袖珍复本即称作模板(Template),它们与外部的模式有一对 一的对应关系;当一个刺激作用于人的感官时,刺激信息得到编码并与已贮存的各种模板进行比较,然后作出决定,看哪一个模板与刺激有最佳的匹配,就把这个刺 激确认为与那个模板相同。这样,模式就得到识别了。由于每个模板都与一定的意义及其他的信息相联系,受到识别的模式便得到解释或其他的加工。例如,当我们 看一个字母A,视网膜接收的信息便传到大脑,刺激信息在脑中得到相应的编码,并与记忆中贮存的各式各样的模板进行比较;通过决策过程判定它与模板A有最佳 的匹配,于是字母A就得到识别;而且我们还可以知道,它是英文字母表中的第一个字母,或是考试得到的最好的分数等等。由此可见,模式识别是一个一系列连续 阶段的信息加工过程
[from: http://wenda.tianya.cn/wenda/thread?tid=495f4c692607eeeb]

数据稀疏问题
( data sparseness):指的是N元模型中,由于正确的词语搭配没有出现在训练集中而导致在处理过程中出现零概率的现象。
[from: http://dict.youdao.com/search?q=retrived&ue=utf8&keyfrom=dict.index#le%3Deng%26q%3Ddata%2Bsparseness%26tab%3D%26keyfrom%3Ddict.top]

你可能感兴趣的:(自然语言处理,Data,数据稀疏,sparseness)