数字化和数据化有差别吗?(这是一道语文题,也是一道数学题)

先来看2004年谷歌发布的计划:试图把所有版权条理允许的书本内容数字化,让世界上所有的人都能通过网络免费阅读书籍。为此,谷歌专门发明了一个可以自动翻页的扫描仪,去完成上百万书籍的扫描工作。通过扫描,书本上的内容被搬到网络上,读者可以随时随地进行阅读,这就是一个数字化的过程。但谷歌想要的不仅仅这么简单,为了激发这些信息的价值,谷歌用专门的软件来识别文本的字、词、句和段落,如此,书页的数字化图像就转化成了数据化文本,人们可以通过检索和查询,了解一个词在海量文本里出现的时间、次数和发展趋势,“据此发现几百年来人类思维发展和思想传播的轨迹。”

有趣的是,数据化的实现让抄袭学术作品的行为越来越多的被发现,据说,很多欧洲政客(包括一名德国国防部长)的抄袭行为被曝光,最终引咎辞职。谈到大数据在查抄上的应用,离我们最近的例子可能就是大学时期的论文作业,尤其是毕业论文,最先检查你论文的不是老师,而是学校的机器,甚至在送学校的机器检查之前,自己要先在各种查抄软件上检测一下,看看抄袭率符不符合规定。如同上文所说的那样,查抄软件最终会给你一个报告,里面详细的罗列了论文里的哪些内容属于重复出现,哪些段落的句子和其他论文里的句子相似,学生再根据查抄结果修改自己的论文直到符合规定为止。由此,查抄的软件也五花八门,而每次查抄,查抄的人需要根据字数的多少向查抄软件按次付费。现在看来,提供查抄软件的公司真是深谙大数据之道,或者也可以说很会借鉴其他公司对大数据的运用,每年毕业季,肯定都挣得盆满钵满,可见,要想创造价值,仅仅数字化还是不够的,必须将数字化转化为数据化。

前段时间有一个新闻说,一群小学生用大数据的方法研究苏轼,比如统计苏轼诗词中某个词在所有作品中出现的次数和时间,在结合苏轼本人的生活经历,发现了很多有意思的事情。在大家都热衷于从商业领域探索大数据的价值时,孩子们却以一念之本心用大数据去研究一个人,我以为这个研究的意义和价值是不下于商业研究的,难能可贵的是孩子们的求知的心和大胆的实践,这也从侧面说明了大数据可以应用的领域很广。有心的人总会想办法去创造价值,而我们要当心了,有时候,走出自己的小圈子去看一看外面的世界,也未尝不可。

你可能感兴趣的:(数字化和数据化有差别吗?(这是一道语文题,也是一道数学题))