大数据处理的几个问题(阅读笔记)

 

http://jjckb.xinhuanet.com/2013-05/31/content_448080.htm

 

一、信息采集不足

牛津大学统计学教授彼得·多纳利对记者说,目前大数据技术的第一个瓶颈就是信息采集不足。

由于各种主观意愿原因、客观技术原因,大数据的获得和采集存在不足。有的人不愿意共享敏感数据,有的人无法提供,有的大数据目前还没有有效的采集技术等等。

我们意识到了大数据的存在和重要性,我们甚至相信大数据无处不在,但是却很难一下子把大数据全部发现和采集。就像我们知道宇宙的存在,但是却无法获知宇宙的全部,只是了解宇宙的一部分。

 

二、缺少专业的数据分析手段、技术和人才

采集到足够信息后,需要由相关领域的专业人士与信息技术专家一起对数据进行有针对性地归纳和分析,而这种跨学科、跨领域合作能否顺利实现,是大数据技术实际应用中的重要问题。

三、现有的硬件处理、存储设备、网络环境制约了大数据的处理。

在技术层面存在网络容量有限的问题,现有基础设施无法满足海量信息分析和处理的需求。因此,如何降低存储成本以及提升应用价值就成为大数据所面临的关键技术难题。

四、安全与隐私,权利与责任,透明与控制

用户在不知情的情况下,被动的情况下提供的信息,这种无意识的采集数据,使用者首先要帮助用户了解他们的哪些个人数据是公开的,这些数据目前和潜在的用途是什么。对可用于推断的数据,用户应享有完全的控制权。

你可能感兴趣的:(大数据)