首先要区分什么是数据?什么是信息?大数据很多是存储的结构化数据。 什么是结构化数据?举个例子,多少岁、性别、学历。这种可以通过筛选条件进行筛选、比较的,均可以成为结构化数据的一部分。大数据管理与应用,主要解决的痛点是如何在大规模数据中挖掘有用知识(信息)。一般,大型公司的日增长数据可以少则几百条多则上万条,甚至百万、千万级。但问题是,哪些数据是我们值得研究的,是有效数据。信息则是另外一种,举个例子,个人简历、档案、图书等这些包含大量知识的文件。信息管理的痛点不是立足于大规模数据,而是寻找到和需求相对应的信息。比如,你在做文献检索时,每篇文献都有价值,但并不是所有的文献都是你需要的。从方法流程来说,两者都需要在大量数据、信息中寻找到有效的"资料",但是他们分别解决不同的痛点。前者更多解决的无效数据的筛选,后者更多注重信息管理流程的优化获得更多的知识。两者可以有效兼容,甚至统一发展。
|