数据挖掘的必要性

admin 2016-04-09 icon-tag 数据挖掘

    在许多行业,数据挖掘已经变成一个热门话题。一个最基本和被频繁问到的问题是:为什么要进行数据挖掘?当一门技术在商业上变得日益流行时,它必须满足两个基本条件:一个条件是技术上的可行性,另一个条件是要有商业需求。

    从数据中提取有价值的、以前未知的、正确的和可以理解的信息,对于大多数行业来说,这并不是一个全新的概念,因为在商务运作中信息始终起着至关重要的作用。不过数据挖掘从其他3个方两奔看是二个全新卯事物。首先,业务处理的计算机化使得人们可以得到大量的数据;其次是关于数据存储技术和计算速度方面性能的提高;再次是可以得到诸如神经网络之类的新的先进的算法。大量可用的数据为大多数数据库营销和数据挖掘提供了所必需的输入。数据仓库为存储较大的数据集和从海量数据库中快速提取有价值的信息提供了必要的工具。同时,一些新的算法为处理商业数据提供了基础和一种新的能力,使得人们运用二种全新的方式进行数据挖掘成为可能。这3个方面使得发现驱动型数据挖掘变得更加丰富多彩和切实可行。因此,它提供了一种探索数据的新方式。由于存在可用的海量数据、必要的计算机存储能力和可用的新算法等,所有这些方面都使得数据挖掘成为切实可行的技术。

数据挖掘

    数据挖掘成为新的热点问题的另一个诱因是商业竞争的压力。商业竞争使得各公司为有效地参与竞争而增加了对数据挖掘的需求。有效竞争的一个主要方面就是更好地了解客户。数据挖掘可用来帮助商家发掘隐藏在数据中的模式、理解关键客户的购买行为、侦测信用卡和保险索赔欺诈、预估金融市场可能发生的变化等。数据挖掘能够帮助企业或公司了解市场动态,以便对瞬息万变的市场环境进行准确的定位和快速做出反应,把握稍纵即逝的商机。数据挖掘能够帮助各公司通过更好地理解他们的客户及其行为而获得竞争优势。此外,各公司会由于更加有效地利用了其数据资源而提高生产力。如果正确地实施了数据挖掘应用并且使用了最少的维护费用,就可以在今天竞争日益激烈的市场环境中以牺牲竞争对手为代价来扩大自己的市场份额。如果不能正确地实施数据挖掘应用或者是无所作为,就会逐渐失去属于自己的市场份额,一旦失去则需要数年的时间才能找回失去的市场。

    通过使用适当的技术,数据挖掘能够使企业从诸多方面获益。已经使用数据挖掘的行业包括但不仅仅局限于银行、金融服务机构、保险公司、电信部门、航空公司、百货公司、零售店、超市、信贷机构、医院、医疗协会、警察机关和政府机构等,典型的应用有:目标市场营销、交叉销售、客户流失分析、民意调查、产品分析和新产品研发目标确定等。不同行业使用数据挖掘的方式取决于本行业的商业特征。但是,数据挖掘的方法和一些基本过程在不同的行业之间是相同的。

    概括来说,主要有两个因素决定了数据挖掘越来越成为商业应用的必要选择。一方面是生成数据的能力提高了,例如,商品的条形码、商业过程的计算机化以及电子商务等,另一方面是数据的存储能力也增强了,例如,更大存储容量的磁介质、光盘,及更好的数据库管理系统以及数据仓库技术等。例如Wal-Mart公司每天生成20000000条交易记录;卫生保健部门建立了GB级的数据库系统;人类基因组项目也生成了超过GB级的数据库系统,而且其规模还在增长;;NASA EOS则每天都要生成TB级的数据。