为了保持竞争力,零售商不只要了解当前消费者的行为,还要能够预测未来的消费者行为。SQL Server 2008通过数据挖掘提供了预测分析,使整个企业中的用户具有了洞察力。###tt_authenticity_url###

 

  【IT专家网独家】

  1.导言

  零售是一个规律变化的行业。增加竞争力、提供广泛的产品、增加客户经验、和客户多点接触,以及客户复杂度,这些只是零售领域动态和静态改变的众多示例中的一部分。随着人口的持续增加以及消费者具有了更多选择,零售商所面对的众多挑战变得更加深入。为了保持竞争力,零售商必须采取一个分析的、指导性的、和说明性的方法来更好的理解他们的业务和预测客户行为。

  预测分析可以提供帮助。很多年来,数据挖掘只适合于有限的具有统计和数学经验的观众。但是,Microsoft SQL Server 2008提供了简化工具,将数据挖掘功能提供给了知识工作人员。

  Microsoft预测分析使得所有的零售企业用户可以利用在表示层中易于理解的强大分析工具。这是通过 Microsoft Office Excel 2007和SQL Server 2008实现的。通过利用Microsoft 数据挖掘的功能,零售商可以更加容易地获得和留住客户,优化销售规划分类,以及更好地客户对他们产品的真实需求。然后零售商就可以确定最能影响业务执行和客户行为的可变因素。

  这篇文章讨论了许多零售商所面临的问题,以及他们利用SQL Server 2008所提供的预测分析解决方案可以怎样解决这些问题。

  2. 预测分析

  预测分析解决方案由数据挖掘技术提供,它使用分析模型来发现隐藏的模式并将它们应用于预测未来趋势和行为。零售企业对预测分析的兴趣与日俱增。但是,在大多数零售企业中数据挖掘技术的使用是受限的。数据挖掘有许多组件,但是确保意义丰富和具有行动力的洞察所需要的最显著组件如下所示:

  1. 定义业务问题。

  2. 探究数据。

  3. 创建预测模型。

  4. 测试这些模型。

  5. 对一个确定的人群应用一个或多个模型来预测行为。

  一般情况下,完整的数据挖掘过程不是连续的——因此,生成的结果不是预测性的,并且只是对获得业务的有限洞察。此外,公司不可能拥有推动数据挖掘环境所需的所有资源或信息,因为过去关注的焦点是集中于回顾分析而不是预测分析。Microsoft SQL Server 2008 Data Mining Add-Ins for Office 2007使得预测分析直观并且简单化了,使得预测分析可应用于所有的企业分析师和决策制定者。

  数据挖掘和预测分析的术语不是新的概念。传统的统计技术已经使用它很多年了,用于为消费者行为建模、预测股票价格、评估劳动力需求、为交易率建模,等等。当商业上可用的数据挖掘软件推出后,预测分析与商业决策和过程进一步集成。然而,有时数据挖掘和统计分析是避免使用的,因为这些分析类型是在陌生的用户环境中,并且要求了解统计和/或编程技能。

  Microsoft,通过Data Mining Add-Ins for Office 2007在改变零售商观察预测分析的方式。有了在熟悉的用户环境中的直观工具,公司现在可以直接在桌面电脑上利用一个完全的数据挖掘平台,为每一个商业决策提供洞察力。

  什么是预测分析?在这篇文章中,它是选择、探索、分析和建模数据以创建更好的商业成果的过程。成功的预测分析考虑了数据放置的位置、数据的状态(冗余、陈旧、脏数据),以及怎样访问它们。预测分析的一个重要方面是数据应该怎样存储以符合商业目标并反映商业操作的实际情况。

  Data Mining Add-Ins for the 2007 Office System创建了一个可以提供无缝和直观的预测分析解决方案的环境。下一节介绍建立成功预测分析解决方案的过程。

 为了保持竞争力,零售商不只要了解当前消费者的行为,还要能够预测未来的消费者行为。SQL Server 2008通过数据挖掘提供了预测分析,使整个企业中的用户具有了洞察力。###tt_authenticity_url###

 

 

  3. 数据挖掘模型

  一个成功的数据挖掘项目要求一个清晰的过程。在这篇文章中描述的过程不只是一个建议的方法,它还确保了返回丰富的结果,这些结果将提供可用于商业决策的洞察。

  3.1 定义业务问题

  一个数据挖掘项目从定义商业问题开始。在很成功的数据挖掘项目中,定义了许多这种问题。示例问题定义如下:

  · 我们想找到前10%最可能成为我们客户的人。

  · 谁是我们的高利润客户?

  如果没有定义商业问题或如果商业问题缺乏度量,那么数据挖掘项目就不能提供有用的结果,因为用户没有一个为了成功的特定度量。

  数据挖掘项目还包括要使用的数据信息。问题定义可以包括更多的规范说明,例如像下面的问题:

  · 数据在哪里?

  · 谁对这个数据负责?

  · 我怎样访问数据?

  · 有多少数据可用?

  · 这些数据是否满足我的商业问题?

  · 我是否有足够的数据?

  · 这些数据是干净的吗?

  · 我可以在哪里处理这些数据?

  数据源在多个位置、以多种文件形式存储、并具有不同的结构是很普遍的。例如,在一个直观的客户关系管理数据挖掘项目中,你可能从几个事务系统、第三方数据、Web日志、以及从移动文本的响应信息中获得数据。要支持这个解决方案的商业问题和数据都需要考虑和计划。

  SQL Server 2008提供了许多计划来简化和自动化这些任务来获得支持这些商业问题的数据。SQL Server集成服务(SSIS)使你可以从多个数据源获得数据、清理数据、将它转化为适当的格式,然后将它加载到一个容易访问的目的地并具有企业级的安全性、性能和扩展性,真正地使得任何数据类型都是可用于任何类型的分析。

  3.2 探究数据

  数据探究是查看数据的形状、健壮性、分布和整个状态的过程。在这一步确定的格式和异常可以帮助改进对业务过程的整个了解。当为一个数据挖掘项目探究数据时,你很可能发现丢失值、外泄、异常分布或一个数据源的基本数据结构中的独特格式。例如,如果数据中丢失了大量的值,那么很可能客户服务没有正确地输入客户信息。一些异常可能揭示真正的问题,例如产品某一版本出现的问题。在这种情况下,异常行为描述了一个真正的商业问题而不是数据输入的错误。

通过一个叫做集群的技术来探究数据,格式开始显现,不过可能不是立即就很明显。例如,如果一个零售存储为一个特定的存储地点创建了四个消费者行为段,他们可以为特定的客户群(每一个都描述了类似的客户行为)优化他们的商品分类以创建更好的客户满意度。对数据进行探究给你带来了对数据结构的巨大洞察力,并潜在地对商业操作具有深远影响。

  Data Mining Add-Ins for Office 2007使得可以通过Table Analysis Tools for Excel和Data Mining Client for Excel来进行数据探究。

  

      Table Analysis Tools for Excel

  

      Data Mining Client for Excel

  3.3 清理数据

  清理数据会要求对此迭代直到生成了适当的数据挖掘集合以解决商业问题。Data Mining Add-ins for Office 2007减轻了与数据准备相关的大量预算。下面的图片显示了当执行数据清理事务时可以替代离群的选择。你不只可以监测离群,你还可以重新赋予数据值。这使得你可以给空值之类的替代以合适的标签。此外,插件的用户界面可视化帮助你清楚地确认异常和直观地采取行动解决它们。

  清理过的数据可以直接组合进原始的工作数据集合,使得具有了很好的灵活性和自服务能力。

  

      定位数据离群

  通常基本的数据可以带多个值、丢失值、或者有的数据指向标准范围之外。很可能异常的值实际上是一个无效的值。例如,一个特定的客户群可能会表现为具有较高或较低的花费行为,但是这个行为的频率是很低的或非常少见的。这也是无效数据。必须特别关注数据是怎样清理的,因为异常是在现有数据集中的格式定义的,可能在固定术语中不是特定的。