充值信息

赞助信息

推荐给好友 上一篇 | 下一篇

六个步骤来保持预测分析中的预测



业务比以往任何时候都更依赖于预测分析来做出重要决策,从银行如何预测价格风险到销售团队如何预测哪些客户是最有可能购买的。对未来的预测是基于数 据模式,从实时网络点击,心理上的人口统计资料和多年积累的交易历史等大量信息源中进行的挖掘。只要基础数据定义和数据流程被妥善地管理,预测分析就是强 大的商业武器。
Advertisement

  当用来预测分析的根本数据基础未能妥善维护或对未来的变化不敏感时,就会出现麻烦。时间的推移,源系统的变化,沟通故障和侵蚀信息准确性的缺乏维护 (输入)和预测的洞察力的减少(输出)。用来交付干净的、相关数据的过程可能在下三个方面出故障:

  在原始数据源中的变化

   数据变量的改变可以来自最初对取值范围和定义的理解上。这种变化或是来自一种流程的改变,或是在源系统中的故障。它可以微妙到从整数到小数的数据类型的 变化,或剧烈到为适应新的业务实际而发生的有效值范围的大规模变化或更糟的,因缺乏维护使数据完全无用的系统变化。这些通常是由于源系统的故障 (即部分流程是建立在无法运行数据供应上,且供应的数据已经被破坏了。)

  在业务定义中的变化:

   通常,这些都是在预测模型中所需数据的计算变化而引起的。它们非常类似于原始数据源的变化,但通常是因为业务规则的改变而导致的变化,而非由于错误所 致。例如,一家银行基于收益(价格)、资金成本、利息和风险建立贷款收益模型。该模型设计用当前定义的包括费用利息的“利息收费”来调试的。然而,这个模 型用了几个月后,银行决定把计算中的费用利息部分分离出来以满足新的政府法规。实行的办法是改变数据单元“利息收费”使它不包括费用利息,同时引进一个新 的元素的“费用利息”。总利息现在是新的“利息收费”加“费用利息”。 在该模型中如果没有包括新数据元素的改变,模型只能基于虚幻的利息收费下降上评价帐户(因为现在利息费是遗漏在模型的输入数据之外了)。不管的话,该模型 将无意中对有费用的帐户变得敏感,它可能是有利息的,但也可能与这些帐户的盈利能力没什么关系。

  外部环境的变化

   环境的变化可以是外部经济因素改变、政府管制或技术发展致使初始模型的假设不正确的特点。例如,想象一种用来对现有客户的销售可能性进行预测的模型。该 模型侧重于对员工的增长(即,20%的增长是好的,没有增长则不好)。一段时间以后,经济进入了萧条期。突然之间,很少有公司以20%的增长来增加员工。 该模型需要体现这一新的现实。能在就业增长上持平的公司可能会有相对较好的前景。

  六个步骤来保持预测分析中的预测

  在银行业或客户面临风险的领域,像Sarbanes-Oxley这样的程序正好能提供保护。大多数风险模型必须通过SOX对确保建模准确性的数据和流程维护测试。

  在缺乏政府强制确保数据准确性的管制情况下,你应该做些什么呢?

  1.为你的模型选择更稳健和一致性定义的数据。向最接近数据的人询问任何已知的数据改变计划,并确保他们也有针对变化管理的流程。尽量避免提供未测试的,无事实证明的流程的数据。

  2.对数据源进行存档。确保模型的输入源被妥善存档,特别注意最高权重的变量。凡是负责维护这些模型的人都应该知道如何验证数据源以及哪些源随着时间的变化可能需要更多的变化审查。

  3. 保持与任何数据供应方的联络 (内部和外部)。确保在建模中数据的产生有意识,你运行的流程对他们提供的数据中的任何变化很灵敏。确保他们对你在那些变化上的循环有变化计划。

  4. 测试模型性能。他们正失去预测的能力吗?即使数据维护得很好,模型的老化和由于社会经济因素,可能需要重新训练。即使模型仍然是好的,也会因为模型性能中超出任何模型“自然老化”的突然改变的发现数据质量问题。

   5.输入数据的概况。即使输入数据最基本的概况 (对每个关键数据元素都能发现大于NULL的平均值,最大值,最小值的历史观察值的2倍标准差) 都有助于维持输入数据的准确性。有几个数据属性工具的供应商,而且你使用的数据库系统(DBMS)往往具有内置的属性能力。这也可以是一套简单的脚本运行 于源数据中作为更新流程的第一步。

  6. 检查分析流程的中间步骤。在数据转换的主要步骤之间检查有效的期望值。数据在预期范围内吗? 即使只是在预期范围内检查行的计数也可以抓住许多意想不到的数据变化。

  如果你正在对预测分析做投资,通过确保模型输入的有效性确保投资。随着可以适用于模型的数据的指数级增长,慢慢的数据错误的风险也随之增加。通过在数据流中建立适当的验证和变化管理流程,你可以增加源数据的准确性和下游的预测能力。




 

评分:0

我来说两句