找回密码
 立即注册
查看: 3739|回复: 2

分析力革命公司(Revolution Analytics)在R的业务用途赛事中对选手嘉奖20000美元

[复制链接]
发表于 2013-3-27 15:21:32 | 显示全部楼层 |阅读模式
分析力革命公司(Revolution Analytics),一家开源R语言的软件、服务和支持商业提供商,在一次旨于突出R的业务用途的赛事中对选手嘉奖20000美元。
Hadoop是一种让企业能够处理大量到PB字节数据的开源软件框架。R是一种开源软件编程语言,广泛为统计师一直用于数据挖掘和创造预测模型。
分析力革命公司(Revolution Analytics) , 是一家在2007年首次提供了R的商业流通。这家公司对于R来说就如同Red Hat对于Linux。它认为Hadoop和R的结合有潜力成为大数据天堂的组合。为了帮助说明这一问题, 分析力革命公司(Revolution Analytics)公司举办了“R在业务中应用的竞赛。”
Revolution公司的营销和社区副总裁David Smith说,从处理并储存大量的数据,到分析数据标志着企业如何将利用他们的数据的下一步进展。他指出Revolution公司在2011公布了Hadoop和R之间的一种整合。“企业已经花了很多钱用于存储所有这些数据。现在他们想分析它,”他说。
R在数据统计师和学术界在做预测分析和预测这一为企业越来越关注的领域上尤其受到欢迎。“它不再仅仅是关于趋势的推断,而且是试图预测它们,利用的不仅是你自己的数据库,也利用外部的数据源,” Smith说。
Smith期待当企业提升他们的数据分析竞争时越来越多的“R和Hadoop之间的交集”和其它的并行处理的环境。 在一次有趣的真实世界的可能性例子中, 三位研究人员使用了一种R和IBM的Netezza平台的组合来测试拟议股票市场控制的有效性用于防止交易中突然和巨大的波动。针对Barron的工作中, 他们分析了2008年和2010年之间美国股市发生的240多亿次交易, 这个任务需要计算机用8035小时在60个并行处理器上进行处理。
Revolution公司比赛的优胜者, Nationwide Insurance公司的Shannon Terry和 Ben Ogorek 创造了一种基于浏览器的机上预测系统, 用于预测在只有一小部分的客户反应被观察时一种营销战术总的效益增量。目标是要识别出早期的商业活动中的成功和失败,以使营销预算的价值最大化。使用该软件, 市场营销者可以测试方案, 当营销活动“进行中”时评估他们的相对影响,而且在需要时调整营销活动的开支。
他们比赛作品的一个关键组成部分是被他们称为的一种“被称作保序回归的旧技术。”由于这一功能建立在R中, 他们需要相对较少的的编码。
他们也用R创造一种基于浏览器的代码版本, 将运行在他们手提电脑中的R代码迁移到那基于Linux的服务器中, 然后利用CGI处理来创建样式表,类似一种普遍用于Nationwide公司内部业务用户中的表达模板,带有支持HTML的功能。
“这种友好的用户界面使我们的业务合作伙伴通过他们最喜欢的网页浏览器访问R的功能而无需安装任何软件或直接提交任何R代码”他们在输入中写道:“事实上,我们的业务伙伴知道R在运行的唯一途径是认出在URL中以‘.R’为结束,因为R在我们的企业中是一种业务所有和管理的工具,这种常规的方法让我们迅速部署许多分析小程序和小工具,用以作为原型。这些微型应用程序中最好的出了我们的实验室,与我们IT伙伴的辅助设备在更可扩展的R环境里进行重建。”
“展示R的业务相关性的机会太重要了,不能错过,”Nationwide公司的信息科学主管Terry说。“通过这些比赛的提交, 我们很兴奋地分享我们2011年中最中意的R语言应用程序。开源R社区真正激发了Nationwide公司, 而且感谢这个不可思议的社区, 我们产生了新的创意并提高了我们的分析能力。”
像其他开源项目一样, R有一个很活跃的支持社区。许多的Revolution比赛参赛作品是基于社区成员所创建的“程序包”, 它被Smith比作“应用程序的建筑模块。目前有4000多个程序包,而且他们正“呈指数级增长,” Smith说。
来自Atmosphere研究集团的亚军Jeffrey Breen用了几个程序包为航空消费者信心的微博挖掘创建了他的应用程序,在其中他下载了微博数据流,寻找有关散乱例如“Delta”和“西南”这样的标签,并分析了消费者随着时间的推移是否对航空公司有正面或负面的反应。Breen在用一个允许开发者将微博数据流带入R环境和其它中执行情绪分析的 R语言程序包时,不得不写了40行左右的代码,还有一些R语言的图形能力对结果进行视觉化。Breen获得了5000美元的奖金。
Terry 和Ogorek凭着他们的获奖产品获得了10000美元,再加上Revolution R Enterprise 5.0,分析力革命公司(Revolution Analytics)的产品级R语言软件,扩展了开源R在更高性能、更大的可伸缩性和较强的可靠性上商业性增强的能力。企业通常所用的数据集远远大于比赛中所用的, Smith说。当R在内存中工作,并且受限于可用的RAM数量时,Revolution解决了这些性能与规模问题,通过为R提供一种并行数据处理框架,“让你一次在一台机器上或者像在Hadoop中那样在一个集群的机器上并行运行很多数据,” Smith解释说。
获得这些分析的业务人员可能没有意识到哪种工作进入了最终产品而“竞争是为我们突显它的一种方式,” Smith说。
比赛也体现了分析预测在整个企业潜在的用途, Smith说。“每一个被选到的应用程序都证明了预测分析和R一起远远超越传统的商业智能赋予企业经营决策者在业务流程中尽早和经常地评估关键成功因素。我们从入选获奖作品中看到,各种不同的行业和流程 — 来自市场, 重工业, 临床试验设计, 和IT项目管理都需要进行中的预测分析。”
评委之一,O’Reilly 媒体的Strata 会议主席Edd Dumbill说,“R吸引一些惊人的创新思想,而且让人兴奋地看到一大批R的例子投入业务中使用。企业获得灵活而强有力的工具来分析数据是势在必行的。”
回复

使用道具 举报

发表于 2013-4-7 08:01:25 | 显示全部楼层
分析力革命公司,长见识了~
回复

使用道具 举报

发表于 2013-4-22 16:05:54 | 显示全部楼层
哟和。。。。不要钱多和谐啊
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|R语言中文网

GMT+8, 2024-11-22 14:56 , Processed in 0.023734 second(s), 17 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表