SAS文本分析 (Text Analytics)

IDC的报告显示,目前大数据的1.8万亿GB容量中,非结构化数据占到了80%~90%之间,并且到2020年将以44倍的发展速度增长。如何有效管理、挖掘、分析海量非结构化数据中蕴藏的信息,已成为大数据领域的重要挑战。而应对非结构化数据的挑战,应该拥有哪些创新技术呢?

凭借38年在高级分析领域的专注投入和领导地位,SAS 本文分析被市场调研机构Hurwitz & Associates誉为功能最强大的文本分析解决方案。SAS文本分析通过机器学习和自然语言处理技术,可以用人类的洞察来引导机器学习结果,自动生成主题识别或建立主题库,大大减少耗时的人工活动;交互式图形用户界面让识别相关性、修改算法、文件分配和资料分组等操作变得十分轻松;高性能内存分析技术可以在几秒或几分钟之间完成亿万条数据的处理,可视化结果展现让您瞬间获取商业洞察。

全球1200多家企业正在使用SAS文本分析驱动企业价值提升。SAS提供多种语言的本地支持, 其中包含中文简体与繁体。

SAS Contextual Analysis
利用非结构化文本更全面地分析企业
产品说明书 
联想通过数据分析
重新考量设计方案
成功案例下载 
惠普将25亿次客户交易转化为客户亲密度
成功案例下载 
SAS Text Analytics
文本分析
产品介绍
SAS Text Miner
文本挖掘
产品介绍
客户之声文本
挖掘方案
解决方案概览

网络课堂

文本分析与挖掘

讲师:SAS中国首席咨询顾问,高居泰

内容概要:企业每天都会产生大量文本形式的信息,客服中心、博客、微博等社交媒体上每天也会产生海量的文本信息,如何从这些非结构化数据中挖掘价值?视频将以实际的案例和互动体验方式向您呈现SAS文本分析与挖掘的强大功能。

 

网络课堂

成功案例

这样的分析让我们能够从客户的角度重新定义质量问题。
Mohammed Chaara
客户洞察与VOC分析总监
挑战
综合分析内部的产品、呼叫中心文本数据与线上数据,更快地发现质量问题,更彻底地了解客户所需。
解决方案
  • SAS® Contextual Analysis

  • SAS® Sentiment Analysis

  • SAS® Visual Analytics

  • SAS® Text Miner
带来的好处
  • 仅需传统保修分析所用时间的三分之一,就能检测出产品问题。

  • 对以往难以检测的问题,保修成本降低10%到15%。

  • 更新优化文档内容,减少呼叫中心的电话咨询次数。

  • 避免可能阻碍销售的键盘新设计。

将客户融入到质量方程中

联想通过数据分析重新考量设计方案

在即将完成最热卖机型的键盘更新设计时,联想发现了一群极其拥护当前键盘设计的玩家。他们来自一个规模虽小却十分重要的在线游戏社区。这让联想意识到,更改键盘布局也许会招致大规模客户群的反感,例如自由开发人员和游戏玩家。

联想公司的企业分析团队使用了SAS软件来实施质量感知项目。通过网页抓取、筛选出涉及联想的文本数据,对此前未知的论坛进行分析挖掘。团队发现一位客户写下关于当前产品设计特别是键盘评价,该评价长达6页且感情饱满。这篇评价引来了2000条评论!客户洞察和VOC分析总监Mohammed Chaara说:“这在我们以往的投产前设计审查中是无法发现的。”

这个发现让联想公司认可了联想早期检测(LED,Lenovo Early Detaction)系统和Chaara领导的其分析团队的工作。

世界上最大的个人电脑和平板电脑制造商联想公司在过去并未针对无名博客或新论坛进行情感分析。公司希望通过研究内部和外部数据,掌握关于质量、产品开发和产品创新的丰富信息。 “我们主要关注供应链优化、交叉销售/追加销售机会、产品定价和打包服务等方面。在这些领域中取得的任何改善都是基于聆听客户之声的基础上,” Charra说道。他表示,SAS提供了用于“管理异常庞大的数据”的技术框架。

该项目的成功在联想公司内点燃了数据分析的熊熊烈火。联想最初计划在LED系统中支持15名用户,但是随着人们的口口相传,最终有300名用户注册登录到LED系统中。LED系统的仪表盘将客户的情感、保修和呼叫中心分析可视化地展示出来。

纵观大局

衡量情感和理解质量的传统方法有其内在的弱点和时间滞后等缺点:

•  客户调查中只包含了客户愿意填写的表面信息。

•  保修信息常常在新产品交付几个月之后才会反馈回来。

•  很难解释造成客户不满和产品问题的众多成因。

此外,联想还会打包销售第三方软件,客户使用的各种配件(笔记本电脑的扩展坞和鼠标设备)等。这些可能是联想的产品,也可能不是。更复杂的问题是,公司的运营覆盖了165个国家并且支持超过30种语言,所以通过人工方法来分析评论无法保持一致性,极其浪费时间,而且不能扩展到分析社交媒体反馈的规模。情感分析的应用帮助联想感知原始语言的细微差别。(例如,澳大利亚人对事情的描述和美洲人是不同的)。

通过分析驱动发现扩展坞问题,是联想LED系统带来的第二个重要成果。客户在打电话要求技术支持时会提到屏幕问题,电脑突然关机,或者是电池无法充电。有些客户则会在社交媒体帖子中提到类似内容。而少数时候,客户会提到扩展坞的问题。直到联想使用SAS软件来综合分析呼叫中心记录和社交媒体帖子的时候,“扩展坞”问题才得到关注,质量工程师从中发现根本原因,并发布相应的软件更新。

Chaara说:“我们能够在短短几周内收集反馈。以前,这往往需要60天到90天的时间,因为我们不得不等待各地提交上来的报告。”现在,这只需要15天到30天的时间。由于缩短了问题的侦测时间,节约了10%-15%的保修成本。从保修派工次数到呼叫中心的电话问题检测时间的减少,整个过程中节约的成本十分可观。

呼叫中心的信息非常重要,而社交媒体信息则更加关键。“人们会在Twitter和Facebook上描述他们在当时所做的事情:‘我将电脑和扩展坞连接,然后某某问题就发生了。’”Chaara说,“这些原始描述未经加工,但却包含了很有用的信息。”

当分析客户在打开电脑开始使用时所描述的问题时,能够都得到一些以前未知的洞察。联想开始认识到它所提供的文档(解释产品功能、保修条款和其它相关信息)不够清晰明了。Chaara说:“这直接增加了呼叫中心的每次电话成本。通过完善相关文档,我们看到关于常用信息的咨询电话数量降低了30%到50%”。

在营销前线之外赢得好评

这个项目取得的佳绩使得Chaara有机会向CEO进行了展示项目成功之处。项目的目标是为管理层提供仪表盘视图。Chaara说:“仪表盘提供了管理层所需思考的内容,他们相信这个。”而且,Chaara的团队将会对项目的成果进行正式评估,并将其拓展用于衡量更多的问题,例如客户在购买联想产品时的客户体验。

“这个分析系统让我们更全面地理解质量的概念。质量不仅仅是个人电脑能否工作正常。它还包括了人们清楚了解如何使用产品,能够从公司快速获得准确的帮助,能够让非联想的组件很好地与联想的硬件兼容工作,以及了解客户对现有产品的喜好,而不是仅凭产品设计人员认为好和对的想法就对产品重新设计。”Chaara说:“SAS让我们能够从客户的角度重新定义质量问题”。

热文一览