商业智能究竟智能在什么地方
商业智能已经在实现着三个转变:从数据驱动转向业务驱动、从关注技术转向关注应用、从关注工具转向关注工具产 生的绩效。而搜索引擎本质上是业务驱动和关注应用的(实时的用户需求响应),因此本人认为商业智能和搜索引擎二者有探讨的空间。这或许有助于理解技术的分 分合合,或能为完善二者提供些参考。
1、搜索引擎本质是(商业)智能的一种体现。
企业或集团的历年数据累积甚为庞大,但信息过量,难以消化,且信息形式不一致,难以统一处理。“要学会抛弃信息”,人们开始考虑:“如何才能不被信息淹没,而是从中及时利用数据资产找到需要的信息、发现有用的知识、辅助自己分析和决策以提高信息利用率?”商业智能应运而生.
2、商业智能和搜索引擎的工作原理一致
我们先看看搜索引擎的工作原理。搜索引擎有抓取网页、处理网页、提供检索服务三个主要环节。首先是抓取网页。端到端的搜索引擎都有自己的网页抓取程序(spider)。Spider以超链接为顺序,连续地抓取网页。被抓取的网页被称之为网页快照。其次处理网页。搜索引擎抓到网页后,还要做大量的预处理工作,才能提供检索服务。其中,最重要的就是提取关键词,建立索引文件。其他还包括去除重复网页、分析超链接、计算网页的重要度。准备工作完成后,即是浏览者所见到的搜索引擎界面,即第三提供检索服务 。
数据获取方面,需求满足第一,效率第二。机器抓取体现了高效率,高稳定,低成本,但原创性和信息的编辑性不够,人工录入如果做到高质量原创性、较低成本则更能体现信息对于用户需求的满足,效率则是排在第二位。
商业智能(BI)的主要工作原理在“数据抽取、数据加工存储、数据分析和数据展现”这四个环节体现,这是一个完整的端到端的商业智能解决方案。
3、商业智能在三方面需要借鉴搜索引擎
1)搜索引擎获取结果的方式极为简单,值得借鉴
商业智能应用主体的泛化,使得BI融入日常业务运作,这需要极为简单的操作方式和低成本传播方式。而搜索引擎的简易操作性可以实现这个目的。从使 用者的角度看,搜索引擎提供一个包含搜索框的页面,在搜索框输入词语,通过浏览器提交给搜索引擎后,搜索引擎就会返回跟用户输入的内容相关的信息列表。操使用非常简单。
2)完善和提升实时理解分析能力
商业智能在if-what-how模式基础上,补充what-how模式,实现实时智能。不少商业智能解决方案,特别是应筹学的建模应用,一般都 是先假设问题,并对此建模、构造数据及应用体系,针对特定领域,采用特定的分析方法,返回特定的结果。而采用搜索引擎技术则可以通过“数据+语义+分析方 法+结果编排+呈现”的方式,具有数据范围广、分析结果动态的特点,能实现实时智能。
3)增强对非结构化数据的处理能力
非结构化数据对于业务处理日益重要。支持一个决策的信息不仅仅限于来自数据仓库、ODS层的结构化信息,往往还包含大量的非结构化信息,比如文档、邮件、媒体文件等。搜索引擎在处理图片、视频、音乐等非结构信息方面有着较强的能力。
4、搜索引擎在四方面需要借鉴商业智能
1)借鉴专家系统,提高搜索引擎对用户检索提问的理解,去掉多余的检索结果。
当前搜索引擎检索结果已经有较大准确性,但仍需完善。过多的信息、过多的无关紧要的信息,应该在检索结果中去掉。附加的多余信息的出现,重要原因是搜索引擎不理解用户提问的原意。
2)提升智能程度,从搜索数据/信息到给出解决方案,甚至可以执行方案
现在的搜索引擎,它就像一只神奇的手,从杂乱的信息中抽出一条清晰的检索路径,提供了相应的数据或信息。至于信息如何分析和判断,并帮助我们用以决策甚至直接执行,还只能依靠我们的大脑。
商业智能在综合分析和方案选择上有些进展,但依然不成熟,搜索引擎和商业智能可以融合共进。
3)革新网页重要度的评价体制
如何展示用户所需的数据或者结论,以什么标准进行衡量,这对于搜索引擎和商业智能都是非常重要的课题。
现在搜索引擎有两种评价标准,即基于链接评价的搜索引擎和基于访问大众性的搜索引擎。“链接评价体系”认为,一个网页的重要性取决于它被其它网页链接的数量,特别是一些已经被认定是“重要”的网页的链接数量。
4)借鉴商业智能的应用方法,研究搜索用户的行为和需求
搜索引擎是网站建设中针对“用户使用网站的便利性”所提供的必要功能,同时也是“研究网站用户行为的一个有效工具”。搜索引擎聚集庞大的用户需求信息,用户每输入一次查询,即代表了一种需求。累积并分析“需求数据”具有重要的商业价值。商业智能相关产品可以帮助搜索引擎厂家充分利用“需求数据”,找到更有利的商业模式。
事实上,业界早已开始了商业智能和搜索引擎的这种融合。
2004年开始, 商业智能与搜索引擎的结合开始受到广泛的关注。2006年起,各个商业智能厂商普遍出现该类解决方案。