BI入门

最近想学习BI,因为自己做的一个项目用到了大量Oracle分析函数,而烃使用使用OLAP技术,系统目前数据量少,速度相对来说可以。每天数据量这么大,谁能保证积累了两年的数据后,运算速度还有这么快呢。这让我不得不思考我在做的项目与BI的差别,BI这概念之前只听说过没深入了解更没有用过相应的工具。一开始自己就想到开源的BI工具,就开始下载,找入门文档。两天之后让我发现这行不通,连概念都不理解,仅有工具是不行的。我们需要理解它的定义、历史、作用,才能开始学习它,才需要用过工具。

1、BI的定议:

BI(BusinessIntelligence)是一种运用了数据仓库、在线分析和数据挖掘等技术来处理和分析数据的崭新技术,目的是为企业决策者提供决策支持。

从定义上我们要明白BI运行的基础是:数据仓库,和联机分析,数据挖掘

目的:提供决策支持

2、BI分类

信息类BI应用

指由原始数据加工而来的数据查询、报表图表、多维分析、数据可视化等应用,这些

应用的共同特点是:将数据转换为决策者可接受的信息,展现给决策者。例如将银行交易数据加工为银行财务报表。

知识类BI应用

指通过数据挖掘技术和工具,将数据中隐含的关系发掘出来,利用计算机直接将数据加工为知识,展现给决策者。

3、BI的应用模式

A、初级模式

数据查询和生成报表,这是BI的初级应用模式

B、

1、BI高级应用模式

OLAP,即联机分析处理,是BI带来的一种全新的数据观察方式,是BI的核心技术之一。

2、数据挖掘

数据挖掘的目的是通过计算机对大量数据进行分析,找出数据之间潜藏的规律和知识,并以可理解的方式展现给用户。数据挖掘是最高级的BI应用,因为它能代替部分人脑功能。

数据挖掘的三大要素是:

技术和算法:目前常用的数据挖掘技术包括——

自动类别侦测(AutoClusterDetection)

决策树(DecisionTrees)

神经网络(NeuralNetworks)

数据:由于数据挖掘是一个在已知中挖掘未知的过程,

因此需要大量数据的积累作为数据源,数据积累

量越大,数据挖掘工具就会有更多的参考点。

预测模型:也就是将需要进行数据挖掘的业务逻辑由

计算机模拟出来,这也是数据挖掘的主要任务。

4、底座——数据仓库技术

数据仓库(DataWarehouse)是一个面向主题的(SubjectOriented)、集成的(Integrate)、相对稳定的(Non-Volatile)、反映历史变化(TimeVariant)的数据集合,用于支持管理决策。以上是数据仓库的官方定义。

5、总结:

要想学好BI,以上知识点是基础。必须把基础学习才能深切的理解BI,理解客户在这主面真正意义上的需求。

相关推荐