|
用户名:happyscry 笔名:happyscry 地区: 北京-北京 行业:其他 |
| 日 | 一 | 二 | 三 | 四 | 五 | 六 |
| 搜索BI百科全书 |
《ttnn BI 观点》电子杂志下载
(作者置顶)
暂停公告
本BLOG将暂停更新,未来新文章见ttnn 邮件列表:http://groups.google.com/group/ttnn
维度是正交的吗
数据探索 之 数据源分析
饿老婆的悲哀
美
多维分析的历史
啥是System Of Record
继续昨天关于主数据的话题,又想到一个概念,“system of record”,这个词语我也一直不明白是什么意思,从字面上理解,曾经将它理解为记录原子数据的表,将它用中文表述成为“记录系统”。见《度量数据仓库系统的指标》。
但恐怕它并非此意,而跟主数据有着很类似的含义。由此,又开始犯糊涂,它们俩到底有什么区别呢?
System of record是一个比较古老的概念,应该是在主数据之前。它是记录某种信息的地方,是唯一的,是标准的。
数据一般会分布、复制。在作版本控制的时候,总得确定一个最新版本,这个版本可以被取出,但如果你要修改,就要锁定这个最新版本,告诉别人,这个最新版本在你这里,修改完了在解除锁定,否则,造成版本混乱。因此,可以将最新版本看作是一种system of record。
譬如对于目前移动正在建设的数据集市,同样的数据会出现在省公司数据仓库、地市公司集市,例如客户的姓名、地址资料,帐单、详单等。总得要以某个为标准,这个标准就是system of record,按理来说,这个标准是在省公司的。但很多实际工作中,并没有这样的标准。例如客户资料,在营业系统中录入的客户资料很多都是不准确的,大客户部门提取大客户资料进行一对一关怀,在沟通过程中完善了客户资料,可这些资料有时就保留在大客户部门自己手中。如此,也就没有了标准。
在统计工作中,通常发生统计口径不一致的现象,同一个指标数,从市场部得到,和从生产部门得到的,有差别。可能是指标定义不同,也可能获取的途径不同。这也是缺乏标准的结果。
我想system of record无非就是强调标准化。作数据管理也要想作版本管理一样,要有个作为标准的地方,可以将数据复制发布下去。如果副本修改,需要更新标准。
因此,说到system of record与主数据的区别,我想他们应当是不同领域中,在不同语境中用到的两个词,前者是在信息架构中用到,是一种数据管理的基本思想。而主数据,大多在数据仓库领域,谈论数据质量的时候谈到,可以认为它用到了前者的思想。
主数据定义之争
看到一篇关于主数据管理的文章,国外的。"主数据"这个概念已经在很多厂商的产品线中出现
原来国外对这个概念也是百家争鸣在,各位专家对这个词语下的定义含
还有一位说主数据是那种表示"跟踪状态"的数据,什么叫跟踪状态
扯远了,此位专家提到的跟踪事物状态,也就是累积快照型数据
看到这些不同的见解,很是欣慰,很多人认为国外的数据仓库体系很成
在追求这个概念本意而不得之后,不由要重新回头看看为什么会冒出这
这是它的目的,要建立数据标准。但主数据是什么?是标准本身
一体儿产品的核心能力
度量、指标和指示器之区别
有位朋友提到什么是KPI(Key Performance Indicator,恐怕这篇文章不可避免地提到英文了
度量,用中文表示可以是名词,也可以是动词。名词的意思可以是
因此理解度量这个词,可以从其本身意义理解。度量
度量和维度构成OLAP的主要概念,这里面,对于在事实表或者一个
在OLAP中还有计算度量的说法,用一个总费用除以用户数
这就得说到指标,英文的Metric。在绩效管理软件里面
而Indicator的字面意思为指示器,在KPI中
想想我们身边哪些东西是充当指示器的。红绿灯,提醒行人车辆是否等
可以设想提出KPI的初衷,是希望企业通过一些粗略(非细节
现实中,大家对于三者的称呼并不那么严格,"指标
然而,这些系统中的KPI并非完全上面提到的指示器
,很多系统建设称为度量系统或是指标系统。而对一个企业
关于这三者的区别,曾经在数据质量的考虑中应用过,参见《数据质量体系 之 概念》。再总结一下。
"度量"是绝对的定量值;
"指标"是基于两个或更多度量计算得出的相对值;
"指示器"是基于度量或指标,并依据某个基准值得到的定性结果;
分析模式之实践
定向营销型专题的分析模式
本文主要谈谈此类专题作需求分析时候的模式,撇开细节的挖掘模型不
再简要重复一下,"分析模型"输出名单给"营销流程",
那么在作需求分析时,通常要在哪些方面是重点把住的呢
"目标、角色、策略、评估"
首先是目标,这个专题最终要解决什么问题,通常,目标需要用一个或
当然,影响此类目标不光是技术原因,还有营销活动甚至是大局面的原
第二个,角色,一般是指与系统边界之外与系统交互的人、物、系统
对于具体的执行层面的角色,还得计算其数量,并且评估其可以承受的
第三个策略,其实在整个专题中,营销策略的制定工作量比重很大
在策略制定之前,需要对目标客户进行分群,哪些是高价值的
这个策略的本身设计就可以单独拿出来说的,从目标客户的分群
通过策略的制定,客户的类型、参与策略判断的属性
第四个评估,是要有方法衡量模型、营销活动的完成目标的效果
要得到这类评估信息,显然必须要将营销活动执行结果反馈至模型
当然执行反馈信息可以从两个角度来看,一是从评估者的角度
此四点,窃以为是定向营销型专题的分析模式。当然,所谓"模式"
《ttnn BI观点》200603 第五期发布,欢迎下载!
下载:http://happyscry.googlepages.com/ttnn_bi_opinion_200603.pdf (578K)
往期下载:http://happyscry.googlepages.com/
本期内容在数据仓库架构和需求分析这块有不少内容,也涌现出不少新朋友加入,发表自己的观点,好欣慰啊。
这个月大部分的时间都是在广州呆着,阴雨绵绵的天气搞得人很是无奈,而且上网很不方便,于是和很多朋友的联系变少,因此而受到一些责备。既然俺漂泊到广州,有没有朋友愿意认识一下,通通邮件,或者发发短信,电话聊天,再甚者,出来饮茶更好了。
请看本期目录:
3 精神胜利法
4 怎样的架构设计才是真正的数据仓库架构
11 indicate的挖掘对数据仓库项目的重要性
14 变幻莫测
17 数据仓库总体架构
18 开源BI向我们走来(我们就是不向它走去,看,丫憋不住了吧)
20 再谈谈ODS
23 BI需求、分析模型之我见
26 爱你在心口难开
27 数据仓库是不是实时的?
29 分析问题的模式
30 数据仓库选型
33 BI传奇 之 龙虎斗(上)
34 对于产品和项目的需求分析有什么不同
需求——对系统边界的描述
关于产品和项目的需求分析差异问题,和西宁私下沟通了过,明晰了一些。其实
主要观点是,需求应该包括对系统边界的描述,不论这个系统是产品还
这就是仅仅对其功用的描述,其目标是作凳子用。这可以看作是功能性
因此,在描述需求的时候,重要的就是界定系统的内外
譬如有的需求书,它描述了系统内部模块划分,三层结构,数据存储
当然,有时候根据客户在作要求的时候,并非完全从系统边界上考虑
需求所描述的系统边界,用UML中的用例图来表示是比较简洁的
用例图是起到示意作用,在需求规格说明书中,需要对这些角色