期货交易自动化论坛

 找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 20|回复: 0

信用卡数据集市咨询 - 第2页 - 金融行业 - ITPUB论坛-专业的IT技术社区

[复制链接] |主动推送

285万

主题

285万

帖子

855万

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
8553710
发表于 2022-9-11 07:17:08 | 显示全部楼层 |阅读模式
jack2008 发表于 2013-3-6 19:49

理论而已,我没见到2个月能实现一个专题数据集市的,恐怕连数据需求分析都做不完
一个主题域,2个月建成,这也没什么好奇怪的。虽说是理论,但这理论也是人家归纳总结的结果,总是有点道理。
在打散和聚合的过程,数据就规范和整合到一起了
也就是这样,把各个源业务系统,千奇百怪的数据整合到一起了
信用卡数据集市绝不是把数据仓库中的信用卡数据按仓库的模型抽象出来就OK的。
数据仓库主题域:团体、产品、协议、事件、地域、渠道、资产、总账……
信用卡集市主题域:按实体层级分为:客户、账户、卡片;按产品生命周期分为:申请、行为、催收……
本帖最后由 CountOnMyself 于 2013-3-8 00:32 编辑
jack2008 发表于 2013-3-7 20:32

信用卡数据集市绝不是把数据仓库中的信用卡数据按仓库的模型抽象出来就OK的。
数据仓库主题域:团体、产品 ...
新鲜,首次看到以数据内容作为划分数据仓库和数据集市的标准。
集市主题域可以有客户、账户,仓库就不可以有?那ECRM,ECIF怎么实现的呢?
有此“创新”,即使是INMON也只能让自已建立的数据仓库理论靠边站了。
不过,什么叫实体,什么叫主题,什么是ODS,什么是DW,真弄清楚了么?
本帖最后由 CountOnMyself 于 2013-3-8 00:55 编辑
dawu21983 发表于 2013-3-7 16:22

我们的集市是 建立在仓库之上的,也就是说仓库是集市的数据源头
仓库模型,主要是三范式,毕竟需要进行数据 ...
三范式的存储,叫ODS,是基于业务实体进行数据存储模型的组织,例如客户、账户、交易、总账等,是数据仓库和数据集市的数据准备阶段,不是真正的数据仓库。
真正的数据仓库和数据集市,是逆范式的存储,是基于业务主题的多维数据存储模式,具体设计模式,前面提到过了不展开。
而所谓业务主题,就是指商业活动过程中共同关心的重要课题,其中有各行业的共性主题,例如客户流失分析,潜在客户分析、消费行为分析等,也有行业特色的主题,例如电信行业的互联互通分析、通话行为分析,金融的反洗钱分析、欺诈交易分析、恶意透支分析等,只要有企业自已关心的问题,都可以在数据仓库中组建相应的数据模型进行分析。
数据仓库这玩意,进入中国已经10多年了,实在是没什么新花样,好好学习一下有关数据仓库原理的资料,结合自已在银行业务知识方面的积累和信息需求,不难建成自已真正需要的数据平台。
如果已经有了EDW,可以考虑建仓内的DM。
另外,如果有明确的业务需求,信用卡也已经进仓了,暂时主要在接口层考虑具体业务的具体需求就可以了。想在所有的业务需求之前见仓内的集市,其实短期内也没办法想全的。
本帖最后由 CountOnMyself 于 2013-3-8 11:41 编辑
raftyang 发表于 2013-3-8 09:32

DW肯定是要三范的,DM的维度表一般是逆反的,因为要分层
如果大家未学过inmon的教材,也没有研究过国际著名数据仓库产品厂商的培训材料,不妨拿百度百科普及一下。
http://baike.baidu.com/view/19711.htm
留意以下内容,与前面讨论的问题有关,不解释。
关系内容二者的联系:
数据仓库的出现,并不是要取代数据库。目前,大部分数据仓库还是用关系数据库管理系统来管理的。可以说,数据库、数据仓库相辅相成、各有千秋。
二者的区别:
1、出发点不同:数据库是面向事务的设计;数据仓库是面向主题设计的。
2、存储的数据不同:数据库一般存储在线交易数据;数据仓库存储的一般是历史数据。
3、设计规则不同:数据库设计是尽量避免冗余,一般采用符合范式的规则来设计;数据仓库在设计是有意引入冗余,采用反范式的方式来设计。
4、提供的功能不同:数据库是为捕获数据而设计,数据仓库是为分析数据而设计,
5、基本元素不同:数据库的基本元素是事实表,数据仓库的基本元素是维度表。
6、容量不同:数据库在基本容量上要比数据仓库小的多。
7、服务对象不同:数据库是为了高效的事务处理而设计的,服务对象为企业业务处理方面的工作人员;数据仓库是为了分析数据进行决策而设计的,服务对象为企业高层决策人员。
数据集市
为了特定的应用目的或应用范围,而从数据仓库中独立出来的一部分数据,也可称为部门数据或主题数据(subjectarea)。在数据仓库的实施过程中往往可以从一个部门的数据集市着手,以后再用几个数据集市组成一个完整的数据仓库。需要注意的就是在实施不同的数据集市时,同一含义的字段定义一定要相容,这样在以后实施数据仓库时才不会造成大麻烦。
CountOnMyself 发表于 2013-3-8 11:34

如果大家未学过inmon的教材,也没有研究过国际著名数据仓库产品厂商的培训材料,不妨拿百度百科普及一下。 ...
很好!!!!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?立即注册

x
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|期货交易自动化论坛

GMT+8, 2024-11-27 20:34 , Processed in 0.090416 second(s), 28 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表