本站首页    管理页面    写新日志    退出


«October 2025»
1234
567891011
12131415161718
19202122232425
262728293031


公告

数据仓库&数据挖掘

  对某一件事需要坚持方能真正完成这件事

            薛 峰  

           2009.02.03


我的分类(专题)

日志更新

最新评论

留言板

链接

Blog信息
blog名称:数据仓库与数据挖掘
日志总数:85
评论数量:14
留言数量:0
访问次数:723493
建立时间:2005年3月17日




[反洗钱专栏]中国反洗钱启动全攻略 警方已协助调查70余线索
文章收藏

薛 峰 发表于 2005/7/5 11:02:59

中新网2月19日电 进入2003年,中国反洗钱力度骤然加大,中国人民银行三天内连续颁布了《金融机构反洗钱规定》、《人民币大额和可疑支付交易报告管理办法》和《金融机构大额和可疑外汇资金交易报告管理办法》等三项法规,目标直指洗钱活动。   中国人民银行对洗钱全面宣战之后,各级机构,包括商业银行、公安部门、外汇管理部门用什么手段打击深藏不露的洗钱活动?金融机构每天的资金交易极为庞杂,监管部门怎样从中找到洗钱的蛛丝马迹呢?对此,中央电视台“经济半小时”记者对此进行了采访。   洗钱,确切地讲是把走私贩毒、黑社会组织犯罪、恐怖活动等违法活动获得的收益,通过各种手段,使它在形式上变成合法资金,“把黑钱洗成白钱”。这其中,犯罪分子琢磨出很多手段,但无论采用什么方式,大额交易都是进入金融机构洗钱的第一步,反洗钱首先从这一环节展开。   央行反洗钱处亮相   中国人民银行支付交易监测处是一个全新的部门。由于太多工作要一一落实,开张半年至今没有时间挂牌。从事金融监管工作已有20年时间的李莲是该部门的领军人物,她对开始着手的


阅读全文(1793) | 回复(0) | 编辑 | 精华 | 删除
 


[数据仓库]四种数据ETL模式
文章收藏

薛 峰 发表于 2005/7/5 9:01:16

  四种数据ETL模式 根据模型的设计和源数据的情况,有四种数据ETL模式:
    

   完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。

镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式


阅读全文(7050) | 回复(1) | 编辑 | 精华 | 删除
 


[反洗钱专栏]中国掀起反洗钱风暴
网上资源

薛 峰 发表于 2005/7/4 16:59:03

7月2日,《华尔街日报》头版的一篇长文称:“五年前的一个冬天的晚上,本·拉登得力助手扎瓦哈里,失败的车臣之旅”中的一个细节:“5年前一个冬天的晚上,扎瓦哈里,穿过里海和高加索山脉之间一段狭长的陆地,潜入俄罗斯,俗往车臣发展恐怖基地。尽管使用化名并乔装改扮,扎瓦哈里和他的两名追随者刚刚进入俄境内,即遭联帮安全机构逮捕。根据俄方的资料,当时搜查出的与其恐怖活动相关的线索有,申请去台湾的签证申请表、一张香港某银行的信用卡、中国某省某银行的账户明细......”     扎瓦哈里,本.拉登得力助手,被称为:“本.拉登的大脑”、“埃及医生”,策划“9.11”对美国恐怖袭击事件的最大嫌疑人。   &

阅读全文(1940) | 回复(0) | 编辑 | 精华 | 删除
 


[数据仓库]给我一个评估方法 谈数据仓库投资回报 (http://www.china-bi.com/)
网上资源

薛 峰 发表于 2005/7/1 17:51:58

给我一个评估方法 谈数据仓库投资回报
作者:Vickie Farrell 
 
  企业对于任何行动都想知道一件事情:“投资回报率 (ROI) 是多少?”投资的每一元钱都应持之有据,购入的任何技术都应提供积极有形的成效。企业追求ROI的过程,也是自身需求由模糊到清晰的过程。 

  数据仓库市场早期发展并不理想,如今市场已日渐成熟,许多企业已经开始受益于投资的成果。但毕竟建立数据仓库是牵扯企业业务、管理、IT系统等多方面“大工程”,企业要真正发挥其效益,如若没有通过一定的评估手段,明确投资回报结果,数据仓库的价值或许难以被真正获得。 

  CIO:给我评估方法 

阅读全文(3279) | 回复(0) | 编辑 | 精华 | 删除
 


[数据挖掘]数据挖掘技术的三大支柱
网上资源

薛 峰 发表于 2005/7/1 17:40:01

(1) 数据库技术。SQL 统治数据库查询语言标准三十多年这一事实本身就与现在 IT 发展的节拍不符,难道我们"只会查询"吗?所以就有很多专家纷纷转向数据仓库与数据挖掘技术,从数据查询转向数据挖掘、从数据演绎转向数据归纳。传统的数据库系统的体系结构也过于瘦少,只有不协调的两层,这样的结构就造成了只有程序员能编程,老板只能求助于这些"专家"。
(2) 人工智能技术。人工智能技术的三大难题:"知识获取、知识表示、缺乏常识"直接制约了它在现实技术市场上的作为。而在与数据仓库技术的结合上,它可以发挥重要作用,这使得它转向数据挖掘技术。
(3) 概率与数理统计。数理统计技术是应用数学中最重要、最活跃的学科。但在与数据库技术的结合上作为有限,这从 SQL 中那可怜的几条汇总函数便可看出。随着数据挖掘对查询、归纳对演绎需求的进化,概率与数理统计将获得新的生命力。
数据挖掘所能发现的知识有如下几种:广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决

阅读全文(4664) | 回复(0) | 编辑 | 精华 | 删除
 


« 1 2 3 4 5 6 7 8 9 10 »



站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.234 second(s), page refreshed 144814442 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号