« | October 2025 | » | 日 | 一 | 二 | 三 | 四 | 五 | 六 | | | | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 | 17 | 18 | 19 | 20 | 21 | 22 | 23 | 24 | 25 | 26 | 27 | 28 | 29 | 30 | 31 | | |
| 公告 |
数据仓库&数据挖掘
对某一件事需要坚持方能真正完成这件事
薛 峰
2009.02.03 |
Blog信息 |
blog名称:数据仓库与数据挖掘 日志总数:85 评论数量:14 留言数量:0 访问次数:723493 建立时间:2005年3月17日 |

| |
[反洗钱专栏]中国反洗钱启动全攻略 警方已协助调查70余线索 文章收藏
薛 峰 发表于 2005/7/5 11:02:59 |
中新网2月19日电 进入2003年,中国反洗钱力度骤然加大,中国人民银行三天内连续颁布了《金融机构反洗钱规定》、《人民币大额和可疑支付交易报告管理办法》和《金融机构大额和可疑外汇资金交易报告管理办法》等三项法规,目标直指洗钱活动。
中国人民银行对洗钱全面宣战之后,各级机构,包括商业银行、公安部门、外汇管理部门用什么手段打击深藏不露的洗钱活动?金融机构每天的资金交易极为庞杂,监管部门怎样从中找到洗钱的蛛丝马迹呢?对此,中央电视台“经济半小时”记者对此进行了采访。
洗钱,确切地讲是把走私贩毒、黑社会组织犯罪、恐怖活动等违法活动获得的收益,通过各种手段,使它在形式上变成合法资金,“把黑钱洗成白钱”。这其中,犯罪分子琢磨出很多手段,但无论采用什么方式,大额交易都是进入金融机构洗钱的第一步,反洗钱首先从这一环节展开。
央行反洗钱处亮相
中国人民银行支付交易监测处是一个全新的部门。由于太多工作要一一落实,开张半年至今没有时间挂牌。从事金融监管工作已有20年时间的李莲是该部门的领军人物,她对开始着手的 |
|
[数据仓库]四种数据ETL模式 文章收藏
薛 峰 发表于 2005/7/5 9:01:16 |
四种数据ETL模式
根据模型的设计和源数据的情况,有四种数据ETL模式:
完全刷新:数据仓库数据表中只包括最新的数据,每次加载均删除原有数据,然后完全加载最新的源数据。这种模式下,数据抽取程序抽取源数据中的所有记录,在加载前,将目标数据表清空,然后加载所有记录。为提高删除数据的速度,一般是采用Truncate清空数据表。如本系统中的入库当前信息表采用此种模式。
镜像增量:源数据中的记录定期更新,但记录中包括记录时间字段,源数据中保存了数据历史的记录,ETL可以通过记录时间将增量数据从源数据抽取出来以附加的方式 |
|
[反洗钱专栏]中国掀起反洗钱风暴 网上资源
薛 峰 发表于 2005/7/4 16:59:03 |
7月2日,《华尔街日报》头版的一篇长文称:“五年前的一个冬天的晚上,本·拉登得力助手扎瓦哈里,失败的车臣之旅”中的一个细节:“5年前一个冬天的晚上,扎瓦哈里,穿过里海和高加索山脉之间一段狭长的陆地,潜入俄罗斯,俗往车臣发展恐怖基地。尽管使用化名并乔装改扮,扎瓦哈里和他的两名追随者刚刚进入俄境内,即遭联帮安全机构逮捕。根据俄方的资料,当时搜查出的与其恐怖活动相关的线索有,申请去台湾的签证申请表、一张香港某银行的信用卡、中国某省某银行的账户明细......”
扎瓦哈里,本.拉登得力助手,被称为:“本.拉登的大脑”、“埃及医生”,策划“9.11”对美国恐怖袭击事件的最大嫌疑人。
& |
|
[数据仓库]给我一个评估方法 谈数据仓库投资回报 (http://www.china-bi.com/) 网上资源
薛 峰 发表于 2005/7/1 17:51:58 |
给我一个评估方法 谈数据仓库投资回报
作者:Vickie Farrell 企业对于任何行动都想知道一件事情:“投资回报率 (ROI) 是多少?”投资的每一元钱都应持之有据,购入的任何技术都应提供积极有形的成效。企业追求ROI的过程,也是自身需求由模糊到清晰的过程。
数据仓库市场早期发展并不理想,如今市场已日渐成熟,许多企业已经开始受益于投资的成果。但毕竟建立数据仓库是牵扯企业业务、管理、IT系统等多方面“大工程”,企业要真正发挥其效益,如若没有通过一定的评估手段,明确投资回报结果,数据仓库的价值或许难以被真正获得。
CIO:给我评估方法 |
|
[数据挖掘]数据挖掘技术的三大支柱 网上资源
薛 峰 发表于 2005/7/1 17:40:01 |
(1) 数据库技术。SQL 统治数据库查询语言标准三十多年这一事实本身就与现在 IT 发展的节拍不符,难道我们"只会查询"吗?所以就有很多专家纷纷转向数据仓库与数据挖掘技术,从数据查询转向数据挖掘、从数据演绎转向数据归纳。传统的数据库系统的体系结构也过于瘦少,只有不协调的两层,这样的结构就造成了只有程序员能编程,老板只能求助于这些"专家"。 (2) 人工智能技术。人工智能技术的三大难题:"知识获取、知识表示、缺乏常识"直接制约了它在现实技术市场上的作为。而在与数据仓库技术的结合上,它可以发挥重要作用,这使得它转向数据挖掘技术。 (3) 概率与数理统计。数理统计技术是应用数学中最重要、最活跃的学科。但在与数据库技术的结合上作为有限,这从 SQL 中那可怜的几条汇总函数便可看出。随着数据挖掘对查询、归纳对演绎需求的进化,概率与数理统计将获得新的生命力。 数据挖掘所能发现的知识有如下几种:广义型知识、特征型知识、差异型知识、关联型知识、预测型知识、偏离型知识。所有这些知识都可以在不同的概念层次上被发现,随着概念树的提升,从微观到中观再到宏观,以满足不同用户、不同层次决 |
|
|