Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2495754 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
Dumpster - 分手在情人节(可视化) |
|
|
|
|
|
数据挖掘者 发表于 2008/2/23 16:32:09 |
|
|
|
IDMer:数据分析常常给人的印象都是非常严肃和复杂的,但我们也常常能看到一些很有意思的应用。下面就是这样一个例子—Dumpster项目,它通过对上百万个网络日志的分析,抓取出2005年内发生的大约20000个描写恋人分手的日志,并进行了可视化的展示。在这些被分析的对象中,超过一半是13到19岁的青少年,70%是女性,15%为男性。
图形中有很多圆形组成,称为“分手泡泡”(Breakup Bubbles)。黄色泡泡是当前关注的一次分手,其它泡泡是和黄色泡泡类似的分手,相似度由颜色来标明。
右上角方框里的文字,就是当前关注的分手所对应的日志片断。
| |
|
|
阅读全文(7214) | 回复(6) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
2008(第五届)中国数据挖掘与商业智能研讨会-参会通知 |
|
|
|
|
|
数据挖掘者 发表于 2008/2/14 13:33:14 |
|
|
|
会议公告.doc
2008(第五届)中国数据挖掘与商业智能研讨会 暨海峡两岸应用统计研讨会 -参会通知-
在当今竞争日益激烈的市场环境中,只有那些利用先进的信息技术成功地收集、分析、理解信息并依据信息进行决策的企业才能获得竞争优势,才是市场的赢家。因此,商业智能需要进展到下一步--数据挖掘。数据挖掘能帮助您在浏览巨量数据的同时从中发现潜在有效的模式,并将这些模式应用于商业运营中。因此,越来越多的管理者开始借助数据挖掘技术和商务智能技术来发现商务运营过程中存在的问题,找到有利的解决方案,提高企业的竞争力。 为了促进海峡两岸在数据挖掘这一主题上应用型研究的交流,本 |
|
|
|
阅读全文(6955) | 回复(3) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
文本挖掘:事实与谎言 |
|
|
|
|
|
数据挖掘者 发表于 2008/1/1 23:00:43 |
|
|
|
转自:http://www.texttechnologies.com/2007/12/23/text-mining-myths-realities/
Text mining - fact and fiction
Categories: 删除 |
|
|
|
|
|
|
|
专家观点:数据挖掘的本质  |
|
|
|
|
|
数据挖掘者 发表于 2008/1/1 22:31:24 |
|
|
|
转自:http://www.google.com/group/dm-club/web/%E4%B8%93%E5%AE%B6%E8%A7%82%E7%82%B9%EF%BC%9A%E6%95%B0%E6%8D%AE%E6%8C%96%E6%8E%98%E7%9A%84%E6%9C%AC%E8%B4%A8
J.H.Friedman 斯坦佛大学统计系及线性加速中心
摘要:DM(数据挖掘)是揭示存在于数据里的模式及数据间的关系的学科,它强调对大量观测到的数据库的处理。它是涉及数据库管理,人工智能,机器学习,模式识别,及数据可视化等学科的边缘学科。用统计的观点看,它可以看成是通过计算机对大量的复杂数 |
|
|
|
阅读全文(5628) | 回复(1) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
RE: web数据挖掘  |
|
|
|
|
|
数据挖掘者 发表于 2007/12/29 15:07:31 |
|
|
|
Sunstone,
我在做的事情是一个关于用户行为和用户习惯推荐的事情,属于分类信息或者垂直搜索的细分市场。
业务逻辑是:
如果甲需要购买租赁房屋,将信息发布到我们的网站上了,我们的网站能够自动帮助他推荐适合他条件的一些房屋。由于房屋本身可以做成格式化数据,但是类似于环境良好、房屋干净等很多数据是需要通过数据的分析得到的。
再例如,甲要购买化妆品,她将自己的基本皮肤特征输入到网站上就能够获得这方面类似"好友" 的使用记录,并且通过她的使用将她的购买记录推荐给她的"好友"。
我购买了一本《web数据挖掘》发现和我的要求相去甚远,请教哪类的书籍能够满足这些基本要求。中间我参考过两个算法: 关联规则的Coff |
|
|
|
阅读全文(8090) | 回复(2) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
[转] 机器学习与数据挖掘 (周志华) |
|
|
|
|
|
数据挖掘者 发表于 2007/12/17 22:03:42 |
|
|
|
全文:http://cs.nju.edu.cn/zhouzh/zhouzh.files/publication/cccf07.pdf
机器学习与数据挖掘 周 志 华 南京大学计算机软件新技术国家重点实验室,南京 210093
【摘要】
“机器学习”是人工智能的核心研究领域之一, 其最初的研究动机是为了让计算机系统具有人的学习能力以便实现人工智能,因为众所周知,没有学习能力的系统很难被认为是具有智能的。目前被广泛采用的机器学习的定义是“利用经验来改善计算机系统自身的性能”[1]。事实上,由于“经验”在计算机系统中主要是以数据的形式存在的,因此机器学习需要设法对数据进行分析,这就使得它逐渐成为智能数据分析技术的创新源之一,并且为此而受到越来越多的关注。 < |
|
|
|
阅读全文(17014) | 回复(6) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
【转】Google的神秘配方  |
|
|
|
|
|
数据挖掘者 发表于 2007/8/27 11:30:28 |
|
|
|
转自:http://www.yeeyan.com/articles/view/BlueF/1642
原作者: Paul Smalera 删除 |
|
|
|
|
|
| | |