首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2496838
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
KDnuggets:Polls:数据存储格式 (June 2005)
数据挖掘者 发表于 2005/7/3 13:19:52
IDMer总结:

在数据挖掘中,采用文本格式来存储数据是目前的主流(占32%),其次是将数据存储在数据库中(占23%),其它的则是存储在DM软件专有格式中(SAS、SPSS、Excel等)。由此可见,采用何种格式来存储数据挖掘所用的数据,首先考虑的要素是数据的可交换性,文本方式和关系数据库如此流行,一方面是因为可以方便的存取和处理,另一方面是因为DM工具对它们具有良好的支持。

以下内容引自KDnuggets(http://www.kdnuggets.com/polls/2005/data_storage_formats.htm):
KDnuggets :
阅读全文(2383) | 回复(0) | 编辑 | 精华 | 删除
Computer Science Conference Rankings
数据挖掘者 发表于 2005/7/1 10:18:20
http://www.cc.gatech.edu/people/home/guofei/CS_ConfRank.htm

AREA: Artificial Intelligence and Related Subjects
  Rank 1:
       AAAI: American Association for AI National Conference
       CVPR: IEEE Conf on Comp&nbs

阅读全文(9610) | 回复(2) | 编辑 | 精华 | 删除
机器学习讲义(幻灯片)
数据挖掘者 发表于 2005/6/29 15:54:43
机器学习讲义(幻灯片)
http://www.cs.utah.edu/~hal/courses/2008S_ML/index.html

Machine Learning Lecture Slides

Overview
Introduction
Version Spaces
Version Spaces and Inductive Bias
Learning for Decision Trees
Issues in Learning for Decision Trees
Conceptual Clustering
Neural Networks
Neural Networks, continued
Evaluating Hypotheses
Genetic Algorithms
Instance-
阅读全文(4460) | 回复(2) | 编辑 | 精华 | 删除
一个介绍机器学习的站点
数据挖掘者 发表于 2005/6/29 15:50:43
不错,作为入门挺好
http://www.cs.utexas.edu/users/mooney/cs391L/

提供以下的学习材料:
Introduction to Machine Learning
Concept Learning and Generality Ordering
Decision-Tree Learning
Experimental Evaluation
Computational Learning Theory
Rule Learning and Inductive Logic Programming
Neural Network Learning
Bayesian Le

(下面还有13字)
阅读全文(2891) | 回复(0) | 编辑 | 精华 | 删除
决策树学习
数据挖掘者 发表于 2005/6/29 15:42:13
决策树学习
附件:2 机器学习-决策树学习.zip
编写:Sunstone Zhang (Aug, 2001)
来源:www.cs.utexas.edu/users/mooney/cs391L 决策树


(下面还有16字)
阅读全文(26560) | 回复(11) | 编辑 | 精华 | 删除
blogger.org.cn在Linux下无法正常显示
数据挖掘者 发表于 2005/6/28 13:46:58
昨天因工作需要安装了TurboLinux 10,在调通网络后,打开其自带的浏览器(忘记是什么浏览器了,不是Netscape)连上blogger.org.cn,发现主页显示有问题,文字出现了错位和覆盖现象,不知道Collin等同志们有没有关注过?

还有一个问题,我的主页上会自动出现Google提供的公益广告,这个是必需的吗?有没有可能去掉?
阅读全文(8451) | 回复(6) | 编辑 | 精华 | 删除
数据挖掘人员的能力要求
数据挖掘者 发表于 2005/6/26 17:26:08
这个是我以前编写的一份文档,在面试新人时会考察如下条件,有兴趣进行数据挖掘实施工作的朋友可以参考一下(当然如果您有补充意见也请给我留言,谢谢)
删除
美丽的武汉大学图书馆
数据挖掘者 发表于 2005/6/26 14:23:26


(下面还有200字)
阅读全文(4106) | 回复(3) | 编辑 | 精华 | 删除
« 21 22 »


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.078 second(s), page refreshed 144762037 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号