Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2496838 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
KDnuggets:Polls:数据存储格式 (June 2005) |
|
|
|
|
|
数据挖掘者 发表于 2005/7/3 13:19:52 |
|
|
|
IDMer总结:
在数据挖掘中,采用文本格式来存储数据是目前的主流(占32%),其次是将数据存储在数据库中(占23%),其它的则是存储在DM软件专有格式中(SAS、SPSS、Excel等)。由此可见,采用何种格式来存储数据挖掘所用的数据,首先考虑的要素是数据的可交换性,文本方式和关系数据库如此流行,一方面是因为可以方便的存取和处理,另一方面是因为DM工具对它们具有良好的支持。
以下内容引自KDnuggets(http://www.kdnuggets.com/polls/2005/data_storage_formats.htm):
KDnuggets :
阅读全文(2383) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
机器学习讲义(幻灯片) |
|
|
|
|
|
数据挖掘者 发表于 2005/6/29 15:54:43 |
|
|
|
机器学习讲义(幻灯片) http://www.cs.utah.edu/~hal/courses/2008S_ML/index.html
Machine Learning Lecture Slides
Overview Introduction Version Spaces Version Spaces and Inductive Bias Learning for Decision Trees Issues in Learning for Decision Trees Conceptual Clustering Neural Networks Neural Networks, continued Evaluating Hypotheses Genetic Algorithms Instance- |
|
|
|
阅读全文(4460) | 回复(2) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
一个介绍机器学习的站点 |
|
|
|
|
|
数据挖掘者 发表于 2005/6/29 15:50:43 |
|
|
|
不错,作为入门挺好 http://www.cs.utexas.edu/users/mooney/cs391L/
提供以下的学习材料: Introduction to Machine Learning Concept Learning and Generality Ordering Decision-Tree Learning Experimental Evaluation Computational Learning Theory Rule Learning and Inductive Logic Programming Neural Network Learning Bayesian Le
(下面还有13字) |
|
|
|
阅读全文(2891) | 回复(0) | 编辑 | 精华 | 删除 |
|
|
|
|
|
|
|
数据挖掘人员的能力要求 |
|
|
|
|
|
数据挖掘者 发表于 2005/6/26 17:26:08 |
|
|
|
这个是我以前编写的一份文档,在面试新人时会考察如下条件,有兴趣进行数据挖掘实施工作的朋友可以参考一下(当然如果您有补充意见也请给我留言,谢谢)
删除 |
|
|
|
|
|
|
| |