首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2500951
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
KDnuggets:Polls:数据存储格式 (June 2005)
数据挖掘者 发表于 2005/7/3 13:19:52
IDMer总结:在数据挖掘中,采用文本格式来存储数据是目前的主流(占32%),其次是将数据存储在数据库中(占23%),其它的则是存储在DM软件专有格式中(SAS、SPSS、Excel等)。由此可见,采用何种格式来存储数据挖掘所用的数据,首先考虑的要素是数据的可交换性,文本方式和关系数据库如此流行,一方面是因为可以方便的存取和处理,另一方面是因为DM工具对它们具有良好的支持。 以下内容引自KDnuggets(http://www.kdnuggets.com/polls/2005/data_storage_formats.htm): KDnuggets : Polls : Data Storage Formats (June 2005) Poll What are your preferred methods for storing data for data mining? [403 votes total] Text, CSV (comma-separated) (72) 500)this.width=500'> 18% Text, space or tab separated (55) 500)this.width=500'> 14% Excel (38) 500)this.width=500'> 9% SAS (57) 500)this.width=500'> 14% SPSS (31) 500)this.width=500'> 8% S-Plus/R (15) 500)this.width=500'> 4% Weka ARFF (23) 500)this.width=500'> 6% Other data mining tool format (11) 500)this.width=500'> 3% In a database system (93) 500)this.width=500'> 23% Other - please comment (8) 500)this.width=500'> 2%

阅读全文(2388) | 回复(0) | 编辑 | 精华

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.201 second(s), page refreshed 144762652 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号