Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2500951 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
KDnuggets:Polls:数据存储格式 (June 2005) |
|
|
|
|
|
数据挖掘者 发表于 2005/7/3 13:19:52 |
|
|
|
IDMer总结:在数据挖掘中,采用文本格式来存储数据是目前的主流(占32%),其次是将数据存储在数据库中(占23%),其它的则是存储在DM软件专有格式中(SAS、SPSS、Excel等)。由此可见,采用何种格式来存储数据挖掘所用的数据,首先考虑的要素是数据的可交换性,文本方式和关系数据库如此流行,一方面是因为可以方便的存取和处理,另一方面是因为DM工具对它们具有良好的支持。 以下内容引自KDnuggets(http://www.kdnuggets.com/polls/2005/data_storage_formats.htm):
KDnuggets : Polls : Data Storage Formats (June 2005)
Poll
What are your preferred methods for storing data for data mining? [403 votes total]
Text, CSV (comma-separated) (72)
500)this.width=500'> 18%
Text, space or tab separated (55)
500)this.width=500'> 14%
Excel (38)
500)this.width=500'> 9%
SAS (57)
500)this.width=500'> 14%
SPSS (31)
500)this.width=500'> 8%
S-Plus/R (15)
500)this.width=500'> 4%
Weka ARFF (23)
500)this.width=500'> 6%
Other data mining tool format (11)
500)this.width=500'> 3%
In a database system (93)
500)this.width=500'> 23%
Other - please comment (8)
500)this.width=500'> 2% |
|
|
|
阅读全文(2388) | 回复(0) | 编辑 | 精华 |
|
|
|
|
|
|
| |