Blog信息 |
|
blog名称:IDMer (数据挖掘者) 日志总数:175 评论数量:848 留言数量:119 访问次数:2504532 建立时间:2005年6月24日 |
我的相册 |
|

|
联系方式 |
 |
|
| |
公告 |
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com 我的新浪微博:@张磊IDMer |
网络日志 |
|
毕业设计 |
|
|
|
|
|
debby(游客)发表留言于2006/4/26 11:49:42 |
|
|
|
我的毕业设计题目:文本挖掘。首先要在现成的语料库中提取特征,想用词频统计的算法,但是以前没有接触过这方面的内容,不知道怎么下手,希望能给与帮助。谢谢!
|
|
|
|
| 编辑 | 主人回复 | 删除 |
|
|
|
|
|
|
|
请教 |
|
|
|
|
|
dmdou(游客)发表留言于2006/4/14 23:20:46 |
|
|
|
请教一下,我最近开始学习数据挖掘技术,您能介绍一下这方面的前景吗?庸俗一点就是找工作是否很有需求?嘿嘿 多谢
以下为blog主人的回复:
现在和以后对数据挖掘人才的需求还是有一些的,不过由于数据挖掘是对数据的深层分析,所以一般除了要求深入了解数据挖掘技术之外,还要求对数据库(数据仓库)、行业业务、分析等方面的能力和经验。因此建议你熟悉数据库技术,同时有机会的话多参与一些实际项目,这样可以扩大你的择业范围。 | |
|
|
|
| 编辑 | 主人回复 | 删除 |
|
|
|
|
|
|
|
毕业设计求助 |
|
|
|
|
|
jeff(游客)发表留言于2006/4/4 10:18:15 |
|
|
|
您好,我是的毕业设计题目定了,基于分区的算法的孤立点分析,但是感觉到没有头绪,另外也没有找到合适的数据源.现在我应该应该看那些书呢?从哪个地方下手呢?
|
|
|
|
| 编辑 | 主人回复 | 删除 |
|
|
|
|
|
|
|
您好,咨询一下 |
|
|
|
|
|
hello(游客)发表留言于2006/3/21 11:15:00 |
|
|
|
我的方向是遗传算法进行关联规则挖掘,但是看的不多,还有50天就NDBC2006就截稿了,您能否给我一些建议,比如看什么书,如何准备,
谢谢
以下为blog主人的回复:
遗传算法我了解得很少,所以无法告诉你去看些什么书,只能给些投稿方面的建议。NDBC(全国数据库年会)接收的稿件主要分为两大类:研究报告类和技术报告类,前者侧重于科学研究(新的模型、新的思路、算法改进等),后者侧重于技术实现(结合具体的应用,一般需要有系统原型、应用效果等)。一般来说,前者比后者的学术价值更高些,稿件的质量也要求较高,所以需要比较长时间的研究和积累才可能做出来。
因此,如果你希望在没有前期准备的情况下,用50多天来完成论文,可行的方法是向技术报告类的方向靠拢。我建议你首先找到有价值的应用问题(比如商业或企业等方面对关联分析的应用),然后应用遗传算法和其它关联分析方法(比如Apriori算法)来进行分析,对不同算法的性能效果进行评估比较,总结各种算法的特点及适用范围。当然,如果能对算法做些有益的改进更好,可以让论文的学术性更强。最后,描述出应用了关联分析的结果能带来什么效益(比如对货架位置的调整、对客户的交叉销售等到)。
以上是论文的大致思路,但需注意的是,一定要有创新。如果仅仅是对算法的简单应用,则被录用的可能性很小。因为你的文章中的内容,在其他人的文章中都可以找到,那么你的文章就失去了存在的意义,也就不会被评委所接受。 | |
|
|
|
| 编辑 | 主人回复 | 删除 |
|
|
|
|
|
|
| |