首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2504532
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
留言板(签写留言)

毕业设计
debby(游客)发表留言于2006/4/26 11:49:42

我的毕业设计题目:文本挖掘首先要在现成的语料库中提取特征,想用词频统计的算法,但是以前没有接触过这方面的内容,不知道怎么下手,希望能给与帮助。谢谢!

以下为blog主人的回复:

请参考北京大学自然语言学研究所主页(http://www.icl.pku.edu.cn/default_cn.asp)。

微软亚洲研究院-自然语言计算组(http://research.microsoft.com/asia/group/nlc/

计算语言学和自然语言信息处理研究和应用综述(http://ling.cass.cn/yingyong/courses/nlpbase.htm

| 编辑 | 主人回复 | 删除
请教
dmdou(游客)发表留言于2006/4/14 23:20:46

请教一下,我最近开始学习数据挖掘技术,您能介绍一下这方面的前景吗?庸俗一点就是找工作是否很有需求?嘿嘿 多谢

以下为blog主人的回复:

现在和以后对数据挖掘人才的需求还是有一些的,不过由于数据挖掘是对数据的深层分析,所以一般除了要求深入了解数据挖掘技术之外,还要求对数据库(数据仓库)、行业业务、分析等方面的能力和经验。因此建议你熟悉数据库技术,同时有机会的话多参与一些实际项目,这样可以扩大你的择业范围。 

| 编辑 | 主人回复 | 删除
毕业设计求助
jeff(游客)发表留言于2006/4/4 10:18:15
您好,我是的毕业设计题目定了,基于分区的算法的孤立点分析,但是感觉到没有头绪,另外也没有找到合适的数据源.现在我应该应该看那些书呢?从哪个地方下手呢?

以下为blog主人的回复:

关于孤立点分析,我了解得很少。唯一做过的相关工作就是将其应用到数据质量检查中,根据历史趋势发现新的数据中是否存在异常。除此之外,孤立点分析应该在网络流量异常检测中应用得比较多。至于需要看哪些书,象《数据挖掘:概念与技术》等书中只有简单介绍,深入的内容建议你尝试一下Google的学术搜索http://scholar.google.com/schhp?hl=zh-CNwww.researchindex.org等等。

欢迎对这方面熟悉的同行给出宝贵意见,谢谢。

| 编辑 | 主人回复 | 删除
您好,咨询一下
hello(游客)发表留言于2006/3/21 11:15:00

我的方向是遗传算法进行关联规则挖掘,但是看的不多,还有50天就NDBC2006就截稿了,您能否给我一些建议,比如看什么书,如何准备,

谢谢

以下为blog主人的回复:

遗传算法我了解得很少,所以无法告诉你去看些什么书,只能给些投稿方面的建议。NDBC(全国数据库年会)接收的稿件主要分为两大类:研究报告类和技术报告类,前者侧重于科学研究(新的模型、新的思路、算法改进等),后者侧重于技术实现(结合具体的应用,一般需要有系统原型、应用效果等)。一般来说,前者比后者的学术价值更高些,稿件的质量也要求较高,所以需要比较长时间的研究和积累才可能做出来。

因此,如果你希望在没有前期准备的情况下,用50多天来完成论文,可行的方法是向技术报告类的方向靠拢。我建议你首先找到有价值的应用问题(比如商业或企业等方面对关联分析的应用),然后应用遗传算法和其它关联分析方法(比如Apriori算法)来进行分析,对不同算法的性能效果进行评估比较,总结各种算法的特点及适用范围。当然,如果能对算法做些有益的改进更好,可以让论文的学术性更强。最后,描述出应用了关联分析的结果能带来什么效益(比如对货架位置的调整、对客户的交叉销售等到)。

以上是论文的大致思路,但需注意的是,一定要有创新。如果仅仅是对算法的简单应用,则被录用的可能性很小。因为你的文章中的内容,在其他人的文章中都可以找到,那么你的文章就失去了存在的意义,也就不会被评委所接受。

| 编辑 | 主人回复 | 删除
留言数:135  « 21 22 23 24 25 26 27 28 29 30 »
给idmer签写留言:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写留言内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.031 second(s), page refreshed 144782394 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号