首页(175) 数据挖掘研究(27) 数据挖掘实践(53) 数据挖掘介绍(25) 杂谈(59) 管理页面   写新日志   退出   关于IDMer

 Blog信息
 
blog名称:IDMer (数据挖掘者)
日志总数:175
评论数量:848
留言数量:119
访问次数:2496961
建立时间:2005年6月24日

 日志更新
 

 我的相册
 

It's me!


 最新评论
 

 留言板
 

 链接
 

 联系方式

 日志搜索





 公告
“数据挖掘者”博客已经搬家,欢迎光临新博客网址:http://idmer.blog.sohu.com
我的新浪微博:
@张磊IDMer
 网络日志
RE: web数据挖掘 
数据挖掘者 发表于 2007/12/29 15:07:31
Sunstone,  我在做的事情是一个关于用户行为和用户习惯推荐的事情,属于分类信息或者垂直搜索的细分市场。   业务逻辑是:       如果甲需要购买租赁房屋,将信息发布到我们的网站上了,我们的网站能够自动帮助他推荐适合他条件的一些房屋。由于房屋本身可以做成格式化数据,但是类似于环境良好、房屋干净等很多数据是需要通过数据的分析得到的。      再例如,甲要购买化妆品,她将自己的基本皮肤特征输入到网站上就能够获得这方面类似"好友"    的使用记录,并且通过她的使用将她的购买记录推荐给她的"好友"。   我购买了一本《web数据挖掘》发现和我的要求相去甚远,请教哪类的书籍能够满足这些基本要求。中间我参考过两个算法: 关联规则的Coffee 和 机器学习的weka 。     特此请教,什么书籍可以错略的学习一些这些知识,或者 由哪类基本成熟的算法可用。     真诚致谢!   耀东     于京 书房     以下为blog主人的回复: 耀东,你好: 这种商品推荐和一种比较成熟的数据挖掘应用非常类似,那就是交叉销售(Cross Selling),你可以搜索一些相关资料来看看。 简单介绍一下相关的处理思路: ① 一个方向是基于用户的层面进行分析: 首先在用户提出了比较明确的需求之后,可以利用匹配算法,把商品库中满足需求条件的产品找出来,这个实现起来比较简单。然后是将用户进行细分,把具有类似偏好的用户划分到相同的用户群,再用该用户群最喜欢的商品作为推荐。这里用到的是聚类(Clustering)技术。最后可以建立预测模型,根据用户的基本特性和商品的使用行为(含点击查看商品的信息),来预测出他购买特定商品的概率。这里可以用决策树、Logistic Regression等技术。 ② 另一个方向是基于商品的层面进行分析: 根据商品的销售信息进行关联分析,找出关联性比较强的商品,例如购买了A商品的客户也很可能会购买B商品,这样就可以针对购买了A商品的客户推荐B商品。这里用到的是关联分析技术。此外,还有一份我最近看到的ppt你也可以参考以下,宾夕法尼亚大学大学Arnaud De Bruyn助教写的“Recommender systems”,网络链接是:http://www.adastral.ucl.ac.uk/~icox/course/presentations/RecommenderSystems.pptBest Regards,Sunstone Zhang

阅读全文(8093) | 回复(2) | 编辑 | 精华
回复:RE: web数据挖掘
烟雨朦胧发表评论于2007/12/30 19:31:42
祝元旦愉快! 以下为blog主人的回复: Thanks!也祝大家新年快乐!

个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
回复:RE: web数据挖掘
开花的芝麻发表评论于2007/12/29 22:08:39
博主你好。 请问一下,你有做分布式数据挖掘吗?想请教一些东西。 以下为blog主人的回复: 呵呵,不好意思,没有做过。
个人主页 | 引用回复 | 主人回复 | 返回 | 编辑 | 删除
» 1 »

发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)


站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.248 second(s), page refreshed 144752325 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号