本站首页    管理页面    写新日志    退出

 

[平芜尽处]Folksonomy的解释资料
明蓝 发表于 2005/12/26 15:14:13

注:以下均来自Kevin Wen的BLOG。 来源一:http://blog.timetide.net/archives/2005/01/15/20050115015808.php Folksonomy是一个创造词,是由社会性书签服务中最具特色的自定义标签(Tag)功能衍生而来。Folksonomy=Floks+Taxonomy,Folks在英文中是比较口语化的词,表示一群人,一伙人的意思。Taxonomy则是指分类法,它是信息构架(Information Architecture)中一个重要部分。而Folksonomy是指“群众”自发性定义的平面非等级标签分类,我将它称为“分众分类”,也有人将之解释为Social Classification。 听起来很复杂,举个例子,当我在收藏Sina.com时,自定义了“门户”,“中国”,“新闻”这3个关键词作为标签,而其他人在收藏Sina.com时也自定义了自己的关键词作为标签。而最后系统统计出来使用“门户”,“中国”,“新闻”这个3个关键词来定义Sina.com的频率最高,那么这3个词就是用户对Sina.com的分众分类 - Folksonomy。 Folksonomy有几个特点,首先,是由个人自发性定义,第二,标签分类是公开共享的,可以被所有人看到,其三,是由用户群体定义的频率来决定。 分众分类使得传统分类法摆脱了固化的现象,并且跟大众的认知程度密切的结合起来,同时这种分类方法也为群体用户和信息之间建立了一个联系桥梁。这种分类是平面化的,没有等级层次的划分,虽然它相对不够严谨,缺乏准确度,但是在社会性软件中,这种平面延伸的分类方法却在无形之中成为形成了沟通的渠道和网络,而且方便,灵活,不受条件限制。所以这种以自定义标签形式的分众分类在现下流行的社会性网络服务中得到了广泛的应用,del.icio.us ,Flickr,43things等等。关于Tag在社会性软件中应用是一个很值得关注的趋势,在这里暂时不做更多说明。 来源二:http://blog.timetide.net/archives/2005/02/04/20050204163145.php  关于Folksonomy(分众分类)与语言的关系是一个很有意思的问题。 Tag的兴起源于两种社会性网络服务的应用 - del.icio.us书签和Flickr的图片分享服务。这两种Web服务很巧妙的将Tag功能运用其中,配合他们独特的易用性,一定程度上引爆了Tag以及分众分类的流行。不过这些服务的语言系统都是基于英文,所以在接受和认知程度上,他们更符合英文用户的使用习惯。 分词特征:英语和汉语在分词的定义上有着显著的区别。英文中的词干以单词形式出现,而中文中的词干是由单个字组成的“词组”。从语言学(Linguistic)的角度来说,英语中的单词可以直接排它性的定义,而汉语的词需要通过特定的分词结构来进行区别。举一个简单的例子,“她用魔法做了一个毒苹果然後扮成一个老婆婆到森林去找白雪公主”。这个句子中的“苹果”和“果然”就需要通过中文的分词算法来解决,到底是“苹果”为一个词还是“果然”为一个词?而英语中很少会出现这样的问题。总的来说,两种语言的分词特征有显著不同。关于中文分词详情见卢亮的中文分词系统。 语义普遍认知(Common Sense)的差别:在不同的语言环境下,对语义的普遍认知存在很大的差异,比如Technology,这是一个普同的定义词,但在汉语中,对于它的解释可能是:科技,技术,工艺等等。在这种情况下,Technology本身在英语语境的普遍认知度则比科技,技术,工艺这三个词中的任一词在汉语语境中的普遍认知度高。同样的情况也出现在汉语语境中,Keso举了“春节”这个例子,在英文中它可以表述为ChineseNewYear,SpringFestival,LunarNewYear等等。可见,不同语言系统中的语义普遍认知度差别明显。 缩写词的特征:这是在英语中一个很特有的现象,比如Get Things Done这个短语是一本书名,在使用中往往被缩写为“GTD”,又比如中国共产党 - Chinese Communist Party,在使用中被普遍缩写为CCP。在英语语境中,许多特定词组都是通过缩写形式来表达。而这种表达方式运用于Tag标签就非常方便,如创作共用Creative commons往往被缩写为CC, 这样的例子不胜枚举。但在汉语语境中则没有这个特征。 趋同性:在整个Tag系统里面还有一个很显著的特征,就是趋同性。也就是对于同一个对象的定义,往往人们趋同选择被定义次数多标签作为其分众分类。举个例子,boingboing在美味书签中被使用“Blog”标签了200多次,而被使用“news”标签了90次,也就是说,用户在定义的时候更趋向于选择使用次数多的标签。而这种结果又恰恰的反射出大家对同一事物的普遍认知度上。所以在整个Tag系统中,用户对一个事物的理解有着趋同性的特征。并且这种趋同性从一个侧面能够反映出群众的普遍认知度,甚至用户结构等。 通过最近做的一些简单使用调查,结合开发中的一些经验,对于分众分类在在汉语上的应用和普及我持比较保守的态度。不伦是从语言的使用习惯,用户群的普遍认知度,还是汉语语境的分词结构,许多地方分众分类标签容易模糊用户的导向,分众分类在中文的社会性网络服务中作为一种辅助功能而存在更为可行,或者在某一些特定领域比如具体地点名称上进行应用,但作为内容平级分类模式,其应用与汉语语境的用法和习惯等诸多方面无法协调,它并不是一种能够在中文环境中保持生命力的应用模式。

阅读全文(2662) | 回复(0) | 编辑 | 精华

 



发表评论:
昵称:
密码:
主页:
标题:
验证码:  (不区分大小写,请仔细填写,输错需重写评论内容!)

 
 



 

.: 公告

我的分类:“春雨楼头”是平时自己对生活的所思所虑,不涉及专业。“平芜尽处”是专业上的所想所惑,不局限于任何主题,day after day主要是英文学习方面的。从2007年8月份起,专业上的内容都放到“图林茶”中去了,这里只写专业以外的东东啰:)。

free web hit counter


 

«August 2025»
12
3456789
10111213141516
17181920212223
24252627282930
31

.: 我的分类(专题)

首页(450)
IT-general(41)
Semantic Web(4)
工作日志(26)
生活备忘(47)
学习备忘(5)
Digital Library(13)
day after day(19)
平芜尽处(75)
Metadata(17)
program(3)
web2.0/lib2.0(12)
春雨楼头(154)



 

.: 最新日志

20170701
佩服自己
宝宝生日快乐
重启之后复睡眠
生命
72小时定律
20100513宝宝满十个月啦
重启
贫民窟的百万富翁
本末倒置看《小猫杜威》


.: 最新回复

回复:20170701
回复:佩服自己
回复:佩服自己
回复:[转帖]泰戈尔《世界上最远的距离》
回复:[转帖]泰戈尔《世界上最远的距离》
回复:[转帖]泰戈尔《世界上最远的距离》
回复:[转帖]泰戈尔《世界上最远的距离》
回复:tenure track
回复:[转帖]泰戈尔《世界上最远的距离》
回复:[转帖]泰戈尔《世界上最远的距离》



blog名称:花生壳
日志总数:450
评论数量:771
留言数量:6
访问次数:7281534
建立时间:2004年11月4日




.: 留言板

签写新留言

看看
你的留言已经收到,十分感谢!!
3434
没什么
投票表决器怎么做
发现了这个元数据项目,不知对你是否有帮助
RE: BLOG正文
多谢关心
什么时候写一下萧峰和阿朱啊
看到你留言了。以后可以多多讨论



.: 链接


数字图书馆研究:

http://www.kevenlw.name

奇正图话:

http://my.donews.com/leonz/

http://leonzhao07.wordpress.com/

计算机爱好者:

http://idswe.blogbus.com

http://my.opera.com/idswe/blog/

青山绿水雅客来:

http://yyqq99.blogchina.com/

Leading the Semantic Web to its reality:

http://blogger.org.cn/collin





站点首页 | 联系我们 | 博客注册 | 博客登陆

Sponsored By W3CHINA
W3CHINA Blog 0.8 Processed in 0.695 second(s), page refreshed 144773333 times.
《全国人大常委会关于维护互联网安全的决定》  《计算机信息网络国际联网安全保护管理办法》
苏ICP备05006046号