昨天开始看一个促进资源共享与服务为宗旨的项目,觉得JISC Information Environment 是一个必须要好好参考的项目。2004年时从资源集合的角度对JISC IE有所涉略,先把老帐翻出来再说:
JISC 的全称为“Joint Information Systems Committee”,该委员会旨在为英国的高等教育(higher and further education)领域如何应用信息与通信技术来促进发展提供战略性的指导、建议和机会[3]。它负责向高等教育领域提供各种信息资源集合,而这些资源集合由不同类型的内容供应商(独立的教育机构、JISC指导下的相关部门、商业出版商等等)提供,有着不同的访问方式(如公开访问、局限于签订过购买协议的机构等)。
IESR全称为“Information Environment Service Registry”,由JISC资助,这里的Information Environment是指JISC信息环境,JISC IE可以理解为允许英国高等教育领域的用户发现、访问、使用、发布信息资源的一系列网络服务,它不是单一的系统或服务,而是一个可以通过部件的组合向感兴趣的用户发布的服务框架[4]。JISC IE指定了一系列的标准与协议,即系统之间的接口,使得不同的服务组件之间的通讯成为可能,减少了最终用户的负担。
JISC IESR是一个在JISC信息环境内机器对机器的中间件共享服务[5]。如前所述,JISC信息环境中存在着大量对英国的研究者、学生及教师可用的资源集合,其中很少有资源集合提供机器对机器的访问接口,IESR提供单一中心目录来组织这些资源集合的高品质描述,以及用以访问这些集合的服务细节。简言之,IESR为门户及虚拟学习服务等应用提供了关于资源集合及其访问途径的一个单一中心目录,避免了资源集合信息的分散或重复,提高资源集合的被认知度和获得性。
这里的资源集合及服务的描述采用基于目前可获得的开放标准、由IESR定义的元数据方案。元数据记录以XML数据库的形式存在,可由Cheshire II信息检索软件对数据库进行索引,辅以meta-registry支持浏览和数据挖掘。通过IESR,某一学科的门户可以为最终用户发现相关的资源集合、决定最佳的访问方式,然后为最终用户提供资源集合的链接或在分发出去的检索中包含对所发现资源集合的检索。
IESR支持或将支持以下几种接口来对它进行访问:Z39.50、OAI-PMH、Web Services SOAP、Web Search等。
IESR的数据模型
IESR的数据模型如下图所示(本图来源于Ann Apps.的A Registry of Collections and their Services: from Metadata to Implementation一文)
500)this.width=500'>
图8:IESR的数据模型
从图中可以看出,IESR主要涉及如下三种实体类型:
l 资源集合(collection)
l 服务(service), 服务可以是提供信息(如访问资源集合的途径),也可以是实施交易处理
请注意,IESR中的服务表示对资源集合一种简单的/低层次的访问。
l 代理(agent),包括资源集合的所有者或服务的管理者、提供者。
注:在IESR中注册的所有类型中任何一个实体都分配有一个唯一标识符,采用PURL-based Object Identifier (POI)的形式。
[1] UCSB Library.The Alexandria Digital Library.URL:http://www.alexandria.ucsb.edu/(检索日期:2004-11-27)
[2] JISC Information Environment Service Registry.URL:http://www.iesr.ac.uk(检索日期:2004-11-27)
[3] Joint Information Systems Committee.URL:http://www.jisc.ac.uk/(检索日期:2004-12-1)
[4] Powell, Andy. JISC Information Environment General FAQ. URL: http://www.ukoln.ac.uk/distributed-systems/jisc-ie/arch/faq/general/(修改日期:2003-4-09)
[5] Ann Apps. A Registry of Collections and their Services: from Metadata to Implementation. URL: http://purl.org/metadataresearch/dcconf2004/papers/Paper_02.pdf(检索日期:2004-12-01)
其他资料
The JISC Information Environment and Web services http://www.ariadne.ac.uk/issue31/information-environments/
The JISC IE 架構是一個3-layer模型, 如下圖所示
500)this.width=500'>
Content providers
最上層是內容供應者(CP), 基本CP是JISC-funded data centres. 換成數位典藏計劃則是各典藏單位. 當然未來要鼓勵其他單位, 如學校, 私人博物館等。
Portals
在呈現層(presentation layer, PL), portal提供使用者找尋各CP提供的服務。因此各CP要將其握有的資源公開, 以便portal可找到。portal的種類繁多, 如以主題入口網站(http://www.portal.ac.uk/spp/)或稱之為垂直入口網站(vertical portal), 以媒體類型區分的網站(如圖片入口網站), 組織入口網站(institutional portals)。
由架構圖來看, CP可以選用以下三種方式將其握有的資源提供其他單位使用:
開放其metadata供搜尋之用: portal送來搜尋詢問的要求, 傳回其資料庫比對的結果. 這裡用Z39.50的Bath Profile
讓其metadata供harvesting之用, i.e., 允許其他服務下載其metadata紀錄. 這裡用OAI Protocol for Metadata Harvesting (OAI-PMH)
通知其他service新的資源到來. 這裡用RDF Site Summary (RSS)
中文来源(2002年的资料,也有助于我偷懒啊,毕竟是中文的,嘿嘿):http://swportal.cse.ttu.edu.tw/dl/homework/doc/20020927.htm
5 step guide to becoming a content provider in the JISC Information Environment
这一文章很清晰地告诉我们,如何才能成为JISC IE的内容提供者。
更多的参考资料在http://www.ariadne.ac.uk中可以获得。