数据资源是数字图书馆的基础,但是我们正面临着这样一种现状:
n 数字图书馆自建的数据库资源和具有访问权的外部数据库资源数量上从几十种到上百种不等并正在快速增长,不同的数字资源出版商提供了不同的用户界面和检索软件;
n 读者对检索简单化的需求也在增长。读者都希望能以统一身份在不受地域限制的情况下访问不同的资源,并同时检索不同数据库资源,实现对资源的快速定位和利用;
SUNTUN认为所谓资源整合,就是将各种分布、异构和多样化的资源进行有序组织,提供统一检索途径,从而在各自独立的数据库资源基础之上动态构建一个虚拟的数据总库,将各种资源以统一的方式呈现给资源读者,实现信息资源的有序组织、快速定位和有效揭示。
在大量的数字图书馆用户需求分析、竞争分析和测试实践基础上,成都易宝迅腾科技有限公司推出了SUNTUN资源整合统一检索平台(SUNTUN Infor Integration Portal,以下简称SUNTUN IIP),帮助用户解决日益迫切的数字资源整合需求。
1.1 数字图书馆的资源
从来源上分,电子资源又可分为如下两种:
n 自建资源:数字图书馆自己进行电子化加工得到的资源;
n 外购资源:从资源提供商处购买的数据资源或资源网上访问权限
从种类上来分,电子资源又可分为:
l 目录资源,包括图书期刊的书目和目次信息,通常各馆都通过OPAC系统向读者提供公共查询服务
l 文摘和全文资源,主要包括由各出版商和数据库商提供的在线或镜像数据库资源;
l 其他资源:例如联合目录资源、引文分析等;
1.2资源使用中的问题与资源整合
数字图书馆的外购资源种类繁多、结构各异,分别由各个不同的资源服务商提供。各资源提供商所生产的资源无法得到统一,总结起来会存在如下差异:
n 数据结构不同:所标引的字段不尽相同;
n 发布方式不同:发布技术不同;
n 权限验证不同:采用不同用户身份识别技术;
n 检索方式不同:提供的检索引擎不同;
n 存储手段不同:存储的数据库结构和类型不同(有的是普通的RDBMS,而有的是特殊的自主开发的数据库系统)。
所有上述外购数字资源之间的差异决定了这些资源在读者和管理人员使用时存在下述问题:
? 资源使用缺乏整体感:用户只能分别使用这些资源的发布和检索,资源之间没有任何联系,形成一个一个的信息孤岛;
? 无法实现统一的检索:用户只能分别使用各个资源提供的检索引擎进行资源检索,造成使用上的不便和时间精力的浪费;
? 检索结果风格各异:各个检索引擎结果显示风格各异,无法得到统一;
? 资源使用情况无从统计:所购资源使用情况如何,没有相应的日志进行记录,更无法得到必要的统计数据,从而使资源的购买无据可依。
? 无法在IP限制范围外使用数据,用户的IP不在资源设定的允许访问范围内时,就不能再使用数据资源了。
? 读者随意使用资源,资源利用只是产出,而不盈利,造成资源建设维护的经济压力逐步加大。
鉴于上述问题,如何整合外购资源,使其象自建资源一样能成为图书馆的一个有机组成部分,就成为数字图书馆建设中的一个全新的课题。
如何进行资源整合,在新一代数字图书馆建设中正越来越受到人们的关注。
1.3 资源整合所面临的挑战
资源整合作为一个迫切需要解决的课题,在如下几个方面对数字图书馆建设者们提出要求:
n 有效组织
内容越来越多,资源之间结构又千变万化,用户所面对的是一个一个的信息孤岛,资源本身缺乏有效的登记管理,资源之间也缺乏有效的组织。
目前,大多数图书馆对所购买的大量数据库资源只是通过简单地链接方式对读者提供了资源导航服务,读者仍需使用各资源系统自己的检索方式进行检索,同时图书馆缺乏对众多资源统一的登记管理和对用户使用情况的统一记录、统计和监控。
n 资源评估和统计
从数字图书馆建设者角度上,需要对所购买资源的使用情况有确切的使用情况记录,并能按各种方式得到使用情况统计数据,这些统计数据将对图书馆的资源管理和服务质量的提高和资源购买决策提供强有力的依据。
n 资源使用的权限控制
资源内容的安全性是资源使用的基本要求,必须正确地控制资源使用的范围(相应的用户授权使用相应的资源)。资源使用的授权要兼顾灵活方便和简单易用两种要求。
n 资源使用计费
对资源的使用过程进行计费,可以实现多样的计费手段,可以对单篇数据进行点击次数计费和价格计费,也可以对资源进行包月处理。
n 资源跨区域
突破电子资源访问上的IP限制,用户在任何IP的情况下,通过统一身份登陆到系统中后就可以是在系统中利用其所整合的数据资源。
n 平台兼容性
为保护用户投资,资源整合必须是具有良好扩展性和平台兼容性的,从而在日后的发展过程中可以根据使用情况随时切换平台、扩展功能。
n 系统的安全性
在保证资源内容安全的同时,系统的健壮性是数字图书馆建设的另一个重要要求。系统的安全性是指系统防恶意访问和黑客攻击的能力,以便在有恶意访问的时候也能保证大多数用户的正常使用。
二、SUNTUN资源整合统一检索平台(SUNTUN IIP v2.0)
SUNTUN资源整合统一检索平台(SUNTUN IIP v2.0)是成都易宝迅腾科技有限公司数字图书馆解决方案的重要组成部分,其主要功能是整合数字图书馆中的分布、异构和多样化的资源,将各种异构资源组织成一个有机的整体,同时为用户提供个性化的服务。
各种外购资源的数据是存储在各种各样的数据库系统中的,资源的发布服务就搭建在这些DB之上,对用户透明。
数字图书馆的资源服务方式主要是通过HTTP SERVER服务来实现的,SUNTUN IIP2.0支持此样的服务方式,并使这些不同种类的资源对用户访问实现透明,用户只要用浏览器,就可以实现对此种资源的统一访问,并使它们的返回结果没有任何区别。
SUNTUN IIP2.0的主要功能可以归纳为如下几点:
? 统一检索:用户可同时对多个资源提交的检索请求;
? 统一结果显示:多各资源的检索结构统一显示给用户;
? 资源直通道:用户可对单个资源单独进行访问;
? 用户访问控制:严格的访问控制保护资源内容的安全性;
? 资源使用评估:对资源的使用情况进行各种统计分析;
? 资源使用计费:对用户在使用资源的过程中进行计费处理;
? 资源跨地域限制:通过跨地域访问机制,实现用户无限制访问资源;
? 管理员工具:为理员提供配置工具,实现系统的实施灵活性。
SUNTUN IIP2.0的上述功能将在下一节中详细描述。
2.2.1 统一检索
用户可同时选择多个资源,从同一个检索入口对多个资源提交检索请求。请求将由SUNTUN IIP v2.0进行多线程并发递交给各个资源的检索引擎,有效提高检索速度,节约用户的时间。对于一个检索请求,SUNTUN IIP v2.0首先给出检索报告,报告各个引擎的检索结果数,为读者提供有指导意义的检索结果概貌。
2.2.2 统一结果显示
SUNTUN IIP v2.0等待各个资源的检索引擎返回结果,并对这些结果进行分析和提取,以统一的方式返回给用户。如果用户要进一步浏览这些检索结果,则可以点击相应的链接,进入各个资源的细览查看详细信息。
2.2.4 用户访问控制
SUNTUN IIP v2.0使用了整个SUNTUN数字图书馆解决方案统一的用户权限管理功能,通过它,可以实现对任何功能组件中访问权限的控制。
独立统一的用户权限管理模块
在整个SUNTUN数字图书馆解决方案中,使用了相对独立的用户授权管理模块,整个解决方案的任何组件都可以从用户管理这个角度整合起来,用户不必记忆多个登录名、密码,进行多次烦琐的登录,可以在多个系统中共享一个用户。
n 灵活方便的授权方式
用户管理模块提供了4种从简到繁的授权方式,通过对这4种授权方式的灵活使用,可以实现简繁结合的授权需求,充分确保了用户权限管理的灵活性。
n 单次登录SSO(Single-Sign-On)
用户管理模块同时还可以整合用户的现有应用,使得用户不必再记忆若干个用户名和密码,而将所有应用的用户管理统一到本模块中
n 可扩展性
用户权限管理模块,可以与其他用户认证系统进行连接,保证了其良好的扩展性。
权限控制
为了满足内容分发过程中对权限控制的各种需求,SUNTUN IIP 2.0的权限控制提供了以下的方式:
n 基于用户/用户组
对系统内用户或用户组进行相应的授权,使指定的用户/用户组可以对相应的内容进行相应的操作。
n 基于IP
可以为为指定的访问IP设置相应的权限,从此IP进行的访问将获得相关的权限。
2.2.5 资源使用评估
SUNTUN IIP 2.0对资源使用情况做准确的记录,并提供基于此之上的多种统计功能,并可生成报表、图表,可打印。
n 访问最多的IP地址:保证系统安全性的一种方式,可以统计一段时间内的IP访问排名前n位;
n 特定资源使用率:可以统计一段时间内特定资源的使用率,以曲线图的方式表现;
n 特定时间资源使用情况:可以统计一段时间内的使用率最高的n个资源,可以饼图和柱图的方式表现;
同时系统还提供个性化统计功能扩展的可能。
2.2.6资源计费
系统提供计费功能,用户在浏览资源详细内容的时候进行计费处理。
计费策略采用:操作费用,操作次数,操作时间三中计费策略,满足用户对资源使用过程中计费的多样性。
2.2.7资源跨地域访问
目前,多数的商业数据库采用IP限制访问的方式提供服务,只有被授权的IP范围内的用户才能使用。这样的限制造成读者只能在图书馆内使用电子资源,资源的使用广度被限制了,给读者造成了不便。
SUNTUN IIPv2.0针对这一情况,提供了跨地域访问资源的功能。即使读者的电脑IP不在资源的授权IP范围内,只要成功登陆我们的系统,进行检索查询后,就可以查看到读者想要参阅的资源信息,同时可以看到信息的详细内容,如有附件内容,还可以下载查看附件文件。
2.2.8管理员配置工具
SUNTUN IIP对资源的支持是可配置的,这项特征使得系统对任何一个新资源的支持非常容易,只需要系统管理员进行适当的参数配置即可。
三、SUNTUN资源整合统一检索平台产品特点
3.1 科学合理的资源组织方式
SUNTUN IIP v2.0为最终用户提供了多种资源视图,包括:
? 树状组织方式:将资源组织成清晰方便的树型,树间节点关系揭示了资源的分类属性,操作简单,方便实用。系统可以组织多棵不同分类标准的资源树,如中图分类树、学科分类树等;
? 列表组织方式:传统的列表方式,提供多样的检索手段,辅助用户找到需要的资源;
? 个人资源收藏夹方式:用户组织自己的个人资源收藏夹,是个性化服务的重要组成部分。
3.2 高度的可扩展性
SUNTUN IIP v2.0具有高度灵活的可扩展性。SUNTUN IIP 2.0对资源的支持是可配置的。就是说,系统管理员可自行配置若干必要的参数,而无须进行任何代码级的改动即可实现一种新的资源检索服务,。
3.3 有效的Cache机制
SUNTUN IIP v2.0设计了科学合理的Cache缓存机制,可有效缓解系统压力和网络流量压力,提高性能。
系统管理员可为每个资源配置数据缓存有效时间,用户的任何一次检索都被系统自动缓存,下一个相同的检索请求在有效缓存时间中将直接使用Cache的数据,节约时间,提高响应速度。
3.5 强大的资源评估
SUNTUN IIP v2.0客观的记录了资源数据库的使用情况,使得外购资源无法记录使用情况的弊端彻底得到改善,为资源购买提供决策参考。
SUNTUN IIP v2.0提供了基于使用记录的各种评估方式,以直观的图表、曲线、报表的方式体现出来,并可将统计结果打印。
3.6 精准的计费处理
对资源使用进行精准计费,实现资源价值的最大化,从而实现高效成功的资源商务运营,便于资源的良性化积累。
通过SUNTUN资源整合统一检索平台访问资源不受地域限制,帮助读者随时随地的使用资源,方便了读者对资源的索取,保障了资源被广泛的利用。
3.8 严密的系统安全性
系统的安全性包括两个部分:
? 资源内容的安全性
为保证系统资源内容的安全性,SUNTUN IIP v2.0提供了两道防线 —IP限制和用户名密码验证。对于合法IP地址段内的用户,可以不必进行用户名、密码验证。对于IP地址不在合法地址段内的用户,必须首先通过用户名密码验证才能通过整合门户正常访问各资源数据库。这种灵活可靠的安全防护机制解决了目前很多最终用户移动办公的需求。
? 系统本身的安全性:
系统本身的安全性是保证大多数最终用户合法访问的手段。系统使用了线程池和单个用户线程数限制技术,使得恶意访问的用户无法对系统构成威胁,同时提高系统的访问效率。
4.1 硬件配置要求
l CPU 1.8G以上
l 2G以上内存
l 1G以上安装硬盘空间
4.2 操作系统要求
l WINDOWS NT4.0/2000 Server(Advanced Server)
l Linux
l 各种主流UNIX
4.3 应用软件配置要求
l JDK1.4.2 版
l Tomcat 4
l Oracle9i/10g
1. 中科院成都分院情报中心:整合各种数据资源库达340种
中科院外网(统一检索)
http://159.226.140.94:8088/UnitedSearch/
若有疑问,请与(易宝迅腾-成都)工程师联系
工程师:向彬(13982185717)
联系电话:028-87574035/36/37
或技术总监:张龙13982126250(手机)联系.
2. 四川农业大学
3. 广东工业大学
4. 四川科技情报所
5. 青海电力试验研究院
6. ……