用例:数字保护
【用例标题】用例4.2数字保护 (牧羊人 Shirley 刘伟)
【原文链接】http://www.w3.org/2005/Incubator/lld/wiki/Use_Case_Digital_Preservation
一、用例名称
用例数字保护
二、用例拥有者
Emmanuelle Bermes
三、背景和现状
数字对象的长期保存十分具有挑战性,这不仅是因为这项工作要受存储和备份的限制,还因其需要一系列复杂的解决措施,以提供可靠环境条件使数字对象可随技术发展、软硬件环境的变化而不断改进。为了实现这种改进,必须采取仿真(emulation)和移植(migration)等措施。在数字对象的整个生命周期内,必须收集、存储和管理与数字对象相关的所有信息。这通常是通过收集保存与数字对象、格式、生命周期内事件等相关的元数据来完成的。
四、目标
规划和实现相关数字对象的数字保存;
关联数据提供了一个全球环境,可描述数字对象及其重要属性,而且还可避免如数据格式描述时的重复工作。
五、用例情境描述
当其藏品的子集(subset)就要被剔旧处理时,图书馆员需要进行保存工作。例如他希望将注册表文件中所有的TIFF文档转换为JPEG2000文档。 首先,他需要在知识库(repository)中找出所有包含TIFF文件的数字对象:为了做到这一点,所有文件必须用技术元数据和格式信息进行描述。然后,他要确定进行转换的最适合工具,并对数字集合(digital collection)的子集进行测试。还要对测试进行评估,以检查在TIFF来源文件的重要性能在转换过程中没有丢失(这说明这些属性此前已确定)。最后,他开始转移过程,在一套新的(事件)元数据注册结果,并创建数字对象的新版本。 如果旧版本没有删除,就要在两者之间创建一个链接,将这两个版本都提供给用户,并使用不同的标识符。
六、用例中关联数据的应用
需要很多元数据来实现这个用例:
对象的元数据
文件格式和相关工具的元数据
事件中涉及的有关事件和代理(agent)的元数据
对象不同版本的元数据
此外,所有这些元数据必须可在全球范围内被访问、搜索和检索。资源之间存在许多链接和关系。关联数据允许以标准方式描述这些不同类型的资源,创造一个全球性的信息图,它可涵盖所有需要执行复杂的查询和操作的相关信息。
语义Web标准提供了一个丰富多样的描述复杂信息和运行查询(RDF的+的SPARQL)的框架。
最具技术和/或非特定机构的元数据位,如格式、工具或事件描述,可在全世界范围内的图书馆界共享,以避免机构间重复进行类似的活动。
七、现有工作(可选)
数字保存知识库系统,如Fedora的百科全书仓库系统[1]和SPAR(可扩展保存和存档系统,法国国家图书馆开发)[2]用RDF作为其标准来保存元数据。
P2的注册表项目[3]的目的是以关联数据形式,为格式描述提供一个以Pronom [4]为基础的注册处(registry)。
美国国会图书馆已开始将保存词汇作为关联数据,尤其是描述保存事件[5]和保存级别角色(preservation level role)。
美国加州的数字图书馆在数字知识库的微型服务(又称为Merritt)的实施过程中,使用关联数据和REST框架。关联数据用于功能不同的补救服务(curation service)的综合或协调。
八、相关词汇(可选)
保存元数据的表示:
美国图书馆的保存元数据
OAI—ORE(用来描述复杂数据对象的结构)
DOAP(用来描述软件代理)
PRONOM(包含有关文件格式、压缩技术和编码类型的信息)
等
九、问题和局限
一般问题:
主要是关联数据技术的成熟性和可扩展性,由于数字保存面临大量的元数据,具有较强的持久性要求。
现有词汇与方法的问题: 我们仍然缺乏必要的词汇来描述大量需要保存的元数据。
十、相关用例和非预期应用(可选)
技术信息使得关联数据可被用于与数字化保存不同的其他用途。
十一、范围和主题
主题:
概念模型与KOS>除书目数据和权限管理外的图书馆数据类型
数据管理和分配>关联数据管理、托管和保存
尺寸:
系统- >图书馆系统 - >数字资源知识库*
资讯资产“- >数字对象*
*在初始名单中没有这些项目,建议添加
十二、参考文献(可选)
[1] http://www.fedora-commons.org/
[2] http://www.bnf.fr/en/professionals/preservation_spar/s.preservation_SPAR_presentation.html
[3] http://p2-registry.ecs.soton.ac.uk/
[4] http://nationalarchives.gov.uk/PRONOM/Default.aspx