Skip to end of metadata
Go to start of metadata

波德林图书馆是欧洲最古老的图书馆之一,在英国,它的规模仅次于不列颠图书馆。波德林图书馆于1602年首次对学者开放,合并了早期15世纪牛津大学为存放Humfrey, Gloucester公爵的书籍而建造的一座图书馆。自1602年以来,波德林图书馆的规模不断扩大,虽然起步扩展速度较慢,但在过去的150年里,随着藏书、论文和其他材料的不断增多,图书馆规模一直保持不断增长的势头,但旧建筑的核心仍完好无损。合计来算,波德林图书馆共藏有1300多万件印刷品。

自2015年,波德林数字图书馆系统和服务(BDLSS)部门开始使用Zabbix来监控基础设施,包括350多台虚拟服务器、多个存储系统和两个tape robot libraries。

克拉伦登大厦,牛津,英国

目标:

2018年,应新数位保存政策的宗旨要求,BDLSS意欲改善其多个核心数位存储库的数字化保藏:牛津大学研究档案馆(ORA)、波德林数字图书馆(图像存储库)和波德林电子档案和手稿存储馆(BEAM),这些存储库都缺乏数字保存功能,如固定性(校验和)检查、档案格式表征、文件格式验证和病毒检查。

波德林图书馆保存有数个世纪的实物藏品,也承诺以同等的态度保存其数位化馆藏。数位保存是促进波德林图书馆支持当前和未来研究、教学和学习活动的一项核心组织功能。”

—2018波德林图书馆数位保存政策

韦斯顿图书馆,牛津,英国

要求:

将数位保存与现有的数字存储库相整合,记录与存储库相关的主要统计数据,以支持通过可视化仪表板和阶段性报告的形式向服务所有者报告工作进展。

方法:

开发以文件完整性检查为重点的概念验证,由文件完整性工作人员扫描多个数字存储库中的储藏内容,捕获每个文件的详细信息,如文件大小、权限,并计算SHA512校验和,所有详细信息保存到每个存储库的ElasticSearch索引中。通过比较月度索引,可以识别差异,如添加的新文件、删除的文件和修改的文件(包括更改校验和时的差异)。

将每个ElasticSearch索引中超过30个的关键统计值发送到Zabbix监控服务器备案,其中包括计算得出的预测项,可用于协助预测存储量增长。

最近,Zabbix中关于HTTP代理的Kerberos认证更新,可支持使用微服务服务器对ElasticSearch集群进行验证,同时确保安全性。

将Grafana服务器连接到Zabbix服务器API,生成报告仪表板,协助各个数字存储库的服务所有者将Zabbix收集的统计信息可视化。

概念证明解决方案概述

连接到Zabbix API的Grafana仪表板

概念证明中的Grafana仪表板示例

业务成果:

概念验证已成功交付文件完整性微服务,该服务跟踪的是来自三个数位存储库的超过2200万份文件。在未来两年内,计划更进一步开发五项微服务:

Virus Checking病毒检查

确保馆藏内容无病毒,所有用户都可安全使用。

Repository Copy Statistics库中副本数据

确保数位存储库的独立副本彼此保持同步、一致。

Backup verification/monitoring备份文件验证/监控

每月检查备份日志文件,并与数字存储库中的内容进行比较,确认所有项目都已备份。定期恢复数位馆藏内容,确认所有内容已正确恢复。

File Format Characterisation文件格式表征

识别数位存储库中存储内容的文件格式和技术特征。

File Format Validation文件格式验证

确保数位存储库存储内容的有效性及其对文件格式标准的遵从性。