中华人民共和国国家档案局.政务.cn www.saac.gov.cn
北京
您的位置: 首页>新闻动态>地方动态>北京>工作动态
工作动态
北京市昌平区打造数字档案馆建设“新标杆”

工作人员演示全文数据库检索功能 实习记者 李林虎 摄

“小典小典,请介绍一下十三陵水库。”工作人员话音刚落,智能机器人“小典”便迅速响应,精准调取内置知识库内容,将十三陵水库的建设背景、工程细节与综合效益娓娓道来。如今,在北京市昌平区档案馆,这样的智能互动已成常态。而人工智能技术与传统档案业务的深度融合,正推动区档案馆实现从“被动保管”到“主动赋能”的转型,让其从沉淀史料的“资源仓库”升级为激活数据价值的“智慧中心”。

这项智慧成果的落地,始于2022年启动的高水平数字档案馆建设项目。“我们是首批‘吃螃蟹’的团队,没有现成经验可循,每一步都是在未知领域探索。”区档案馆工作人员坦言。项目初期,技术适配、数据梳理等难题接踵而至,团队只能“摸着石头过河”,在试错中推进工作。

昌平区档案馆馆藏资源丰富,现有纸质档案50万余卷(件)、目录数据307万条、图像档案1600万页,为人工智能技术的应用提供了充足的“燃料”。然而,数字化是首要难题:馆藏档案多为2000年前形成,纸张老化、字迹模糊等问题给工作带来了极大挑战。

为此,全体工作人员全力以赴,以驻馆加班方式展开攻坚。历经两年半,突破传统抽检模式,并研发数据合规审查系统,建立起“加工商全自检、质检商全质检、馆方按比例抽检”的三级质量保障机制。同时,坚持“实体档案与数字副本双核对”,发现目录信息与实体不符,则同步修改数据库和实体档案著录信息;遇到图像漏扫或模糊,立即重新扫描入库。

在数字档案馆建设过程中,全文数据库成为关键载体。依托数据库,区档案馆实现了本地全馆全文检索,借助先进大语言模型,打通跨模态检索壁垒。用户无需按文书、照片、视频、音频等门类分头查询,只需输入一个关键词,就能触发全馆藏门类的并发检索,更可实现以文搜图、以文搜视频、以图搜图、以图搜视频及图像语义检索,让档案查找效率实现质的飞跃。

现场,工作人员以《中国档案报》为关键词进行演示,直观展现了新技术的优势:传统目录检索仅找到19条相关内容,而通过全文数据库检索,则精准匹配出716条关联信息。这一对比清晰说明,技术升级大幅拓宽了馆藏资源的挖掘深度与广度,让沉睡在库房中的档案数据真正“活”了起来。

手写体识别一直是档案数字化的“卡脖子”难题。而区档案馆的全文数据库,在这一领域实现了突破性进展:不仅能精准识别印刷体,更具备高效手写体识别能力。工作人员专门选取20世纪50年代昌平老品牌“鹿牌保温瓶”的手写体图片进行检索,系统瞬间匹配出对应图表与档案,点开检索结果即可清晰看到手写报表中“保温瓶”3字的具体位置。这一突破得益于先进的智能OCR(光学字符识别)技术,即在普通OCR基础上叠加深度语义分析功能,既能破译潦草手写文字,又能结合上下文智能推理语义,识别准确率远超国家标准数倍,同时还能精准识别表格手写内容,彻底破解手写档案检索难题。

诸多创新功能中,以图搜视频最令人称奇。工作人员介绍:“以往在海量视频档案中查找特定画面,只能凭模糊记忆手动拖动进度条逐帧排查,不仅耗时耗力,还易因记忆偏差错失关键内容。而以图搜视频功能彻底改变了这一现状:只需上传目标画面截图,系统便能在视频数据库中快速精准匹配,瞬间呈现关联视频结果,且能直接定位到画面对应的分秒时刻,让档案查找从‘大海捞针’变为‘精准锁定’。”这一功能在档案编研、专题汇编等工作中发挥了重要作用,能帮助工作人员快速筛选特定主题画面,大幅提升编研效率与成果质量,为档案资源的利用与开发开辟了便捷路径。

AI(人工智能)很聪明,但有时也会“脑补”——这正是大模型常见的“幻觉”问题。如何防范“AI幻觉”呢?工作人员告诉记者:“我们的大模型完全运行于内部环境,训练与推理所使用的数据均来自经过多重核验的馆藏档案,并实行网络隔离,从源头确保了数据准确与安全。另外,系统还引入检索增强生成技术,使AI在回答时能够实时调取档案数据作为参考,显著提升了信息输出的准确性。”

在此基础上,区档案馆进一步将数字化管理延伸至实体库房,基于数字孪生技术构建了三维可视化库房平台。通过立体建模与物联网感知,管理人员可通过大屏实时掌握库房布局、设备状态与档案位置,实现了从“人眼巡查”到“可视化管控”的转变。

“这个三维库房可不只是看着炫酷。”工作人员一边操作系统一边介绍,“它更像一个‘活’的档案地图。以二号库为例,系统清晰划分了4个区域,每件档案在哪个房间、哪列架、哪一格,轻轻一点,即刻呈现。”

这一切的背后,是一套深度融合的数据调度系统。数字化信息与实体库房管理数据被打通串联,任何一件档案的移动、存放,都会实时同步更新到三维模型中。实体库房和虚拟世界就此形成了动态互联的“孪生体”,馆内资源得以实现全局优化调度。

指尖在屏幕上轻轻落下,对应的档案数字副本和信息便即刻跃入眼帘。工作人员感慨:“过去管理档案,靠的是一趟趟奔波的脚步,如今只需要动动手指。”技术的力量正悄然改变着档案管理的方式,让保存历史这件事变得轻盈而清晰。这一点一滴的改变,正是档案管理提质增效的最好见证。

中华人民共和国国家档案局

Copyright © 2007 www.saac.gov.cn 版权所有:国家档案局中央档案馆

技术维护:国家档案局 经营许可证号:京ICP备05058328号 地址:北京市西城区阜成门外大街29号 邮编:100037