近年来,北京市昌平区档案馆加快数字化转型步伐,持续推进数字档案馆建设。应用智能OCR技术,对重要手写体档案进行全文识别,辅以人工校验,生成可进行深度开发利用的档案全文数据。引入人工智能应用,利用卷积神经网络等算法进行表征学习,自动对手写体原文图像进行坐标识别和标注,并使用特征提取算法提高准确性。利用应用平台,将标注后的手写体副本与识别后的全文进行精准贴合,生成标准的双层版式文件,为后续的数据挖掘和开发利用打下基础。目前,已完成超过20万页重要手写体档案的全文识别,并生成了高质量的版式文件。
原载于《中国档案报》2024年7月8日 总第4159期 第二版
Copyright © 2007 www.saac.gov.cn 版权所有:国家档案局中央档案馆
技术维护:国家档案局 经营许可证号:京ICP备05058328号 地址:北京市西城区阜成门外大街29号 邮编:100037