近日,2024年江苏省档案科技项目立项评议工作已圆满结束,经专家评议,共评出拟立项项目24项。其中,无锡市档案史志馆会同江苏联著实业股份有限公司共同承担的《数字化转型背景下工商业档案专题数据库搭建实现方法的研究——以纺织业档案为例》顺利入围。
图源:江苏省档案局
这也是自联著实业2022年以来,连续第3年入围此重要科技项目名单。开展课题研究是企业提升研发能力、优化服务能力的核心路径。持续不断地课题立项彰显了联著实业对自主知识产权研发的重视态度,这背后离不开长久以来的技术积淀、对于研发人员的重视培养、以及与科研单位的深度合作。
联著实业以自研语义工程技术作为技术底座,以牵头起草多项国家、团体标准作为能力保障,以垂直打造跨越档案开放审核、档案数据校核、档案专题数据等多维度全链路产品作为业务特色。目前已服务近100家全国各级档案馆,其中副省级以上国家综合档案馆11家、全国数字示范档案馆11家。
随着《“十四五”全国档案事业发展规划》不断深入落实,联著实业持续在档案开放审核工作赋能服务,帮助各级档案馆陆续完成档案开放工作,大大解决了档案馆“输入多,输出少”的业务顽疾。
而今,联著实业紧跟档案行业风向,与规划同频,同发展共振,在档案应用场景中逐步进行产研拓展。此次与无锡市档案史志馆共同承担的科技项目,是创新地将中文语义工程技术同档案专题数据库建设相结合的一次有力尝试。
在档案数字化建设工作中,档案专题数据库具有信息资源整合度高、档案内容按相关主题聚集、查询利用便捷高效的特点,对深层次挖掘馆藏资源、展现档案馆馆藏特色、提供精准化利用服务、提高档案利用率具有重要意义。
本项目以纺织业档案为例,研究在数字化转型背景下,工商业档案专题数据库搭建的实现方法,并形成纺织行业专题数据库框架。通过对海量档案文本的深入语义分析,提取初步内容标签,从语义层面锁定纺织业相关所有档案。利用语义分析技术,将锁定的所有的非结构化数据转化为语义结构化数据。再从语义结构化的结果和专题数据库的业务需求场景出发,确定专题数据库框架需要包含的字段,将业务需求特征与语义特征相关联,完成专题数据库框架的搭建。在完成专题数据库框架的搭建后,还可运用语义分析技术对框架内的档案数据进行深度挖掘,实现框架包含字段与实际档案的可信匹配。
未来,联著实业将按照课题的任务要求,做好研究和管理工作,确保项目顺利进展。争取做到产学研一体化,有力推动档案业务由“重保管”向“重利用”转变,创新探索人工智能技术在档案领域深度应用。