上个月,南京开了一场会,“十五五数智档案”学术交流会。 翻完二十多场报告的题目,深的感受就一个——这个行业的方向,从来没这么清楚过。 🏷️ 几个关键信息先划重点: 参会的是谁?人大、南大、武大、中国信通院、中国历史档案馆……学术圈、政策圈、一线档案馆,全到齐了。 聊的是什么?二十多场报告,题目高度一致——高质量数据集建设、数据治理、人工智能应用、数智化转型。 一场行业会议,议题收敛到这种程度,信号已经很明确了。 📌 三个判断,分享一下: ,档案的身份变了。
以前档案是“保管对象”,标准就一条:存得下、不丢、不坏。 现在数据被纳入生产要素,档案成了数据资产。武汉大学王平教授的报告标题直接点了题——“数据要素时代”。身份一变,标准就变了。过去比谁存得多,未来比谁用得好。 一句话:存得下只是及格线,用得活才是新标准。 第二,AI不是主角,数据才是。
这次几乎所有讲AI的报告,前面都加了一个前缀——“基于高质量数据集”。人大刘越男教授、中国信通院李荪主任、上海大学金波教授,讲的全是这个逻辑:数据在先,AI在后。 为什么?因为大多数档案现在还躺着——扫描件、非结构化文档、格式五花八门。AI根本读不懂。得先做清洗、分类、结构化标引,把档案变成机器能处理的数据。这一步叫高质量数据集建设和数据治理,是整个“十五五”档案智能化的地基。 地基不打,AI全是空谈。 第三,已经开始动手了,不是光在讨论。
会议后半程的圆桌对话,主题直接是“怎么建、怎么评”。中国历史档案馆分享了明清档案数据集的经验,南京农业大学展示了大模型训练数据集的实践。前沿机构已经在做工程化落地,不是在写论文了。 落地路径其实就两步:数据底座搭起来 + 实体库房智慧化管理跟上。 两步走通,库房就从“人管档案”变成“数据驱动”。 💡 总结一句: “十五五”档案数智化转型,不是选做题,是必答题。但正确姿势不是追AI热点,而是先把数据底座扎扎实实搭起来。底座有了,上面跑什么应用都顺。 方向已经指出来了,剩下的就是行动。





