5月18日,据腾讯混元消息,为了精准衡量大模型在汉字演化全谱上的视觉感知能力,腾讯混元、SSV数字文化实验室和SSV技术架构部联合安阳师范学院甲骨文信息处理重点实验室、中科院信工所、南开大学,正式推出 Chronicles-OCR——业界首个覆盖"七体之变"完整演化轨迹的中国古文字感知评测基准。
数据来源全部来自机构与古文字学专家:
甲骨文 → 安阳师范学院甲骨文信息处理重点实验室
金文、篆书 → 古文字学博士与研究生团队人工整理
隶、楷、行、草 → 故宫博物院文物手写体识别测试数据集
整个数据集由领域专家多层级交叉标注,包含 2,800 张严格平衡的高质量图像(每种字体 400 张)。