传统古籍研究中,学者判断一段文字的来源、引用关系和文本传播路径,主要依赖个人阅读积累和少量工具书。面对数以万计的典籍,穷举式人工比对不现实。数字人文领域虽有 BuddhaNexus、Kanripo citfind 等工具,但或限于单一语料库(仅佛典),或缺乏精细的结果分层与评分。
溯源系统整合 CBETA 佛典(1080 万句)与殆知阁古籍(6323 万句)共 7400 万句语料,采用「高速字面召回 + 多维精排 + 语义补充」的两阶段检索架构,一次操作即可发现佛典与外典之间的互文关系,自动区分引文、化用、共词三个层次。