中国哲学书电子化计划(英文名Chinese Text Project [7])是一个线上古籍文献检索系统,是线上古典文献最丰富且最可靠的来源之一。它的目的是提供尽可能精确且便利使用的中国古代原典文献,尤其先秦两汉文献,把这些资料以恰当结构、可搜索模式来展现,并且广泛使用现代技术作为工具使这些文献更容易学习和研究。
收录先秦至各朝代的古籍文献,涵盖儒、道、墨、法、兵家、数学、医学等多学科领域,库内超过三万部著作、五十亿字,支持中英双语、简/繁体切换,提供全文检索、比对、典籍并列阅读、文言词典、索引与词频分析等实用工具,并开放 API 和结构化数据导出,支持学术研究与数字人文学应用。
原典资料库
网站最主要的部分为古籍资料库,此资料库包含各种从哲学、历史、语言学等角度被视为重要的文献,写作年代以先秦两汉为主。网站的所有资料都存在一个专门设计的数据库,以便读浏览和搜索的方便。此外,部分原典有附英文或现代汉语翻译,这些翻译是一段一段对照原典而附上的,因此很容易从译文找出对应的原典,或从原典找出对应的译文。
内部字典
内部汉字字典合并三个来源的信息:统一码联盟(Unicode Consortium)的「Unihan」数据库、上述的原典资料库、以及网站新开发的CTP字典。其中Unihan数据库提供有关汉字的基本信息,包括部首、笔画数、异体字、标准字典中的出处、以及英文翻译(但此英文翻译以现代汉语用法为主)。原典资料库则给每一个字提供原典中的具体出处。最后,CTP字典试图对汉字的语义和实际运用提供一个尽可能完整的分析。虽然从汉字的数量上看大多数汉字是单义词,但少数很常用的字却有许多不同的用法,这些不同用法通常有不同语义或读法。 CTP字典把这些不同意义或不同读法的用法分开处理,并且通过原典数据库给每一个不同用法分别提供原典出处。这一功能是透过一种「语义链接」的手段而实现的,即建立从某篇某段某句中的某字到CTP字典中的相关用法的链接。建立这些链接需要对文本的理解,因而是一个手动的且耗时的程序;因此CTP字典的范围暂时很有限(但日益增加)。

