公告:零目录(www.dir0.com)专业分类目录平台,收录各行业优秀网站(违法站勿扰),快审仅需20元/站,永久收录!合作QQ:404959672

快速审核,网站广告合作请联系我们
  • 分类:131
  • 网站:5327
  • 文章:8278

10月11日,由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”测试版正式上线。目前,该平台涵盖390部经典古籍,主要来自《四部丛刊》,共计3000多万字,即日起向公众免费开放。未来三年,“识典古籍”将陆续完成一万种古籍的智能化整理工作,基本覆盖儒家、道家和佛学的核心典籍目录,届时将全部免费开放。

“识典古籍”项目负责人现场讲解

据了解,上述实验室系今年3月北京大学与字节跳动合作成立,将人工智能技术应用于古籍资源的智能化整理。“识典古籍”平台上线,即是双方合作的最新进展。

当前,中国的古籍数字化还处于初级阶段,面临技术难度高、资金缺口大、人才紧张等难点。相关资料显示,现存的20多万种古籍中,只有8万种完成影像数字化扫描,近4万种完成文本数字化。据专家统计,从1949年到2019年,国内共修复整理出版古籍近3.8万种,要将现存古籍全部修复整理出来,可能需要300年时间;若利用人工智能技术辅助修复整理,大概二三十年就能完成。

活动相关海报

据“识典古籍”项目负责人介绍,该平台当前主要使用了三种技术,包括文字识别、自动标点和命名实体识别。文字识别技术,是对古籍的影印版文字进行单个切分,再进行文字识别和顺序识别。自动标点技术,是通过序列标注的方式对古籍自动进行标点划分。命名实体识别技术,则是通过序列标注识别文本中的人名、地名、书籍、时间、官职等信息。据悉,目前行业内OCR识别准确率平均为93%至94%,“识典古籍”的准确率为96%至97%。

与其他古籍数字化平台相比,“识典古籍”具有自身的特点,页面简洁,浏览流畅,提供影印底本作为参照,还具备主题词检索和繁简体转换功能,便于专业研究人员、广大古籍爱好者使用。同时,“识典古籍”书目将持续更新,后续将上线手机移动版。

“识典古籍”网页截图

未来,“识典古籍”将向全社会开放古籍阅读检索研究能力,还将实现全自动整理校对,更高效地实现存量古籍全部数字化。同时,平台也鼓励拥有文献的学者自行上传文献,用户甚至可参与再创作和再阐释,助力古籍文化传承和研究。

一年多来,字节跳动在古籍修复和活化上也有所进展。此前,字节跳动资助国家图书馆定向修复的珍贵古籍104册件,现已完成50多册件,包括一批稀有的样式雷图档。在活化方面,抖音平台推出“寻找古籍守护人”计划,旨在激励创作者通过音乐、说书、绘画、复原美食等形式,普及古籍知识、演绎古籍内容,让古籍鲜活起来。

    关键词: 数字化 古籍 字节 搭建
    精彩推荐

    时间:24/03/27

    今日晚间,在粉丝的一片欢呼声中,2023王者荣耀世界冠军杯巅峰之战在成都...

    时间:24/03/27

    据央视新闻,欧盟委员会当地时间12月30日称,从2024年起,USB-C将成为欧盟...

    时间:24/03/26

    华为最新业绩情况曝光。12月29日,华为轮值董事长胡厚崑发表新年致辞透...

    时间:24/03/26

    专题 2023年国际财经新闻大盘点在金属交易大体平淡的这一年,镍表现最...

    时间:24/03/26

    热点栏目自选股数据中心行情中心资金流向模拟交易客户端12月29日消息...

    文章分类
    快审网站推荐
    随机网站推荐

    322G开服表提供最新网页游戏开服表,页游开服表,今日新开网页游戏.甄...

    大量传媒22/09/06

    明星网拥有最大最全的娱乐八卦新闻、明星资讯、明星资料、明星图库。...

    喜欢国产动漫的朋友,不要错过这里,YYQQ动漫网关注日本动漫以及国产动...

    鬼故事问题中心主要提供了原创故事、真实经历、民间奇谈、自然探索、...

    墨明棋妙22/09/06

    “墨明棋妙原创音乐团队”(mymmqm.com)成立于2007年,聚集了一群对传统...

    漏勺网22/09/06

    漏勺网是一个动画分享网站。比BT更快,比电骡更久,比网盘更多,比在线更清...

    平凡文学网是广大书友最值得收藏的网络小说阅读网,网站收录了当前最火...

    伊甸园22/09/11

    中国益阳网是知名的权威新闻门户网站。中国益阳网24小时滚动报道国内...

    奇热网22/09/04

    网链输送机一身新裁...

    帝国战网22/09/10

    帝国时代下载 帝国时代游戏攻略 帝国时代战队 ...