磨铁读书 通过搜索各大小说站为您自动抓取各类小说的最快更新供您阅读!

“本来是这样的。”周至乐得眼睛都眯缝了:“可是两位师兄提供的字卡太好用了。”

“《字海》的字卡,有编号,有大字,有拼音、民国拼音、甚至还有老四角号码,还有小字的释义和凡例,满足了我们自动识别软件对于调试校准模型的一切要求,我们当然也要用到那头去!”

周至又道:“有了字卡的辅助,我们很快便将软件识别图形文字的准确率,从百分之九十二,也就是一百个字错八个,提升到了百分之九十九点六,也就是依靠软件识别文字,一千个字里只会读错四个。直接提升了一个量级。”

“这个成就,也直接帮我们跨过了数字图书馆最后一个巨大门槛,这个软件,已经算是真正成熟了。”

“这次带来的数字化的《字海》,就是我们第一本通过计算机扫描识别技术建立起来数字图书,既然字数最多的《字海》都可以实现数字化,那对其余典籍,我们当然充满了信心!”

“那就是古籍数字化工作可以提上日程了?”韦一心大喜:“我们学校正在搞《四库全书丛目》这部大书,要不肘子你来我们学校?学籍什么的好说……”

一边计算机中心主任也连连点头:“其实清华那边没去头,肘子你到底是文科生,来我们这儿正好搞古籍数字化工程,想想看,这个大工程搞出来,那会是多大成就?古人说的君子三立,立德立功立言,不都在里边了?”

周至听得心中暗笑,应该说北大的文化氛围的确可以的,你看计算机中心主任都说得出君子三立这样的命题解读来……

不过这事儿暂时没有可能,周至只好笑着解释:“我们蜀大的《道藏》,《儒藏》两部大书也准备开修了,师爷爷是不可能放人的。”

“不过现在有了好工具,哪怕我不来北大,大家也能够加快工程的进度。现在还是说回正事儿,我利用数字化的《字海》,演示一下我们对数字典籍整理的工程架构协议及标准。”

这个东西是周至的自创,哪怕上一世,这也是图书典籍工程里没有过的东西。

直到周至穿越回来之前,国家将典籍进行数字化的工作,主要还停留在建立树状数据库的较为原始的应用阶段。

就好比一个标准的图书馆,将一本书作为一个文本文件整体存放,然后给这个文件编出,书名,书号,最多再给出个作者,出版社之类的信息,作为标签。

这样做的好处就是简单明了,升级维护也容易,信息保存也算全面,一句话说完,就是够用,但不好用。

这样的东西在周至眼里当然是不合格的,最多最多只能算是地基,离百尺高塔还差着老远的功夫。

信息工程就是这样,算法和协议的思路,往往比基础工作还要重要,如果指导思想发生了错误,等到工程进展到不敷使用,才想着改弦易辙,在已经叠房架屋的情况下,再要开展,将付出巨大的代价。

后世中文编码的巨大混乱情形,就是这种教训的最好注脚。

这些思路,是在四叶草的研发思想,周至提出来的“如何三问”原则思想指导下梳理出来的。

“如何三问”听着玄奥,其实很简单质朴,就是对于任何需求,我们要问三层以上的问题。

比如典籍数字化工程,按照一般的思路,好不好用?

答案肯定:不好用。

那第一个如何就来了:如何让它好用?

答案也简单:除了将一部部书籍扫描成文本文档外,还要在这个基础上,建立起一个庞大的标签体系和智慧搜索引擎。

那第二个如何就来了:如何建立起一个庞大的标签体系和智慧搜索引擎?

答案就是需要一个能够根据文档内容,自动化地分析提取特征标签的标签采集软件;要完成智慧搜索引擎,又需要一个球网状的数据拓扑关联系统。

那第三个如何就来了:我们如何开发这个标签采集软件和球网状的数据拓扑关联系统。

答案就是软件硬件并行,软件上,利用现在最新的数学统计学原理,引入计算机模型当中,开发出一套特征提取算法和特征联动算法,并将这套算法作为指导思想,完成软件开发。

硬件上,要克服现有计算设备算力不足的情况,就利用网络时代的助力,将广域网上的所有算力资源都最大程度地利用起来,研发出基于互联网基础的分布式算力应用系统。

这套理念现在还比较初步,但是根据这个理念建立起来的数字化《字海》,却非常的清晰明白,周至还牵头发明了一套论述体系,通过三维图层的方式来讲解一页字卡上,各项内容之间的复杂关联关系。

这隔着图示讲解下,韦一心和冷玉龙就能够看见平面化的字卡,变成了一个类似秸秆蝈蝈笼子,或者说像折叠式灯笼打开后的样子,各个图层之间通过算法将每一层的特征标签连接起来,构成了字卡的立体结构。

对于这一套思维体系,学文科的人理解起来甚至比学理科的还要容易,跟计算中心的曾教授,周至还要讲解一番,而两位老师兄却看得倍感舒适。

因为在两位老师兄的脑海中,关于字卡的知识体系,就和周至现在在信息系统里展现出来的那样!

冷玉龙开心地鼓起掌来:“妙极,妙极!什么叫青出于蓝,这就叫青出于蓝!谁能想到有一天书本的每一页会变成立体的?!哈哈哈哈,这是我们花了多少年才在脑海里构建起来的东西,现在却一目了然了,这个数字图书,有点东西啊!”

刚刚周至给他们讲的很多技术细节他们也闹不明白,但是这些技术细节支撑起来的应用却让他们太熟悉了,不由得生出了一种“他乡遇故知”的惊喜感。

“五四时期的诸多贤达,曾对我们的国学失望至极,认为汉字都没有存在的必要,或者字符化。”周至笑道:“这是一种毫无依据的悲观估计,然而直到今天,这样的流毒居然还有市场,那就实在是匪夷所思了。”

“这话也不能空说。”两位老师兄都是踏踏实实搞学术的人,冷玉龙就说道:“你得拿出足够强大的理由来,不然不就是又犯了五四学人的错误?”

磨铁读书推荐阅读:豪门第一少奶奶空间锦鲤之农门药香最佳女婿美女总裁的极品高手烈火狂妃:兽性王爷,硬要宠杨辰秦惜我,异能女主,超凶的凌依然小说免费阅读先生是个偏执狂家有悍妻怎么破凌依然萧子期小说终极小村医都市最强小保安医妃在上:鬼帝请小心仙家萌喵娇养成萌宝来袭:总裁爹地,宠上天独宠狂妃:尊主大人别惹火我的极品小姨田园空间之辣妃有喜帝道丹神妙手天医之锦绣医女赘婿出山丑女种田:山里汉宠妻无度回到2002当医生千亿傲娇宝宝:爹地,来solo修仙兵王在都市小王爷他必不可能动心隐婚,天降巨富老公!官场之再做一次弄潮儿又如何贴身兵皇什么年代了还玩儿江湖那一套神棍夫人:夫君,要听话闪婚老公太凶猛临时老公,吻慢点杨辰秦惜在线阅读九阳丹帝都市仙尊洛尘女总裁的超级高手重生军婚:首长大人套路深桃运天王未来科技强国猎尸追毒从前有座镇妖关东宫掌娇女总裁的逍遥兵王非凡特工重生之我是星二代重生后,神医娘亲她杀疯了妙手小村医如初似锦
磨铁读书搜藏榜:我有一个异世界天家小农女又谜又飒穿成悲催农女后的发家日常上门佳婿大国重器:机师成神之路!开局我怒休渣男逃离异都王牌相公:霸道妻主爱上我身为仙帝的我开局穿越了万亿透视豪医鸡飞狗跳的农门生活重生之着魔.操盘手札记无限影视,从流金开始岁月如此多娇相思西游之大圣追爱记觉醒钞能力都市医仙魂穿大汉之未央宫赋都市游侠之青铜短剑农女:星际战将在古代开顺风快递残疾大佬不孕不育?她一胎生四宝!带着萌宝去结婚于枫于山高雨霜噩梦复苏,我有一只小僵尸三国召唤之袁氏帝途民政局门口签到,奖励美女老婆想躺平,却被娱乐圈女人们套路了特级厨师四合院:这个司机太过嚣张赘婿无双官道红颜四合院:从下乡归来后开始离婚后我成了薄爷的白月光闪婚甜蜜蜜:总裁老公宠爆了黑心娇妻,太放肆!我是真有宝藏农家努力生活乡村野汉:与表姐一起钻进山林白手起家杀嫡重生,反派演员被爆捐款无数一窝三宝,总裁喜当爹沧桑之情天才高手的妖孽人生从1977开始快穿之跪求愿望成真绝世容颜美女总裁董事长是我老婆四合院:八极传人过目不忘玄门大佬她直播后,全国沸腾了田园弃妇
磨铁读书最新小说:手机连未来,破产又何妨妻子出轨之后,跪着求我原谅重生1996,从打猎开始发家致富重生后我只做正确选择全球抽卡,我的保底自带万倍增幅重生2001,我能掌控生死重生急诊医生:从挽救市长千金开始医武双绝:高冷总裁求我别装了重生70,从深山采药开始致富和女房东同居后,我看到隐藏信息我,满级舅舅,十六个外甥争宠!玩转宇宙之我是宇宙掌控者女帝跨界求购,我的保险太香了重生1961,我有狼王分身折纸师弱?六千亿起爆符听过没?重生年代:开局接盘美艳大姨子乡村逍遥小仙医全家战死,无敌的我杀疯了!灵气爆发,我把万魂幡上交国家拒绝S级,我觉醒天庭反骨仔哪吒被赶出家门后,我靠打猎赚十个亿我在香江具现武道神话博物馆实习生,开局被误认为邪神外卖小哥的温柔女房东留子已是星际第一,啥时接我回家大学报道,军训教官见我立正敬礼每天一个系统宝箱,助我超神鉴宝:被绿后,我能看到物品属性败好感抽词条,白丝校花带头求饶我的故事会法外狂徒:观众席上,被判十年高武:苟在学校的我怎么无敌了?地摊神医:开局被城管追着跑穿越1665,我的黑科技暴打列强婚书是你要撕的,我无敌后你又后悔了?高武:刚满十八,你让我中年逆袭?亮剑:打造兵工厂,这火力有点猛重生八零:开局女知青悔婚,反手迎娶她闺蜜人生模拟:女剑仙跨界寻我身高万米,还说你不是灭世巨兽?游戏通异世,我娇养了一堆女帝老婆高冷妻子求我别走出狱后,绝色未婚妻疯狂倒贴我我在哥谭当法医加钟按摩,高冷校花崩不住了破碎虚空,他终究回到了现代紧急通知,那个男人出狱了徒儿,下山祸害你七个师姐去吧末世:我觉醒了SSSSS天赋!最强战兵