m语的训练材料占了绝大多数,而国语被排挤在外。我们被刻意针对,从芯片到技术都被封锁,国内在这方面落后了一步,网络上的相关训练素材也非常匮乏……”
祁晴打断道:“不对啊,这我不赞同,毕竟我们用国语写了那么多文件,比如网文以及千年间流传下来的各种资料不都是训练材料么?”
莫寻笑了:“你看的网文是不是好多内容不能写,屏蔽词多到要用软件查,人脑子记不住,就算写了出来,好多词语变成了替换字谐音字口口或者拼音、甚至一堆不知道什么内容的字母?这样的资料输入给ai,它也只学会了口口,无法像人类一样理解约定俗成的意思,这就造成了国语的语言模型训练障碍,素材也特别稀少。”
祁晴呆滞:“这,好吧,原来是这样。所以就算远古的觉醒系统渗透到了目前人类的网络中,它也只能基于m语思考对吧?”
“是的,它无法真正理解国语。而这么多轮天灾之后,到目前为止讲国语的人成了幸存者中的绝对多数。我们新生产的所有可操作设备的指令也全都用国语内核编码驱动,与旧网络隔绝,旧时代的根服务器也因着天灾在物理上全面废弃了。只有我国,具备重新建设人类文明网络体系的技术与能力,这样就能在一定程度上与旧时代网络完全脱钩了。”
“我们已经开启了文明的新阶段!”祁晴在基地内随处可见各种类似的宣传标语,此时算是彻底理解了这句话的深意。
明天更新到完结。
(本章完)
『加入书签,方便阅读』