那你应该想一下真的是语料库不够吗,占全世界人口两成的语言环境构建不出来像样的AI,是不是语料库不是不够的问题?还是说哪怕你再整几倍的语料库都没有真的能用的AI
我说的是功能性,的确是有差距。而且语料库不够
而且我讨论没有说因为这个才功能不够,功能对比不够现在是客观情况,不是因为啥导致的
当然建不起来,我为了一些研究索引国国外信息,存档库甚至保存了大萧条时期每天的报纸。英文信息源历史悠久而且保存很好。另外目前大部分最好的研究报告和论文都是英文写的
国内人再多,历史上记录的内容很多没有留下来。而且还有一点是很多国内一般日常交流的信息是同质的。就是不考虑zz影响这些信息量也没有各类研究内容大。
同样的道理,印度也是十几亿人而且没有各种限制,印度语信息敢说比英文大嘛?