发布于: 公告转发:0回复:2喜欢:0
中国科传:中国科技出版传媒股份有限公司股票交易风险提示公告 网页链接

全部讨论

2023-04-25 08:17

风险提示了,要跌停了吧

2023-04-24 23:55

方汉带领的“天工”团队,在项目开发过程中也得到了开源社区上百位AI科学家助力。此外,“天工”团队投入大量资源攻克了中文语料库的质量瓶颈,从数十万亿的数据中清洗、筛选出了3万亿单词数据用于训练大模型。
采访中谈及当下AI大模型训练的关键点时,不同于大众认知的“缺算力”和“缺数据”,方汉坦言最大的差距将会是不同项目组之间的工程经验积累。
从算力上看,“这些年我们的工程师可以通过优化算法,不断抬高算力天花板。”方汉说道,相比之下,对于大模型此类大项目的工程调度,精细化调试将成为最大短板。
方汉解释道:“以训练数据为例,其实业界最难的不是找数据,而是如何给AI投喂数据。什么样的数据不能使用,筛选数据的标准是什么,如何做数据的剪枝、清洗等。通过筛选数据调整参数、改进模型设计才是最核心的机密,这也是OpenAI没有在论文中公开的核心技术。”$昆仑万维(SZ300418)$