“可图”的推出标志着快手在大模型业务领域继“文生文”之后,又成功填补了“文生图”的空白。该产品具备三大显著特点:卓越的文本理解能力、丰富的细节刻画以及多样化的风格转换能力。
“可图”大模型在中文表达理解方面具有先天优势。快手的研发团队透露,其AI系统拥有数十亿的图文训练数据,这些数据来源于开源社区以及自研AI技术合成,覆盖了三千万常见的中文实体概念。在此基础上,快手训练研发了一个强大的中文CLIP模型。
结合自研的中文大型语言模型(LLM)和融合CLIP的图文特征,“可图”的文本理解模块使得该大模型能够更精准地理解中文特色概念。这不仅减少了在图像生成领域常见的复杂概念和属性混淆问题,还极大提升了图像生成的准确性和用户满意度。
“可图”的推出,不仅展现了快手在AI图像生成领域的技术实力,也为用户带来了前所未有的便捷和个性化体验。