发布于: Android转发:0回复:0喜欢:0
#量子位AI日报
20240515
【新进展】
谷歌AI新产品IO全亮相!60秒视频生成模型虽迟但到,还把上下文窗口卷到了200万
网页链接
Ilya官宣离职OpenAI,“下一个项目意义重大”
网页链接
腾讯混元文生图大模型全面开源
网页链接
微软宣布GPT-4o模型可在 Azure OpenAI上使用
网页链接
GPT-4o的特性全面总结
网页链接
【新应用】
AT-EDM(图像生成-普林斯顿大学、Adobe 研究中心)
-免训练高效扩散模型,图像生成效率相比SDXL,FLOPs节省38.8%,加速高达1.53
项目主页:网页链接
TALC(视频生成-加州大学洛杉矶分校、谷歌)
-使模型能够识别视频场景和场景描述之间的时间对齐,生成在视觉上连贯且遵循多场景文本描述的视频
项目主页:网页链接
【新模型】
HunyuanDiT(文生图模型-腾讯)
-采用和Sora一致的DiT架构,可以与用户进行多轮多模态对话,在中文到图像生成方面达到开源最先进水平
开源地址:网页链接
Llama-3 8B Gradient Instruct 1048k(大语言模型-Gradient AI)
-在原Llama-3 8B的基础上,将上下文长度从8K大幅扩展到超过1048K
开源地址:网页链接
【新研究】
Plot2Code:用于评估科学绘图代码生成中的多模态大型语言模型的综合基准
(香港大学、腾讯ARC实验室、上海交通大学)
论文地址:网页链接
【其他】
宇树科技发布公司第一款通用人形机器人Unitree H1,售价 9 万美金
网页链接