#量子位AI日报20240515【新进展】谷歌 AI新产品IO全亮相！60秒视频生成模型虽迟但到，还把上下文窗口卷到了...

#量子位AI日报
20240515
【新进展】
谷歌AI新产品IO全亮相！60秒视频生成模型虽迟但到，还把上下文窗口卷到了200万
网页链接
Ilya官宣离职OpenAI，“下一个项目意义重大”
网页链接
腾讯混元文生图大模型全面开源
网页链接
微软宣布GPT-4o模型可在 Azure OpenAI上使用
网页链接
GPT-4o的特性全面总结
网页链接
【新应用】
AT-EDM（图像生成-普林斯顿大学、Adobe 研究中心）
-免训练高效扩散模型，图像生成效率相比SDXL，FLOPs节省38.8%，加速高达1.53
项目主页：网页链接
TALC（视频生成-加州大学洛杉矶分校、谷歌）
-使模型能够识别视频场景和场景描述之间的时间对齐，生成在视觉上连贯且遵循多场景文本描述的视频
项目主页：网页链接
【新模型】
HunyuanDiT（文生图模型-腾讯）
-采用和Sora一致的DiT架构，可以与用户进行多轮多模态对话，在中文到图像生成方面达到开源最先进水平
开源地址：网页链接
Llama-3 8B Gradient Instruct 1048k（大语言模型-Gradient AI）
-在原Llama-3 8B的基础上，将上下文长度从8K大幅扩展到超过1048K
开源地址：网页链接
【新研究】
Plot2Code：用于评估科学绘图代码生成中的多模态大型语言模型的综合基准
（香港大学、腾讯ARC实验室、上海交通大学）
论文地址：网页链接
【其他】
宇树科技发布公司第一款通用人形机器人Unitree H1，售价 9 万美金
网页链接

作者：浦东剑侠