长城证券通信行业动态点评:海外巨头稳步推进AI布局,持续引领大模型及应用端深化发展

发布于: 雪球转发:0回复:0喜欢:0

时间:2024-5-17

来源:长城证券

$电信ETF(SZ159507)$ #电信ETF# #通信设备#

事件:5月13-14日,OpenAI与谷歌分别陆续召开发布会,公布了公司最新AI大模型布局及一系列AI新品和功能升级。

OpenAI发布最新大模型,性能表现实现稳步提升。OpenAI在活动中发布了新模型GPT-4o,可以接受文本、音频和图像三者组合作为输入,并生成文本、音频和图像的任意组合输出。该模型能在232毫秒内对音频输入做出反应,与人类在对话中的反应时间相近。据OpenAI表示,该模型所有输入和输出都由同一神经网络处理,是公司在文本、视觉和音频方面端到端训练的新模型,在探索该模型的功能及其局限性方面仍处于起步阶段。具体来看,据财联社,音频方面,该模型能够从急促的喘气声中理解紧张的含义,并且指导用户进行深呼吸,还可以根据用户要求变换语调;图像输入方面,该模型可以通过图像完成基础数学题目。性能方面,根据传统基准测试,GPT-4o在文本、推理和编码等方面实现了与GPT-4 Turbo级别相当的性能,同时在多语言、音频和视觉功能方面的表现分数也创下了新高。应用方面,据公司新闻稿,该模型将向ChatGPT Plus和Team用户推出,并且很快就会向更多企业用户推出。微软Azure OpenAI用户已可以使用GPT-4o,加速赋能了微软云服务业务。此外,OpenAI还推出适用于macOS的ChatGPT桌面应用程序,通过简单的键盘快捷键可以立即向ChatGPT提问,还可以直接在应用程序中截取屏幕截图与机器人进行讨论。

谷歌召开I/O开发者大会,AI不断深入赋能应用端。谷歌在发布会中发布了最新AI搜索引擎功能AI Overviews,通过多步推理,Gemini可以帮助用户找到更好的搜索结果。根据现场演示,通过Ask PhotosithGemini功能可以在谷歌相册找到用户想要的照片,例如照片中拍到的车牌号。大模型及应用端, Gemini 1.5 Pro迎来了上下文窗口的重大升级,扩展到200万个token。同时,谷歌表示将在今年夏季扩展Gemini的多模态功能,包括增加用语音进行深入双向对话的能力Live。此外,公司推出新的多模态AI项目Project Astra,可以为用户解释智能手机拍到的东西。在手机端,公司宣布已将Gemini整合到安卓系统中,引入了多种实用AI功能。基础设施端,公司推出第六代TPU AI芯片Trillium,与前代相比,每个Trillium芯片的计算性能提高了4.7倍,能效高出67%。该芯片还配备了第三代SparseCore专用加速器,用于处理高级排名和推荐工作负载中常见的超大嵌入。Trillium TPU可以更快地训练下一波基础模型,并以更少的延迟和更低的成本为这些模型提供服务。公司预计将在2024年底向云服务客户提供Trillium。我们认为,随着海外龙头厂商对AI的持续加速布局,大模型计算能力将不断提升,同时基础设施端的不断升级也将助力新应用的加速落地,我们持续看好相关产业链投资机会。

风险提示:AI业务研发不及预期风险;云计算市场竞争加剧风险;宏观经济环境波动风险;核心技术人员流失风险。

$电信ETF(SZ159507)$

风险提示:本资料仅作参考,不构成本公司任何业务的宣传推介材料、投资建议或保证,不作为任何法律文件。基金管理人承诺以诚实信用、勤勉尽职的原则管理和运用基金资产,但不保证基金一定盈利,也不保证最低收益。投资人购买基金时应详细阅读基金的基金合同和招募说明书等法律文件,了解基金的具体情况。基金管理人管理的其他基金的业绩和其投资人员取得的过往业绩并不预示其未来表现,也不构成本基金业绩表现的保证。基金投资需谨慎。