OpenAI、谷歌大模型惊艳升级，AI巨头掀起新风暴！一、谷歌举办开发者大会，发布Gemini1.5 Pro等多款AI更新1、事件：谷歌举办开发者大会，发布Gemin...

一、谷歌举办开发者大会，发布Gemini1.5 Pro等多款AI更新

1、事件：谷歌举办开发者大会，发布Gemini1.5 Pro新版本

5月15日，谷歌举办了2024年I/O开发者大会， AI是全场的主题，谷歌CEO桑达尔·皮查伊和他的同事们发布了Gemini 1.5 Pro的新版本，在100万Tokens的窗口能力上，进一步扩大至200万Tokens，它们的最终目标是无限上下文。

谷歌还展示了新的搜索产品，比如从本周开始，谷歌搜索引擎将在美国推出“AI概览”（AI Overviews）的功能，搜索引擎会直接归纳总结搜索结果。此外，谷歌还推出了新的TPU ，第六代TPU芯片Trillium，较上一代芯片的算力表现翻4.7倍。

在此次发布会上，谷歌还展示了一个名为Astra的项目，这是谷歌开发的通用人工助理，在演示视频中，Astra通过手机摄像头能识别真实环境中的物体，实现了能看、能说、能听。 这与前一天OpenAI上线的GPT-4o功能类似，都实现了人机交互的新形式。 但谷歌似乎不满足于此，Astra更强调指向人、机器与现实世界的三重交互。

事件点评：继微软将Copilot整合进入Windows后，谷歌宣布将其大模型整合进入安卓系统，AI大模型有望在手机、PC、可穿戴等消费电子终端设备上加速应用，将刺激手机、PC等设备换机周期以及芯片溢价等，推荐关注人工智能 AIETF（515070）及其联接基金（008585/008586）、云计算50 ETF（516630）及其联接基金（019868/019869）、数据 ETF（516000）的投资机会。

2、谷歌发布会内容简介

发布TPU v6 Trillium：相较于TPU v5e提升4.7倍算力，能效高出6.7倍，通过增加高带宽内存容量和整体带宽来实现额外的性能提升；将于2024年晚些推出。

大模型：1）Gemini 1.5 Pro，正式向全球开发者开放，上下文窗口年内进一步提升至200万Tokens，并将长期推向“无限上下文”。多模态能力进一步提升，优化原生音频理解能力，支持全球35种语言。3）Gemini 1.5 Flash：新模型注重成本效益和快速响应，价格仅35美分/百万Tokens（GPT-4o5美元/百万Tokens），同时通过端到端蒸馏优化响应速度，上下文窗口与Gemini 1.5 pro看齐，年内扩展至200万Tokens。 4）Veo：对标Sora的视频生成模型，能够根据提示，生成超60秒的高质量1080p视频。

AI助理Project Astra：类似GPT-4o的AI助理，支持语音实时交互，能够理解和响应复杂指令，是谷歌人工智能助手的最新进展。在演示中，AI助手可以通过视频和音频识别。例如，帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。同时能够与智能眼镜联动，展示AR领域潜力，底层技术基于Gemini模型并将在今年晚些时候推出。

AI搜索AI Overviews：这个功能将“简化”用户提问，拥有更强大的多步推理能力——先将一个复杂问题，拆解成多个简单问题，再将简单问题拆解成多个关键词——反馈给用户的页面中，将是高度格式化的解释、简洁实用的行动指引、直接引导后续行为的链接等。谷歌搜索负责人Liz Reid强调，谷歌的AI搜索概述有三大独特优势：实时信息、排名和质量体系、Gemini模型能力。谷歌AI搜索概述将在美国全面推出，后续推广到更多国家和地区，在今年内覆盖10亿用户。

安卓系统：AI将嵌入安卓底层，做成系统级AI。Google 表示，已将 Gemini 模型整合到 Android 中，并引入了很多实用的 AI 功能。如通过“Circle to Search”（划圈搜索），可以使用户无需切换应用程序，使用画圈、涂鸦、点击等简单的交互方式获取更多信息，如今，Circle to Search 可以帮助学生完成作业，当学生圈出他们遇到的提示时，他们将获得解决一系列物理和数学问题的分步说明从而获得更深入的理解，而不仅仅是答案。另外，Google 将很快在 Android 系统上更新 Gemini，方便用户在应用程序顶部调出 Gemini 的叠加层，以便以更多方式轻松使用 Gemini。

此外，谷歌还更新了Google Workspace、文生图工具Imagen、AI音乐沙盒等应用，以及谷歌最新开源AI模型Gemma 2。

3、手机与AI大模型双向赋能，互为利好

OS厂商入局更好展现AI应用能力：此前AI LLM在手机、PC端应用多以网页、App、API等方式出现，部分手机厂商亦有自研LLM应用于系统级AI助手，但嵌入操作系统底层的AI仍需要谷歌、苹果、微软等OS厂商参与。随着微软将Copilot嵌入Windows，谷歌将Gemini嵌入安卓，以及未来苹果可能展开的AI系统更新，真正的系统级AI正式到来，AI有望更好利用设备硬件以及信息，为用户提供更加深入到位的人机交互体验。

AI手机有望凭颠覆性用户体验成为AI核心入口。AI PC作为生产工具，其使用场景往往局限于办公场景，注重效率；而AI手机终极使命是成为用户的私人助理，赋能生活全场景，从琐碎和繁杂中解放用户。从使用场景看，AI手机因其伴随属性强，数据采集设备能够收集到丰富、广泛的多模态用户数据，从而给出个性化解决方案。手机凭借其天然便携性，可下沉至用户日常生活的各类场景，有望超越AI PC，成为终端AI的核心入口。

AI手机有望带来更高产品溢价。复盘4G芯片至5G芯片的升级，彼时小米的骁龙865的采购成本接近上一代骁龙855的两倍。三星采购成本亦有所印证，据TechInsights公布的三星Galaxy S20 Ultra（12G+256G）物料成本数据，骁龙865 SoC的成本为81美元，与骁龙855基本保持一致，但叠加X55 5G基带（26.5美元）和RF射频天线模组（33美元），三者打包总价实为140.5美元，此外仍有专利费和关税，实际骁龙865整体成本远超150美元，比2019年上半年（国内5G尚未商用）不包含X50基带的骁龙855 4G移动平台贵1倍左右。由此可见划时代产品具有较强的溢价能力，骁龙8Gen3、联发科天玑等AI芯片有望凭借其卓越性能及完整生态，复刻4G升级至5G的轨迹，享受高溢价，将有利于整个芯片产业链的量价提升。

AI手机亦将加速大模型商业变现。谷歌大模型Gemini包含三个版本：搭载于移动设备端的Gemini Nano，泛用模型 Gemini Pro，以及规格最高、适用于高度复杂任务的 Gemini Ultra。2024 年 2 月，谷歌上线了基于Gemini Ultra 的付费订阅服务，用户通过订阅Google One AI高级版（19.99美元/月）可使用Gemini Ultra模型。随着越来越多的手机具备AI能力，高级AI的订阅服务将有望提升，提高大模型厂商的变现能力。

二、OpenAI推出GPT-4o，AI应用有望加快落地

1、事件：OpenAI推出GPT-4o

当地时间5月13日，OpenAI通过直播展示了产品更新。与此前传出的市场消息不同，OpenAI并未推出搜索引擎，也未推出GPT-4.5或GPT-5，而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本，聚焦多模态和端侧应用。

据介绍，GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平，速度是上一代AI大模型GPT-4 Turbo的两倍，但成本仅为GPT-4 Turbo的一半，视频、音频功能得到改善。OpenAI CEO奥尔特曼（Sam Altman）在博客中表示，ChatGPT免费用户也能用上新发布的GPT-4o。此外，OpenAI还与苹果合作推出了适用于macOS的桌面级应用。

事件点评：近期，ChatGPT、Kimi+等应用/模型发布更新，AI应用有望加快落地，AI的版本迭代有望带来投资机会，同时，AI更新和应用落地也有望提振TMT板块，建议关注人工智能 AIETF（515070）及其联接基金（008585/008586）、云计算50 ETF（516630）及其联接基金（019868/019869）、数据 ETF（516000）的投资机会。

2、GPT-4o热点解析

（1）GPT-4o模型基座：三种模态的混合模型，带来更大泛化能。GPT-4o是文本、视觉和音频的端到端训练的一个新模型，这意味着所有输入和输出都由同一个神经网络处理。对文本、音频和视觉三种模态统一进行混合训练，因而大部分数据都是通过无监督学习实现；相比过去拼接模型需要对视觉进行标注，混合模型在整体数据量规模上可以做得更大，进而带来更大的泛化能力。

（2）GPT-4o奠定AI语音助手基础：低延迟+情绪感知+视觉感知。1）AI语音基础：接近于人类对话响应速度。GPT-4o可以在短短232毫秒内响应音频输入，平均为320毫秒，这类似于对话中的人工响应时间，没有表现出丝毫延迟的视觉和声音反馈。在GPT-4o之前，使用语音模式与Chat GPT交谈平均延迟为2.8秒（GPT-3.5）和5.4秒（GPT-4）。2）情绪感知能力：情绪的感知是对语音一维输出模态的丰富。GPT-4o不仅能感受到你的情感，还自带情绪和情感，并且用户可以随时打断AI的话，互动更加拟人。3）视觉感知能力：适配AI手机、AI电脑和AI智能硬件。手机端Chat GPT可以依靠手机摄像头和用户实时互动，如实时教人做题，观察房间、观察用户情绪；客户端Chat GPT能随时解决写代码、读图表等任务。

（3）GPT-4o的进阶——控制中心：获得操作系统的权限，打造手机和PC的Agent。相比于网页端，手机端和桌面端可借助屏幕信息，实时跟踪用户动态需求。在获得权限背景下可以进行更多的控制。AI手机：如果未来能获得手机操作系统权限，如iPhone Siri权限，便可控制手机完成预置应用或第三方应用操作和控制。从“Hey Siri”到“Hey ChatGPT”，交互媒介手机终端在GPT-4o的赋能下，有望显著提升手机交互功效。GPT-4o具备实时类人的语音对话交互与及时反馈，情感交互，GPT-4o凸显了端侧模型与代码生成能力等场景化应用。在手机媒介下，交互方式跃升，换言之，对PC、MR等媒介，在GPT-4o的加持下，其交互能力同样值得期待，后续重点关注和iPhone IOS 18的合作进展。AI电脑：发布Chat GPT桌面应用，尚不能下载，预计未来几周内广泛推出，重点关注后续和微软的Windows系统的合作。

3、投资机会

OpenAI 的此次发布会展示了多项革命性更新，特别是 GPT-4o 在文字、语音和视频方面的突破，极大地提升了 AI 的应用潜力，此外多模态能力大幅提升，给AI应用特别是智能助理、多模态内容生产、3D模型等方向带来新的机会，为用户带来前所未有的便利和体验。此外，GPT-4o代表了对话式 AI 的重大飞跃，提供了增强的语言理解、上下文感知、多模式功能和自定义选项，这些新功能开辟了广泛的应用领域，从客户支持和个人助理到教育工具和内容创建，凭借改进的实时协作和道德保障，GPT-4o必将改变我们与 AI 的互动方式，使其成为各个行业更强大、更可靠的工具，随着我们继续探索其潜力，人工智能驱动对话的未来前景一片光明。

未来，随着技术的不断进步，可以期待更多令人惊叹的 AI 应用和服务，随着大模型超多模态不断升级迭代，内容供给的持续释放，助推AIGC在设计、内容创作、游戏智能、影视IP、机器交互等领域实现降本增效。AIGC逐步实现人工智能从感知理解世界到生成创造世界的进击，催生传媒行业新景观及生产力革新。

交易上看，从国产搜索产品Kimi及秘塔，到当下GPT-4o的推出，国产化类产品后续的推出也有望重燃市场热度，近期我们看到部分科技大厂持续上调全年资本支出指引，市场对AI投入持续性的担忧得到缓释，软件端来看，多数公司本季度业绩超预期，产品创新持续推进，AI产业链长期趋势向好。

相关产品：

1、人工智能 AIETF（515070）及其联接基金（008585/008586）：中证人工智能主题指数（指数代码: 930713.CSI，指数简称： CS 人工智）选取为人工智能提供基础资源、技术以及应用支持的公司中选取代表性公司作为样本股，反映人工智能主题公司的整体表现。该指数已纳入截至 2018 年 9月 30 日的 IOSCO 金融基准原则鉴证报告范围。

2、云计算50 ETF（516630）及其联接基金（019868/019869）：中证云计算与大数据主题指数（指数代码： 930851.CSI，指数简称：云计算指数）选取 50 只业务涉及提供云计算服务、大数据服务以及上述服务相关硬件设备的上市公司 A 股作为样本股，以反映云计算与大数据主题股票的整体表现。

3、数据 ETF（516000）及其联接基金(020336/020335)：中证大数据产业指数（指数代码： 930902.CSI，指数简称：中证数据）选取涉及大数据存储设备、大数据分析技术、大数据运营平台、大数据生产、大数据应用等领域的沪深 50 只 A 股作为样本，采用自由流通股本加权，设置10%的权重上限。

活动规则：

球友们对AI大模型的最新研发进展有什么看法呢？欢迎来评论区各抒己见！

参与方式：1、转发+评论区留言+加自选+关注@机器人与人工智能AI

2、配上$机器人ETF(SH562500)$ $人工智能AIETF(SH515070)$ 的加自选截图

欢迎转发、留言，并将投顾组合【加自选】，截图已加自选页面，我们将选取最精彩的3条留言瓜分奖金，活动截至5月18日17:00！

数据来源：互联网媒体、中信证券、德邦证券、广发证券、国泰君安证券、华福证券、华鑫证券、互联网媒体、iFind、Wind，截至2024.5.15，以上个股不作投资推荐。

以上基金属于指数基金，风险等级为R4，存在标的指数回报与股票市场平均回报偏离、标的指数波动、基金投资组合回报与标的指数回报偏离等主要风险，其联接基金存在联接基金风险、跟踪偏离风险、与目标ETF业绩差异的风险等特有风险，且市场或相关产品历史表现不代表未来。申购：A类基金申购时，一次性收取申购费，无销售服务费；C类无申购费，但收取销售服务费。二者因费用收取、成立时间可能不同等，长期业绩表现可能存在较大差异，具体请详阅产品定期报告。投资者在投资基金之前，请仔细阅读基金的《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件，充分认识基金的风险收益特征和产品特性，并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力，在了解产品情况及销售适当性意见的基础上，理性判断并谨慎做出投资决策，独立承担投资风险。

对于ETF基金，投资者投资于本基金面临跟踪误差控制未达约定目标、指数编制机构停止服务、成份券停牌等潜在风险、标的指数回报与股票市场平均回报偏离的风险、标的指数波动的风险、基金投资组合回报与标的指数回报偏离的风险、标的指数变更的风险、基金份额二级市场交易价格折溢价的风险、申购赎回清单差错风险、参考IOPV决策和IOPV计算错误的风险、退市风险、投资者申购赎回失败的风险、基金份额赎回对价的变现风险、衍生品投资风险等。

对于ETF联接基金，基金资产主要投资于目标ETF，在多数情况下将维持较高的目标ETF投资比例，基金净值可能会随目标ETF的净值波动而波动，目标ETF的相关风险可能直接或间接成为ETF联接基金的风险。ETF联接基金的特定风险还包括：跟踪偏离风险、与目标ETF业绩差异风险、指数编制机构停止服务风险、标的指数变更的风险、成份券停牌或违约的风险等。

本资料不作为任何法律文件，观点仅供参考，资料中的所有信息或所表达意见不构成投资、法律、会计或税务的最终操作建议，我公司不就资料中的内容对最终操作建议做出任何担保。在任何情况下，本公司不对任何人因使用本资料中的任何内容所引致的任何损失负任何责任。市场有风险，入市需谨慎。

OpenAI、谷歌大模型惊艳升级，AI巨头掀起新风暴！

作者：机器人与人工智能AI

精彩讨论

全部讨论