OpenAI、谷歌大模型惊艳升级,AI巨头掀起新风暴!

发布于: 修改于:雪球转发:0回复:12喜欢:2

一、谷歌举办开发者大会,发布Gemini1.5 Pro等多款AI更新

1、事件:谷歌举办开发者大会,发布Gemini1.5 Pro新版本

5月15日,谷歌举办了2024年I/O开发者大会, AI是全场的主题, 谷歌CEO桑达尔·皮查伊和他的同事们发布了Gemini 1.5 Pro的新版本,在100万Tokens的窗口能力上,进一步扩大至200万Tokens,它们的最终目标是无限上下文。

谷歌还展示了新的搜索产品,比如从本周开始,谷歌搜索引擎将在美国推出“AI概览”(AI Overviews)的功能,搜索引擎会直接归纳总结搜索结果。此外,谷歌还推出了新的TPU , 第六代TPU芯片Trillium,较上一代芯片的算力表现翻4.7倍。

在此次发布会上,谷歌还展示了一个名为Astra的项目,这是谷歌开发的通用人工助理,在演示视频中,Astra通过手机摄像头能识别真实环境中的物体,实现了能看、能说、能听。 这与前一天OpenAI上线的GPT-4o功能类似 ,都实现了人机交互的新形式。 但谷歌似乎不满足于此,Astra更强调指向人、机器与现实世界的三重交互。

事件点评:微软将Copilot整合进入Windows后,谷歌宣布将其大模型整合进入安卓系统,AI大模型有望在手机、PC、可穿戴等消费电子终端设备上加速应用,将刺激手机、PC等设备换机周期以及芯片溢价等,推荐关注人工智能 AIETF(515070)及其联接基金(008585/008586)、云计算50 ETF(516630)及其联接基金(019868/019869)、数据 ETF(516000)的投资机会。

2、谷歌发布会内容简介

发布TPU v6 Trillium:相较于TPU v5e提升4.7倍算力,能效高出6.7倍,通过增加高带宽内存容量和整体带宽来实现额外的性能提升;将于2024年晚些推出。

大模型:1)Gemini 1.5 Pro,正式向全球开发者开放,上下文窗口年内进一步提升至200万Tokens,并将长期推向“无限上下文”。多模态能力进一步提升,优化原生音频理解能力,支持全球35种语言。3)Gemini 1.5 Flash:新模型注重成本效益和快速响应,价格仅35美分/百万Tokens(GPT-4o5美元/百万Tokens),同时通过端到端蒸馏优化响应速度,上下文窗口与Gemini 1.5 pro看齐,年内扩展至200万Tokens。 4)Veo:对标Sora的视频生成模型,能够根据提示,生成超60秒的高质量1080p视频。

AI助理Project Astra:类似GPT-4o的AI助理,支持语音实时交互,能够理解和响应复杂指令,是谷歌人工智能助手的最新进展。在演示中,AI助手可以通过视频和音频识别。例如,帮助用户记住他们把眼镜放在哪里、检查代码并回答有关某个部分的问题。同时能够与智能眼镜联动,展示AR领域潜力,底层技术基于Gemini模型并将在今年晚些时候推出。

AI搜索AI Overviews:这个功能将“简化”用户提问,拥有更强大的多步推理能力——先将一个复杂问题,拆解成多个简单问题,再将简单问题拆解成多个关键词——反馈给用户的页面中,将是高度格式化的解释、简洁实用的行动指引、直接引导后续行为的链接等。谷歌搜索负责人Liz Reid强调,谷歌的AI搜索概述有三大独特优势:实时信息、排名和质量体系、Gemini模型能力。谷歌AI搜索概述将在美国全面推出,后续推广到更多国家和地区,在今年内覆盖10亿用户。

安卓系统:AI将嵌入安卓底层,做成系统级AI。Google 表示,已将 Gemini 模型整合到 Android 中,并引入了很多实用的 AI 功能。如通过“Circle to Search”(划圈搜索),可以使用户无需切换应用程序,使用画圈、涂鸦、点击等简单的交互方式获取更多信息,如今,Circle to Search 可以帮助学生完成作业,当学生圈出他们遇到的提示时,他们将获得解决一系列物理和数学问题的分步说明从而获得更深入的理解,而不仅仅是答案。另外,Google 将很快在 Android 系统上更新 Gemini,方便用户在应用程序顶部调出 Gemini 的叠加层,以便以更多方式轻松使用 Gemini。

此外,谷歌还更新了Google Workspace、文生图工具Imagen、AI音乐沙盒等应用,以及谷歌最新开源AI模型Gemma 2。

3、手机与AI大模型双向赋能,互为利好

OS厂商入局更好展现AI应用能力:此前AI LLM在手机、PC端应用多以网页、App、API等方式出现,部分手机厂商亦有自研LLM应用于系统级AI助手,但嵌入操作系统底层的AI仍需要谷歌苹果微软等OS厂商参与。随着微软将Copilot嵌入Windows,谷歌将Gemini嵌入安卓,以及未来苹果可能展开的AI系统更新,真正的系统级AI正式到来,AI有望更好利用设备硬件以及信息,为用户提供更加深入到位的人机交互体验。

AI手机有望凭颠覆性用户体验成为AI核心入口。AI PC作为生产工具,其使用场景往往局限于办公场景,注重效率;而AI手机终极使命是成为用户的私人助理,赋能生活全场景,从琐碎和繁杂中解放用户。从使用场景看,AI手机因其伴随属性强,数据采集设备能够收集到丰富、广泛的多模态用户数据,从而给出个性化解决方案。手机凭借其天然便携性,可下沉至用户日常生活的各类场景,有望超越AI PC,成为终端AI的核心入口。

AI手机有望带来更高产品溢价。复盘4G芯片至5G芯片的升级,彼时小米的骁龙865的采购成本接近上一代骁龙855的两倍。三星采购成本亦有所印证,据TechInsights公布的三星Galaxy S20 Ultra(12G+256G)物料成本数据,骁龙865 SoC的成本为81美元,与骁龙855基本保持一致,但叠加X55 5G基带(26.5美元)和RF射频天线模组(33美元),三者打包总价实为140.5美元,此外仍有专利费和关税,实际骁龙865整体成本远超150美元,比2019年上半年(国内5G尚未商用)不包含X50基带的骁龙855 4G移动平台贵1倍左右。由此可见划时代产品具有较强的溢价能力,骁龙8Gen3、联发科天玑等AI芯片有望凭借其卓越性能及完整生态,复刻4G升级至5G的轨迹,享受高溢价,将有利于整个芯片产业链的量价提升。

AI手机亦将加速大模型商业变现。谷歌大模型Gemini包含三个版本:搭载于移动设备端的Gemini Nano,泛用模型 Gemini Pro,以及规格最高、适用于高度复杂任务的 Gemini Ultra。2024 年 2 月,谷歌上线了基于Gemini Ultra 的付费订阅服务,用户通过订阅Google One AI高级版(19.99美元/月)可使用Gemini Ultra模型。随着越来越多的手机具备AI能力,高级AI的订阅服务将有望提升,提高大模型厂商的变现能力。

二、OpenAI推出GPT-4o,AI应用有望加快落地

1、事件:OpenAI推出GPT-4o

当地时间5月13日,OpenAI通过直播展示了产品更新。与此前传出的市场消息不同,OpenAI并未推出搜索引擎,也未推出GPT-4.5或GPT-5,而是发布了GPT-4系列新模型GPT-4o以及AI聊天机器人ChatGPT的桌面版本,聚焦多模态和端侧应用。

据介绍,GPT-4o文本、推理、编码能力达到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的两倍,但成本仅为GPT-4 Turbo的一半,视频、音频功能得到改善。OpenAI CEO奥尔特曼(Sam Altman)在博客中表示,ChatGPT免费用户也能用上新发布的GPT-4o。此外,OpenAI还与苹果合作推出了适用于macOS的桌面级应用。

事件点评:近期,ChatGPT、Kimi+等应用/模型发布更新,AI应用有望加快落地,AI的版本迭代有望带来投资机会,同时,AI更新和应用落地也有望提振TMT板块,建议关注人工智能 AIETF(515070)及其联接基金(008585/008586)、云计算50 ETF(516630)及其联接基金(019868/019869)、数据 ETF(516000)的投资机会。

2、GPT-4o热点解析

(1)GPT-4o模型基座:三种模态的混合模型,带来更大泛化能。GPT-4o是文本、视觉和音频的端到端训练的一个新模型,这意味着所有输入和输出都由同一个神经网络处理。对文本、音频和视觉三种模态统一进行混合训练,因而大部分数据都是通过无监督学习实现;相比过去拼接模型需要对视觉进行标注,混合模型在整体数据量规模上可以做得更大,进而带来更大的泛化能力。

(2)GPT-4o奠定AI语音助手基础:低延迟+情绪感知+视觉感知。1)AI语音基础:接近于人类对话响应速度。GPT-4o可以在短短232毫秒内响应音频输入,平均为320毫秒,这类似于对话中的人工响应时间,没有表现出丝毫延迟的视觉和声音反馈。在GPT-4o之前,使用语音模式与Chat GPT交谈平均延迟为2.8秒(GPT-3.5)和5.4秒(GPT-4)。2)情绪感知能力:情绪的感知是对语音一维输出模态的丰富。GPT-4o不仅能感受到你的情感,还自带情绪和情感,并且用户可以随时打断AI的话,互动更加拟人。3)视觉感知能力:适配AI手机、AI电脑和AI智能硬件。手机端Chat GPT可以依靠手机摄像头和用户实时互动,如实时教人做题,观察房间、观察用户情绪;客户端Chat GPT能随时解决写代码、读图表等任务。

(3)GPT-4o的进阶——控制中心:获得操作系统的权限,打造手机和PC的Agent。相比于网页端,手机端和桌面端可借助屏幕信息,实时跟踪用户动态需求。在获得权限背景下可以进行更多的控制。AI手机:如果未来能获得手机操作系统权限,如iPhone Siri权限,便可控制手机完成预置应用或第三方应用操作和控制。从“Hey Siri”到“Hey ChatGPT”,交互媒介手机终端在GPT-4o的赋能下,有望显著提升手机交互功效。GPT-4o具备实时类人的语音对话交互与及时反馈,情感交互,GPT-4o凸显了端侧模型与代码生成能力等场景化应用。在手机媒介下,交互方式跃升,换言之,对PC、MR等媒介,在GPT-4o的加持下,其交互能力同样值得期待,后续重点关注和iPhone IOS 18的合作进展。AI电脑:发布Chat GPT桌面应用,尚不能下载,预计未来几周内广泛推出,重点关注后续和微软的Windows系统的合作。

3、投资机会

OpenAI 的此次发布会展示了多项革命性更新,特别是 GPT-4o 在文字、语音和视频方面的突破,极大地提升了 AI 的应用潜力,此外多模态能力大幅提升,给AI应用特别是智能助理、多模态内容生产、3D模型等方向带来新的机会,为用户带来前所未有的便利和体验。此外,GPT-4o代表了对话式 AI 的重大飞跃,提供了增强的语言理解、上下文感知、多模式功能和自定义选项,这些新功能开辟了广泛的应用领域,从客户支持和个人助理到教育工具和内容创建,凭借改进的实时协作和道德保障,GPT-4o必将改变我们与 AI 的互动方式,使其成为各个行业更强大、更可靠的工具,随着我们继续探索其潜力,人工智能驱动对话的未来前景一片光明。

未来,随着技术的不断进步,可以期待更多令人惊叹的 AI 应用和服务,随着大模型超多模态不断升级迭代,内容供给的持续释放,助推AIGC在设计、内容创作、游戏智能、影视IP、机器交互等领域实现降本增效。AIGC逐步实现人工智能从感知理解世界到生成创造世界的进击,催生传媒行业新景观及生产力革新。

交易上看,从国产搜索产品Kimi及秘塔,到当下GPT-4o的推出,国产化类产品后续的推出也有望重燃市场热度,近期我们看到部分科技大厂持续上调全年资本支出指引,市场对AI投入持续性的担忧得到缓释,软件端来看,多数公司本季度业绩超预期,产品创新持续推进,AI产业链长期趋势向好。

相关产品:

1、 人工智能 AIETF(515070)及其联接基金(008585/008586):中证人工智能主题指数(指数代码: 930713.CSI,指数简称: CS 人工智)选取为人工智能提供基础资源、技术以及应用支持的公司中选取代表性公司作为样本股,反映人工智能主题公司的整体表现。该指数已纳入截至 2018 年 9月 30 日的 IOSCO 金融基准原则鉴证报告范围。

2、 云计算50 ETF(516630)及其联接基金(019868/019869):中证云计算与大数据主题指数(指数代码: 930851.CSI,指数简称: 云计算指数) 选取 50 只业务涉及提供云计算服务、大数据服务以及上述服务相关硬件设备的上市公司 A 股作为样本股,以反映云计算与大数据主题股票的整体表现。

3、 数据 ETF(516000)及其联接基金(020336/020335):中证大数据产业指数(指数代码: 930902.CSI,指数简称:中证数据) 选取涉及大数据存储设备、大数据分析技术、大数据运营平台、大数据生产、 大数据应用等领域的沪深 50 只 A 股作为样本,采用自由流通股本加权,设置10%的权重上限。

活动规则:

球友们对AI大模型的最新研发进展有什么看法呢?欢迎来评论区各抒己见!

参与方式:1、转发+评论区留言+加自选+关注@机器人与人工智能AI

2、配上$机器人ETF(SH562500)$ $人工智能AIETF(SH515070)$ 的加自选截图

欢迎转发、留言,并将投顾组合【加自选】,截图已加自选页面,我们将选取最精彩的3条留言瓜分奖金,活动截至5月18日17:00!

数据来源:互联网媒体、中信证券、德邦证券、广发证券、国泰君安证券、华福证券、华鑫证券、互联网媒体、iFind、Wind,截至2024.5.15,以上个股不作投资推荐。

以上基金属于指数基金,风险等级为R4,存在标的指数回报与股票市场平均回报偏离、标的指数波动、基金投资组合回报与标的指数回报偏离等主要风险,其联接基金存在联接基金风险、跟踪偏离风险、与目标ETF业绩差异的风险等特有风险,且市场或相关产品历史表现不代表未来。申购:A类基金申购时,一次性收取申购费,无销售服务费;C类无申购费,但收取销售服务费。二者因费用收取、成立时间可能不同等,长期业绩表现可能存在较大差异,具体请详阅产品定期报告。投资者在投资基金之前,请仔细阅读基金的《基金合同》、《招募说明书》和《产品资料概要》等基金法律文件,充分认识基金的风险收益特征和产品特性,并根据自身的投资目的、投资期限、投资经验、资产状况等因素充分考虑自身的风险承受能力,在了解产品情况及销售适当性意见的基础上,理性判断并谨慎做出投资决策,独立承担投资风险。

对于ETF基金,投资者投资于本基金面临跟踪误差控制未达约定目标、指数编制机构停止服务、成份券停牌等潜在风险、标的指数回报与股票市场平均回报偏离的风险、标的指数波动的风险、基金投资组合回报与标的指数回报偏离的风险、标的指数变更的风险、基金份额二级市场交易价格折溢价的风险、申购赎回清单差错风险、参考IOPV决策和IOPV计算错误的风险、退市风险、投资者申购赎回失败的风险、基金份额赎回对价的变现风险、衍生品投资风险等。

对于ETF联接基金,基金资产主要投资于目标ETF,在多数情况下将维持较高的目标ETF投资比例,基金净值可能会随目标ETF的净值波动而波动,目标ETF的相关风险可能直接或间接成为ETF联接基金的风险。ETF联接基金的特定风险还包括:跟踪偏离风险、与目标ETF业绩差异风险、指数编制机构停止服务风险、标的指数变更的风险、成份券停牌或违约的风险等。

本资料不作为任何法律文件,观点仅供参考,资料中的所有信息或所表达意见不构成投资、法律、会计或税务的最终操作建议,我公司不就资料中的内容对最终操作建议做出任何担保。在任何情况下,本公司不对任何人因使用本资料中的任何内容所引致的任何损失负任何责任。市场有风险,入市需谨慎。

精彩讨论

全部讨论

我对 AI 大模型的最新研发进展持有不同的看法。我认为这是 AI 发展的重要里程碑,标志着人工智能领域的又一步进展,例如:1. xAI 公司的成立:马斯克旗下 xAI 公司宣布正式开源其大模型 Grok-1,该模型参数达到3140亿,远超 OpenAI GPT-3.5的1750亿,是迄今参数量最大的开源大语言模型。2. GPT-5 的性能跃升:OpenAI 的 CEO 奥特曼首次公开表示,GPT-5将实现史诗级性能跃升。3. 英伟达的技术突破:英伟达再次推出“超级芯片”——Blackwell B200 GPU 和 GB200,B200一块能顶5个 H100,30倍推理加速,能训练万亿参数大模型。然而,也有人对 AI 大模型的发展表示担忧,例如:1. 安全和隐私问题:AI 技术的发展需要更多的人才支持,包括人工智能开发人才、数据专业人才和行业专家。还有就是 AI 技术的安全和隐私问题也需要得到重视和解决。总的来说,AI 大模型的发展是一个充满挑战和机遇的领域,需要不断地进行研究和探索。@机器人与人工智能AI

05-16 17:02

看好AI大模型的最新研发进展!$机器人ETF(SH562500)$ $人工智能AIETF(SH515070)$
OpenAI和谷歌在AI大模型领域的最新研发进展确实令人印象深刻。OpenAI发布的GPT-4o多模态实时大模型,通过跨文本、视觉和音频的端到端模型,实现了更自然的人机交互体验。而谷歌则推出了Gemini 1.5 Pro、Gemini 1.5 Flash以及两个新的Gemma模型,旨在提升模型性能并满足开发者的多样化需求。
谷歌的Gemini 1.5 Pro、Gemini 1.5 Flash以及两个新的Gemma模型在处理多语言任务时,具有更强大的计算能力,采用了更先进的算法,更丰富的数据来源进行训练,针对更广泛的应用场景进行了优化,这使得它们在处理多语言任务时能够更好地满足用户的需求。
AI大模型的最新研发进展具有很高的投资价值,因为它们正在推动人工智能技术的快速发展,并正在被广泛应用于多个行业和领域。
技术的快速迭代与升级使得国产AI大模型在技术上逐渐缩小了与国际先进水平的差距。例如,百度文心一言、商汤日日新以及阿里云发布的通义千问2.5等,均已经迈入“全面赶超GPT-4”的阵营。在特定任务和场景中,国产AI大模型的表现已经超越或逼近国际先进水平。
此外,AI大模型已经广泛应用于多个行业和领域,包括金融、医疗、零售、出版等。在这些领域,AI大模型通过赋能传统产业,实现了提质增效和产业升级。例如,在金融领域,AI大模型可以协助银行进行风险评估、反欺诈和智能客服等;在医疗领域,AI大模型可以辅助医生进行疾病诊断和治疗方案制定。
政策支持与推动也是AI大模型研发进展的重要驱动力,因为它们正在推动人工智能技术的快速发展,并正在被广泛应用于多个行业和领域。随着技术的不断进步和应用的日益广泛,我国AI大模型无疑将在全球AI发展史上占据重要的篇章。@机器人与人工智能AI

05-16 16:53

我很看好$人工智能AIETF(SH515070)$ 的投资价值!
AI就是今年最大的主线,之前Sora的发布,对视频,广告,新闻,影视,娱乐等行业产生巨大影响,对于短视频平台,人人都是微电影导演的时代将会到来。
其次是对于内容创作而言,一方面降低视频内容生产制作门槛,使得低水平内容竞争更加激烈。对于创意、逻辑、编剧、交互等要求较高的垂类或深度内容的创作AI视频模型将成为重要的降本增效工具。尤其是动画、科幻题材等超现实、但又需符合一定逻辑、解放想象力的内容以及视效领域。
AI的迭代真是太快了,资本的投入也在加速。人工智能的未来空间非常大,随着数字经济产业的高速发展,中国人工智能产业与实体经济正加速融合,传统产业利用新一代信息技术推进产业数字化进程和数字产业化发展的步伐不断加快,中国人工智能产业将迎来更大的发展空间。预计到2035年,我国人工智能产业规模为1.73万亿元,全球占比达30.6%,同时,我国产业数字化率将突破85%,进一步催生全新的相关产业。

05-21 09:13

OpenAI推出GPT-4,实现了多模态融合和多语种处理能力的突破,标志着大模型技术又向前迈进了一大步。这必将为AI技术的发展和应用注入新的动力。
展望未来,我更希望看到以下几个方向的AI大模型问世:
强大的因果推理能力
目前的大模型虽然在语义理解和生成方面表现卓越,但缺乏真正的理解和推理能力。如果能训练出具备因果推理、逻辑推导、建模分析等高级认知能力的大模型,将是人工智能领域的里程碑式突破。
学习能力强大的模型
现有大模型都是通过事先训练获得知识,难以像人一样不断学习新知识。如果能研发出具备持续进化和自我进化能力的大模型,将极大提高AI系统的通用性和适应性。
极强的泛化迁移能力
大多数大模型都是专注某一领域的,跨领域泛化迁移能力较差。如果能推出一种全能型模型,在不同领域都能表现出良好的泛化性,将能最大限度发挥AI的价值。
注重隐私和安全的模型
随着AI系统的不断发展,数据隐私、系统安全等问题日益突出。如果能研发出内置隐私保护和安全约束的大模型,不仅提升了安全性,也有利于公众对AI的信任。
低碳环保的大模型
未来还需要能源效率更高、碳足迹更小的绿色人工智能模型,以减少AI系统对能源和环境的负荷。
总之,大模型技术仍有很大的探索空间。相信通过不断创新,人工智能系统一定能变得更加强大、安全、环保和通用。我也期待着这一天的到来。

05-21 08:42

我对该领域的最新进展还是有一些认识和看法的。AI大模型的发展给科技创新和社会生产生活带来了巨大的影响,也吸引了公众的广泛关注。我总结了一些最新进展和值得关注的方向:
大模型的计算能力和参数规模持续提升,模型训练所需算力大幅增长,对算力硬件设备提出更高要求。
多模态大模型的研究成为新热点,整合视觉、语音等不同模态数据,展现出跨模态理解和生成的能力。
微调技术使大模型可在特定领域获得高性能,通过少量数据便可快速迁移,提高了大模型的实用性。
机器学习与符号推理相结合的探索不断深入,有望突破大模型推理和因果推断的瓶颈。
大模型的能耗、碳足迹、安全隐私等挑战亟待解决,可解释性、对抗性攻击等问题仍是重点。
基于大模型的应用创新层出不穷,智能辅助、智能写作、智能辅导等方向极具前景。
总的来说,AI大模型是一个充满活力的前沿领域,科研和产业两个层面都有诸多机遇和挑战并存。我们既要认识到AI的巨大潜力,也要直面其中的风险,在Ethics AI的基础上推动AI赋能社会发展。让我们共同期待AI大模型的新进展,也欢迎大家继续分享宝贵见解!

人工智能AI大模型,最新的chatGPT4o 属于多模态,我认为这个进步更多的是为未来人形机器人更适合,也有利于软件和硬件结合,对人形机器人的跨越发展奠定基础,也为整个科技行业更多的方便工作生活提供更多的用户需求。我认为是值得称赞的。$机器人ETF(SH562500)$ $人工智能AIETF(SH515070)$

$机器人ETF(SH562500)$ ,看好AI大模型的最新研发进展。
GPT-4o 在理解和探讨用户分享的图片方面已超越所有现存模型。举例来说,你只需拍摄一份外语菜单,GPT-4o 就能帮你翻译内容、了解菜品背后的文化故事并提供建议。
未来,技术升级将实现更加流畅、实时的语音交互,以及通过实时视频与 ChatGPT 对话的能力。比如,我们可向 ChatGPT 展示正在进行的体育赛事,让它讲解规则。接下来数周内,OpenAI 将启动带有这些新功能的语音模式 Alpha 测试,Plus 用户将首批体验,随后逐步扩大覆盖范围。
目前,ChatGPT 已支持超过 50 种语言,覆盖注册、登录、用户设定等多个环节。GPT-4o 正逐步向 ChatGPT Plus 和团队用户开放,企业版也将很快面世。同时,免费用户5月14日起也可体验,但设有使用配额。Plus 用户的消息发送上限将是免费用户的 5 倍,团队和企业用户则享有更高额度。

05-16 18:31

AI新研究成果倒是不错,但是需要应用场景并能够获利还需要时间等待,现在随着AI发展整个产业链也发生着变化,投资机会也会很广泛,赚钱的机会也在增加,需要积极布局其中,

继续看好 $人工智能AIETF(SH515070)$
调整完了后 还会有行情的,相信今年人工智能会贯彻全年。