国内chatgpt智能终端10倍潜力股!

发布于: 修改于: 雪球转发:1回复:1喜欢:0

本文纯作为一个喜欢AI技术的,思考推测,验证思路,笔记记录。

有更新,章节目录

一:gpt-4o生态圈API调用10倍潜力股机会思考在哪里?

二:某手机厂商专家解读:GPT-4o 和苹果生态落地会议内容

1)GPT-40与以往的手机语音助手相比有哪些突破?

2)IOS系统和GPT-40如何合作?

3)语音助手如何控制手机预置应用和三方应用?

4)手机厂商如何考虑GPT4-0作为语音助手带来的算力成本?

三:根据以上生态圈API之后,看好的标的方向!

一:gpt-4o生态圈API调用10倍潜力股机会思考在哪里?

OpenAI一夜改写历史,GPT-4o干翻所有语音助手!丝滑如真人引爆全网科幻成真

谈谈我的想法

gpt-4o,到目前为止已经能看到很多评测。昨晚OpenAI发的这款GPT-4o可以简单理解为升级版的Siri(增加了多模态,速度更快),多模态的个人语音助手,

但是有没有想过下一个版本会如何升级?比如5.0版本,6.0版本等

就像各种评测视频中的思考,那后面的大招是什么?和人类交互体验在哪些功能会继续革新?

看这个-4o版本中,「帮我推荐达拉斯5个适合夜晚约会的餐厅」,ChatGPT通过搜索3个网站,立即总结出了你想要的结果。

OpenAI与Be My eyes合作,使AI Agent能够为盲人导航、提供周遭环境各类外部信息、甚至还能够完成打车等日常生活行为。

什么意思?不管AI怎么发展,目的就是变得更加智能化,您的第二管家,一个足够了解你个人喜好的管家。然后在你需要的时候,给你需求推荐。(为什么是第二管家,因为你是你自己的第一管家)

那么一个问题,后面继续升级的话,就像这个问题,推荐餐厅。后面衣食住行娱等细分行业,比如gpt-5.0版本,是不是根据你的个人数据喜好,就会直接推荐出来了。重点来了,这个时候,端侧的API链接就会打开。推荐好了之后,直接通过这个API调用生态圈的公司,直接去使用。有使用有行为数据(衣食住行娱),就有现金流产生,这个过程是收费的,生态圈源源不断的现金流就来了。

我目前能想象到功能之一。

那调用API链接生态公司!生态位拥有个人行为数据最多的公司肯定受益,

假如我和我的管家说,我要去哪里旅游;要买车;找一个适合约会的餐厅;准备出差。等等需求,你会发现我的管家,可以完成基本的操作,直接根据我的个人喜好数据完善好。也就是个人多模态语音管家,他会调用各个细分行业API端口的软件给我用,这就打开了。

目前chatgpt-4o的这个发布会,看到了迭代的方向,这只是公布的发布会。通用免费大模型,那后面的5.0是什么版本?6.0呢?所以您的管家越来越懂您!

最后总结一下:昨晚OpenAI发的这款GPT-4o可以简单理解为升级版的Siri(增加了多模态,速度更快),既然是多模态的个人语音助手,生态圈就会出现大量被调用的端口API,多模态就会包含多个行业涉及到衣食住行娱等行业。被链接被调用,助力更好的打造拥有一个很懂您的“她”管家!

那么A股生态映射的机会,就是苹果手机内置大模型接近落地,国外ChatGPT,国内百度文心一言(openai入种花家被禁),国产手机华为小艺、小米手机小爱同学等。

国内找找谁有大量的行为数据,未来可以被调用链接API的企业,在未来5.0版本甚至6.0版本,拥有一个很懂您的“她”管家。肯定最有潜力的AI应用10倍股!

二:某手机厂商专家解读:GPT-4o 和苹果生态落地会议内容

1)GPT-40与以往的手机语音助手相比有哪些突破?

2)IOS系统和GPT-40如何合作?

3)语音助手如何控制手机预置应用和三方应用?

4)手机厂商如何考虑GPT4-0作为语音助手带来的算力成本?

摘要

本次讨论集中探讨了人工智能(AI)技术在提升手机和相关电子设备智能水平的各种途径,以及随之而来的一系列挑战和机遇。特别是在如何有效整合大模型如GPT-4与苹果生态系统,提升人工智能能力的同时,面临的数据合规性、成本控制、以及用户隐私保护等问题也被广泛关注。讨论指出,无论是采用端侧还是云侧技术,均面临着技术难度和成本效益的权衡。同时,提出通过情感识别和更流畅的人机交互等技术革新,能够改善用户体验,但这也需要解决技术上的实际挑战。此外,关于如何在国内推广类似技术,强调了需要充分考虑本地化需求和技术安全性的重要性。总体而言,本次对话反映了当前科技企业追求技术创新与应对风险挑战之间复杂的平衡过程。

问答

问:苹果如何与GPT-4O合作,并可能采用何种合作模式?

答:苹果可能会在云端引入GPT-4O的服务,这将使得其语音助手在云识别能力、翻译能力、数学推理等方面表现出色,与国内厂商在许多领域的领先地位形成分水岭。由于GPT-4O参数量巨大且依赖强算力,做成端侧合作的可能性较小,预计会采取云端的方式进行合作。

问:GPT-4O的发布对过去的AI手机生态产生了怎样的影响?GPT-4O与国内现有的手机语音助手相比有哪些重大突破?

答:GPT-4O的发布对过去的一些AI手机生态产生了一定的影响,它作为一个原生多模态模型,在训练时将文本、视频和音频数据底层融合,使得其在交互体验上具有显著优势,如低时延(仅300多毫秒)和情感识别等特性。这对现有语音助手如国内和海外的同类产品形成了一定的竞争压力。GPT-4O的主要突破在于其多模态技术,它不需要经历文本转成文本的处理过程,可以直接理解音频、视频和文本等多种形式的信息,这在国内现有的硬件产品中尚未实现。此外,它还支持打断和多轮响应、情感识别等功能,这些都是过去国内语音助手所不具备的。

问:苹果引入GPT-4O后,国内手机厂商的应对策略是什么?

答:国内手机厂商可能会采取一种大模型中控的策略,利用大模型强大的语言理解和处理能力,将消费者的指令分派给不同的子模型进行处理,包括云端和端侧模型。同时,他们会结合多云策略和调用本地应用来完成复杂任务,以此来实现类似苹果接入GPT-4O的效果。

笔者笔记:先大模型理解处理,再细分指令调用子模型API处理。一个好汉,多个帮)

问:目前苹果语音助手接入时,唤醒和识别是在本地还是云端处理?苹果语音助手接入GDP后,识别功能是否会转向云端?

答:苹果语音助手的唤醒和识别都是在本地进行的,它与国内厂商不同,后者普遍采用云端处理。苹果语音助手接入GDP后,识别功能不会走现有的端测识别路线,而是在云端调用名单识别功能。

问:情感识别在国内技术现状如何?

答:目前国内技术尚不能完全实现苹果的语气识别和情感表达能力,如生成语气词、阴阳顿挫等,但国内厂商已有能力改善TTS(文本转语音)技术以实现部分情感表达效果,但与苹果相比仍有差距。

问:苹果唤醒后是否可能使用云端模型,以及部分功能是否能本地与云端混合使用?

答:苹果唤醒可能直接使用GPT的云端模型,但具体任务的调用策略需要一个系统引擎来决定何时调用云端或本地模型。对于文本处理、生成等功能,本地模型就能胜任,但对于需要细腻度和准确率更高的多模态交互(如视频功能),可能需要调用云端模型。

问:目前的手机本地端侧模型能否控制预置应用及第三方应用?对于没有提供数据权限的第三方应用(如网易邮箱),GDP4O是否能绕过权限限制进行操作?

答:对于预置应用,如微信,本地模型可以轻松地通过关键词匹配或大模型限量匹配快速唤醒并打开应用。但当需要应用内部数据交互时,可能需要调用云端模型以实现更复杂的任务。GDP4O有两条途径处理第三方应用权限问题。一种是直接要求权限,另一种是利用多模态识别能力,对当前应用截图并利用agent进行操作,无需获取应用权限层面的交互。

问:GPT-4O如何在不获取微信授权的情况下读取聊天记录?

答:GPT-4O通过唤醒微信并使用其视频能力查找菜单位置和联系人信息,模拟人的视觉操作进行截图识别,然后通过agent思考、决策和提取文本来找到并读取所需聊天记录。

问:对于一个没有训练过的模型,它能理解不同应用的操作界面和按键吗?

答:不能,不同应用的操作界面和按键设计差异很大,需要提前演示、培训消费者或者由手机厂商提前进行训练。消费者需要通过实际操作打开应用并遍历菜单来让模型学习。

(笔者笔记:国产AI手机需要用户消费者,行为数据提前训练,让大模型学习)

问:公司目前是否有与第三方应用进行合作或开发类似功能的规划?

答:有规划,公司已经开发了一个传送门功能,可以与下游应用进行交互。例如复制文本时,系统会调用模型理解能力,进行自动选择应用。随着功能发展,可能需要与更多应用进行权限交换或合作。

(笔者笔记:先大模型理解处理,再细分指令调用子模型API处理。一个好汉,多个帮。这里不就是和第三方APP合作开发,需要用到自己功能的时候,直接调用自己的API接口完成操作处理)

问:对于公司内部的本地模型(如地理位置或预制应用)为何选择保留本地而非打通?

答:主要是出于隐私合规的考虑。打通本地应用(如相册搜索功能)涉及到OCR识别和理解,目前尚不安全直接从云端执行,而是采用端侧处理,以保护用户隐私。

问:端测模型的安装包大小和云端模型相比如何?

答:端测模型的安装包大小约为143兆,实际模型运行需要放到云端,这个数字包含UI包装、缓存等,云端模型的实际比特大小要更大。

问:对于未来哪些功能会放在端侧,哪些会放在云端?

答:文本生成、文本处理、图像处理(抠图、智能识别、扫描翻译等)和大部分音频处理可以在端侧完成。对于涉及隐私敏感数据、需要学习用户习惯的服务(如自动弹出付款码等),则必须使用端侧模型。云端成本相对较高,主要体现在识别和调用大模型时产生的费用。

(笔者笔记:涉及到用户隐私敏感数据、需要学习用户行为使用习惯数据的,都需要放在手机端侧完成,那么就像上面聊到的国产AI手机需要用户消费者,行为数据提前训练,让大模型学习)

问:在苹果合作之后,对于10亿级用户同时调用中心算力的挑战,您的看法是什么?

答:如果苹果和10亿用户体量的手机厂商合作,由于权值form的价格和预测时需要便利的数据,10亿用户同时调用中心算力会导致云端交互变得不顺畅,这在当前的技术框架下可能难以支撑。

问:您能否预估一下一年内服务一个用户可能需要多少费用?云端的算力成本有没有框架计算过?

答:一般来说,一个手机厂商每年需要向识别相关的大模型供应商付费大约8千多万。如果苹果也接入这个大模型进行处理,按照当前国内LGB的价格,每用户费用可能在上亿级别。

问:您能否帮我们算一下将这些成本摊到单个用户身上大概是多少?

答:这个数据需要进一步测算,我们正在研究计算单个用户的成本问题。

问:您能帮我们预测一下未来市场的需求吗?对于苹果和iOS 18合作,您觉得谷歌的安卓系统是否有竞争力?

答:安卓阵营可能会在自身系统上进行改进,类似华为的强制接入大模型机制。但谷歌作为领头羊,更倾向于抱团取暖对抗苹果,预计会采取相应措施推动市场销量。

问:目前消费者对AI手机合作的期待有多大?是否会影响换机需求?

答:消费者对AI手机有较高期待,如果苹果成功推出AI手机,很可能带动一波销量,并且AI手机的概念对消费者具有吸引力。

问:如果国内厂商不接大模型,是否会导致苹果手机卖得更好?

答:是的,如果不接大模型,可能会导致苹果手机因自身模型优势而卖得更好,但关键还要看后续趋势发展。

问:作为国内手机厂商,在云端模型选择上会倾向于谁?

答:目前偏向选择百度作为云端模型供应商,因为百度在很多业务上表现比讯飞阿里腾讯更好,且有盈利的数据支持。

问:与大模型厂商合作时是谈单个用户还是按token量谈?

答:一般按token量谈,但也会探讨是否可以灵活接入不同大模型,而非固定绑定某个厂商。

问:如果用户购买了搭载大模型手机后频繁使用,费用会算到厂商头上吗?

答:费用通常不会算到用户头上,而是由厂商通过其他途径分摊或盈利,比如通过推荐系统收取费用。

(笔者笔记:就像前面章节一自己的思考,open ai。未来5版本6版本的变线模式,从-4o版本看初见端倪其实能打开了,如果和苹果合作,那么生态圈调用,就会产生用户使用。产生购买之类的,有流量就有现金流。无非就是苹果和open ai和各大app怎么分蛋糕的问题了。这里根据手机专家的交流,的确这个模式)

问:在苹果和GV4O合作后,国内其他手机厂商是如何应对的?

答:各家厂商对AI战略定位有所不同,华为倾向于与下游应用合作,OV则倾向于构建自己的agent系统,小米、荣耀等厂商则在OS上进行变革,为引入大模型做准备。对于苹果的合作,厂商可能会对云端提出新的要求或寻找替代方案来缩短差距。

问:苹果与GV4O合作后,落地时间和具体产品形态是什么样的?

答:云端应用预计会在iOS 18发布时出现,而硬件则会在今年9月份的iPhone 17上体现,这将带动国内厂商瞄准AI手机定义进行相应变革和参照。

三:根据以上生态圈API之后,看好的标的方向!

根据以上个人思考和手机专家交流,后续open ai功能继续迭代。那么可以看到的是这对整个生态圈是颠覆性的。最直接的就是大模型内嵌或者合作之后,会直接影响各个细分行业的流向入口。

同样,C端应用趋势当然是手机端、PC端、智能音响等入口端,以后还会应用到机器人上。

内嵌大模型,然后语音管家的形式。语音管家,根据您的个人喜好数据,根据同类型人的行为数据库,给您需求匹配。然后调用端侧API,您使用,过程产生现金流,双赢。

那么谁最受益?国内的话,总结下来,优先考虑有大量生态圈,可以调用很多细分行业API的公司。有优先权。这里,你可以看好腾讯(微信的生态圈)、也可以看好百度、华为、小米等等。但是以上都只是推测。

已知信息:

国外苹果手机内置大模型(Siri+国外版本ChatGPT),

国内版苹果手机,百度文心一言(openai入种花家被禁),

国产手机华为小艺、小米手机小爱同学等。

比较巧合的是,晚上正好百度有一则消息,

20:26:27【小米、OPPO、vivo、联想、蔚来接入百度文心大模型】

《科创板日报》16日讯,百度2024年第一季度财报电话会上,百度创始人、董事长兼首席执行官李彦宏透露,继上季度与中国三星、荣耀合作后,本季度,小米、OPPO、vivo等手机厂商均接入文心大模型API。大模型的合作领域还在从手机向PC和电动汽车领域拓展,联想和蔚来汽车也在季度内与达成合作。(记者 黄心怡)

所以这里,评审对比下来,优先看百度的生态圈——文心一言。未来在智能终端的落地合作!

1)标的这一点的话,百度看好。小米腾讯等关注

2)百度生态圈细分的话,找找关联公司

看好300766每日互动

百度(鼎鹿中原)为其第二大股东,国内手机等智能终端 行为数据拥有者,ai手机高辨识度标的。公司动覆盖了全国10亿的手机设备数据,掌握用户行为数据,是AI手机自我训练的刚需。开发者服务SDK累计安装量突破1000亿。覆盖了美妆、日化、运动、食品餐饮、资讯阅读、生活服务、社交出行、金融、娱乐影音视频、电商等,涵盖了用户的使用习惯、行为偏好等行为数据。

同时在智能交通领域和百度无人驾驶未来有存在合作的可能。无人驾驶领域,特斯拉FSD国内百度地图。每日互动的智能交通领域已经落地的产品,和浙江交投集团(浙江国资委)有合资公司——浙江高信,联合交通部门数据,打造的 数智绿波系统 和 高速障碍物预警系统。

政策支持:两部门联合发文支持交通基础设施数字化转型。2024年4月29日,交通部联合财政部发布《关于支持引导公路水路交通基础设施数字化转型升级的通知》。

同时技术上又处于历史低位。跌破上市发行价13.08元、去年股权激励价20.2元。股价安全护垫足,研发投入占比高。在时代的浪潮看好爆发成长潜力!——新质生产力代表爆发企业!

后面苹果发布会如果采用了chatgpt或者国内手机相关智能终端的消息落地,就是最大的加速催化剂!
#openai发布GPT-4o#OpenAI$百度概念(BK0623)$$小米集团-W(01810)$ $腾讯控股(00700)$

全部讨论

05-17 10:51

$腾讯控股(00700)$ 港股涨得也好,腾讯的话,是因为有微信,有很多小程序,有这个生态圈。又要发布C端大模型APP
10:42:12【腾讯混元即将发布大模型C端App腾讯元宝】财联社5月17日电,在今日举办的腾讯云生成式AI产业应用峰会上,腾讯明确将在5月30号发布基于混元大模型的面向C端的App“腾讯元宝”。