AI进入端侧,最性感的是AI眼镜!一文讲清楚逻辑!

发布于: 雪球转发:0回复:5喜欢:15

AI宇宙第一公司NV发布财报,尽管业绩、分拆、GB200发货提前等亮点,但总有担心“放缓”的声音。追溯这一波NV+NV链的业绩,就是“炼丹厂”在scaling law信仰下,买更多算力,训练更大参数量的模型,想大力出奇迹涌现更高智慧的AI。NV的铜缆到以太网的变化是不再简单追求极致性能,而是兼顾经济性,未来重点从训练往推理。GPT-5大招憋了很久,还能不能震撼大家不知道,但是炼丹厂们买量后,留存越来越差了,还纷纷降价?异曲同工,最近大厂发的新模型OpenAI的GPT-4o和谷歌的Gemini Flash迭代已经不是要大力出奇迹了,而是要如何巧力省力,更低延时、更低算力成本、横向拓展多模态能力。这一切说明,大模型已经从做大一条路到需要兼顾做强的“高质量”两条路的阶段,这正是解答大家关于AI商业化应用的问题,也就是随着生成式AI的使用成本在光速下降,AI正进入适合商业化应用爆发的舒适区。

端侧AI

AI类似互联网,终将从B端走向C端,随着大模型训练+算力硬件建设,进入端侧AI已是必然结果。究竟什么是端侧AI?广义来说,就是通过终端使用AI,这包括狭义的直接在端侧离线状态下也能实现的运行小参数量的大模型解决高频、简单的问题,也包括调用云端的大参数量模型解决复杂的问题。AIPC、AI手机已成为产品演进的共识,从硬件上比较明显增强了适合端侧低功耗运行大模型的NPU算力模块(高通最近比NV还风光)和更大的内存,也有更强的散热、声学传感器、高密度电池、轻量化结构件等变化。从软件层面,终端厂商普遍的做法是:系统集成官方的AI助手(端+云)+AI应用(商店)。例如联想AIPC:

我花了13999买了人生第一台AIPC,然后把你想知道的全测了》卡兹克这篇测评展示了联想的小天,可以选择本地和云端两种不同的大模型模式,以及绘画应用和端侧隐私优势。

例如OPPO AI手机:

系统集成小布助手,可以实现翻译、AI摘要、旅游行程制定等功能,主打的AI应用里面包括修图、消除之类的。

目前的AIPC/手机仍在早期,更像是传统PC/手机+AI,类似早期智能汽车的硬件升级+不断OTA,苹果两周后的WWDC将迎来iOS18大迭代和以AI siri为核心,跟OpenAI等合作开启端侧AI。多模态的GPT-4o目前看仍是云端推理,但是响应速度更快,能调用终端的声学、摄像头等传感器,这是一个最像人的大模型,他能理解你的情绪、你所处的环境。端侧的AI助手将变得更聪明、更强大、更懂你和更像人。

本地运行的AI,最基础的语言能力是完全没有问题的,随着大模型跟操作系统和其他应用的融合迭代,结合云端强大的大模型,能完成越来越复杂的任务,所以以后人们跟自己的AI助手交流会变成一个很常见的场景。端侧AI,不是让普通人学习更多的AI专业知识来使用AI,而是让AI学习变得更懂人的需求,并解决问题。作为类比,人与人之间是怎样交流的?可以写信、发文字信息,也可以语音、通话,还可以视频、见面,很显然后者比前者的交流会更到位,也就是相比之前文字对话为主的AI对话框,未来声学、摄像头传感器带来的听觉、视觉交互更符合端侧AI的人机交互方式

AI眼镜

如果说AIPC/AI手机是一个产品升级换机的逻辑,那么眼镜形态的轻量化AI终端,可能是最性感的增量终端。简单说,AI眼镜是最符合人与AI交互的一个载体。

AI Pin、Rabbit R1是新生的AI轻量化终端创意,试图能给人们带来更便捷、高效体验AI的终端,但很显然他们并不是很成功,本身使用就很麻烦,为啥不直接用手机?随着AI手机的普及,我们其实并不需要一个全新的终端来替代手机,AI眼镜就很好,甚至我们都不用放在口袋或者包里,我们平时就戴着。

从三个形态,给大家分别介绍一下AI眼镜的应用场景和优势:

1、音频AI眼镜

华为智能眼镜2有很多不同款式的镜框,跟我们选配眼镜是一样的,可以是太阳眼镜,也可以是近视眼镜,你可以理解为这是一个always on的无线耳机。钛空款不含镜片仅28g,跟普通镜框已经非常接近,普通人晚上充好电续航够一天用,反向声波减少漏音。相比耳机,音频眼镜的使用场景在哪?耳机带久了会不舒服,平时并不会戴着,通常是用电话来,或者想要听歌才找出耳机戴上。音频眼镜对于比较高频使用的人来说,既减少了频繁戴脱的麻烦,也减少了耳朵的负担。相比耳机、手机的麦克风拾音还更好,在AI交互场景里,能让大模型更好地听清楚你的话。有了音频AI眼镜,AI服务有更多的可能性,例如允许他主动提醒你天气变化、航班日程。

华为智能眼镜2硬件结构:

类似TWS耳机的对称式设计,两只镜腿无线连接。镜腿内部采用了88mAh+30mAh双电池,搭载同向双振膜单元,配备电量计芯片,核心的主控芯片来自WUQI物奇WQ7036AX蓝牙音频SoC,其高性能DSP和NPU,支持复杂的多麦克风上行降噪算法和关键字唤醒,同时兼顾低功耗。

小米这款459,跟华为眼镜用的主控芯片一样,相比华为的1500-2200要便宜不少,音频AI眼镜跟TWS技术同源,非常成熟。一笑判断,很快会有大量这类产品出现,跟普通眼镜框相比价格差不太多,但也多了新的音频AI体验,随时召唤你的AI。

2、视觉AI眼镜

一笑暂且叫他视觉AI眼镜好了,就是他在音频眼镜的基础上,加了摄像头这样的视觉传感器,也意味着需要ISP模块和更强大的SoC,某种意义上复杂程度相比TWS要高了一个LEVEL。以META和Rayban联名开发的智能眼镜第二代为例,有1200万像素的摄像头和5个麦克风阵列,售价299美元起,去年10月一经发售就非常火爆,受到网红潮人的一致好评,上图就是一笑在X上截的。这款眼镜能语音唤醒拍照、摄像,还能便捷地直接分享到META旗下的社交软件,甚至还可以直播,单从其基础功能看就有很强的可玩性。就在最近,这款智能眼镜可以接入META的多模态大模型Llama3了!

泰裤辣!这眼镜不仅能听懂你说的话,还能看懂你看到的!从AI理解你的角度来说,听觉视觉齐备了!毫不夸张地说,这一波AI眼镜热潮就是他引爆的!

心有灵犀,这里给一笑好友警长打个CALL,《AI眼镜引爆销量奇迹,将开创消费电子新蓝海?》XR研究院星球下一期分享的主题就是AI眼镜。

同样的,另一位朋友何老师《网页链接{XR硬件拆解及BOM成本报告:Meta Ray Ban 智能眼镜}》这篇拆解报告很详尽,关心硬件构成的可以细看。这款智能眼镜,其实是META一个尝试,由rayban品牌方生产,这次迭代的火爆证明了这个细分定位的市场前景,结合AI的到来,下一个迭代会加入显示(这样从人这一侧也能听觉视觉齐备了,近视显示复杂),META也不再跟rayban合作,准备自己来大干一场了。(之前有聊过,大致方案是Lcos+反射光波导单目显示,代工和重要零组件都在国内)

3、AR AI眼镜

AR眼镜,这并不是一个新东西,但由于OST下的显示技术不够成熟,以及应用场景仍不够清晰,所以消费级AR又贵又没什么用,一直没能普及。但是,随着AI大模型的到来,很好地丰富了应用场景。AI眼镜,如果加上显示,那就是大家过去一直期待的AR了。

这类消费级AR有代表性的产品如雷鸟X2和影目AIR2。

上面这个对比图,可以大致看出来他们的硬件情况,重量都100g+,一直佩戴肯定还是太重了点儿。那么,还有一个代表:

43g魅族系MYVU采用单色Micro LED的AR,用的BES2700系列的低功耗主控SoC,但是有个问题,他没有摄像头!在AI到来,这个眼镜的用处提升,但未来还是要加入摄像头滴!

AR鼻祖的谷歌,在开发者大会上关于多模态AI应用的场景演示里,放出了22年研发但一直未发售的代号Project Astra的AR,这或预示着谷歌的AR+AI产品要落地了。

5月22日消息,Brilliant Labs宣布了其备受期待、具有突破性的开源AI眼镜Frame在全球范围内上市可及。Frame支持Claude 3、Llama 3和Stable Diffusion在内的大型语言模型(LLM),这使得开发者能基于Frame AI助手Noa构建创意应用,该助手已集成了Perplexity、Whisper和GPT-4o。

带货四年“真还传”的“退网”罗永浩,4月1日剧透自家“颠覆性、破坏式的创新”,是“高科技产品,智能化设备”新品快上了,199美元和299美元大家准备好。自22年6月成立细红线专注AR以来,也近2年了!风口冥灯的罗永浩,在AR消停之际,AI眼镜风口又来了!

AR其实是苹果库克最看好的未来终端产品,只是量产好的产品难度过大,才先从VISION PRO这样的MR产品形态开始。现在苹果和META两个被给予厚望的XR玩家,都在大力投入生成式AI,那么大概率AR产品的战略重要性提高,产品节奏加速!

……

最后小结一下,端侧AI还在早期,今年下半年会看到大厂重要的产品验证,那么AI眼镜作为最性感的增量,也是一个探索和早期渗透的阶段。AI眼镜的向前演变,AR眼镜的商用落地,交汇了!不同形态的智能眼镜,N条路径同时开启,用户喜欢的爆品就是最好的产业逻辑!所以,我们需要关注大厂爆品以验证逻辑,目前META的眼镜SAY YES了!AI应用,虽然还很早期,但是在AI陪伴这样的场景已经非常受欢迎。AI眼镜的到来,随时交流,“她”还能感受你的真实世界,虚拟AI陪伴的交互将迎来新的高度。

全部讨论

05-28 21:51

有合适的标的吗

05-27 11:17

等风起

05-27 09:04

苹果Ai手机有看好的标的吗?

估计需要苹果MR国内上市预热一下,或者等苹果的AR眼镜出来才行!

感觉不大行,炒过了,冷饭在a股得有切实业绩吧