AGI要闻:斯坦福李飞飞首次创业,瞄准“空间智能”;OpenAI下周发布搜索产品挑战谷歌|...

发布于: 雪球转发:0回复:0喜欢:1

斯坦福大学首位红杉讲席教授 李飞飞

通用人工智能(AGI)领域又公布了一系列重磅消息。

5月4日凌晨,据路透社,著名华人计算机科学家李飞飞(Fei-Fei Li)正在建立一家初创公司,该公司利用类似人类对视觉数据的处理,使 AI 能够进行高级推理,或称为“空间智能”企业,但没有透露名字。

报道称,这家公司已在近期完成种子轮融资。投资方包括硅谷风险投资公司 Andreessen Horowitz(a16z)、加拿大基金Radical Ventures。

与此同时,有消息称,OpenAI下周将发布ChatGPT搜索引擎,挑战全球搜索引擎领域的“霸主”谷歌

另外,5月3日,顶级科学期刊、英国《自然》(Nature)杂志发布文章指出,中国 AI 芯片技术落后于美国科技巨头。报道引述美国大学工程师巴纳法 (Ahmed Banafa) 称,“由于英伟达AMD 等公司的存在,美国领先于几乎所有国家。在 AI 芯片领域,中国仍然落后美国‘至少五到十年’,部分原因是它无法获得生产所需的最先进 AI 芯片设备。”

AGI领域持续狂飙。

AI 教母李飞飞首次创业,成立“空间智能”公司,已完成种子轮

5月4日凌晨,据路透社报道,李飞飞(Fei-Fei Li)正在创建一家初创公司,该公司利用类人视觉数据处理技术,使 AI 能进行高级推理,并且其公司已完成种子轮融资。

李飞飞是 AI 领域的先驱性人物,也是计算机领域的华人女科学家,目前还是斯坦福大学首位红杉讲席教授、美国国家工程院院士、美国国家医学院院士、美国文理科学院院士、ImageNet的首席科学家和首席研究员、斯坦福以人为本人工智能研究院院长、AI4ALL联合创始人。她的专业领域是计算机视觉和认知神经科学。

李飞飞一直被称为“AI 教母”——源自与图灵三大“AI 教父”一样的称号。她通过开发一种名为ImageNet的大规模图像数据集在AI领域名声大噪。该数据集帮助开创了新一代能可靠识别物体的计算机视觉技术,也是ChatGPT底层技术之一。

2016年11月,李飞飞加入谷歌,担任谷歌云AI/ML首席科学家。2018年9月,返回斯坦福任教,现为谷歌云AI/ML顾问。10月20日斯坦福大学以人为中心的AI计划开启,李飞飞担任联合负责人。

对于这家新的初创公司介绍,一位消息人士提到,上个月,李飞飞在温哥华 TED 大会上演讲中表示,最前沿的 AI 研究涉及一种算法,这种算法可以合理地推断出图像和文字在三维环境中的样子,并根据这些预测采取行动,这种算法使用的概念叫做“空间智能”。

李飞飞表示:“在空间智能的驱动下,大自然创造了这种看与做的良性循环。我们在斯坦福大学的实验室正试图教计算机如何在三维世界中行动,例如,利用大型语言模型让机械臂执行任务,如根据口头指令开门和制作三明治。”

报道还称,李飞飞曾对美国 AI 研究方面的资金缺口表示遗憾,一方面是资源充足的私营部门,另一方面是学术界和政府实验室,他呼吁美国政府以“登月心态”投资该技术的科学应用和研究它的风险。

她在斯坦福大学的个人资料显示,从 2024 年初到 2025 年底,她将部分休假。她的个人资料中列出的研究兴趣包括“认知启发式AI”、计算机视觉和机器人学习。

从 2024 年 1 月开始,在 LinkedIn 上,她将自己目前的工作列为“新手”和“新事物”,

许多人表示,在实现通用人工智能(AGI)之前,必须先建立这种“推理”能力,AGI 指的是系统可以像人类一样或更出色地执行大多数任务的阈值。

一些研究人员认为,他们可以通过构建更大、更复杂的当前模型来改进推理,而另一些研究人员则认为,前进的道路涉及使用新的“世界模型”,该模型可以从周围的物理环境中获取视觉信息来开发逻辑,复制婴儿如何学习。

针对融资消息,截至发稿前,Andreessen Horowitz(a16z)和 Radical Ventures 的发言人拒绝置评。李没有回应置评请求。

OpenAI将于5月9日发布ChatGPT搜索引擎,挑战谷歌搜索

5月3日,前Mila研究员、麻省理工大学教授Lior S爆料,根据OpenAI最新的SSL证书日志显示,已经创建了search.chatgpt.com子域名(目前无法访问),将会进军搜索引擎全面挑战该领域的全球霸主谷歌

比较巧的是,OpenAI已经更新了网站主页,第一个轮番页是一个搜索框上面写着“向ChatGPT问任何事情”。再结合theinformation在今年2月14日的新闻,OpenAI正在秘密研发一款ChatGPT支持的web搜索引擎,这个事情还是挺靠谱的。

目前,多方消息证实,OpenAI将会在5月9日上午10点公布该消息,大约是北京时间5月10日(周五)凌晨2点。

OpenAI抢在5月9日发布这个消息也挺有意思,因为5月14日谷歌将举行一年一度的“Google I/O”大会,OpenAI不希望谷歌的技术大会抢了该产品的风头。

早在今年2月14日,The information报道,OpenAI会联手微软的Bing研发一款网络搜索引擎来挑战谷歌

目前,全球前五搜索引擎分别是谷歌、Bing、雅虎百度Yandex,而谷歌的市场份额占到了90%左右,几乎垄断了整个市场。

因此,OpenAI进军搜索引擎的消息放出后,不少人认为,谷歌将迎来最艰难的对手。

目前谷歌搜索在技术层面和用户使用体验方面仍然有很多问题。如,广告太多、死链、过时链接和数据更新太慢,谷歌搜索结果中存在大量死链和过时的链接,致使用户访问无效的网页浪费时间,以及关键字匹配有局限性,无法深度理解上下文搜索,传统搜索引擎主要依赖于关键词匹配来返回搜索结果。

而基于上一代算法的谷歌个性化搜索,似乎会出现“过滤泡沫”的情况,就是用户只能看到与自己观点一致的信息,限制了信息的多样性和视野的广阔性,长此以往会形成“信息茧房”。

那么,利用ChatGPT这类大模型去做搜索引擎,到底靠不靠谱呢?

近期,基于GPT-4的微软新Bing搜索公布全球用户突破1亿大关。而且,微软称利用其技术,搜索能力、市场用户、营收等迎来一波井喷式增长,这似乎说明用户对大模型加持的搜索引擎一定认可。

同时,前不久获得6270万美元,估值10.4亿美元的纯大模型搜索引擎Perplexity AI获得资本市场认可。Perplexity AI提供了一个搜索框,可以像谷歌搜索引擎那样输入我们想搜索的东西。

例如,人感冒的时候如何才能快速恢复?Perplexity 会列出6个文本内容,并附带真实的网站地址。这一点很重要,是在告诉用户它说的内容是真实、可靠的。但如果源地址是错误的,也会影响大模型结果的输出。

那么,在OpenAI正式加入搜索引擎赛道后,谷歌要如何回应呢?让我们拭目以待吧。

Coreweave完成11亿美元融资,最新估值190亿美元

5月1日,英伟达投资的GPU云计算提供商Coreweave宣布已获得 11 亿美元的C轮融资。

本轮由Coatue领投,Magnetar、Altimeter Capital、Fidelity Management & Research Company和Lykos Global Management参与投资。

新资金将用于支持所有业务领域的快速增长,以及 CoreWeave 向新地理区域的扩张,以满足全球 GPU 加速云基础设施的爆炸性需求。

有消息称,融资完成后,Coreweave最新估值达到 190 亿美元,比五个月前的 70 亿美元几乎增长了两倍。

据CoreWeave透露,公司一直在迅速扩大其数据中心规模,去年数据中心数量从 3 个增至 14 个,并计划到 2024 年底达到 28 个。

CoreWeave 联合创始人&CEO Mike Intrator 表示,CoreWeave 作为 AI 开发中关键基础设施的提供商,不断向前发展,持续信任我们的高素质投资者证明了 Coreweave 拥有定义下一代云计算的巨大机会。CoreWeave 专为解决高性能计算领域最复杂、最紧迫的挑战而设计。

在接受《财富》杂志对话时,Mike Intrator表示,Coreweave 正在建造地球上最大的超级计算机,并且一次又一次地建造它们,这就是 CoreWeave 独特的资质。

英伟达联合构建训练机器人的 AI 智能体

NVIDIA 和宾夕法尼亚大学合作的最新成果 DrEureka,这是一个大语言模型智能体,能编写代码来训练机器人,可以将在模拟器中训练的结果移植到现实环境中,从技能学习到模拟到真实环境部署的整个过程可以做到全自动化。

让机器狗在瑜伽球上保持平衡是很有挑战的任务,在没有大语言模型之前需要人去调整参数,但现在像 GPT-4 这样的大语言模型,因为本身就具备了丰富的物理知识,所以大语言模型可以代替人类去调整参数,并根据反馈的结果进行推理和参数调整。

项目地址:网页链接

代码库:网页链接

新的开源 AI 眼镜来了

5月3日晚,美国Brilliant Labs公司公布了一个开源AI硬件,名为Frame AI 眼镜。

Brilliant Labs表示,你可以通过语音和 Frame 进行沟通,它的回复会显示在眼镜屏幕上,而且会有小图标表示现在的情绪。

据悉,Brilliant Labs成立于2019年,由前苹果公司(Apple)员工Bobak Tavangar与联合创始人Raj Nakarja和Ben Heald共同创立,致力于通过开发生成式AI嵌入式眼镜来重新想象人机交互。

自成立以来,Brilliant Labs 已吸引了 600 万美元的融资。去年Brilliant Labs还获得著名投资者、AR先驱Niantic CEO的融资支持。

今年2月,Brilliant Labs宣布推出Frame——全球首款集成多模态AI助手的眼镜。Frame不仅重新定义了视觉方式,还重新定义了用户与物理世界的交互方式,而它的外观设计与真实眼镜无差别。

Frame内置个性化的多模态AI助手Noa,通过眼镜,用户与AI助手之间的复合交互,使Noa不仅可以提供个性化的用户体验,还可以形成自己的个性。

例如,任务和请求可能包括总结一本书的要点,然后将书中的外语文本翻译成您偏好的语言;将白板会议整理成可共享的文档,与同事分享;识别皮肤问题并推荐现成的药膏;甚至根据一杯咖啡中的营养价值或咖啡因含量建议每日饮用的健康量。

甚至可以充分利用眼镜内置的多模态GenAI功能,这意味着 Frame 可以组织多个 AI 系统一起完成更高级的任务。

与市场上的其他增强型可穿戴设备不同,Frame不仅仅是戴上一两个小时后就得取下的智能眼镜。Frame本身就是一副光学眼镜,可以完全取代您每天佩戴的眼镜,只是提供了一个轻量级的个人AI助理。

具体特点方面如下:

轻量级AI眼镜:使用工程级尼龙塑料制造,Frame经过优化,重量仅为39克,与标准眼镜一样轻,但坚固耐用,适合全天佩戴;

时尚设计:呈现经典复古造型,提供烟熏黑、哑光冷灰和一个命名为H2O的透明变体,为日常风格增加了时尚元素;

生动显示:Frame的高分辨率生动显示屏亮度高达3000尼特;

前置空间摄像头:Frame集成了一个低功耗机器视觉摄像头,可以精准捕获和解读周围物理世界;

集成麦克风:通过语音输入与 AI 助手进行控制或交流,实现免提体验;

多模态AI:通过蓝牙5无线连接到您的手机,支持Perplexity, Stability AI和Whisper等的同时GenAI输入,为现实世界的问题提供高级解决方案;若Frame在中国上市,Noa将按照相关法域支持本地LLMs,包括文心一言;

6DoF IMU:位于鼻梁中央位置的先进 6 轴 IMU(惯性测量单元)为 Frame 提供了三个加速度轴和三个罗盘轴,可用于菜单导航、计步、方向等功能;

定制供应链:与 AddOptics 合作,可以通过独特的光学镜片铸造工艺将处方镜片精密粘合到 Frame 上。

开源技术:Brilliant Labs将提供全面支持,为有意对 Frame 的硬件和软件进行修改或破解的开发人员提供充足的资源,包括实时文档、开源代码库和硬件原理图。而且,开发人员还可以调整 Noa 支持的AI模型参数。

另外,凭借用户可以在与数字世界连接的同时解放双手的特质,Brilliant Labs还宣布了与 Perplexity 合作,重新思考和定义 AI 增强眼镜时代的传统搜索引擎概念。Perplexity 基于首创的在线 LLMs ,参考最新的网页数据,其AI问答引擎可以即时简洁地回答口头查询,无需受制于同类产品知识滞后的问题。因此,Frame 用户可以随时随地、解放双手地获取来自网络的实时可靠信息。

例如,现在将 Perplexity 添加到 Noa 的多模式功能中,Frame 可以通过简单地眼球转动,将连锁零售店中的一件服装,与亚马逊上的价格进行比较;在看房时,只需瞥一眼房子,就可以在类似贝壳的房产App上搜索其房源;或是需要自己进行家庭维修时,Noa 可以帮助您锁定并交叉参考您完成项目所需的正确螺丝;您甚至可以立即查看路过的每家餐厅的评论,同时还能够交叉参考它是否有最近的负面新闻……可能性是无限的。

Brilliant Labs CEO兼联合创始人 Bobak Tavangar 表示,“Frame 真正为人类与数字世界、人与彼此之间的互动带来了全新范式。Noa,一种全新的 AI 虚拟助手,让用户能够更多地参与周围的世界,而不是与物理世界隔绝。我们希望 Frame 能够使人们以全新的方式彼此连接,并在日常生活、工作场所、课堂等等方面开启新的体验。这是将GenAI带到人类眼前的独特承诺。”

Perplexity创始人兼CEO Aravind Srinivas 表示,“人类与AI交互的未来将在创新的可穿戴设备和新装置中得以体现,我非常高兴能够将 Perplexity 的实时问答引擎带到 Brilliant Labs 的 Frame中。”

英国《自然》杂志:中国 AI 芯片技术落后美国5-10年

5月3日,全球顶级期刊、英国《自然》(Nature)期刊发布关于中国 AI 的文章。

《自然》期刊指出,生成式人工智能 (AI) 的快速发展引发了一场全球技术竞赛,旨在生产为模型提供动力的计算机芯片。国内外研究人员表示,美国禁止向中国出售高性能计算机芯片正在抑制中国在关键技术方面的进步。而这些芯片对于推动 AI 最新进展变得越来越重要。

“生成式 AI 可以改变社会,”杜克大学的电气和计算机工程师Yiran Chen(陈怡然,华人、微博博主)说, “如果中国被孤立,它就无法迎头赶上。”

由于生成式 AI 技术的进步,人们对人工智能的兴趣激增,并且 AI 技术的繁荣还引发了一场全球竞赛,而英伟达是 AI 芯片的领先开发商之一,去年 3 月其市值首次突破 2 万亿美元。

加利福尼亚州圣何塞州立大学的工程师艾哈迈德·巴纳法 (Ahmed Banafa) 表示:“由于 NvidiaAMD 等公司的存在,美国领先于几乎所有国家。”

陈怡然表示,美国商务部措施“极大限制”了中国在训练 AI 模型方面的进展。

“我们无法在中国获得高端英伟达芯片,也无法制造高端芯片,”北京清华大学电子工程师王宇表示,“对于中国来说,台积电只能制造低于规定的芯片,这意味着拜登政府设定的 300 teraflop 限制。所以中国只能在中国境内生产自己的高算力芯片。”

巴纳法表示,中国仍然落后美国“至少五到十年”,部分原因是它无法获得生产所需的最先进 AI 芯片设备。随着英特尔英伟达和三星向2nm迈进。“当制程更小,你可以添加更多晶体管和更多功率。在他们取得技术突破、降低成本之前,他们(中国)正在追赶美国,”巴纳法说。

但目前,随着其他国家 AI 芯片的快速发展,中国发现自己越来越孤立。“谁会使用中国制造的芯片?”陈怡然说道。“这是一场商业战争。”

又有两位OpenAI高管离职

5月4日,据The information报道,本周早些时候,OpenAI的两位高管:人力资源副总裁Diane Yoon,以及非营利组织及战略计划负责人Chris Clark离开公司。

对此消息,OpenAI发言人Kayla Wood在声明中表示,Yoon将在今年的剩余时间里继续担任公司的顾问。目前担任OpenAI人力资源负责人的Julia Villagra将接替Yoon成为人力资源副总裁。她没有评论Clark是否会被替代。Wood表示,两位高管都是自愿决定辞职的。

Wood说:“我们非常感激Diane过去六年的奉献和领导。在她的指导下,OpenAI取得了显著增长,同时在研究、产品和其他功能上保持了高标准的卓越。”

而这两位OpenAI高管的辞职,是在Sam Altman戏剧性地被解雇-回归系列事件,这些变动凸显了估值860亿美元的OpenAI公司内部不寻常的架构。

报道称,尽管OpenAI的价值和影响力在不断增长,但是其内部的领导层却在经历着一系列的变动。这些变动不仅影响了公司的管理,也引发了人们对其公司结构和未来发展方向的关注。而这两位高管的辞职是OpenAI领导层变动的最新事件,也是该公司不寻常公司结构的一次显著体现。

据悉,Yoon于2018年加入OpenAI,监督了公司员工的快速增长,到去年年底已超过700人,以及在11月下旬的一周动荡期间,当时公司数百名员工因Altman被解雇而威胁要辞职。

根据LinkedIn资料,Clark在OpenAI工作了八年多,并从2016年开始担任其首位首席运营官。根据税务申报,他还在2016年和2017年担任了非营利组织的董事会成员。Clark此前曾在Y Combinator与Altman共事,并在Loopt工作,这是Altman在2005年共同创立并后来出售的由Y Combinator支持的位置共享初创公司。

2022年5月,Clark担任了他最近的职务,他将其描述为“领导OpenAI的非营利组织和几个全球运营职能,包括房地产、工作场所和战略计划。”在给员工的一份笔记中,Clark表示,“在OpenAI度过了八年不可思议的时光后,我决定退一步,将更多时间投入到我深深关心的OpenAI之外的人和项目上。”

而OpenAI的创始成员之一Andrej Karapthy在2月份离开了公司。

Yoon和Clark没有回应评论请求。

(本文首发于钛媒体App,作者|林志佳,编辑|胡润峰)