AI创投周报|科大讯飞发布讯飞星火大模型V4.0,OpenAI发布CriticGPT

发布于: 雪球转发:0回复:0喜欢:1

AI创投周报是阿尔法公社推出的聚焦于以生成式AI为代表的人工智能新浪潮的创投资讯周报。阿尔法公社发现和投资非凡创业者(Alpha Founders),相信非凡创业者们在技术、商业和社会方面的巨大推动力,他们指引着创投生态的风向。

本图由“千象”(网址:网页链接)生成

本周,我们观察到以下AI领域的新动向和新趋势:

1.科大讯飞发布讯飞星火大模型V4.0,性能超越GPT-4 Turbo,科大讯飞最新发布的讯飞星火大模型V4.0在8个国际权威测试集中荣登榜首,全面超越了GPT-4 Turbo,展现了在文本生成、语言理解、知识问答、逻辑推理和数学等核心能力的显著提升,并在多模态领域逼近国际顶尖水平。

2.OpenAI发布CriticGPT,助力模型自我进化,突破RLHF限制,CriticGPT模型旨在提升下一代模型训练效率,尤其在挑错能力上取得显著突破。CriticGPT能发现代码中75%以上的细微错误,远超人类的25%识别率。

3.人工智能生物科技初创企业Formation Bio,近日宣布成功完成3.72亿美元的融资,该公司凭借其独特的AI算法,能够深入挖掘海量生物数据,精准预测化合物活性、优化药物设计,此轮融资旨在推动其利用先进的AI技术平台,加速药物从发现到临床应用的全过程,为生物医药行业带来颠覆性变革。

如果您对人工智能的新浪潮有兴趣,有见解,有创业意愿,欢迎扫码添加“阿尔法小助理”,备注您的“姓名+职位”,与我们深度连接。

人工智能产品和技术的新突破

1.讯飞星火4.0:超越GPT-4 Turbo,引领国产大模型新纪元

科大讯飞最新发布的讯飞星火大模型V4.0,标志着国产大模型能力达到崭新高度。该模型在8个国际权威测试集中荣登榜首,全面超越了GPT-4 Turbo,展现了在文本生成、语言理解、知识问答、逻辑推理和数学等核心能力的显著提升,并在多模态领域逼近国际顶尖水平。

星火V4.0的发布伴随一系列应用革新,如“智能体”功能的深化,允许用户定制专属AI助手,以及在医疗、教育领域的深度应用。“讯飞晓医”作为医疗大模型,不仅在海量知识问答、文书生成等方面超越GPT-4系列,还为医生提供精准辅助诊断,惠及患者。在教育领域,智能批阅机和AI学习机的升级,通过自动化和个性化教学,极大地提高了教育效率和质量。

语音方面,讯飞依托其语音识别优势,星火语音大模型新增37种方言识别,支持74种语言及方言的自由交流,展现了在嘈杂环境下的卓越语音转写能力,尤其在车载智能座舱应用上展现巨大潜力。

综上,讯飞星火V4.0不仅在底层技术上实现突破,更通过贴近实际应用场景的创新,加速了大模型的商业化进程,为用户提供了更个性化、高效的智能服务,彰显了国产AI技术的强劲实力和广阔前景。

来源:科大讯飞

2.哈佛辍学生创史上最快AI芯片Sohu,专攻Transformer模型性能飞跃

美国初创公司Etched推出革命性AI芯片Sohu,这款ASIC芯片专为Transformer架构设计,运行速度比英伟达H100快20倍,比B200芯片快超10倍。在处理Llama 70B模型时,Sohu每秒可输出50万个token,远超同类产品。Sohu是首个完全专注于Transformer计算的芯片,牺牲了对其他类型模型的支持,换取了前所未有的性能提升。

通过高度专门化的硬件设计,Sohu实现了90%以上的FLOPS利用率,相比之下,基于GPU的解决方案如TRT-LLM仅能达到约30%。Sohu芯片能够输出更多FLOPS,是因为它剔除了非必要的控制流逻辑,专注于矩阵运算,充分利用晶体管资源。此外,Sohu在内存带宽使用上也更为高效,避免了常见的瓶颈问题。

在软件层面,Sohu简化了开发流程,因为它只需支持Transformer相关的软件栈,而非像GPU那样需兼容广泛的AI模型,这使得软件开发更为直接。Etched的开源策略也为用户提供了灵活性,便于定制和优化。

由哈佛辍学生Gavin Uberti领导的Etched团队已完成1.2亿美元A轮融资,正将Sohu推向市场。CEO Uberti表示,若Transformer持续主导AI模型,Sohu将带领公司走向巅峰。尽管面临行业巨头英伟达的竞争,Sohu凭借其对大模型计算的独特优化,预示着AI硬件领域的专业化趋势,可能开启计算效率的新篇章。

来源:网页链接

3.昆仑万维联手南大推Q*算法,革新7B模型推理效能

昆仑万维与新加坡南洋理工大学合作,成功研发出名为Q的先进算法,此算法针对大型语言模型的推理能力进行了显著增强。Q算法的提出是对OpenAI保密的Q*项目的积极响应,旨在打破技术壁垒,推动开源AI模型的发展。

该算法通过对大模型推理路径的精细分割,结合DeepCubeA策略,整合历史状态收益与未来预期收益评估,运用A搜索进行最优化决策,实现对复杂推理任务的高效规划。实验结果显示,Q算法助力Llama-2-7b模型在GSM8K数据集上的准确率提升至80.8%,优于ChatGPT;DeepSeek-Math-7b在MATH数据集上的准确率提升至55.4%,超越Gemini Ultra;CodeQwen1.5-7b-Chat在MBPP数据集上的编程能力提升至77.0%,接近GPT-4水平。

Q不仅极大增强了小规模模型(7B参数级别)的推理表现,使之媲美甚至超越大规模模型,同时有效减少了计算资源消耗,标志着向高效智能化迈出了重要一步。尽管Q尚处早期研发阶段,其潜力已显现,未来昆仑万维将持续优化,力图打破闭源限制,引领AI领域新变革。

来源:网页链接

4.谢赛宁与Yann LeCun团队发布“寒武纪1号”:革新多模态LLM的视觉理解

纽约大学谢赛宁与图灵奖得主Yann LeCun携手推出开源项目“寒武纪1号”(Cambrian-1),旨在通过视觉为中心的多模态大语言模型(MLLM)推动AI的视觉表征学习达到新高度。团队针对现有多模态学习的局限性,特别是过度依赖语言和缺乏有效视觉基准,开发了全新的评估与训练框架。

研究核心在于创新的“空间视觉聚合器”(SVA),该技术通过可学习的查询集合有效融合多种视觉编码器特征,同时保持视觉数据的空间结构,显著提升了模型在高分辨率图像处理任务上的表现。结合精心设计的指令微调数据集Cambrian-7M,以及针对“答题机现象”的系统prompt策略,该模型在多项基准测试中超越了现有开源及专有模型,如LLaVA-NeXT和GPT-4V。

寒武纪1号系列模型的成功,不仅在于它能够以更少的图像token处理复杂视觉任务,而且展示了多视觉编码器组合的潜力,特别是在结合语言监督与自监督学习(SSL)模型时,展现出对视觉表征的强大提升。这一成果不仅为多模态AI的进步提供了新视角,也为未来如何结合视觉与语言智能,解决真实世界感知难题指明了方向,标志着迈向更高效、更全面的人工智能理解能力的一大步。

来源:网页链接

5.史上首现实时AI视频生成:尤洋团队PAB技术,DiT模型加速10.6倍

新加坡国立大学尤洋团队研发出首个实时AI视频生成技术,名为Pyramid Attention Broadcast (PAB),在不损害包括Open-Sora等DiT模型视频生成质量的前提下,实现了高达21.6 FPS的生成速度和高达10.6倍的加速。PAB通过精巧设计减少注意力计算冗余,尤其针对视频扩散Transformer模型中不同类型的注意力变化特性,提出了差异化广播策略,显著降低了计算成本且无须额外训练。

该方法基于对视频生成过程中注意力模式的深刻洞察,利用中间步骤注意力输出的稳定性,将其广播至后续多个步骤,同时根据不同类型注意力的差异性设定不同广播范围,确保了加速的同时几乎无损质量。此外,PAB还通过优化序列并行技术,特别是在时间注意力上的传播,有效减少了通信开销,使得多GPU环境下能实现更高效的分布式推理,加速效果线性扩展,最高可达10.6倍加速。

此创新不仅为DiT模型的即时视频生成开辟了道路,还为未来基于此架构的模型提供了通用的加速方案,推动了生成式AI应用迈向实时视频生成的新纪元。

来源:网页链接

6.OpenAI发布CriticGPT:基于GPT-4训练,助力模型自我进化,突破RLHF限制

OpenAI新推出的CriticGPT模型,基于GPT-4训练,旨在提升下一代模型训练效率,尤其在挑错能力上取得显著突破。CriticGPT能发现代码中75%以上的细微错误,远超人类的25%识别率,并能撰写更具价值的错误评价,60%情况下被人类训练师偏好。该模型通过接受包含大量错误输入的RLHF训练,利用人类标注员故意植入并审查的代码bug数据,促使模型不断学习进化,识别更隐蔽问题。

CriticGPT引入的“强制采样束搜索”(FSBS)技术,在生成评论时兼顾全面性与准确性,减少“幻觉”现象,实现评论的最优组合。研究显示,CriticGPT不仅在代码领域表现出色,还能应用于非代码任务,识别ChatGPT训练数据中被认为是“完美”但实际存在的错误。尽管CriticGPT偶有误报,但它与人类合作时能有效平衡发现错误与避免误判。

CriticGPT的成功意味着RLHF(人类反馈强化学习)的性能不再受限于人类能力,开启了用弱模型监督训练强模型的可扩展监督新途径。前超级对齐团队负责人Jan Leike虽已加入Anthropic,但仍强调了CriticGPT对推动AI进步的意义,指出只要拥有更优的预训练模型,该框架就能持续优化。CriticGPT的诞生,代表了AI自我审视与迭代能力的重大跃进,预示着未来AI训练中自我完善机制的巨大潜力。

来源:网页链接

7.STAR模型:自回归新范式2.9秒生成高质量图像,超越扩散模型

中科大、哈工大与度小满等机构联合推出STAR,一种自回归通用文生图模型,以2.9秒的超快速度生成高质图像,性能超越包括SDXL在内的扩散模型,同时在图像真实性、图文一致性及人类偏好上展现卓越成效。

STAR通过增强的文本引导与归一化旋转位置编码(Normalized RoPE)两大技术创新,解决了自回归模型在图像生成领域的局限性。增强的文本引导使模型能从文本特征出发,生成高分辨率图像,确保文本与图像的高度匹配,并在每一Transformer层采用交叉注意力机制,细化图像生成的控制。归一化旋转位置编码则有效处理不同尺度的图像位置编码,消除尺度混淆,无需额外学习参数,利于高分辨率图像生成。

在训练策略上,团队先在256256尺寸上以大批次训练,再微调至512512尺寸,借助归一化位置编码,模型快速收敛,仅少量微调便能产出优质高分辨率图像。在多个基准测试中,STAR模型的FID分数、CLIP得分及ImageReward均表现优异,证实了其在生成真实度、图文一致性和用户满意度上的突出优势。

总而言之,STAR模型通过创新的自回归范式,实现了高效且高性能的文本引导图像生成,为图像生成领域带来了超越扩散模型的新选择,展现了自回归模型在文生图领域的巨大潜力。

来源:网页链接

8.英伟达支持的Luma AI推出Dream Machine,AI视频生成技术引发热潮

英伟达支持的Luma AI公司推出了一款名为"Dream Machine"的下一代文生视频模型,其新功能"关键帧控制"上线后迅速受到网友的热烈追捧。用户只需上传两张首尾图像并配以文字说明,即可生成具有自然衔接效果的视频,无论是延时摄影还是人物角色的刻画,都能达到电影级的画面质量。新功能目前免费开放,激发了网友们的创意和热情,从经典表情包到瑞克摇的转场,再到枪战片和二刺猿的变身,各种脑洞大开的创意层出不穷。

Luma AI的这一创新,不仅在技术层面展现了AI视频生成的潜力,更在市场层面引发了广泛关注。据悉,该公司已获得超过7000万美元的融资,英伟达在其中扮演了重要角色。与此同时,Runway版Sora(Gen-3)也对创作者们开放了测试,视频生成领域的竞争愈发激烈。在这场技术与创意的较量中,谁将最终胜出,成为市场的主导者,值得业界和网友们的持续关注。

文章通过丰富的实例和网友的反馈,生动展现了AI视频生成技术的趣味性和实用性,同时也反映了英伟达在AI领域的深远布局和影响力。随着技术的不断进步和应用场景的拓展,AI视频生成无疑将成为内容创作和娱乐产业的重要驱动力

来源:网页链接

人工智能初创公司的新融资

1.Stability AI重获新生:前Facebook总裁领投8000万美元,债务豁免助转型

官方网站:网页链接

陷入困境的AI独角兽Stability AI迎来转机,前Facebook总裁Sean Parker领投8000万美元,同时一笔勾销4亿美元债务,公司管理层亦经历重大调整。这一系列举措旨在为这家致力于AI创意技术的企业注入新活力。

Stability AI曾因商业模式挑战遭遇财务困境,创始人Emad Mostaque卸任CEO,公司面临运营难题及高额欠款。新投资由Parker领衔,Greycroft、O’Shaughnessy Ventures等多家知名投资机构参与,还包括前Google CEO Eric Schmidt的支持,他们不仅注入新资金,还助力公司免除了巨额云计算债务,为Stability AI清除发展障碍。

伴随资金注入,公司迎来新领导层,Parker担任董事会执行主席,强调继续坚持开源原则,推动开放模型发展。而前Weta FX负责人Prem Akkaraju被任命为新CEO,他将利用自身在影视特效行业的经验,带领Stability AI向企业与专业工作室市场推进,利用其生成式AI产品开拓新机遇,包括推广视频生成工具,吸引好莱坞注意。

Akkaraju计划在未来三个月内制定新的商业战略,融合生成式AI与工作室内容创作,预期Stability AI将在新资本和管理层的引领下,恢复增长态势,进一步扩大其在企业和创意领域的影响力。

2.EvolutionaryScale融资1.42亿美元,发布里程碑式AI模型ESM3推动生物学革命

官方网站:网页链接

EvolutionaryScale,一家位于纽约的前沿AI生物学研究实验室,宣布完成1.42亿美元种子轮融资,并推出具有划时代意义的AI模型ESM3。该模型能够生成新蛋白质,包括一种经5亿年进化才能自然形成的绿色荧光蛋白,标志着生物学步入可编程的新纪元。本轮融资由Nat Friedman、Daniel Gross以及Lux Capital领投,亚马逊英伟达风险投资部门等跟投,将用于模型能力的进一步扩展。

ESM3基于地球上27.8亿种蛋白质的庞大数据库,历经1万亿次运算训练而成,是首个能同时解析蛋白质序列、结构与功能的生物生成模型。其潜力在于加速从药物研发到碳捕捉等多领域的科学发现。ESM3由前Meta AI蛋白质团队负责人Alexander Rives领导的团队开发,他们曾创造出首个蛋白质转化语言模型ESM1,对科学界贡献显著。

EvolutionaryScale已发布ESM3的科学预印本及开源版本,同时与AWS、英伟达合作,通过API开放测试访问,便于科研人员使用,并优化模型在药物发现到合成生物学等领域的应用性能。与AWS的合作使全球研究人员能安全、大规模地利用自有数据对该模型进行微调,而与英伟达的合作则确保了模型在训练和推理上的高性能。

这一系列动作不仅展示了AI在生物学领域的革新力量,也预示着EvolutionaryScale将作为科学家的强大工具,引领生物学走向一个可编程的未来。

3.Hebbia融资近1亿美金,由a16z领投,AI驱动文档搜索革新

官方网站:网页链接

硅谷初创公司Hebbia近期宣布完成近1亿美元B轮融资,本轮融资由知名风投机构Andreessen Horowitz(a16z)领投。此轮融资标志着Hebbia在AI技术,尤其是AI驱动的文档搜索领域取得的重大进展获得市场高度认可。

Hebbia专注于利用先进的人工智能技术彻底改变人们在海量文档中寻找关键信息的体验。其核心产品能够智能化索引、理解并检索文档内容,极大提升工作效率。用户只需简单的查询,即可从企业内部的各类文档、报告乃至邮件中迅速找到所需信息,解决了信息过载时代的痛点。

此轮融资的顺利完成,不仅为Hebbia的持续技术创新和市场扩张注入强劲动力,也反映了资本市场对AI技术重塑知识管理未来的乐观预期。Hebbia表示,新资金将主要用于加大研发投入,扩大销售与市场团队,以及深化与企业客户的合作,推动AI技术在企业日常运营中的深度应用。

Andreessen Horowitz的投资是对Hebbia愿景的有力背书,认为Hebbia的解决方案有望成为未来工作场所的基础设施之一,通过AI技术优化信息检索流程,助力企业解锁数据潜能,提升决策效率。随着AI技术的不断成熟与应用普及,Hebbia正站在行业变革的前沿,引领一场文档管理与信息获取的革命。

4.Formation Bio筹集3.72亿美元,利用AI加速药物研发进程

官方网站:网页链接

Formation Bio,一家致力于利用人工智能革新药物研发的生物科技初创企业,近日宣布成功完成3.72亿美元的融资。此轮融资旨在推动其利用先进的AI技术平台,加速药物从发现到临床应用的全过程,为生物医药行业带来颠覆性变革。

该公司凭借其独特的AI算法,能够深入挖掘海量生物数据,精准预测化合物活性、优化药物设计,并有效预测候选药物的安全性和有效性,从而大幅度缩短药物研发周期,降低研发成本。Formation Bio的愿景是通过AI赋能,以前所未有的速度和效率,将更多创新疗法带给患者。

本轮融资由全球知名投资机构领投,吸引了众多医疗健康领域投资者的关注。所筹资金将用于进一步优化其AI驱动的药物研发平台,扩展研发管线,以及加速推进多个处于不同阶段的药物开发项目,包括针对难治性疾病的新疗法探索。

Formation Bio的此次融资成功,不仅是对AI在药物研发领域应用潜力的认可,也预示着AI技术正逐步成为推动生物医药创新的关键力量,为解决全球医疗健康挑战开辟了新的路径。随着资金的注入,Formation Bio正稳步朝向其目标迈进,力求在不远的将来,以AI技术为核心驱动力,为患者提供更多突破性治疗方案。

5.CData融资3.5亿美元,助力企业跨应用数据利用与AI模型构建

官方网站:网页链接

CData,一家专注帮助企业跨越不同应用程序无缝集成数据并构建AI模型的创新企业,近日宣布成功完成3.5亿美元融资。这笔资金将进一步强化其在数据连接与AI赋能领域的领导地位,帮助企业解锁数据孤岛,促进数据流动,以及在更广泛的应用场景中部署智能解决方案。

CData的核心技术在于其强大的数据连接平台,该平台能够连接到数千种不同的数据源,包括云服务、数据库、SaaS应用等,使数据在不同系统间自由流动。此外,CData还为企业提供了一站式AI模型构建工具,使得即便是非技术背景的业务人员也能轻松利用数据构建预测模型,推动业务决策智能化。

本轮融资由一群顶级风险投资机构领投,显示了市场对CData独特价值主张的高度认可。所筹集的资金将用于产品研发,包括深化数据连接技术、扩展AI模型构建功能,以及加大市场拓展力度,特别是在国际市场上建立更广泛的合作伙伴网络。

CData的此番融资成功,不仅为其在全球范围内加速数据驱动的数字化转型战略提供了强大动力,也为那些寻求在复杂多变的商业环境中实现数据高效利用和AI应用的企业,点亮了新的航标。随着数据集成与AI技术的深度融合,CData正引领着企业智能化转型的新潮流。

6.AI个人助手初创公司Ario融资1600万美元,旨在普及数字化助手

官方网站:网页链接

Ario,一家专注于开发AI驱动个人助手的初创公司,近日宣布已成功筹集1600万美元资金,用以构建其所谓的“通用基础AI”技术,目的是为每个人提供数字个人助手。Ario由网络安全领域的资深人士创立,它在日益拥挤的AI助手领域中采取了一种非传统的方法。该公司的助手能够连接到亚马逊DoorDash谷歌日历等应用程序,以减少家庭任务所花费的时间,并提供个性化推荐。

Ario的创始人兼首席执行官Sumit Agarwal在接受采访时表示,公司正在利用其在前公司10年的工作经验,该公司专注于防止数据从美国各大银行、酒店、航空公司和电子商务网站流出。Ario的第一步是帮助用户从主要消费网站和服务中收集自己的数据,这一过程被Agarwal描述为“对抗性ETL”(提取、转换、加载)。这些数据构成了高度个性化助手的基础。

Ario的雄心壮志是每年为用户提供价值数千美元的个人助理服务,而成本几乎为零。这与每年可能花费高达10万美元的传统个人助理服务形成了鲜明对比。Agarwal声称,由于生成性AI的惊人能力,人们可以免费获得价值数万美元的服务。

Ario面临的挑战包括来自谷歌苹果等科技巨头以及专注于AI的初创公司的竞争。公司需要在遵守复杂的隐私法规和解决用户信任问题的同时,证明其能够实现其宏伟的承诺。然而,如果成功,Ario可能会改变个人与其个人数据和数字服务的互动方式。公司专注于节省时间和个性化,而不是参与度,这为当前的AI助手模型提供了一种有趣的替代方案。

随着AI能力的快速发展,Ario将数据聚合与个性化助手相结合的方法,可能代表着向使先进的AI工具对更广泛的受众可访问和有价值迈出的重要一步。未来几个月对公司来说至关重要,因为它将努力将其愿景变为现实。

本文由阿尔法公社综合自多个信息源,并在ChatGPT的辅助下写作,封面图片由Hidream.ai的Pixeling(千象)生成。

更多精彩内容

关于阿尔法公社