4)OpenAI宣布推迟GPT-4o语音模式,发布macOS桌面版ChatGPT
OpenAI官方账号宣布,ChatGPT MAC版本桌面应用程序向公众免费开放使用,但原定于6月底向Plus用户开放的语音功能将推迟一个月上线。
5)讯飞星火大模型V4.0明日发布,对标GPT-4Turbo
科大讯飞宣布将于6月27日发布讯飞星火大模型的最新进展。公告称,讯飞星火大模型全面提升大模型底座七大核心能力,对标GPT-4Turbo,并发布多款新产品和应用,包括讯飞星火APP/Desk、星火智能批阅机、讯飞AI学习机、讯飞晓医APP、星火企业智能体平台等。
6)苹果上新视觉模型4M-21,搞定RGB、几何特征图、元数据等21种模态
苹果与EPFL联合开发的4M-21视觉模型能处理21种模态,包括图像、文本和结构化数据,提升跨模态检索和生成能力;模型通过对不同模态执行特定离散tokenization,实现统一处理,并在多数据集上联合训练,增强性能和适应性。
/ 02 / AI应用
1)钉钉发布 AI 搜索,将对所有 AI 大模型厂商开放,首批7家接入
钉钉推出7.6版本,AI搜索产品开启邀请测试。钉钉总裁叶军宣布,钉钉将对所有大模型厂商开放,构建“国内最开放 AI 生态”。
钉钉7.6版本升级后,用户创建的AI助理默认接入通义大模型,也支持用户根据自身需要切换AI大模型,首批可选择MiniMax、月之暗面、智谱AI、猎户星空、零一万物、百川智能6家大模型。
2)商汤AI办公小程序“Raccoon智能助手”上线
基于商汤日日新大模型推出的小程序Raccoon智能助手上线。Raccoon智能助手是商汤旗下数据分析产品办公小浣熊的小程序版本,可以直接插入微信聊天中的文件,可以对文件提炼重点、生成各类图表。所有结果采用流式方式输出。
3)荣耀发布手机行业首个端侧AI反诈检测技术
在上海世界移动通信大会上,荣耀发布了手机行业中首个端侧AI反诈检测技术。荣耀CEO赵明介绍,该技术可以精准识别用户视频通话中的画面要素。一旦发现视频中存在AI换脸现象,系统将立即向用户发出风险提醒,帮助用户警惕潜在的网络诈骗风险。
据外媒报道,谷歌正在基于明星和YouTube网红构建新的AI聊天机器人,由Gemini大语言模型提供技术支持。谷歌还在开发一项功能,让人们只需描述自己的个性和外表就可以创建自己的聊天机器人,类似Character.ai的做法。
5)ElevenLabs推首个iOS应用Reader,可将任何文本转化为AI语音
ElevenLabs推出的首个iOS应用“ElevenLabs Reader”,它可以将文本转化为用户可以在移动中听取的音频叙述。用户可以通过应用内添加自己的内容,并享受多种语音和口音选择的功能。
/ 03 / 投融资情报
1)哈佛华人辍学生创办AI芯片公司Etched,完成1.2亿美元融资
AI芯片初创公司Etched宣布完成1.2亿美元,以扩大其专用芯片的制造,并与Nvidia产品展开竞争,同时提供一种更具成本效益和能源效率的选择。
/ 04 / AI基础设施
1)“国奖”放榜,科大讯飞获得十年来AI领域首个国奖一等奖
全国科技大会、国家科学技术奖励大会、两院院士大会首次共同举行,国家自然科学奖、国家技术发明奖、国家科学技术进步奖等奖项重磅揭榜。
华为、科大讯飞、阿里云、小米等科技公司出现在获奖名单中,而科大讯飞作为第一完成单位的“多语种智能语音关键技术及产业化”项目,斩获国家科学技术进步奖一等奖,这是十年来人工智能领域首次获得该奖项。
2)南大与旷视研究院联手推出无监督范式SeVa,破解视觉大模型对齐难题
南大与旷视研究院联手推出无监督范式SeVa,成功解决了视觉语言模型的偏好对齐问题,而且整个过程无需人类或GPT-4标注,大大降低了对齐成本,仅使用8k构造的无监督数据,就显著提升了VLM的指令遵循能力,降低了幻觉。
这项技术的核心在于自动化构造偏好数据的pipeline,通过对比偏好对齐前后的模型输出,可以明显看出变化。
3)Nature研究称语言≠思维,大模型学不了推理:
《Language is primarily a tool for communication rather than thought》表明人类大脑的语言网络与形式化推理分离,语言主要是交流工具,而不是思考的媒介。
研究通过fMRI等成像技术观察了大脑中语言区域的活动,发现语言网络支持语言理解和生成,对词义和句法结构有敏感性,但并非是思维的基础。即使在语言能力受损的情况下,人们仍能进行多种形式的推理,包括数学问题解决、执行规划和遵循非言语指令等。
4)牛津研究人员利用语义熵来识破AI“幻觉”
牛津研究员提出了利用语义熵来检测大型语言模型的“捏造”问题的方法,该研究已发表在《自然》杂志。该方法不需要额外的监督或强化学习,可以快速识别LLMs的“幻觉”问题,即使是在面对未知任务时也能应用,从而提高用户对LLMs的信任。
5)Q*项目公开发布,小模型推理能力百倍提升
近日,昆仑万维颜水成团队与新加坡南洋理工大学合作发布了名为Q*的项目,旨在提升小模型的推理能力。通过Q*算法,小模型在多个数据集上取得显著成果,超越了大模型如ChatGPT和Gemini Ultra,展示了Q*算法的潜力和有效性。