【华西计算机】行业跟踪 | 国产应用更新迭代加快,AI产业推进持续

发布于: 雪球转发:0回复:0喜欢:0

核心观点

Med-Gemini:专注于医疗领域的多模态AI临床先进应用

Med-Gemini是基于Google的Gemini模型开发的多模态医学AI家族,在MedQA医学问答测试中,Med-Gemini的表现优异,准确率达到91.1%,显著高于先前模型。

该模型能有效处理包括文本、图像、视频和生物信号在内的多种医学数据,特别在长篇医学信息的理解与分析方面表现突出。

Med-Gemini不仅在医学教育中发挥作用,还支持基于文本和图像的临床诊断,提高了决策支持的质量。其在3D医学图像处理如头部CT扫描中能生成详尽诊断报告,并在胸部X光报告生成与医学视觉问答等领域表现卓越。Med-Gemini-Polygenic模型在多基因风险评分上超越传统模型,为精准医疗提供新的可能。此外,Med-Gemini广泛应用于皮肤科、放射科等多模态诊断,通过高级样本训练与长文本处理技术,大幅降低了专家标注的成本,并优化了临床决策流程。Med-Gemini具备出色的临床推理能力和诊断准确性,我们认为医疗或将成为AI领域最快落地的垂直场景。

kimi+:引领AI长文本处理新纪元,技术革新与市场潜力并进

Kimi+包括二十余种特定场景模板化的智能体,专业性凸显,月之暗面构建起强大的AI生产线。

Kimi+ 支持200万字的无损上下文阅读理解和分析,引领AI发展聚焦长文本处理。Kimi成功模拟人脑处理大量信息的过程,同时依赖于大数据训练和标注以关注核心信息,使其在长文本处理领域保持领先。

资本市场反映积极,kimi相关股票显著上涨。月之暗面科技在2月份完成了超过10亿美元的融资,刷新了国内AI领域的融资记录,彰显了资本市场对公司长远发展潜力的认可。

Kimi用户持续增长,交互活跃,市场对Kimi有着极高的接受度和兴趣。根据AI产品榜aicpb.com统计,目前国内访问量前十的产品中,Kimi在3月以12.61M的访问量、环比321.58%的增长排在第二,仅次于文心一言。从目前趋势看,我们认为Kimi发展势能强劲,随着长文本处理技术普及,办公场景和内容创作类厂商效率有望进一步提升。

商汤科技接连发布SenseNova 4.0和5.0大模型:全面升级与多领域应用突破

SenseNova 4.0体系更新主要围绕提升处理能力和功能多样性,具体包括增强的知识覆盖,推理能力,代码生成能力,对长文本的处理能力和跨模态交互能力。

该大模型体系及其相关产品和工具,促进了全场景、多产业“大模型+”应用,进一步扩展了大模型的应用范围。

“SenseNova 5.0”大模型体系快速实现升级,全面达到甚至超越了GPT-4 Turbo的标准。模型采用MoE架构,基于10TB的token进行训练,支持高达200K的长度,大幅提高了在复杂任务处理中的性能和效率。SenseCore商汤大装置赋能,显著提升人工智能生产效率。日日新 5.0具有优秀的自然语言能力、文生图能力、多模态和数据分析能力。端侧大模型采用端云协同策略,提供即时响应。商汤科技技术发展迅速,我们认为该公司将继续保持国内AI行业领先地位,有望进一步提高应用渗透率,并通过商业合作推动行业AI应用,具有强大市场潜力。

阿里巴巴AI技术全面升级:通义大模型引领行业革新,赋能多领域智能化转型

阿里巴巴以通义大模型为抓手,正在构建一个完整的 AI 模型生态体系,并着手于产品服务优化,以实现产品的智能化升级和用户体验提升。基于通义大模型推出一系列模型,例如通义千问、通义灵码、通义点金等等,专业性程度进一步提升,行业适应性强。

SkySense成为迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感大模型,有望投入实际应用,有效辅助农业生产和经营。

阿里巴巴接连推出Qwen1.5、Qwen2.5,全方位提升大模型性能,展现出公司强大的科技实力。截至目前,通义大模型服务超过200+万家企业,可见通义大模型深受市场欢迎。此外,通义落地应用进程加速,目前已与多家不同领域的企业及其产品展开合作。通义大模型展示了卓越的技术能力和广泛的行业适用性,不仅推动了技术普及,还为行业创新提供了有力支持,显示出强劲的市场竞争力和未来发展潜力。

阿里巴巴还推出Emote Portrait Alive(EMO)创新人像视频生成框架,该框架由音频驱动,能够在弱条件下利用音频视频扩散模型生成富有表现力的肖像视频。EMO能够在弱条件下利用音频视频扩散模型生成富有表现力的肖像视频,这标志着人像视频生成领域的一个重大突破,为AI人像视频制作开启新纪元。

投资建议

受益标的:

AI应用:润达医疗拓尔思科远智慧金山办公万兴科技新致软件福昕软件彩讯股份佳发教育捷顺科技

昇腾一体机:恒为科技开普云

风险提示

AI进展不及预期;下游场景拓展不及预期;政策发生变化。

正文

1.kimi+:引领AI长文本处理新纪元,技术革新与市场潜力并进

Kimi+是 KimiChat 中的智能体商店,包括二十余种特定场景模板化的智能体,如文案生成、研报撰写、200万字无损上下文阅读理解和分析、服务推荐、学术搜索等,不仅致力于解决各类特定问题,专业性进一步凸显,更是构建起了强大的AI生产线,为用户提供前所未有的智能支持,在提高用户体验和扩展市场应用上发挥了关键作用。

Kimi核心技术:

Ø解决长上下文序列问题的新经营机制。

Ø多模态能力,包括图像和视频处理。当前版本已融合文本和图像解析能力,能够处理扫描文档并运用 OCR等技术。

Ø无损压缩技术。

Kimi的部分技术如图生图技术、XL模型和糖系列解决方案已开源,但无损压缩技术尚未开源,构成技术壁垒。Kimi+ 支持200万字的无损上下文阅读理解和分析,引领AI发展聚焦长文本处理。公司在半年时间里将模型处理规模从20万字拓展到200万字,从国内AI市场中脱引而出,获得大量关注。这种能力使Kimi能在10分钟内针对新领域内容达到初级专家水平的理解,显著扩展了其在复杂问题解决和决策支持方面的应用。

通过优秀的记忆能力和注意力分配,Kimi成功模拟人脑处理大量信息的过程,同时依赖于大数据训练和标注以关注核心信息,构建了一定的技术壁垒,使其在长文本处理领域保持领先。此外,Kimi 基于 transform-attention 架构,通过类结构化设计和系统化外挂,让用户能够匹配相关关键词。Kimi 的参数量达到了 2000 亿左右,这为其强大的长文本处理能力提供了坚实的基础。

长文本处理技术愈加普及,专注长文本处理的Kimi发展暗含风险。随着Kimi在长文本处理领域取得显著的技术突破,其他行业巨头也开始积极响应,例如阿里巴巴的通义千问项目扩展了其长文本处理能力至1000万字。随着技术普及,技术壁垒逐渐降低,如何继续保持创新和领先是Kimi面临的主要挑战。

资本市场反映积极,Kimi市场吸引力和技术潜力强大。Kimi超长上下文处理能力的技术突破使得Kimi行业应用广泛,相关股票显著上涨。据金融投资报统计,3月份Kimi相关概念股延续涨势,3月22日,Kimi指数上涨4.34%,多只个股涨停,部分股票5个交易日涨幅达100%。融资活动上,月之暗面科技在2月份完成了超过10亿美元的融资,刷新了国内AI领域的融资记录,彰显了资本市场对公司长远发展潜力的认可,为其技术创新和市场扩张提供有力保障。

Kimi用户持续增长,交互活跃,市场对Kimi有着极高的接受度和兴趣。根据AI产品榜aicpb.com统计,目前国内访问量前十的产品中,Kimi在3月以12.61M的访问量、环比321.58%的增长排在第二,仅次于文心一言。Similar web数据显示,3月Kimi的月访问量迅速增至近1063万,同比增加303.39%;4月,Kimi模型的日活跃用户数已达1824万人,同比增加71.57%,增长迅速。

2.Med-Gemini:专注于医疗领域的多模态AI临床先进应用

Med-Gemini 是基于 Google 强大的 Gemini 模型构建的多模态医学AI模型家族,具备高级的临床推理能力,通过自我训练和网络搜索集成,能更准确地进行诊断和推理。模型在多个医学基准测试中,如MedQA(USMLE),展现了优异性能。

研究人员用了14个医疗基准测试Med-Gemini的能力。结果发现,它在10个基准上都取得了最佳表现,远超之前最强的GPT-4模型。

在多模态医学数据处理方面,Med-Gemini通过精细的微调和定制编码器,有效地处理了文本、图像、视频和生物信号等多种数据形式,提高了处理这些数据的准确性和效率。此外,Med-Gemini具有强大的长文本处理能力,能够有效地提取关键信息,分析和理解长篇医学信息。

Med-Gemini不仅用于医学教育,帮助医学生和专业人员理解复杂的医学程序,也为临床医生提供提供基于文本和图像的诊断,同时解释推理过程并提出决策支持,改进诊断准确性和治疗建议。模型利用超过700万个样本和370万个医疗案例进行训练,包括大量自由文本,这使其能广泛应用于各种临床场景,降低专家标注的成本。

根据AI寒武纪,在处理3D医学图像数据方面,Med-Gemini采用创新方法处理如头部CT扫描的3D数据,生成详尽的诊断报告。尽管处于早期阶段,已有53%的头部CT扫描经由美国认证的放射科医师评定,认为其能够提供等同于专业医生的患者护理水平。这预示着在MRI、超声波等其他体积或时间序列数据上的应用前景广阔。

Med-Gemini-2D在胸部X光报告生成方面也有不俗表现,数据显示,对于正常情况下的报告,AI撰写与放射科医师撰写的报告相比,有57%至96%被认为同样出色或更优。此外,Med-Gemini-2D还在医疗视觉问答领域达到新高度,并在组织病理学、眼科、放射学和皮肤科等多个领域的图像分类任务上表现出色。

Med-Gemini-Polygenic是首个利用多基因风险评分预测健康结果的线性混合模型,它超越了传统PRS线性模型,甚至能预测出未被训练过的健康结果。这展现了其在精准医疗领域的巨大潜力。

Med-Gemini已成功应用于皮肤科和放射科的多模态诊断,且将继续结合2D和3D放射学、组织病理学、眼科等专业学科知识和数据,持续为医疗用途设计,这显示出其在实际医疗环境中的专业性应用潜力。目前已有真实的临床案例,例如Med-Gemini 在皮肤科场景下的多模态诊断对话、在放射科场景下的多模态诊断辅助对话、在长篇 EHR 理解任务中的长文本处理、在手术视频理解中的长文本处理、在医学教学视频理解中的长文本处理、在手术动作视频分割和标注中的长文本处理、在科学信息综合中的长文本处理,展示出Med-Gemini-M 1.5 强大的能力。

3.商汤科技接连发布SenseNova 4.0和5.0大模型:全面升级与多领域应用突破

SenseNova 4.0

2024年2月,商汤科技发布了全面升级的大模型体系SenseNova 4.0。该模型体系的更新主要围绕提升处理能力和功能多样性,具体包括增强的知识覆盖,推理能力,代码生成能力,对长文本的处理能力和跨模态交互能力。

商汤推出“日日新SenseNova”大模型体系及其相关产品和工具,促进了全场景、多产业“大模型+”应用,进一步扩展了大模型的应用范围。

Ø“日日新SenseNova 4.0”提供多种灵活的API接口和服务,便于开发人员调用模型各项AI技术能力,以更低成本、更高效率实现各类AI应用。

ØSenseChat V4具备128K语境窗口长度,其综合性能与GPT-4相匹敌,并在多个领域超越了GPT-3.5。该模型特别强化了在知识理解、阅读理解、综合推理、数理分析及代码生成等领域的能力,确保能够处理更复杂的逻辑和数据分析任务。在权威的HumanEval Coding测试中,SenseChat V4的一次通过率达到了75.6%,表现优于GPT-4的74.4%。

基于大模型评测平台OpenCompass全集测试,SenseChat V4,综合整体评测成绩水平比肩GPT-4。

ØSenseChat-DataAnalysis V4数据分析场景下的数据测试集中以85.71%的正确率超过GPT-4,能够有效处理复杂的数值计算和数据分析任务。

ØSenseChat-Medical V4针对医疗行业需求进行优化,增强了多轮对话和上下文理解能力,有效实现专业医学问答及复杂医学任务推理,并支持更多模态医学文件的智能解读和交互问答。性能逼近GPT-4,其中职业药剂师考试大模型评测中的两个细分方向性能已超越GPT-4。

ØSenseChat-Vision V4拥有300亿参数,能够在多模态场景中进行高效的信息处理和解析。这一模型在MME Benchmark基准测试中的综合得分达到2199.5,显著高于GPT-4V(1926.57)。该多模态大模型已在智能驾驶、智能车舱、电力等行业得到应用,极大地推动了行业的智能化升级。

ØSenseMirage V4图像生成领域表现出显著进步,其参数规模扩大至百亿级别。这一升级利用了Mixture of text experts、Spatial-aware CFG和Adversarial Distillation算法,显著提升了模型的语义解析能力和图像细节质量,并实现速度的十倍提升。

ØFunction call & Assistants API版本的大语言模型为开发者提供了灵活、高度可定制的工具调用框架,支持不同模态的工具调用,大幅降低了开发者使用大模型的技术门槛,使得集成AI功能变得更为简单和高效。

SenseNova5.0

4月23日,商汤科技举办技术交流日活动,发布行业首个“云、端、边”全栈大模型产品矩阵,以满足不同规模场景的应用需求,并且全新升级“日日新SenseNova 5.0”大模型体系,推出了一系列生成式 AI 模型及应用。

此版本在多方面实现了显著的技术升级,特别是在知识深度、推理能力、数学处理及编程能力等方面,综合性能全面对标GPT-4 Turbo,并在主流客观评测上达到或超越GPT-4 Turbo。同时,日日新 5.0瞄准本土化应用场景,有效实现行业差异化,适应国内语境下的应用。

日日新 5.0采用MoE架构,基于10TB的token进行训练,使用大量合成数据来增强模型的推理上下文窗口,现在支持高达200K的长度,大幅提高了在复杂任务处理中的性能和效率。根据商汤科技SenseTime,在主流客观评测中,该模型展现出强大的竞争力,综合性能全面对标 GPT-4 Turbo,并在主流客观评测上达到或超越 GPT-4 Turbo。

根据商汤科技SenseTime,SenseCore商汤大装置赋能,显著提升人工智能生产效率。该装置拥有12,000 petaFLOPS的算力和4.5万GPU,支持万亿参数大模型的全周期生成。其GPU互联技术在大规模集群中实现了90%的高加速效率,同时维护超过30天的稳定训练能力,并能在半小时内完成训练中断的诊断恢复。

根据国际知名调研机构弗若斯特沙利文(Frost & Sullivan)联合头豹研究院发布的《2023年中国AI开发平台市场报告》,商汤大装置在全球AI开发平台市场中表现卓越,国内排名第一,全球第二,仅次于亚马逊云。

日日新 5.0具有优秀的自然语言能力、文生图能力、多模态和数据分析能力。

Ø自然语言能力方面,利用广泛的中文语料库,模型显著提升了文本理解、创作和总结能力,使其在教育和内容产业中尤为有效。

Ø图像生成方面,该模型在人像生成和图文一致性上取得了重大进展,尤其是在细节和纹理表现上。

Ø多模态能力方面,日日新 5.0支持高清长图的解析和理解以及文生图交互式生成,还可以实现复杂的跨文档知识抽取及总结问答展示,具备丰富的多模态交互能力。性能全球领先,在权威综合基准测试MMBench中综合得分排名首位,在多个知名多模态榜单MathVista, AI2D, ChartQA, TextVQA, DocVQA, MMMU 取得领先成绩。

数据分析能力上,该模型通过自然语言和模糊的人类交互方法,就能够精确分析导入的表格,并自动生成雷达图实现可视化。

端侧大模型提供即时响应,有望进一步提高应用渗透率。端侧模型版本SenseChat-Lite 1.8B在性能上实现了跨级领先,提供了快速且高效的AI处理能力,适用于多种端侧应用。搭载 1.8B 商汤端侧模型在中端手机上能够实现 18.3 字/秒的速度,而在旗舰手机则最高支持 78.3 字/秒,成为业内最快推理速度。

采用端云协同策略,通过智能化分配系统优化端侧和云端的任务处理,极大地降低了成本并提高了效率。这一策略使得端侧大模型不仅能够快速生成复杂文档和图像,还能在没有网络连接的情况下独立运作,极大地提高了AI应用的灵活性和可靠性。

日日新 5.0 大模型体系有效推动行业AI应用,具有强大市场潜力。商汤推出高性价比、开箱即用、数据安全、全国产化的企业级应用一体机,强化金融、医疗、政务、代码生成等多领域AI应用,显著降低AI技术的应用门槛。根据大模型之家,相比行业同类产品,推理成本节约80%,检索大大加速,CPU工作负载50%。

积极与各行业开展合作,实现AI应用落地:金山办公合作,允许WPS 365利用日日新大模型增强办公软件的智能化处理能力;与海通证券合作,推动金融行业AI技术的深度融合和创新应用。这些合作不仅优化了客户体验,还加速了数字化转型的步伐,反映出商汤科技在推动AI 2.0时代产品应用和新质生产力构建中的战略视角。

商汤科技的端侧大模型SDK服务的开放,使得AI技术的整合更加灵活。模型全面覆盖智能手机、平板电脑、VR眼镜、车载系统等多样化的设备场景,进一步拓宽了AI应用的范围。这一开放性策略将加速AI技术的普及和行业应用的创新。

4.阿里巴巴AI技术全面升级:通义大模型引领行业革新,赋能多领域智能化转型

通义大模型是由阿里云研发的一系列人工智能预训练模型,这在自然语言处理、多模态理解和生成等领域展现出卓越的性能。这也意味着阿里巴巴正在构建一个完整的 AI 模型生态体系,并着手于产品服务优化,以实现产品的智能化升级和用户体验提升。

通义大模型下的模型汇总:

Ø通义千问:具备强大的语言理解、生成能力和长文本处理能力,能够支持单次最长1000万字文档的处理,同时处理多达100个文档,且支持对PDF、Word、图表等多种不同格式的文档,极大提高工作效率。根据硅星GenAI,目前通义千问的API日调用量已突破亿次大关,企业用户数也成功跃过9万家,展示了阿里云在AI技术领域的深厚实力。

根据阿里云,阿里云的通义千问大模型深度融入营销、客服、编码等多种应用场景,以及多种智能终端如手机、电脑、芯片、座舱等。与多家企业的合作,例如新东方同程旅行等等,达到良好的市场效果,商业作用凸显。

Ø通义万相:场景化智能绘画创作平台。它基于强大的AI技术,实现了多种图片创作方式,如文生图、图生图、涂鸦作画等等,为广大创作者提供了多场景的图片创作能力,实现创作者高自由度创作。

Ø通义听悟:音视频记录阅读分享工具,集成了阿里最先进的语音和语言技术,能够帮助用户高效出色地完成对音视频内容的转写、翻译、检索、摘要和整理。

Ø通义灵码:智能编码助手。基于通义大模型的强大能力,提供代码智能生成和研发智能问答服务,能够帮助开发者提高编程效率,优化编码体验。

Ø通义星尘:个性化角色创作平台。为用户提供了创建、定制和管理个性化角色的能力,并通过记忆、关系、情感等模块深度链接用户。

Ø通义晓蜜:深度整合AI应用,为企业提供全渠道的智能服务解决方案,提供更好的客户服务。

Ø通义点金:实现AI+金融,是一款智能金融分析研究工具。利用大模型驱动,帮助用户解读财报研报,分析金融事件,自动绘制图表表格,实时分析市场数据。

Ø通义法睿:实现AI+法律,通过自然语言处理、深度学习和法律知识图谱等技术,具备丰富的法律知识和推理能力,支持相关案例推送、案情分析、法律文书生成、法律知识自动检索、法律文本的高效阅读等功能。

Ø通义仁心:实现AI+健康,支持健康咨询、疾病诊断、用药指导和健康管理等功能,旨在为用户提供全方位、个性化的健康服务。

Ø通义智文:实现AI+阅读,能够智能提取关键信息、生成摘要、文档场景化阅读、结构化导读等,支持多种文档格式,全文搜索,知识问答,改善读者阅读体验。

Ø百炼:面向客户和合作伙伴的一站式大模型服务平台,可以帮助企业快速实现AI技术的场景化落地,例如智能营销,研报分析智能创作等等,提升经营效率。

多模态遥感基础模型 SkySense,经过基于内部构建的遥感影像数据集进行预训练达到20.6 亿参数量,成为迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感大模型。

实验数据显示,SkySense 在 17 项测试场景中指标均超过国际同类产品,这也是迄今为止国际上参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。SkySense 可用于地貌、农作物观测和解译等,有效辅助农业生产和经营。

Qwen1.5

Qwen1.5是阿里Qwen团队于今年二月推出的大型语言模型。模型多维能力得到显著提高,在诸如MMLU(5-shot)、C-Eval、HumanEval、GS8K、BBH等一系列传统评测基准上表现突出,展现了模型在语言理解、数学问题解答、逻辑推理等方面的强大优势。

最新发布1100亿参数开源模型Qwen1.5-110B性能优越,在MMLU、TheoremQA、GPQA等基准测评中超越了Meta的Llama-3-70B模型;在HuggingFace推出的开源大模型排行榜Open LLM Leaderboard上,Qwen1.5-110B冲上榜首,再度证明通义开源系列业界最强的竞争力。

Qwen1.5核心特性总结:

Ø多语言能力提升:Qwen1.5支持更广泛的语言类型和更复杂的语言场景展示了强大的多语言处理能力。利用多种数据集对十二种代表性语言进行全面测试,结果显示,Qwen1.5在学科解答、文本理解、故事理解、跨语言翻译等方面均表现出色。

Ø人类偏好对齐:通过采用直接策略优化(DPO)和近端策略优化(PPO)等技术,Qwen1.5与人类偏好的对齐度进一步增强。在MT-Bench和Alpaca-Eval等广泛使用的基准上,Qwen1.5展现了与人类偏好高度一致的回复质量。

Ø长序列支持:所有规模的Qwen1.5模型均支持高达32768个tokens的上下文长度,大幅提升了处理长文本的能力。L-Eval基准上的严格测试表明,即使是较小规模的Qwen1.5-7B-Chat模型也能媲美GPT-3.5的长文本处理能力,而Qwen1.5-72B-Chat则仅稍落后于GPT4-32k。

Ø优秀的外部交互和信息整合能力:RAG任务作为当前热门研究方向,Qwen1.5在解决大语言模型普遍面临的实时信息获取、数据私密性及幻觉问题上展现出了显著优势。RAG效果评测显示,特别是在中文语境下,Qwen1.5模型具有优秀的端到端场景下的对接效能。

Qwen1.5-Chat模型在调用API和执行代码解释器任务时展现出强大的潜力。其中,Qwen1.5-72B-Chat模型在工具使用性能方面接近业界领先的GPT-4水平。

CodeQwen1.5基于Qwen1.5,是一个专门针对编程的语言模型,它拥有7B 参数,采用 GQA 架构,经过约3T tokens 代码数据的预训练,支持92种编程语言,能够处理高达64K字符的长上下文,具有强大的代码生成、编辑和SQL处理能力,极大提升了开发人员的工作效率。

Qwen2.5

相比于2.1版本,2.5版模型的理解能力、逻辑推理、指令遵循、代码能力分别提升9%、16%、19%、10%。

与GPT-4相比,中文语境下,通义千问2.5文本理解、文本生成、知识问答及生活建议、闲聊及对话、安全风险等多项能力赶超GPT-4,本土化应用前景广阔。在权威基准OpenCompass上,通义千问2.5得分追平GPT-4Turbo,这是国产大模型首次在该基准取得该项成绩。

百炼平台实现从模型开发、应用开发到算力底座的全面升级,提升了易用性和开放性,并引入了更多模型。平台率先兼容LlamaIndex等开源框架,企业可以灵活替换能力组件以适应自身系统需求。针对当前企业关注的RAG链路,百炼提供了灵活开放的企业级检索增强服务,只需5到10行代码即可搭建RAG应用,显著增强大模型的能力。

通义灵码宣布推出企业版(包括标准版和专属版两个版本),旨在满足企业用户的定制化需求,提升研发效率。根据阿里云公众号,通义灵码是国内用户规模最大的智能编码助手,其插件下载量超过350万,每日代码推荐次数超过3000万次,累计被开发者采纳的代码超过亿行,深受市场欢迎。目前,通义灵码编码助手已应用于金融、汽车、新零售及互联网等多个行业,引领行业智能化升级。

通义灵码熟练掌握Java、Python、Go、JavaScript、TypeScript、C/C++、C#等200多种编程语言,可以辅助写代码、读代码、查Bug、优化代码等,具备优秀的代码生成能力、长序列建模能力、代码修改能力和SQL能力,4月份登顶Big Code模型排行榜。

根据InfoQ,截至目前,通义大模型通过阿里云服务超过9万家企业、通过钉钉服务超过220万家企业。大量海内外中小企业和开发者通过下载开源模型的方式使用通义大模型,其在HuggingFace和魔搭ModelScope等开源社区的累计下载量已超过700万。

通义落地应用进程加速。通义现已进入PC、手机、汽车、航空、天文、矿业、教育、医疗、餐饮、游戏、文旅等领域,与多家不同领域的企业及其产品展开合作,例如小米、微博、新东方等等。通义大模型展示了卓越的技术能力和广泛的行业适用性,不仅推动了技术普及,还为行业创新提供了有力支持,显示出强劲的市场竞争力和未来发展潜力。

阿里巴巴还推出Emote Portrait Alive(EMO)创新人像视频生成框架,该框架由音频驱动,能够在弱条件下利用音频视频扩散模型生成富有表现力的肖像视频。EMO通过解析音频线索和面部动作之间的细微关系,先后用用ReferenceNet和Backbone主干网络去噪,确保视频在帧转换过程中的无缝对接和身份一致性,极大地增强了视频的真实感和表现力,使得生成的人像视频显得生动而准确。这标志着人像视频生成领域的一个重大突破,重为AI人像视频制作开启了新纪元。

5.受益标的

AI应用:润达医疗、拓尔思、科远智慧、金山办公、万兴科技、新致软件、福昕软件、彩讯股份、佳发教育、捷顺科技;

昇腾一体机:恒为科技、开普云。

6.风险提示

AI进展不及预期;下游场景拓展不及预期;政策发生变化。

相关报告

1、【华西计算机】行业跟踪|英伟达GTC大会跟踪: 零部件升级是最大亮点

2、【华西计算机】行业跟踪 | Kimi改变AI,迎国内AIG时代

3、【华西计算机】行业跟踪 | NVIDIA GTC盛宴,产业链全面启动

4、【华西计算机】行业点评 | Groq横空出世,算力的下一种可能

5、【华西计算机】AIGC | 行业深度:Sora算力倍增,国产架构+生态崛起

6、【华西计算机】Sora | 行业专题:算力应用再加速

7、【华西计算机】行业跟踪|聚焦央国企和战略性新兴产业发展

8、【华西计算机】行业跟踪|海外AI高景气度,A股科技静待花开

9、【华西计算机】行业跟踪|科技拐点已至,算力打响反击战

10、【华西计算机】行业点评 | HarmonyOS NEXT 鸿蒙星河版发布,鸿蒙生态千帆起

11、【华西计算机】行业跟踪|CES 2024展会震撼来袭,AI成为绝对关键词

12、【华西计算机】行业点评|英伟达持续加码AI,华为领先演绎国产崛起

13、【华西计算机】行业点评|《数据要素×》正式落地,政策与资金齐发力!

14、【华西计算机】华为鸿蒙 | 行业专题:鸿蒙千帆起,生态全面启动

相关声明

► 分析师承诺

作者具有中国证券业协会授予的证券投资咨询执业资格或相当的专业胜任能力,保证报告所采用的数据均来自合规渠道,分析逻辑基于作者的职业理解,通过合理判断并得出结论,力求客观、公正,结论不受任何第三方的授意、影响,特此声明。

► 评级说明

► 华西证券免责声明

华西证券股份有限公司(以下简称“本公司”)具备证券投资咨询业务资格。本报告仅供本公司签约客户使用。本公司不会因接收人收到或者经由其他渠道转发收到本报告而直接视其为本公司客户。

本报告基于本公司研究所及其研究人员认为的已经公开的资料或者研究人员的实地调研资料,但本公司对该等信息的准确性、完整性或可靠性不作任何保证。本报告所载资料、意见以及推测仅于本报告发布当日的判断,且这种判断受到研究方法、研究依据等多方面的制约。在不同时期,本公司可发出与本报告所载资料、意见及预测不一致的报告。本公司不保证本报告所含信息始终保持在最新状态。同时,本公司对本报告所含信息可在不发出通知的情形下做出修改,投资者需自行关注相应更新或修改。

在任何情况下,本报告仅提供给签约客户参考使用,任何信息或所表述的意见绝不构成对任何人的投资建议。市场有风险,投资需谨慎。投资者不应将本报告视为做出投资决策的惟一参考因素,亦不应认为本报告可以取代自己的判断。在任何情况下,本报告均未考虑到个别客户的特殊投资目标、财务状况或需求,不能作为客户进行客户买卖、认购证券或者其他金融工具的保证或邀请。在任何情况下,本公司、本公司员工或者其他关联方均不承诺投资者一定获利,不与投资者分享投资收益,也不对任何人因使用本报告而导致的任何可能损失负有任何责任。投资者因使用本公司研究报告做出的任何投资决策均是独立行为,与本公司、本公司员工及其他关联方无关。

本公司建立起信息隔离墙制度、跨墙制度来规范管理跨部门、跨关联机构之间的信息流动。务请投资者注意,在法律许可的前提下,本公司及其所属关联机构可能会持有报告中提到的公司所发行的证券或期权并进行证券或期权交易,也可能为这些公司提供或者争取提供投资银行、财务顾问或者金融产品等相关服务。在法律许可的前提下,本公司的董事、高级职员或员工可能担任本报告所提到的公司的董事。本公司及其所属关联机构或个人可能在本报告公开发布之前已经使用或了解其中的信息。

所有报告版权均归本公司所有。未经本公司事先书面授权,任何机构或个人不得以任何形式复制、转发或公开传播本报告的全部或部分内容,如需引用、刊发或转载本报告,需注明出处为华西证券研究所,且不得对本报告进行任何有悖原意的引用、删节和修改。

团队成员

注:文中报告节选自华西证券研究所已公开发布研究报告,具体报告内容及相关风险提示等详见完整版报告。

分析师:刘泽晶

分析师执业编号:S1120520020002

证券研究报告:《【华西计算机】行业跟踪|国产应用更新迭代加快,AI产业推进持续》

报告发布日期:2024年5月12日

重要提示:

《证券期货投资者适当性管理办法》于2017年7月1日起正式实施。通过本订阅号发布的观点和信息仅面向华西证券的专业投资机构客户。若您并非华西证券客户中的专业投资机构客户,为控制风险,请取消订阅、接收或使用本订阅号中的任何信息。因本订阅号受限于访问权限设置,若给您造成不便,敬请谅解。市场有风险,投资需谨慎。

法律声明:

本订阅号为华西证券计算机团队设立及运营。本订阅号不是华西证券研究报告的发布平台。本订阅号所载的信息仅面向华西证券的专业投资机构客户,仅供在新媒体背景下研究观点的及时交流。本订阅号所载的信息均摘编自华西证券研究所已经发布的研究报告或者是对已发布报告的后续解读,若因对报告的摘编而产生歧义,应以报告发布当日的完整内容为准。

在任何情况下,本订阅号所推送信息或所表述的意见并不构成对任何人的投资建议。华西证券及华西证券研究所也不对任何人因为使用本订阅号信息所引致的任何损失负任何责任。

本订阅号及其推送内容的版权归华西证券所有,华西证券对本订阅号及推送内容保留一切法律权利。未经华西证券事先书面许可,任何机构或个人不得以任何形式翻版、复制、刊登、转载和引用,否则由此造成的一切不良后果及法律责任由私自翻版、复制、刊登、转载和引用者承担。