重磅突破!天士力“数智本草”大模型引领变革,30年韧性助力数智中药开新局

发布于: 雪球转发:0回复:0喜欢:3

随着参数量最大、产业证据最全的中医药大模型——“数智本草”大模型发布,一个由AI大模型驱动的中医药产业“第五范式”,正式引领新一轮中药产业变革。

数智时代,通往中药产业未来的新动量及智能“大脑”,出现了。

在近期召开的数智赋能大健康产业新质生产力暨第四中医药国际发展论坛上,天士力医药发布了《数智中药——现代中药的数智化发展白皮书》,紧接着重磅推出了聚焦中药产业创新研发的“数智本草”大模型。这是由天士力与华为云在华为盘古大语言模型和盘古药物分子大模型的基础上,联合开发的中医药语言大模型和计算大模型。

算力与数据是所有大模型的两大发动机,而“数智本草”大模型对应的“配置”,可谓是业内顶尖:一边基于华为澎湃算力与向量库等先进工具,一边注入了中医药守正、创新和产业化三大类海量数据。“参数量最大,产业证据最全,数据可谓业内最丰富”,天士力国际基因网络药物创新中心有限公司总经理王文佳向E药经理人表示,“而与ChatGPT和其它中医药大模型相比,‘数智本草’的最大突破在于,不止有语言,还有计算大模型,不仅能找到证据,还具备可溯源的中药研发证据链条。”

对于30年持续探索智能制造升级突破之路,当下已迈入“数智中药”新阶段的天士力来说,“数智本草”也是见证自我创新求通、实现整个中药行业从无到有突破的又一大标志。这一模型的推出,目的在于“不作诗,只做事”。1.0版覆盖研发全链条,提供研发辅助,实现证据提炼、辅助决策与效能提升,促成“从病到方”和“从方到病”两大目标的实现。

而作为面向行业推出的首个可长期应用于多个生态场景的的智能“大脑”,“数智本草”大模型未来还能在天士力与产业各端协同、共建创新生态过程中,得以在更多生态场景应用,实现用药精准、生产机制、疗效精确的数智中药愿景。

(“数智本草”大模型发布仪式)

01

做数智中药的新技术工具

构建中医药AI大模型,解码“数智赋能”,驱动产业重塑与质变,是天士力外应时代变化,内应行业发展需求,以及契合自身战略升级的关键举措。

随着AI技术蓬勃发展,药物研发范式正在发生新变革。

2023年,科技部会同自然科学基金委启动了“人工智能驱动科学研究”(AI for Science)专项部署工作,围绕药物研发、基因研究、生物育种等重点领域科研需求展开,布局AI for Science前沿科技研发体系。这一体系可以更真实细致地刻画复杂系统的机理,同时把基本原理以更加高效、实用的方式应用于解决实际问题,大大提升研发效率。

尤其对于中医药创新研发来讲,由于物质基础、作用机制和理论思维具备高度复杂性,中医药“说理、寻药”,则更需AI赋能。

“数智本草”大模型便是在五次科研范式迭代下,应运而生的新型技术工具,同时也正为中医药产业培育“新质生产力”(以革命性、颠覆性科技创新为前提),找到了切实的着力点。

天士力自身来说,“数智本草”大模型是推动现代中药数智化升级后,迈出重要一步。

在成立30周年之际,天士力给予了自身一道与时俱进,但颇具挑战的新“命题”:从做现代中药,到率先升级打造数智中药这一新范式。这不仅是技术浪潮带给传统产业转型升级的新机遇,更受国家战略需求驱动,同时是实现中药高质量发展的新质生产力。

天士力给数智中药注入的核心内涵,在于“六化三精”。结合云计算、大模型等新型技术手段,通过实现“六化”,从而达到“三精”,最终实现中药全产业链、全生命周期的跨跃性转型升级,颠覆传统中药一人一方的经验模式,形成精准获益的数智中药设计模式。

其中,“六化三精”分别指:

组方配伍数智化、物质基础数智化、量时毒效数智化、生产质控数智化、临床应用数智化、消费认知数智化。达到用药精准、生产精智和疗效精确。

“六化三精”就是天士力现代中药走向未来的明确方向,实际剑指现代中药产业发展存在的难突破瓶颈:典型如临床定位不精准、药效物质不清、作用机制不明、制药工艺粗放、质控水平低下……

尤其是研发端,中药药效物质基础研究难以满足创新研发需求,存在传统中药信息稀疏、离散等研发痛点。

对应地,此次发布的“数智本草”大模型1.0版,即覆盖了中医药全研发链条,旨在提升研发效率,解决研发痛点。

王文佳向E药经理人举例谈到了大模型可解决的三大研发痛点:

其一,“中医药首先强调守正,需在充足的理论基础上,提供真实世界研究信息的支持。但典籍浩如烟海,理解起来不易,提取精髓信息的难度更是非常大。而‘数智本草’语言大模型,能帮助我们高效抓取内容。”

其二,“中药体系物质基础、作用机制和理论思维特别复杂,每种药材所含成分都在数百上千种,复方成分更不用说。怎样找到作用机制?这就需要结合计算大模型强大的科学计算、预测的能力,进一步精准预测中药成分到药材特性及功效。”

其三,“中医药研发人员一般需要很多年的培训,熟悉中西医等多领域、多学科知识。通过大模型自然语言交互功能,研发人员可以用更简单的方式,大大提升研发效能。”

02

做中医药研发革新范式

不管与ChatGPT,还是其它现有中医药大模型相比,“数智本草”大模型最明显的差异化在于落地性、实用性

给予其两大特性的基础在于:参数量最大,产业证据最全、补全了分子靶点及产业层面的海量数据,首度实现中医药“语言+计算”模型并生,又通过智能问答、交互计算和文档生成三大应用模式,真正帮助到研发端降本增效。

海量数据分为三类:守正(1000+古籍及翻译,9万+方剂,4万+中成药等)、创新(4千万+文献摘要,3百万+天然产物等)、产业化(10万+临床方案,16万+中药专利以及药典政策指南等)。

“数智本草”语言大模型,拥有380亿参数量,基于中医药海量文本数据预训练,结合向量库检索强化,以及中药研发多场景的微调,能够更好帮助研究者完成中医药理论证据的挖掘和总结。

“数智本草”计算大模型,用于进一步提升可靠性,以实现精准研发,这明显区别于现有的中医药大模型。基于数十亿分子结构的预训练,使用350万特有的天然产物分子数据微调,能够更精准地执行“表征天然产物分子、提高下游属性预测”等计算任务,并可结合相应算法快捷实现药材与复方的筛选和优化。

基于此,大模型能深度挖掘和整合中医经典理论和中药药理、中药配伍以及临床应用的内涵和联系,通过三种应用模式,实现“从病到方”和“从方到病”两大目标。

其中,三大应用模式颇有层层递进之意。

在智能问答模式下,通过自然语言问答,可选择从不同类别结构化数据与非结构化文本中体验药物与疾病,从宏观到微观证据链条加速中药机制解析方剂、创新优化过程中的核心方剂筛选、文献古籍证据提取、方剂优化思路发现、创新方剂生成等重要环节。

交互计算,即利用中药计算大模型和星斗云计算平台,覆盖从方剂计算到药材成分计算等多个场景。基于智能回答对方剂药材的筛选生成,通过一站式计算平台进一步全面分析组方规律,挖掘核心药材配伍,助力方剂精准优化。对于已上市中药,通过问答总结上市中药目前使用状况,然后通过进一步计算预测已上市中药的新适应证,辅助研发决策。

文档生成模式,关键词在于“一键生成”,能加速减少99%的研发时间和成本。数智本草报告生成系统针对中医药研发链条上的多个环节,从立项、临床研究和上市后研究等场景,结构化梳理中药研发全方位信息,一键生成研发报告,大大提升产业研发效能。

“过去研发人员撰写一个保护品种的说明报告,可能需要一个多月的时间,现在将资料提供给大模型,报告生成可能只要几个小时,大大节省了人力投入。”王文佳分享了一个降本增效的实际场景。

值得注意的是,在该大模型使用过程中,可实现结果“溯源”,即可以提供可溯源的中药研发证据链条,打通中药宏观真实世界经验与微观分子机制的沟通桥梁,追踪证据引用来源以及查看原文。“一篇论文附有参考文献,我们大模型不仅有丰富多样的‘参考文献’,还能直接点进去看到‘文献’原内容。”王文佳补充道。

03

领军者的宿命是自我革命

通往中医药未来的路上,还蕴藏着诸多尚未知晓的答案。数智中药发展并非一路坦途,其在中药大数据整合、算法研发、算力集成及如何与新药研发路径衔接等方面,还面临众多亟待解决的挑战。但要促进中医药传承创新,加速走向国际化,同时让全产业链实现飞跃性转化升级,这是必须踏出的一大步。

而先踏出这一步的天士力,率先给予了中医药行业新的可能性发生。

“数智本草”大模型诞生史,半部现代中药龙头创新发展史。今年是天士力成立三十周年。在这一关键时间节点,大模型的发布一能深刻见证天士力过去30年的积累沉淀具备领先价值,二是战略性迈入数智中药新阶段的重要标志。

30年前,从一粒直径仅为1.5毫米的复方丹参滴丸开始,到2000年率先提出“现代中药”的概念,再到2024年提出打造“数智中药”,天士力始终将中医药创新与产业链的智能制造升级突破,紧密联系在一起,在很早的时候成为了重构产业体系的“引领者”,并始终为“下一步”未雨绸缪。

据了解,在数智中药发展过程中,天士力已经形成3条关键路径:

以多维度、多模态数智中药研发技术深刻解析药物与疾病特征;以智能制造技术保障中药产品质量精准控制、高效、绿色、可持续发展;以智慧中医大脑高效赋能数智中药个体化精准服务。

基于这3条关键路径,天士力秉持“长期主义”,持续在中药研发、制造等领域不断进行创新性自我重塑。

在做专做精现代中药的基础上,天士力将积累到的丰富中医药理论知识、临床人用经验与大数据、云计算及人工智能等数字科技结合,自主开发的星斗云中药智能研发平台已积累海量中医药特色数据,实现了复方丹参滴丸等中药机制数字化解析,为行业提供了中药创新上更精准的挖掘中药传统现代理论,融合真实世界经验与分子机制,整合流程算法工具的更多可能。

这也深刻印证了,天士力研发团队对于模型的实际场景应用提前有着深刻洞察和对需求的深度捕捉。只有懂需求、具备在中医药领域深厚的行业经验及服务资源优势,才能加速“数智本草”大模型的落地,并让其率先占据产业新高地。

而作为引领者,关注的永远是下一步要在哪里实现从无到有的突破。这是一个阶段的终点,也是下一个阶段的起点。下一步,天士力仍将坚持创新求通、韧性驭变,但将要在战略上,以“数智”致胜。