首个专为半导体行业设计的开源大模型 SemiKong 问世

发布于: 雪球转发:0回复:0喜欢:1

作者 | 赵明华

7 月 10 日,国外初创公司 Aitomatic 宣布推出 SemiKong。这是世界上第一个专为半导体行业设计的开源 AI 大型语言模型(LLM)。它旨在通过将特定领域的知识纳入模型来解决半导体行业面临的一些挑战,例如有关半导体器件和工艺的物理和化学问题。

SemiKong 由人工智能联盟(AI Alliance)成员合作研发。AI 联盟成立于 2023 年,致力于构建、支持和倡导整个 AI 技术领域的开放式创新,包括软件、数据和模型、安全、安保和信任、工具、评估、硬件、教育、开放科学和宣传。

SemiKong 基于联盟成员 Meta 开源的 Llama3 模型,利用了包括 Tokyo Electron 在内的领先半导体公司和 FPT Software 等 AI 专家的专业知识。IBM 研究院 AI 开放创新负责人 Anthony Annunziata 强调,“SemiKong DRAFT v0.6 的诞生表明,汇集不同的专业知识能推动半导体制造等关键行业的重大进步。”

SemiKong 的训练过程主要分为 3 个主要阶段:预训练领域知识——自我微调(指令数据集)——合并和量化。从放出的代码权重,可以看出 SemiKong 有 8B 的参数。它在准确性、相关性和对半导体工艺的理解方面表现出了显著的进步。

Aitomatic 表示,即使是其较小版本,在特定领域的应用中也常常超越较大的通用模型,从而有可能加速整个半导体价值链的创新并降低成本。并且,它也为那些打造适合自身的专有模型的芯片公司提供了一个有价值的基座。

随着 SemiKong 降低半导体生产成本,消费者可以在未来几年内以更低的价格看到功能更强大的智能手机、笔记本电脑和智能家居设备。SemiKong 于 2024 年 7 月 9 日起在 HuggingFace 和 GitHub 上提供下载。下一个更强大的版本计划于 2024 年 12 月推出,预计 2024 年 9 月将推出首批特定工艺型号。

开源地址:网页链接

SemiKong 项目的领导者, Aitomatic 首席执行官 Christopher Nguyen 表示:“SemiKong 将重新定义半导体制造业。这种开放式创新模式由人工智能联盟提供支持,利用集体专业知识应对行业特定挑战。在 Aitomatic,我们正在使用 SemiKong 创建领域特定 AI 智能体,以前所未有的效率解决复杂的制造问题。”

Tokyo Electron 高级专家、半导体行业模型的早期提出者 Daisuke Oku 补充道:“SemiKong 是半导体开源 AI 的一个令人激动的开始。Aitomatic 的创新方法有可能为我们的行业带来巨大的飞跃。”

参考链接:

网页链接

网页链接

内容推荐

AIGC技术正以惊人的速度重塑着创新的边界,InfoQ 首期《大模型领航者AIGC实践案例集锦》电子书,深度对话30位国内顶尖大模型专家,洞悉大模型技术前沿与未来趋势,精选10余个行业一线实践案例,全面展示大模型在多个垂直行业的应用成果,同时,揭秘全球热门大模型效果,为创业者、开发者提供决策支持和选型参考。关注「AI前线」,回复「领航者」免费获取电子书。

活动推荐

AICon 全球人工智能开发与应用大会,为资深工程师、产品经理、数据分析师等专业人群搭建深度交流平台。聚焦大模型训练与推理、AI Agent、RAG 技术、多模态等前沿议题,汇聚 AI 和大模型超全落地场景与最佳实践,期望帮助与会者在大模型时代把握先机,实现技术与业务的双重飞跃。

在主题演讲环节,我们已经邀请到了「蔚来创始人 李斌」,分享基于蔚来汽车 10 年来创新创业过程中的思考和实践,聚焦 SmartEV 和 AI 结合的关键问题和解决之道。大会火热报名中,7 月 31 日前可以享受 9 折优惠,单张门票节省 480 元(原价 4800 元),详情可联系票务经理 13269078023 咨询。

今日荐文

xAI 和 Oracle 间 100 亿美元的生意谈崩了!有钱也租不到芯片的马斯克要自建超级计算中心,就不信“钞”能力还会失效?

有赞取消 HRBP 岗位,员工拍手叫好!中国科技大厂的尴尬境地:既要富士康的效率,又要谷歌的创新

微软中国CTO韦青:亲身经历大模型落地的体会与思考

零就业保障、全天精神“酷刑”!ChatGPT类产品背后80%贡献者,时薪1.16美元,但也没得选

网易员工内部群怼丁磊:人人陪你演戏点赞;李彦宏:开源模型是智商税;小红书再裁员:人效比只能达到拼多多的一半 | AI周报

你也「在看」吗?