武汉话有句方言，叫做“闹眼子”，意思大致是走台面、纯忽悠。三月以来A股涉及Ai、计算机、芯片、存储、软件以及Ai运用...

武汉话有句方言，叫做“闹眼子”，意思大致是走台面、纯忽悠。三月以来A股涉及Ai、计算机、芯片、存储、软件以及Ai运用端的游戏、电影等股票无论业绩都鸡犬升天。典型的就是360、寒武纪、上海电影等。就是炒概念、闹眼子。
当前Ai竞赛的实质，主要还是大模型和高质量场景数据。
我们实际上在两方面都是缺乏的。大模型方面，从国外看，谷歌率先步ChatGPT后尘，但实际发布效果及运用目前远不及ChatGPT。从国内来看，最开始拿出大模型的是百度，搞个“文心一言”发布会，结果是录播！当即股票大跌，后续又搞成闭门升级发布（从若干年前的“莆田系医院”拿钱买百度搜索排名开始，我就觉得这家企业文化不咋滴！），后面大家的测试，特别是描述转图片的测试，也进一步证明，它就是直接调用国外的Api实现的所谓“智能”。这不光叫“闹燕子”，这叫骗子。360在我看来就是个做杀毒的，杀毒的就是自己制造病毒养活自己的产业，这一波炒它，简直莫名其妙，最后这几天闹个假离婚减持。有人说是它浏览器、搜索引擎可以类比ChatGPT在微软Bing的运用。如果硬要扯，相似点顶多这些搜索引擎公司都多多少少具备一些通过网络爬虫积累的互联网数据资源而已，但真正如何能有效做到像ChatGPT一样深度“数据清洗、去重，数据挖掘、分析”，具备理解上下文、连贯性，则相去甚远。如GPT-3的论文《LanguageModelsareFew-ShotLearners》所述：“OpenAI从万亿参数归纳出众人所熟知的1750亿参数，其核心原因在于‘未经过滤或轻度过滤的爬虫数据往往比筛选后数据集质量更低’。”
最近ai发布会接二连三，华为盘古、商汤、阿里、同花顺、科大讯飞…..个人认为：华为、阿里、商汤是好好做的，同花顺、科大讯飞和百度一样是闹眼子的。
这一次阿里没有东施效颦直接像百度一样迅速的抄作业，而是基于它的物联网终端以及高质量数据场景，弄出来的这一套全家桶，可用性及实用性还是比较期待的。但我觉得最核心的，还是目前国内有这个训练算力的机构并不多，ChatGPT能够最后取得成功，依赖的就是nvidia的A100的计算卡，这可能也是国内炒作寒武纪它们的原因。但nvidia最新的100计算卡，hopper h100性能是A100的6倍。可惜对中国禁售了，算力芯片跟不上，何谈有效大模型建设？阿里四年前就在做含光800。
最近还听说彭博也发布了一个专门针对金融领域的大型语言模型—BloombergGPT，他们利用40年的现有数据，构建了一个3630亿个标签的数据集，并针对金融业务场景进行混合模型训练，这些特有数据及特殊训练，使得BGPT比ChatGPT专业性更强。
那么映射至国内，掌握垂直优质数据的机构，比如新华社、人民网、银行（农行），都应该可以结合自己的数据库开发XXXGPT。
希望我们少些闹眼子、炒概念、抄作业，多些像华为、阿里这样埋头苦干、深耕前沿、与时俱进、为创新提速，造福国家、人民、未来的企业。

作者：faro988

全部讨论