发布于: 雪球转发:1回复:74喜欢:35

丢了个问题给目前最火的AI,根据它们网络搜索和文档分析的结果,10分制个人打分:

月之暗面Kimi:0分

抖音豆包:0分

腾讯元宝:0.1分

Open AI GPT-4o:0.1分

阿里巴巴通义千问:5分

通义千问最好,但也不及格,因为没有找到股权结构的数字。

文档中没有的东西都能胡编乱造,现阶段AI还是靠不住啊





$腾讯控股(00700)$ $阿里巴巴(BABA)$ $中电华大科技(00085)$

精彩讨论

wangshenglong06-02 13:49

目前来看,Ai就是“胡编乱造”,有的东西它就直接拿过来,没有的话根据以前的资料拼凑整合起来的,就把a的理论嫁接到b的上面,然后一通总结下来,然后一大堆的长篇大论,一大堆的废话,看起来挺像那么回事的,但是错误有很多。完全正确的答案,其实就是这些东西已经非常普遍了,已经有非常权威的答案了,他拿过来当然不会错,你新一点的东西或者是复杂、深入一点的东西,它就不行了。本质上是数学中的统计,是对数据的整理和分析,当然它,现在还在进化,后面整理分析的能力越强

深刻的财经小矿石06-02 14:48

这是非常客观的评测,一帮傻逼说抖音豆包好,真tm扯淡,一个八卦娱乐的能做出来好的,我测了一下豆包,简直是比傻逼还傻逼

石板坡小王06-02 12:17

这种问题就不适合问AI

cenryu06-02 13:08

我试了下画画,元宝最好,但比不过gpt,通义垃圾但能画,kimi不能画

股市行路难06-02 14:02

文心一言也不咋行

全部讨论

06-02 13:49

目前来看,Ai就是“胡编乱造”,有的东西它就直接拿过来,没有的话根据以前的资料拼凑整合起来的,就把a的理论嫁接到b的上面,然后一通总结下来,然后一大堆的长篇大论,一大堆的废话,看起来挺像那么回事的,但是错误有很多。完全正确的答案,其实就是这些东西已经非常普遍了,已经有非常权威的答案了,他拿过来当然不会错,你新一点的东西或者是复杂、深入一点的东西,它就不行了。本质上是数学中的统计,是对数据的整理和分析,当然它,现在还在进化,后面整理分析的能力越强

这是非常客观的评测,一帮傻逼说抖音豆包好,真tm扯淡,一个八卦娱乐的能做出来好的,我测了一下豆包,简直是比傻逼还傻逼

06-03 09:44

文心一言

06-02 13:08

我试了下画画,元宝最好,但比不过gpt,通义垃圾但能画,kimi不能画

有没有可能是你测试的方法不对呢?这种一般需要调api接口的,用agent会好。还有这个指令写的太直接了吧

06-02 14:02

文心一言也不咋行

06-02 12:17

这种问题就不适合问AI

现在的 ai 模型无法区分哪些需要精确哪些需要推理创造

06-02 16:08

GPT能打0.1分说明你用的免费

06-02 13:31

小爱同学的结果,几分