我现在备课都用gpt,但都会扔到谷歌验证一下,毕竟容易胡说八道。
1,GPT4 用过,当时觉得比较好的地方有 code interpreter,可以直接导入表格,做数据分析,然后还可以让大模型根据数据去写 code,比如可以用不同的算法去训练这些数据,相信的 code 非常快的生成,再导入到 colab 训练,大大减少编程和机器学习的难度。这是一个场景。
2,GPT4,可以使用插件 ,尝试过通过文本描述工厂的生产场景,然后 GPT 给出一个生产成本最低,收益最大的排产方案。用的是大模型的能力和 Wolfram解答数学的能力,只可惜插件生态发展的不太好。大模型理解文本转换成数学需要运算的言语,这是一个很好的应用场景。也是为什么行业专家强调的单纯的大模型数学能力不行。目前来看国内还没有一个公司在做该方面的研究。
3,P8Y(perplexity)和国内做的不错的月之暗面比较像,大模型+网络浏览+文本总结(类似于 chatPDF 工具),可以不像 GPT 局限于训练的时间,只要网络上面有的内容都可以搜寻到,和去年 gpt 出的 Browsing 有点像,只是 gpt 这个功能做的不伦不类,最后好像不是太好用还关闭一段时间。Chatgpt 目前应该是也把联网的功能内嵌了。
包括前几名的大模型都深度用过,只是有一些搜索还是少不了谷歌,有些问答你就是想要开放式的搜索,不要总结,因为这会增加大模型自己的理解而忽略了真实的内容。
仅一家之言,仅供参考(还没打过这么多字😂)
英文应该不会吧。看看图片?主要应该是没有训练中文语料。不过总体来说,这种有两个或者多个类似答案,它会选择一个的情况确实可能出错。本质上它是根据概率选了一个,而搜索引擎是列出所有可能,那么搜索引在十个可能中做对的概率肯定更高。类似的情况,比如问它说A更流行还是B更流行,连续提问下它会依靠语境,那么问的先后会有影响,要是之前先让它看过A,接着问A和B谁流行,它很可能就答A,但是如果之前让它看B,然后问AB谁流行它很可能就说是B。
找LinkedIn我倒是觉得它应该能做到,因为它实际上也就是去现场调用一次搜索,试试search xx xx working in xxx on LinkedIn. 我试了好像都还成,找不到的它还会说找不到。
linkedin纯英语搜索前同事(已离职),google只提供前单位可以搜到这个人,perplexity需要提供现单位。
另外用perplexity随便搜了一个“s&p 500 return q1 2024”,得到的答案是从去年10月开始算的。[捂脸][捂脸][捂脸]
其他我还挺满意的,特别是“how many Panda Express stores outside of US”,比google好多了,哈哈。
google之所以准确很多时候是因为在前几个选项中我人肉进去找到答案,perplexity只提供最终答案,确实容易出现错误。google是怎么保证答案在首页结果的?perplexity如何改善?多用就会好么?