AI补习老师,生育率有救了?

发布于: 雪球转发:0回复:1喜欢:2

大家好,我是很帅的狐狸

GPT-4o

所以今儿稍微聊几句,顺带介绍下国内的平替。

先看视频——

网页链接

如果国内可用的话,那学龄儿童的爸妈们要乐死了…

给还不知道GPT-4o的人稍微科普下:

这是OpenAI最新的旗舰模型,o for omni,也就是无所不能的意思。

这个模型的NB之处在于——

上一代GPT-4模型在手机上语音对话,本质上是生成文字后,再用Whisper模型转为语音,所以往往每次用语音提问后,都要等个几秒才能听到语音助手的回复。

而GPT-4o可以直接生成语音(真正的多模态),响应速度缩减到了数百毫秒。

跟人类的对话差不多,而且你还可以随时打断它

我们再看一个demo——

网页链接

是不是很像电影《她》里面的寡姐?或是钢铁侠的Jarvis?

反正看到新闻后,我速度体验了一把。

然后在电脑上也改用了这个模型。

虽然GPT-4o的评分比较高(除了离散段落推理能力),但不晓得为啥,我自己用起来的感觉,似乎复杂任务(比如写代码)还是GPT-4比较好用。

我今天尝试用GPT-4o,把网上一段爬虫代码给改成新闻语音助手,前后让它改了几十次才彻底没有bug(不过可能也跟我不断在提新需求有关)。

要是对这个感兴趣,可以留言告诉我

我稍作完善后分享出来

iPad被我妈带回老家了,所以暂时没法用上分屏功能。

不然我也想试试AI补习老师功能。

顺带一提,MacOS也出了相关应用,所以也可以在MacOS上用来帮忙写代码什么的。

不过国内还是继续用不了

毕竟人家的模型censor的标准跟咱不一样。

通过API套壳暂时也不行。

目前GPT-4o我看了下,只支持输入输出图片和文字。

Anyway,国内的一些平替还是勉强可用的……

不过一是没那么有感情(GPT-4o甚至还会开玩笑),二是还是只能手动打断它的输出,所以没那么像真人对话,三是确实还是要等很久

我稍微分享两个我的试用视频吧——

一个是智谱清言

网页链接

回答间隔大概5~6秒。

其实我一直觉得智谱清言在语音对话上处理得还行…

可能是因为之前用ChatGPT还是有网络时滞,所以我之前一直觉得智谱的语音其实比GPT-4好用。

还有百度的文心一言

网页链接

这个真的有点恐怖谷效应

东哥的数字人不知道强多少倍。

哦科普一个知识点:所谓恐怖谷效应,就是——

当机器人或角色的相似度较低时(例如卡通形象),人们通常觉得它们有趣或可爱。

当相似度接近但不完全像人类时(例如高度逼真的机器人但动作僵硬),人们会感到不适,这是因为它们看起来既像人类又不像人类,造成心理上的矛盾。

最终,当相似度足够高且行为自然时(例如非常逼真的CGI角色),人们会再次产生正面情感。

解释/ ChatGPT

图表/ 智谱清言

参考Prompt/ 「帮我用python+matplotlib画一个line chart解释恐怖谷效应,纵轴为恐怖值,横轴为与人类的相似程度」

其实我本来是想录一个ChatGPT的测试视频的…

不过早上测试的时候忘记录屏了。

到了晚上,它服务器超载一直没法正常连接上…

所以你们就看看公开视频算了。

P.S.最近更新得是比较低频,so,也欢迎关注我们团队每个工作日都更新的日报内容——

「Greed is good.」

「很帅的投资客」的所有内容皆仅以传递知识与金融教育为目的,不构成任何投资建议。一切请以最新文章为准。

相关阅读:

适合普通人的AI场景:《感觉我现在强得可怕》《我让我的AI老婆出道了!》AI数据分析:《这些部门要开始裁员了…》《AI的尽头真的是光伏和储能吗?》《我用我们的1159篇文章,训练了一个AI》《工具 | 境内可用的AI分析工具》《方法 | 我开始用AI来做投资分析了》《收藏 | 超好用的AI提问模板》

✍ 图文/@狐狸君raphael,曾供职于麦肯锡金融机构组,也在 Google 和 VC 打过杂。华尔街见闻、36氪、新浪财经、南方周末、Linkedin等媒体专栏作者,著有畅销书《风口上的猪》《无现金时代》。

觉得对你有用的话,帮我点个在看

全部讨论

05-14 23:47

厉害