阿里巴巴:通义大模型体验(多图警告)

发布于: 修改于: 雪球转发:3回复:13喜欢:10

虽然阿里要到4月11号才开通义大模型发布会,但是4月6号就已经对通义的AI作画(文本生成图像)模型做了更新。我用MidJourney V5(MJ V5目前是全球标杆)的生成结果和这版阿里大模型PK一下,看看通义大模型目前达到了何种水平。

欲扬先抑,阿里通义大模型在手部处理上不够,这是Midjourney V4及以前代的通病,阿里的模型应该有参考MJ,想必后期能够解决这个问题。

为了公平起见,MidJourney V5和阿里大模型的文图生成提示词保持一致,

1.提示词:artificial intelligence, Futuristic ,4k    (人工智能,未来派,4K)

MidJourney V5(转自知乎Kerry):

通义大模型:

第一回合,通义大模型的表现还不错。

2.提示词:Batman, Matrix raining code(蝙蝠侠,黑客帝国代码雨)

MJ V5:

通义大模型:

第二回合,通义大模型没有准确理解代码雨的含义

3.提示词:Blacklight wolf(黑光狼,即紫外线灯下的狼)

MJ V5:

通义大模型:

除了狼腿有问题,通义整体还不错。

4.提示词:A couple with a dog in watercolor(带着狗的夫妇俩,水粉画)

MJ V5:

通义大模型:

这回我更喜欢通义大模型的出图。

5.提示词:A Nokia cell phone, diagramatic drawing(一台诺基亚手机,示意图绘图)

MJ V5:

通义大模型:

6.提示词:a miniature forest lakes and village inside a melted resin, vivid, colorful lighting, artistic (森林湖和小村的树脂微缩景观,多彩光影,艺术风格)

MJ V5:

通义大模型:

7.提示词:中国队勇夺世界杯

MJ V5:

通义大模型:

通义大模型的世界杯用错了,可能是出于版权考虑[狗头],但MJ的队标也错了。

总结:阿里的文生图对比MJ V5有较大的代际差距,但部分场景的准确度超出预期。

注:对阿里通义大模型感兴趣的朋友可以自己去测试一下,AI作画 · 创空间 (modelscope.cn)

$阿里巴巴(BABA)$ 

$商汤-W(00020)$ 

全部讨论

拜败2023-05-02 03:19

$万兴科技(SZ300624)$ 也对比一下

下午五点过四分2023-04-10 19:19

在哪里用

融资不难2023-04-10 17:59

这种图,看多也是油腻得很

大乖象2023-04-10 12:28

文转图好抄,stable diffusion是开源的,直接拿过来用都比他开发强

满仓半导体2023-04-10 11:21

这是真ai,光能写代码就已经吊打文心了

用户47710613242023-04-10 10:14

虽然阿里的技术我是认的,但是说差不多的也太搞笑了吧

鄂志杰2023-04-10 00:12

学习!

思维19912023-04-09 22:59

手的模型好像是Gpt4最完美

apan12162023-04-09 22:30

刚测试一下,差很远啊

宫崎232023-04-09 22:28

感觉风格模型没有训好