我们没有等到GPT-5,不过作为一个春季更新,即使之前已经有过剧透,新的GPT-4更新是有很强的语音对话助手,但是,实事求是讲,模型的表现依然非常惊艳:
1、语音与实时视频交互丝滑融合,我们还在海上飘着的Rabbit r1原地被“取代”,模型能力依然是决定产品的最重要基础;
2、这是一个几乎完全拥有情感的语音模型,而且以几乎实时的低延迟交互,无论是对于用户情感的理解,还是模型自身输出的情感表达,都在证明自己是“人”;
3、不仅理解声音的情感,还理解表情的情感;
4、真正的全能助手开始了,不仅在手机上,还可以在桌面系统上,实时交流代码问题,进行数据分析;
5、实时翻译,我们再也不需要翻译机了;
官网给出了更多令人惊艳的例子:
生成卡通头像
角色一致的漫画
生成图片,但是文字都对(对比Dall-e3)
各种logo
生成三维(先生成六张图,再三维重建)
UI?
会议纪要整理
看懂视频,并摘要:
是的,25分钟的live demo就是展现了这样的功能,但是背后意味的信息量却一点都不少:
1、多模态的能力已经又上一层楼了;几乎实时的交互,带来了非常多的可能,只是可能,大家希望在GPT上再开发应用的空间又被压缩了;
2、模型开始“懂得”情感,这是一个可怕的事情,因为曾经我们就把是否有情感作为AI和人的重要区别;
3、GPT-4o可以免费访问,虽然这个免费访问一定会打折扣,但对于ChatGPT的流量而言无疑是一剂强心剂;
4、如果Apple与OpenAI在iPhone上的合作的消息是真的,那么,我们可以对第一个真正的ai手机——iPhone16,充满期待了;
5、是的,这还是GPT-4,不是GPT-5,意味着模型的基本能力还是GPT-4这一代的水平,但是,它几乎整合了我们能想到的各种能力,也打开了各种场景应用的更大空间,关键是,它还是准确无误的;
6、这次发布没有提到sora,但是我们已经可以看到,sora的图像和视频能力已经被集成进了新模型,以一种更灵活的方式,取代好莱坞可能还需要等等,但是作为新的社交工具,各种内容一定会在接下来的一段时间里疯狂传播;
7、我始终相信,我们每个人都需要AI助手的,GPT-4o是又一新高,或者说满血版;
最后,一个小彩蛋:之前神秘的gpt2,就是GPT-4o的预先测试版本。
本文链接:https://yuchubao.com/chatgptxiazai/42.html
GPT-4oGPT4ogpt-4o检测人的情绪gpt-4o多模态大模型发布GPT-4o免费GPT-4o官网GPT4o官网
网友评论