最近谷歌发布了Gemini Pro,国内自媒体也是开启了吹嘘模式:
(下次先把C和G分清了再写)
博主最近正好在复习概率论,作为生成式AI的重度使用用户,就用简单的概率论问题来测了测能力。
设事件A在每次试验中发生的概率为0.3,当A发生不少于3次时,指示灯发出信号,求进行了5次独立试验,指示灯发出信号的概率。
这题就是一道简单的二项分布问题,乍一看没啥问题,Gemini的思路也没啥问题(虽然没必要用对立事件),但是仔细一看....
算数算错了!
P(X = 1) = 5 * (0.3)^1 * (0.7)^4 = 0.37823
正确的结果应该等于0.3087...典型的GPT-3时代的能力缺陷
至于是怎么算成这样的, 咱也不敢问,咱也不知道
顺便附上一个国内的生成式大模型moonshot-v1-8k的结果,这也是我目前最喜欢和最好评的国内大模型,轻松搞定。
总结
用了一段时间Gemini Pro,还是转回了GPT-4-Turbo,差距不是一点点,有时候连GPT-3.5都比不过...