谷歌生成式大模型Gemini Pro使用简单体验

Destiny

文章	评论	标签
10	2	0

最近谷歌发布了Gemini Pro，国内自媒体也是开启了吹嘘模式：

~~（下次先把C和G分清了再写）~~

博主最近正好在复习概率论，作为生成式AI的重度使用用户，就用简单的概率论问题来测了测能力。

设事件A在每次试验中发生的概率为0.3，当A发生不少于3次时，指示灯发出信号，求进行了5次独立试验，指示灯发出信号的概率。

Gemini Pro的结果：

这题就是一道简单的二项分布问题，乍一看没啥问题，Gemini的思路也没啥问题（虽然没必要用对立事件），但是仔细一看....

算数算错了！

P(X = 1) = 5 * (0.3)^1 * (0.7)^4 = 0.37823

正确的结果应该等于0.3087...典型的GPT-3时代的能力缺陷

至于是怎么算成这样的， ~~咱也不敢问，咱也不知道~~

顺便附上一个国内的生成式大模型moonshot-v1-8k的结果，这也是我目前最喜欢和最好评的国内大模型，轻松搞定。

用了一段时间Gemini Pro，还是转回了GPT-4-Turbo，差距不是一点点，有时候连GPT-3.5都比不过...