初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

2023-07-14 216 其它文章

“我用几个模型计算得到的结果都不一样……”

7月14日,一位群友使用AI帮助计算一道数学题:高为11cm,上底直径为7.8cm,下底直径为6.2cm的圆台的容积为多少毫升?

这位网友使用了Claude-2、GPT-4、ChatGPT,得出的结果分别是:3634.57毫升、359.4毫升、469.3毫升。

另一位群友用文心一言得出的结果是64474.666666666635毫升。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

“初中题不会了”,“好家伙,各不相同”群友们七嘴八舌地评价。

我也好奇地使用ChatGPT测试了一下,得出的结果是1436.08毫升。

ChatGPT给出的计算步骤是完全正确的,圆台的容积公式=πh*(R^2+r^2+R*r)/3。

然而计算的结果是错误的。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

我让ChatGPT再次回答,得出的结果是513.47毫升。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

就离谱,计算步骤完全正确,最后的结果竟然每次都不一样。

我又使用了百度浏览器自带的“AI”,这是由文心一言支持的大模型。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

第一次得出的结果是:193522.10746113118毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

这错的太离谱了,我又问了一下得出的结果是:1168.75毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

还是不对,我又问了一下,结果是:1099620毫升

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

再三追问下,百度AI不装了,彻底摆烂了。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

此前报道,GPT-4在MIT的数学本科学位考试中拿下满分,后来被曝出测试数据集的很大一部分被污染了。也就是说,模型就像一个学生在考试前被告知了答案,这是赤裸裸的「作弊」。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

此前还有报道,ChatGPT在参加中国高考数学考试中翻车‌。

初中题都不会了,ChatGPT、文心一言、Claude露出鸡脚了?

大模型无疑是最近被追捧的技术,然而频出的翻车案例,似乎如此前物理学者、科普作家张天蓉所说,语言模型本质是概率论的胜利‌,通俗的意思就是一个会“文字接龙”的机器,变换器对输入进行一个合理的延续,闹出一本正经地胡说八道的笑话也就不难理解了。

若大模型是概率论的胜利,那么人工智能觉醒还远未到来。

币币情登载此文出于传递更多信息之目的,并不意味着赞同其观点或证实其描述。文章内容仅供参考,不构成投资建议。投资者据此操作,风险自担。

交易平台最新公告查看更多>
成交额排行榜
  • 交易所
  • 币种
排名 交易所 成交额
1 币安网币安网 ¥5,264.95亿
2 欧易OKX欧易OKX ¥1,941.83亿
3 火币全球站火币全球站 ¥165.84亿
4 抹茶抹茶 ¥366.98亿
5 芝麻开门芝麻开门 ¥378.95亿
6 库币库币 ¥181.32亿
7 Coinbase ProCoinbase Pro ¥183.75亿
8 bitFlyerbitFlyer ¥7.80亿
9 BitMEXBitMEX ¥0
10 BitstampBitstamp ¥22.50亿