互聯(lián)網(wǎng)晚報 | 李佳琦方回應(yīng)直播間賣假和田玉傳聞;特朗普遭刺殺后支持率未顯著領(lǐng)先;多家大模型測不出9.11和9.9哪個大
共 7470字,需瀏覽 15分鐘
·
2024-07-18 13:24
大部分大模型在問答中都錯誤地比較了小數(shù)點后的數(shù)字,認為9.11大于9.9,考慮到數(shù)字涉及的語境問題,記者將其限定為在數(shù)學(xué)語境下,如ChatGPT這樣的大模型也照樣答錯。在這背后,大模型數(shù)學(xué)能力較差是長期存在的問題,有行業(yè)人士認為,生成式的語言模型從設(shè)計上就更像文字思維而不是數(shù)字思維。不過,針對性地語料訓(xùn)練或許能在未來逐步提升模型的理科能力。(第一財經(jīng)日報)
評論
圖片
表情
