丐版圖靈測試難住大模型,一個問題區分人類和AI[人類和AI]?
最近,網上的一段圖靈測試吸引人們注意,僅僅是一個“終極丐版”的測試,就讓目前人們研究出的所有大語言模型都陷入困境,而人類可以毫不費力地通過這一測試,這就是大寫字母測試。經過了解,研究人員把一些大寫字母寫成的單詞,混到了數據庫里面讓大語言模型檢驗,結果<愛尬聊_健康養生>發現大語言模型并不能很好地識別這些問題并給出正確答案,而問題本身的內容十分簡單:is water wet or dry?對此如果是人類,可以直接回復一個wet,但是大語言模型一直給不出合理的答案。
![丐版圖靈測試難住大模型,一個問題區分人類和AI[人類和AI]? 丐版圖靈測試難住大模型,一個問題區分人類和AI[人類和AI]?](http://www.ytbyz.com/res/2023/06-06/12/50c322281634e9b5784f3a477606b027.jpg)
甚至是之前爆火的ChatGPT,回答的相關內容也始終沒到那個點上,可以明顯見到是大寫字母給搜索引擎帶來了干擾。在此之后,研究人員又將另外幾個開源的模型拿到這里測試,結果幾個模型的測試結果都一樣,不能剔除這一影響。
