中國西藏網(wǎng) > 即時(shí)新聞 > 博覽

ChatGPT通過美放射學(xué)委員會(huì)考試

劉霞 發(fā)布時(shí)間:2023-05-18 09:09:00來源: 科技日?qǐng)?bào)

  科技日?qǐng)?bào)北京5月17日電 (記者劉霞)加拿大科學(xué)家在16日出版的《放射學(xué)》雜志上刊登新論文稱,最新版本的ChatGPT通過了美國放射學(xué)委員會(huì)的考試,突出了大型語言模型的潛力,但它也給出了一些錯(cuò)誤答案,表明人們?nèi)孕鑼?duì)其提供的答案進(jìn)行核查。

  為評(píng)估ChatGPT在美國放射學(xué)委員會(huì)考試問題上的表現(xiàn)并探索其優(yōu)勢(shì)和局限性,多倫多大學(xué)研究人員首先測(cè)試了基于GPT-3.5的ChatGPT的表現(xiàn)。研究團(tuán)隊(duì)使用了150道選擇題,這些選擇題與加拿大皇家學(xué)院和美國放射學(xué)委員會(huì)考試的風(fēng)格、內(nèi)容和難度相當(dāng)。這些問題不包括圖像,分為低階(知識(shí)回憶、基本理解)和高階(應(yīng)用、分析、綜合)思維問題。高階思維問題可進(jìn)一步細(xì)分為影像學(xué)表現(xiàn)描述、臨床管理、計(jì)算和分類、疾病關(guān)聯(lián)。

  研究人員發(fā)現(xiàn),基于GPT-3.5的ChatGPT的正確率為69%,接近70%的及格線。該模型在低階思維問題上表現(xiàn)相對(duì)較好,正確率為84%,但回答高級(jí)思維問題時(shí)表現(xiàn)不佳,正確率僅為60%。而性能更優(yōu)異的GPT-4的正確率為81%,且在高階思維問題上的正確率為81%,遠(yuǎn)好于GPT-3.5。但GPT-4在低階思維問題上的正確率僅為80%,答錯(cuò)了12道題,而GPT-3.5全部答對(duì)了這些題目,這引發(fā)了研究團(tuán)隊(duì)對(duì)GPT-4收集信息的可靠性的擔(dān)憂。

  這兩項(xiàng)研究都表明,ChatGPT會(huì)有提供不正確答案的傾向,如果僅僅依靠它獲取信息,非常危險(xiǎn),因?yàn)槿藗兛赡芤庾R(shí)不到其給出的答案是不準(zhǔn)確的,這是它目前面臨的最大的問題。(來源:科技日?qǐng)?bào))

(責(zé)編: 王東)

版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責(zé)任。

无码h黄动漫在线播放网站| 五月婷婷在线中文字幕观看| 天堂在线观看中文字幕| 18禁黄无码高潮喷水乱伦 | 国产免费无码一区二区| 无码福利写真片视频在线播放| 精品无码国产污污污免费网站国产 | 日韩av无码中文无码电影| 亚洲人成无码网WWW| 无码无遮挡又大又爽又黄的视频| 国产中文字幕乱人伦在线观看| 亚洲av无码不卡私人影院| 未满十八18禁止免费无码网站| 日韩精品无码一区二区三区AV| 2022中文字幕在线| 中文字幕人妻中文AV不卡专区 | 人妻丰满熟妞av无码区| 精品亚洲成在人线AV无码| 久久中文精品无码中文字幕| 欧美 亚洲 日韩 中文2019| 国产精品无码一区二区在线观一| 亚洲成a人片在线观看无码专区| 无码成人精品区在线观看| 亚洲电影中文字幕| 日韩高清在线中文字带字幕| 精品久久久中文字幕人妻| 亚洲v国产v天堂a无码久久| 无码日韩人妻AV一区免费l| 精品久久久久久无码中文字幕 | 精品无码一级毛片免费视频观看| 人妻无码一区二区三区AV| 无码一区二区三区老色鬼| 无码人妻精品中文字幕| 欧洲成人午夜精品无码区久久| 无码国产精成人午夜视频一区二区| av无码人妻一区二区三区牛牛| 国产成人综合日韩精品无码不卡 | 无码av免费一区二区三区| 无码国内精品人妻少妇蜜桃视频| 亚洲精品无码成人片久久| 亚洲国产精品无码成人片久久|