<bdo id="4awyc"><del id="4awyc"></del></bdo>
  • <s id="4awyc"></s>
  • <tfoot id="4awyc"><small id="4awyc"></small></tfoot>
    <s id="4awyc"><acronym id="4awyc"></acronym></s>
  • <center id="4awyc"></center>
    <s id="4awyc"><acronym id="4awyc"></acronym></s>

    ChatGPT通過美放射學委員會考試

    2023-05-18 07:51:32 來源: 科技日報


    【資料圖】

    科技日報北京5月17日電 (記者劉霞)加拿大科學家在16日出版的《放射學》雜志上刊登新論文稱,最新版本的ChatGPT通過了美國放射學委員會的考試,突出了大型語言模型的潛力,但它也給出了一些錯誤答案,表明人們?nèi)孕鑼ζ涮峁┑拇鸢高M行核查。

    為評估ChatGPT在美國放射學委員會考試問題上的表現(xiàn)并探索其優(yōu)勢和局限性,多倫多大學研究人員首先測試了基于GPT-3.5的ChatGPT的表現(xiàn)。研究團隊使用了150道選擇題,這些選擇題與加拿大皇家學院和美國放射學委員會考試的風格、內(nèi)容和難度相當。這些問題不包括圖像,分為低階(知識回憶、基本理解)和高階(應用、分析、綜合)思維問題。高階思維問題可進一步細分為影像學表現(xiàn)描述、臨床管理、計算和分類、疾病關聯(lián)。

    研究人員發(fā)現(xiàn),基于GPT-3.5的ChatGPT的正確率為69%,接近70%的及格線。該模型在低階思維問題上表現(xiàn)相對較好,正確率為84%,但回答高級思維問題時表現(xiàn)不佳,正確率僅為60%。而性能更優(yōu)異的GPT-4的正確率為81%,且在高階思維問題上的正確率為81%,遠好于GPT-3.5。但GPT-4在低階思維問題上的正確率僅為80%,答錯了12道題,而GPT-3.5全部答對了這些題目,這引發(fā)了研究團隊對GPT-4收集信息的可靠性的擔憂。

    這兩項研究都表明,ChatGPT會有提供不正確答案的傾向,如果僅僅依靠它獲取信息,非常危險,因為人們可能意識不到其給出的答案是不準確的,這是它目前面臨的最大的問題。(來源:科技日報)

    標簽:

    相關熱詞搜索:

    [責任編輯:]

    相關閱讀

    最近更新

    日日噜噜夜夜狠狠扒开双腿,欧美视频在线第一页,伦理草民看一天宅急看,超清国产粉嫩456在线免播放
    <bdo id="4awyc"><del id="4awyc"></del></bdo>
  • <s id="4awyc"></s>
  • <tfoot id="4awyc"><small id="4awyc"></small></tfoot>
    <s id="4awyc"><acronym id="4awyc"></acronym></s>
  • <center id="4awyc"></center>
    <s id="4awyc"><acronym id="4awyc"></acronym></s>
    主站蜘蛛池模板: 手机福利视频一区二区| 国产区精品一区二区不卡中文| 国产乱人伦Av在线无码| 亚洲精选在线观看| 人人澡人人透人人爽| 久久综合色婷婷| www夜插内射视频网站| 国产亚洲sss在线播放| 精品国产av一二三四区| 老熟妇仑乱一区二区视頻| 欧美成人猛男性色生活| 成人亚洲网站www在线观看| 国产激情电影综合在线看| 免费看日b视频| 久久无码人妻一区二区三区| 99久在线精品99re6视频| 色综合久久综合中文小说| 欧美精品亚洲精品日韩专区| 性色欲情网站iwww| 国产人妖ts在线观看免费视频| 亚洲国产成人精品无码区在线观看 | 被女同桌调教成鞋袜奴脚奴| 欧美人与禽交另类视频| 天天干天天爽天天射| 国产av人人夜夜澡人人爽麻豆| 亚洲一级片免费看| 99re热这里只有精品视频 | 欧美人与动人物姣配xxxx| 在线观看亚洲av每日更新| 变态调教视频国产九色| 久久免费视频网站| 亚洲伊人tv综合网色| 熟妇人妻不卡中文字幕| 成年私人影院免费视频网站| 国产又大又粗又长免费视频| 久久久久久久久久国产精品免费| 亚洲xxxx18| 欧美大香a蕉免费| 国产超碰人人爽人人做人人添| 免费看又黄又无码的网站| 99久久精品免费看国产|