PTT評價

[爆卦] ChatGPT疾病診斷準確率超越人類醫生

看板Gossiping標題[爆卦] ChatGPT疾病診斷準確率超越人類醫生作者
jackliao1990
(j)
時間推噓 4 推:8 噓:4 →:22

https://jamanetwork.com/journals/jamanetworkopen/fullarticle/2825395

研究團隊隨機從史丹佛大學、維吉尼亞大學等機構招募了50名醫生,其中包括44名內科醫生、5名急診醫生和1名家庭醫生,總共26名主治醫師和24名住院醫生。研究團隊接著再從90年代以來的105個經典病例中進行了選擇和改編。所有病例均來自真實病人但最終診斷結果從未公開,這樣醫生和ChatGPT都無法預先知曉答案。4位專業醫師選出6個最終入選病例給受試者一個小時做判斷。

研究團隊使用提示工程框架,迭代開發了一個最優的0樣本提示,其中包含了任務細節、背景、指示等關鍵要素,且每個病例使用相同提示。研究員會將優化後提示連同病例內容輸入ChatGPT,每個病例獨立運行三次。研究員不對ChatGPT的輸出做任何人工修改直接交給評分者一起盲評,評分者也不知道哪些結果由ChatGPT產生。

結果ChatGPT得到的診斷得分中位數高達92%,明顯高於人類醫生對照組,且p值為0.03,具有統計意義。需要注意的是,這些病例經過人類臨床醫生篩選和總結,已經對提取關鍵資訊。在實際臨床中,獲取資訊的過程更加複雜,因此實驗結果並不代表大模型能在臨床中取代人類。

--

※ PTT 留言評論
※ 發信站: 批踢踢實業坊(ptt.cc), 來自: 111.253.154.141 (臺灣)
PTT 網址

HodorDragon 11/18 19:05很正常啊 就是看症狀來篩選啊

Osmium 11/18 19:05正常發揮

orfan 11/18 19:06你是看哪一段得到你標題結論?????

※ 編輯: jackliao1990 (111.253.154.141 臺灣), 11/18/2024 19:06:58

guanluvsquat 11/18 19:06"在實際臨床中,獲取資訊的過程更加

guanluvsquat 11/18 19:06複雜,因此實驗結果並不代表大模型

guanluvsquat 11/18 19:06能在臨床中取代人類。"

mithralin 11/18 19:06這不是廢話嗎。這就像餵一堆棋譜給AI

mithralin 11/18 19:06跟人類,然後比較誰的下期走法勝率較

mithralin 11/18 19:07

bingripplw 11/18 19:07他的能力就來自於做出正確決定的人

bingripplw 11/18 19:07

mithralin 11/18 19:08現實生活上,你去跟醫生說頭痛,醫生

mithralin 11/18 19:08也要做很多檢查去觀察哪裡有毛病

Gallardo 11/18 19:08贏波波醫生也在吹喔?

adon0313 11/18 19:10難道你圍棋能贏電腦

theshape87 11/18 19:12奇怪,點進去的key point跟abstract

theshape87 11/18 19:12都不符合妳的標題論述耶,我覺得你的

theshape87 11/18 19:12標題過於武斷

y120196276 11/18 19:13因為餵給他的資訊是正確資訊吧?實際

y120196276 11/18 19:13上看醫生,一堆老人連自己怎樣不舒服

y120196276 11/18 19:13都說不清楚,他說頭痛,結果其實是肩

y120196276 11/18 19:13膀酸痛

baboosh 11/18 19:13GPT 的庫存病例肯定超過個人醫生經驗

adon0313 11/18 19:14初步判定 再給真人確認就省一堆人力了

glen3310 11/18 19:14ai可以幫助醫生更快篩選症狀

widec 11/18 19:14不只庫存病例多,它同時能聯想到的記憶也多

mnb1234 11/18 19:17醫生會要立法阻擋這一切

dayend 11/18 19:17這不希奇 光是知識資料庫 就比醫生強^^

paul10404 11/18 19:19給機器人看就好,有問題去告工程師

laser789 11/18 19:25內文無顯著差異 結論哪來的 台灣記者?

那是研究團隊做的另一個實驗 實驗組(有CHATGPT輔助的人類醫生)VS 對照組純人類診斷 結果顯示 人機合作的診斷成功率沒有比較好 結論:純CHATGPT診斷正確率>>人機合作診斷正確率=純人類診斷正確率

catwithptt 11/18 19:32這樣很好啊

matlab1106 11/18 19:39白癡 貴的是誰負責 以為都像妓者喔

※ 編輯: jackliao1990 (111.253.154.141 臺灣), 11/18/2024 19:46:45

darkMood 11/18 20:47不意外啊,因為chatGpt都人類知識都吸乾

darkMood 11/18 20:47了啊,已知知識上超越人類很正常啊