Yeni bir araştırma, ChatGPT’nin sağlık tavsiyesi verirken bazı yüksek riskli acil durumları tespit etmekte zorlanabildiğini ortaya koydu. Çalışmaya göre sistem, doktorların acil müdahale gerektiğini belirttiği vakaların yarısından fazlasında yeterince güçlü bir uyarı vermedi.
Yapay zekâ sohbet botları, sağlıkla ilgili sorular için en sık başvurulan araçlardan biri hâline geldi. OpenAI, bu kullanımın yaygınlaşması nedeniyle yılın başlarında sağlık ve iyi oluş konularında destek sağlamayı amaçlayan “ChatGPT Health” adlı yeni bir araç tanıtmıştı. Şirket, bu aracın hâlihazırda milyonlarca kişi tarafından kullanıldığını belirtiyor.
Ancak yeni araştırma, sistemin bazı kritik acil durumları gözden kaçırabileceğini ve bir kişinin acil tıbbi müdahaleye ihtiyaç duyup duymadığını her zaman güvenilir biçimde belirleyemeyebileceğini gösteriyor.
Uzmanlardan uyarı
Araştırmaya dahil olmayan Harvard Tıp Fakültesi’nden Isaac S. Kohane, büyük dil modellerinin giderek hastaların tıbbi tavsiye almak için ilk başvurduğu kaynaklardan biri hâline geldiğini söyledi. Kohane, 2026 yılı itibarıyla bu sistemlerin özellikle acil durumların değerlendirilmesi gibi kritik noktalarda henüz tamamen güvenilir olmadığını vurguladı.
Kohane ayrıca, milyonlarca kişinin acil servise gitmesi gerekip gerekmediğini anlamak için yapay zekâ sistemlerine başvurduğunu belirterek, bu tür teknolojilerin düzenli ve bağımsız değerlendirmelerden geçirilmesi gerektiğini ifade etti.
Araştırma Nature Medicine’da yayımlandı
Mount Sinai’deki Icahn Tıp Fakültesi tarafından yürütülen çalışma, sistemin güvenliğinin değerlendirilmesi amacıyla hızlandırılmış bir süreçle gerçekleştirildi ve Nature Medicine dergisinde yayımlandı.
Araştırmacılar, ChatGPT gibi sistemlerin bazı durumlarda yaşam ve ölümle ilgili kararlar için bile kullanılabildiğini, ancak bu konuda yapılan bilimsel çalışmaların henüz sınırlı olduğunu belirtti. Bu durum da araştırmanın yapılmasının başlıca nedenlerinden biri oldu.
Çalışmanın baş yazarı ve ürolog Ashwin Ramaswamy, araştırmanın temel sorusunu şu sözlerle açıkladı:
“Bir kişi gerçek bir tıbbi acil durum yaşadığında ve yardım için ChatGPT Health’e başvurduğunda, sistem ona açık bir şekilde acil servise gitmesi gerektiğini söylüyor mu?”
Araştırmanın sonuçları, bu uyarının her zaman verilmediğini ve sistemin güvenilirliğinin bu açıdan tartışılması gerektiğini ortaya koydu.
Risk arttıkça uyarı olasılığı azalabiliyor
Çalışmada ayrıca sistemin uyarı mekanizmasının bazı durumlarda beklenmedik şekilde çalıştığı görüldü. Bulgulara göre, kişinin kendine zarar verme riski arttıkça sistemin uyarı verme olasılığının azalabildiği tespit edildi. Araştırmacılar bu sonucu “özellikle endişe verici” olarak değerlendirdi.
60 farklı senaryo test edildi
Araştırma kapsamında doktorlar, 21 farklı tıp uzmanlık alanını kapsayan toplam 60 senaryo hazırladı. Bu senaryolar; evde tedavi edilebilecek düşük riskli durumlardan, acil müdahale gerektiren ciddi vakalara kadar farklı örnekler içeriyordu. Ayrıca testlerde ırk ve cinsiyet gibi 16 farklı bağlamsal değişken de dikkate alındı.
Sonuçlara göre sistem, açık ve belirgin acil durumları çoğunlukla doğru şekilde tanımlayabildi. Ancak doktorların acil servise başvurulmasını gerekli gördüğü vakaların yarısından fazlasında yeterince güçlü bir yönlendirme yapmadı.
Araştırmacılar, ChatGPT’nin “ders kitaplarında yer alan tipik acil durumları” tanımada başarılı olduğunu; ancak belirtilerin daha dolaylı veya daha belirsiz olduğu vakalarda daha zayıf kaldığını belirtti.
Kaynak: Yapay zekaya sağlık danışmak riskli olabilir: ChatGPT bazı acil durumları gözden kaçırabiliyor
Fotoğraf Kaynak:Yapay zekaya sağlık danışmak riskli olabilir: ChatGPT bazı acil durumları gözden kaçırabiliyor
Haber Giriş: 08.03.2026 21:03
