Tıp Literatüründe Yapay Zeka Krizi: Sahte Referanslar Patlama Yaptı

15 Mayıs 2026

3 dk dk okuma süresi

CITADEL Doğrulama Sistemi, PubMed Central Analizi, Sahte Referans Tespiti, Tıbbi Literatür Bütünlüğü, Yapay Zeka Halüsinasyonu

Tıp Literatüründe Yapay Zeka Krizi: Sahte Referanslar Patlama Yaptı

Columbia Üniversitesi’nde yapay zeka (AI) araştırmacısı olarak görev yapan Maxim Topaz, prestijli bir bilimsel dergiye makale gönderdiğinde sürecin rutin işleyeceğini düşünüyordu. Ancak editoryal ekipten gelen bir e-posta, tüm bilim dünyasını sarsacak bir gerçeğin kapısını araladı. E-postada, makaledeki referanslardan birinin doğruluğu sorgulanıyordu. Topaz kısa süre içinde acı gerçekle yüzleşti: Makalesini hazırlarken destek aldığı yapay zeka aracı, tamamen hayal ürünü olan sahte bir referans üretmişti.

Herkesin Başına Gelebilir

Topaz, bu kişisel aydınlanmasını şu sözlerle özetliyor:

“Eğer bu durum her gün yapay zeka ile çalışan birinin bile başına gelebiliyorsa, inanın herkesin başına gelebilir.”

Bu olay, Topaz’ı sorunun boyutlarını araştırmaya itti. Ekibiyle birlikte, hatalı literatürü tespit etmek için özel olarak tasarlanmış CITADEL (Citation Integrity Testing and Detection of Erroneous Literature) adını verdikleri otomatik bir doğrulama sistemi geliştirdiler. Geliştirilen bu yazılım ile PubMed Central veri tabanındaki tam 2.5 milyon biyomedikal makale mercek altına alındı.

Sahte Referanslarda Korkutucu Yükseliş Eğilimi

The Lancet dergisinde yayımlanan araştırma sonuçları, tıp literatüründe sessizce büyüyen bir metastazı gözler önüne seriyor. Büyük Dil Modellerinin (LLM) bilimsel yazım süreçlerine entegre olmasıyla birlikte, makalelerde “halüsinasyon” olarak adlandırılan ve gerçekte var olmayan çalışmalara yapılan atıfların sayısında muazzam bir artış yaşandı.

CITADEL sistemi kullanılarak 1 Ocak 2023 ile 18 Şubat 2026 tarihleri arasını kapsayan devasa veri seti analiz edildi. Taranan 2.5 milyon makaledeki 125.6 milyon referans, dijital nesne tanımlayıcıları (DOI) ve PubMed ID’leri üzerinden çapraz kontrole tabi tutuldu. Google Scholar, CrossRef ve OpenAlex gibi küresel veri tabanlarında karşılığı olmayan referanslar “sahte” olarak etiketlendi.

2023 yılında, her 2.828 makaleden birinde sahte bir referans bulunuyordu.
2026’nın ilk haftalarına gelindiğinde ise bu oran şok edici bir şekilde her 277 makalede bire yükseldi.
Bir başka deyişle, 2023’te her 10.000 makalenin 4’ünde sahte atıf varken, 2026 başlarında bu rakam 10.000 makalede 56.9’a fırladı.

Toplamda 2.810 makaleye dağılmış, hiçbir zaman yazılmamış ve yayımlanmamış 4.046 sahte referans tespit edildi.

Klinik Uygulamalar ve Hasta Bakımı Tehlikede

Peki bu durum laboratuvar tezgahlarından çıkıp hasta yatağına nasıl yansıyor? Sorunun en kritik noktası, bu sahte referansların hangi tür makalelerde yoğunlaştığı. Araştırmacılar, tıbbi bilginin sentezlendiği ve klinik yönergelerin oluşturulmasında temel alınan derleme (review) makalelerinde sahte referans oranının diğer yayın türlerine göre çok daha yüksek olduğunu tespit etti.

Topaz, bu durumun yaratacağı domino etkisini şöyle açıklıyor:

“Derleme makaleleri, tıbbi bilginin sentez katmanı olarak hizmet eder. Eğer bu katman kirlenirse, bu kirlilik doğrudan klinik uygulamalara ve aşağı akışa (downstream) doğru yayılır. Bir hekim, bir kılavuzu takip ederken, altta yatan kanıtların bir kısmının aslında hiç var olmamış çalışmalara işaret ettiğini bilemez.”

Yayıncılar Seyirci Kalıyor: Fatura Kime Kesilecek?

Sidney Üniversitesi’nden kanser araştırmaları literatür araştırmacısı Jennifer Byrne, sorunun yapay zekaya duyulan aşırı güvenden kaynaklandığını vurguluyor. Ancak asıl skandal, tespit edilen 2.810 hatalı makalenin yüzde 98.4’ü hakkında yayıncılar tarafından hiçbir işlem yapılmamış olması.

Topaz ve Byrne, sorunun çözümünün ücretsiz çalışan ve halihazırda ağır bir iş yükü altında olan hakemlere (peer-reviewers) yıkılamayacağı konusunda hemfikir. Yayıncıların, hakem değerlendirme sürecinden önce referansları otomatik olarak doğrulayan sistemleri devreye sokması gerekiyor. Topaz, bu konudaki engelin teknolojik değil, tamamen kurumsal olduğunu belirtiyor.

Sektör İçin Acil Çözüm Önerileri

Yayıncılar, makale kabul süreçlerine AI tabanlı referans doğrulama araçlarını entegre etmelidir.
İndeksleme servisleri, makale kayıtlarına “bütünlük meta verileri (integrity metadata)” ekleyerek kullanıcıların güvenilirliği tartmasına olanak tanımalıdır.
Araştırma bütünlüğü veri tabanlarında “Üretilmiş/Sahte Referans” yepyeni ve ayrı bir kategori olarak resmen tanınmalıdır.

Bilimsel literatürün güvenilirliği, modern tıbbın üzerine inşa edildiği en temel kolondur. Yapay zekanın sunduğu kolaylıklar, bilimin kendi kendini doğrulama mekanizmasını çökertmeden önce, yayın dünyasının teknolojik bir savunma hattı kurması artık bir tercih değil, zorunluluktur.

Editör Yorumu!

Tıp ve biyobilim literatüründe yaşanan bu yapay zeka kaynaklı kirlenme, Türkiye laboratuvar ve klinik araştırma ekosistemi için doğrudan bir ulusal güvenlik ve halk sağlığı meselesi olarak okunmalıdır. Türkiye'de akademik teşvik sistemleri ve doçentlik kriterlerinin yarattığı yoğun 'yayın yapma baskısı' (publish or perish), araştırmacıları süreci hızlandıran büyük dil modellerine (ChatGPT, Claude vb.) yöneltiyor. Bu durum, TR Dizin ve TÜBİTAK ULAKBİM gibi yerel indeksleme servislerimizin acilen 'Yapay Zeka ve Atıf Bütünlüğü' denetim araçlarını sistemlerine entegre etmelerini zorunlu kılmaktadır. Sağlık Bakanlığı'nın tedavi algoritmalarını belirlerken referans aldığı uluslararası derlemelerin 'hayalet makaleler' içerme ihtimali, klinisyenlerimiz için ciddi bir malpraktis (tıbbi hata) riski doğurmaktadır. Türkiye'deki üniversitelerin etik kurulları ve akademik dergi editörleri, makale kabul süreçlerinde sadece intihal (Turnitin/iThenticate) kontrolü yapmakla kalmamalı, aynı zamanda referansların gerçekliğini doğrulayan API destekli yeni nesil yazılımlara bütçe ayırmalıdır. Aksi takdirde, var olmayan verilere dayanan yerel araştırma projeleri için milyonlarca liralık kamu kaynağının boşa harcanması işten bile değildir.

Büyük Dil Modelleri (LLM), bazen 'halüsinasyon' adı verilen bir durum yaşayarak, metnin akışını tamamlamak amacıyla gerçekte hiç var olmayan, yazılmamış ve dijital nesne tanımlayıcısı (DOI) veya PubMed ID'si bulunmayan hayal ürünü bilimsel atıflar uydurabilmektedir.

CITADEL (Citation Integrity Testing and Detection of Erroneous Literature), literatürdeki hataları ve sahte referansları tespit etmek için özel olarak tasarlanmış otomatik bir doğrulama sistemidir. Makalelerdeki referansları Google Scholar, CrossRef ve OpenAlex gibi küresel veri tabanlarındaki kayıtlarla çapraz kontrole tabi tutarak doğruluğunu saptar.

Sahte referansların özellikle tıbbi bilginin sentezlendiği derleme (review) makalelerinde yoğunlaşması büyük bir risktir. Hekimler ve sağlık otoriteleri klinik yönergeleri ve tedavi algoritmalarını bu makalelere dayanarak oluşturur. Olmayan çalışmalara dayanan yönergeler, doğrudan hasta bakımını etkileyen ciddi malpraktis (tıbbi hata) riskleri doğurur.

Tıp Literatüründe Yapay Zeka Krizi: Sahte Referanslar Patlama Yaptı

Herkesin Başına Gelebilir

Sahte Referanslarda Korkutucu Yükseliş Eğilimi

Klinik Uygulamalar ve Hasta Bakımı Tehlikede

Yayıncılar Seyirci Kalıyor: Fatura Kime Kesilecek?

Sektör İçin Acil Çözüm Önerileri

Editör Yorumu!

Bülten Aboneliği

Sosyal Medyada Paylaşın

Tıp Literatüründe Yapay Zeka Krizi: Sahte Referanslar Patlama Yaptı

Herkesin Başına Gelebilir

Sahte Referanslarda Korkutucu Yükseliş Eğilimi

Klinik Uygulamalar ve Hasta Bakımı Tehlikede

Yayıncılar Seyirci Kalıyor: Fatura Kime Kesilecek?

Sektör İçin Acil Çözüm Önerileri

Editör Yorumu!

Yapay zeka bilimsel makalelerde nasıl 'sahte referans' üretiyor?

CITADEL sistemi nedir ve araştırma bütünlüğü için nasıl çalışır?

Tıbbi literatürdeki sahte atıflar hasta bakımını ve klinik uygulamaları nasıl tehdit ediyor?

Bülten Aboneliği

Sosyal Medyada Paylaşın