Hastaların Spinal Musküler Atrofi Hakkındaki Soruları: Genetik Açıdan Büyük Dil Modellerinin Performansı
PDF
Atıf
Paylaş
Talep
Özgün Araştırma
CİLT: 37 SAYI: 2
P: 230 - 237
Nisan 2026

Hastaların Spinal Musküler Atrofi Hakkındaki Soruları: Genetik Açıdan Büyük Dil Modellerinin Performansı

Gazi Med J 2026;37(2):230-237
Bilgi mevcut değil.
Bilgi mevcut değil
Alındığı Tarih: 15.01.2026
Kabul Tarihi: 01.03.2026
Online Tarih: 31.03.2026
Yayın Tarihi: 31.03.2026
PDF
Atıf
Paylaş
Talep

ÖZ

Amaç

Büyük dil modelleri (LLM’ler), tıbbi ve genetik bilgiye erişim amacıyla toplum tarafından giderek daha fazla kullanılmaktadır. Spinal musküler atrofi (SMA) hastalığının anlaması zorlayıcı genetik terimleri ve halk sağlığı açısından önemi göz önüne alındığında, bu çalışmada LLM’ler tarafından üretilen SMA ile ilişkili sıkça sorulan sorulara (SSS) verilen yanıtların kalite, okunabilirlik ve uygulanabilirlik açısından değerlendirilmesi amaçlanmıştır.

Yöntemler

Google’ın “People Also Ask” özelliği kullanılarak 15 adet SMA ile ilişkili Türkçe SSS belirlenmiş ve bu sorular hastalığın tanımı, genetik tarama testleri ve genetik tanı ile tedavi olmak üzere üç başlık altında sınıflandırılmıştır. Her bir soru, ChatGPT, Gemini ve DeepSeek’in ücretsiz sürümleri kullanılarak sırayla sorulmuştur. Yanıtlar; bilgi kalitesi için modifiye DISCERN aracı ve 5 puanlı Likert ölçeği, okunabilirlik için Flesch–Kincaid Okunabilirlik Düzeyi ve Sınıf Seviyesi, anlaşılabilirlik ve uygulanabilirlik için ise Hasta Eğitim Materyalleri Değerlendirme Aracı (PEMAT) kullanılarak değerlendirilmiştir.

Bulgular

Tüm LLM’lerde ortanca DISCERN puanı 3,00 olarak saptanmış ve bu değer orta düzeyde bilgi kalitesine işaret etmiş olup modeller arasında anlamlı fark izlenmemiştir (p = 0,069). Okunabilirlik açısından anlamlı farklılıklar saptanmış ve ChatGPT’nin Gemini ve DeepSeek’e kıyasla daha düşük Flesch–Kincaid Sınıf Seviyesi ile yanıtlar ürettiği görülmüştür (p = 0,001). PEMAT anlaşılabilirlik ve uygulanabilirlik puanları soru kategorilerine göre farklılık göstermiş; özellikle hastalık tanımı ve genetik tarama sorularında anlamlı farklar saptanmıştır (p < 0,05).

Sonuç

LLM’ler SMA ile ilişkili bilgileri orta düzeyde kalite ve anlaşılabilirlik ile sunabilmektedir; ancak okunabilirlik, uygulanabilirlik ve konuya özgü performanstaki değişkenlik, bu yanıtların genetik danışmada tek başına kullanımını sınırlamaktadır. LLM’ler tarafından üretilen içerikler tamamlayıcı bir eğitim kaynağı olarak değerlendirilebilir; ancak bireyselleştirilmiş risk değerlendirmesi ve karar verme süreçleri gerektiren durumlarda klinisyen tarafından yürütülen genetik danışmanın yerini almamalıdır.

Anahtar Kelimeler:
Spinal musküler atrofi, genetik danışma, yapay zeka, sağlık bilgisi kalitesi, büyük dil modelleri, hasta eğitimi

Kaynaklar

1
Keinath MC, Prior DE, Prior TW. Spinal Muscular Atrophy: Mutations, Testing, and Clinical Relevance. Appl Clin Genet. 2021; 14: 11-25.
2
Prior TW. Carrier screening for spinal muscular atrophy. Genet Med. 2008; 10: 840-2.
3
Verhaart IEC, Robertson A, Wilson IJ, Aartsma-Rus A, Cameron S, Jones CC, et al. Prevalence, incidence and carrier frequency of 5q-linked spinal muscular atrophy - a literature review. Orphanet J Rare Dis. 2017; 12: 124.
4
Cooper K, Nalbant G, Sutton A, Harnan S, Thokala P, Chilcott J, et al. Systematic review of presymptomatic treatment for spinal muscular atrophy. Int J Neonatal Screen. 2024; 10: 56
5
Prior TW, Leach ME, Finanger EL. Spinal muscular atrophy. In: Adam MP, Bick S, Mirzaa GM, et al., editors. GeneReviews® [Internet]. Seattle (WA): University of Washington, Seattle; 1993-. 2000 Feb 24 [updated 2026 Feb 12]. Available from: https://www.ncbi.nlm.nih.gov/books/NBK1352/
6
Milligan JN, Blasco-Pérez L, Costa-Roger M, Codina-Solà M, Tizzano EF. Recommendations for interpreting and reporting silent carrier and disease-modifying variants in SMA testing workflows. Genes (Basel). 2022; 13: 1657.
7
Shahsavar Y, Choudhury A. User intentions to use ChatGPT for self- diagnosis and health-related purposes: cross-sectional survey study. JMIR Hum Factors. 2023; 10: e47564.
8
Kamatani Y, Kaname T. Artificial intelligence in medical genomics. J Hum Genet. 2024; 69: 475.
9
Yun HS, Bickmore T. Online health information-seeking in the era of large language models: cross-sectional web-based survey study. J Med Internet Res. 2025; 27: e68560.
10
Ayik G, Kolac UC, Aksoy T, Yilmaz A, Sili MV, Tokgozoglu M, et al. Exploring the role of artificial intelligence in Turkish orthopedic progression exams. Acta Orthop Traumatol Turc. 2025; 59: 18-26.
11
Kolac UC, Karademir OM, Ayik G, Kaymakoglu M, Familiari F, Huri G. Can popular AI large language models provide reliable answers to frequently asked questions about rotator cuff tears? JSES Int. 2025; 9: 390-7.
12
Mehmet S, et al. Comparative evaluation of large language models in addressing autism-related information queries: insights from ChatGPT, Gemini, and Copilot. Gazi Med J. 2025; 36: 407-16.
13
Volk SC, Schäfer MS, Lombardi D, Mahl D, Yan X. How generative artificial intelligence portrays science: Interviewing ChatGPT from the perspective of different audience segments. Public Underst Sci. 2025; 34: 132-53.
14
Küçüksabanoğlu ZK. Yapay Zeka Politikaları Derneği (AIPA) Gelecek Araştırması: Toplumda yapay zeka algısı. Yapay Zeka Politikaları Derneği (AIPA); 2025. Available from: https://aipaturkey.org/media/pdfs/YapayZeka_AlgiArastirmasi_2025_Toplum.pdf
15
Likert R. A technique for the measurement of attitudes. Arch Psychol. 1932;140:1-55. Available from: https://legacy.voteview.com/pdf/Likert_1932.pdf
16
Charnock D, Shepperd S, Needham G, Gann R. DISCERN: an instrument for judging the quality of written consumer health information on treatment choices. J Epidemiol Community Health. 1999; 53: 105-11.
17
Kincaid JP, Fishburne RP Jr, Rogers RL, Chissom BS. Derivation of new readability formulas: automated Readability Index, Fog Count and Flesch Reading Ease Formula for Navy enlisted personnel. Millington (TN): Naval Technical Training Command, Research Branch; 1975 Feb. Available from: https://stars.library.ucf.edu/istlibrary/56/.
18
Shoemaker SJ, Wolf MS, Brach C. Development of the Patient Education Materials Assessment Tool (PEMAT): a new measure of understandability and actionability for print and audiovisual patient information. Patient Educ Couns. 2014. 96: 395-403.
19
Jeon S, Lee SA, Chung HS, Yun JY, Park EA, So MK, et al. Evaluating the use of generative artificial intelligence to support genetic counseling for rare diseases. Diagnostics (Basel). 2025; 15: 672.
20
Ahimaz P, Bergner AL, Florido ME, Harkavy N, Bhattacharyya S. Genetic counselors’ utilization of ChatGPT in professional practice: a cross-sectional study. Am J Med Genet A. 2024; 194: e63493.
21
Brett GR, Ward A, Bouffler SE, Palmer EE, Boggs K, Lynch F, et al. Co-design, implementation, and evaluation of plain language genomic test reports. NPJ Genom Med. 2022; 7: 61.
22
Farmer GD, Gray H, Chandratillake G, Raymond FL, Freeman ALJ. Recommendations for designing genetic test reports to be understood by patients and non-specialists. Eur J Hum Genet. 2020; 28: 885-95.
23
Haga SB, Mills R, Pollak KI, Rehder C, Buchanan AH, Lipkus IM, et al. Developing patient-friendly genetic and genomic test reports: formats to promote patient engagement and understanding. Genome Med. 2014; 6: 58.
24
Coen E, Del Fiol G, Kaphingst KA, Borsato E, Shannon J, Smith H, et al. Chatbot for the return of positive genetic screening results for hereditary cancer syndromes: prompt engineering project. JMIR Cancer. 2025; 11: e65848.
25
Meekins-Doherty L, Dive L, McEwen A, Sexton A. Generative AI and the profession of genetic counseling. J Genet Couns. 2025; 34: e2009.
26
Tıbbi Genetik Derneği. Spinal Musküler Atrofi El Kitabı [Internet]. Ankara: Tıbbi Genetik Derneği; 2024. 20 p. Available from: https://yonetim.citius.technology/files/kurum/kurum75/menu/spinal-muskuler-atrofi-el-kitabi--bitmis-hali-15x23-olacak---1-.pdf