ÖZ
Amaç
Büyük dil modelleri (LLM’ler), tıbbi ve genetik bilgiye erişim amacıyla toplum tarafından giderek daha fazla kullanılmaktadır. Spinal musküler atrofi (SMA) hastalığının anlaması zorlayıcı genetik terimleri ve halk sağlığı açısından önemi göz önüne alındığında, bu çalışmada LLM’ler tarafından üretilen SMA ile ilişkili sıkça sorulan sorulara (SSS) verilen yanıtların kalite, okunabilirlik ve uygulanabilirlik açısından değerlendirilmesi amaçlanmıştır.
Yöntemler
Google’ın “People Also Ask” özelliği kullanılarak 15 adet SMA ile ilişkili Türkçe SSS belirlenmiş ve bu sorular hastalığın tanımı, genetik tarama testleri ve genetik tanı ile tedavi olmak üzere üç başlık altında sınıflandırılmıştır. Her bir soru, ChatGPT, Gemini ve DeepSeek’in ücretsiz sürümleri kullanılarak sırayla sorulmuştur. Yanıtlar; bilgi kalitesi için modifiye DISCERN aracı ve 5 puanlı Likert ölçeği, okunabilirlik için Flesch–Kincaid Okunabilirlik Düzeyi ve Sınıf Seviyesi, anlaşılabilirlik ve uygulanabilirlik için ise Hasta Eğitim Materyalleri Değerlendirme Aracı (PEMAT) kullanılarak değerlendirilmiştir.
Bulgular
Tüm LLM’lerde ortanca DISCERN puanı 3,00 olarak saptanmış ve bu değer orta düzeyde bilgi kalitesine işaret etmiş olup modeller arasında anlamlı fark izlenmemiştir (p = 0,069). Okunabilirlik açısından anlamlı farklılıklar saptanmış ve ChatGPT’nin Gemini ve DeepSeek’e kıyasla daha düşük Flesch–Kincaid Sınıf Seviyesi ile yanıtlar ürettiği görülmüştür (p = 0,001). PEMAT anlaşılabilirlik ve uygulanabilirlik puanları soru kategorilerine göre farklılık göstermiş; özellikle hastalık tanımı ve genetik tarama sorularında anlamlı farklar saptanmıştır (p < 0,05).
Sonuç
LLM’ler SMA ile ilişkili bilgileri orta düzeyde kalite ve anlaşılabilirlik ile sunabilmektedir; ancak okunabilirlik, uygulanabilirlik ve konuya özgü performanstaki değişkenlik, bu yanıtların genetik danışmada tek başına kullanımını sınırlamaktadır. LLM’ler tarafından üretilen içerikler tamamlayıcı bir eğitim kaynağı olarak değerlendirilebilir; ancak bireyselleştirilmiş risk değerlendirmesi ve karar verme süreçleri gerektiren durumlarda klinisyen tarafından yürütülen genetik danışmanın yerini almamalıdır.
Anahtar Kelimeler:
Spinal musküler atrofi, genetik danışma, yapay zeka, sağlık bilgisi kalitesi, büyük dil modelleri, hasta eğitimi
Kaynaklar
1Keinath MC, Prior DE, Prior TW. Spinal Muscular Atrophy: Mutations, Testing, and Clinical Relevance. Appl Clin Genet. 2021; 14: 11-25.
2Prior TW. Carrier screening for spinal muscular atrophy. Genet Med. 2008; 10: 840-2.
3Verhaart IEC, Robertson A, Wilson IJ, Aartsma-Rus A, Cameron S, Jones CC, et al. Prevalence, incidence and carrier frequency of 5q-linked spinal muscular atrophy - a literature review. Orphanet J Rare Dis. 2017; 12: 124.
4Cooper K, Nalbant G, Sutton A, Harnan S, Thokala P, Chilcott J, et al. Systematic review of presymptomatic treatment for spinal muscular atrophy. Int J Neonatal Screen. 2024; 10: 56
5Prior TW, Leach ME, Finanger EL. Spinal muscular atrophy. In: Adam MP, Bick S, Mirzaa GM, et al., editors. GeneReviews® [Internet]. Seattle (WA): University of Washington, Seattle; 1993-. 2000 Feb 24 [updated 2026 Feb 12]. Available from: https://www.ncbi.nlm.nih.gov/books/NBK1352/
6Milligan JN, Blasco-Pérez L, Costa-Roger M, Codina-Solà M, Tizzano EF. Recommendations for interpreting and reporting silent carrier and disease-modifying variants in SMA testing workflows. Genes (Basel). 2022; 13: 1657.
7Shahsavar Y, Choudhury A. User intentions to use ChatGPT for self- diagnosis and health-related purposes: cross-sectional survey study. JMIR Hum Factors. 2023; 10: e47564.
8Kamatani Y, Kaname T. Artificial intelligence in medical genomics. J Hum Genet. 2024; 69: 475.
9Yun HS, Bickmore T. Online health information-seeking in the era of large language models: cross-sectional web-based survey study. J Med Internet Res. 2025; 27: e68560.
10Ayik G, Kolac UC, Aksoy T, Yilmaz A, Sili MV, Tokgozoglu M, et al. Exploring the role of artificial intelligence in Turkish orthopedic progression exams. Acta Orthop Traumatol Turc. 2025; 59: 18-26.
11Kolac UC, Karademir OM, Ayik G, Kaymakoglu M, Familiari F, Huri G. Can popular AI large language models provide reliable answers to frequently asked questions about rotator cuff tears? JSES Int. 2025; 9: 390-7.
12Mehmet S, et al. Comparative evaluation of large language models in addressing autism-related information queries: insights from ChatGPT, Gemini, and Copilot. Gazi Med J. 2025; 36: 407-16.
13Volk SC, Schäfer MS, Lombardi D, Mahl D, Yan X. How generative artificial intelligence portrays science: Interviewing ChatGPT from the perspective of different audience segments. Public Underst Sci. 2025; 34: 132-53.
14Küçüksabanoğlu ZK. Yapay Zeka Politikaları Derneği (AIPA) Gelecek Araştırması: Toplumda yapay zeka algısı. Yapay Zeka Politikaları Derneği (AIPA); 2025. Available from: https://aipaturkey.org/media/pdfs/YapayZeka_AlgiArastirmasi_2025_Toplum.pdf
15Likert R. A technique for the measurement of attitudes. Arch Psychol. 1932;140:1-55. Available from: https://legacy.voteview.com/pdf/Likert_1932.pdf
16Charnock D, Shepperd S, Needham G, Gann R. DISCERN: an instrument for judging the quality of written consumer health information on treatment choices. J Epidemiol Community Health. 1999; 53: 105-11.
17Kincaid JP, Fishburne RP Jr, Rogers RL, Chissom BS. Derivation of new readability formulas: automated Readability Index, Fog Count and Flesch Reading Ease Formula for Navy enlisted personnel. Millington (TN): Naval Technical Training Command, Research Branch; 1975 Feb. Available from: https://stars.library.ucf.edu/istlibrary/56/.
18Shoemaker SJ, Wolf MS, Brach C. Development of the Patient Education Materials Assessment Tool (PEMAT): a new measure of understandability and actionability for print and audiovisual patient information. Patient Educ Couns. 2014. 96: 395-403.
19Jeon S, Lee SA, Chung HS, Yun JY, Park EA, So MK, et al. Evaluating the use of generative artificial intelligence to support genetic counseling for rare diseases. Diagnostics (Basel). 2025; 15: 672.
20Ahimaz P, Bergner AL, Florido ME, Harkavy N, Bhattacharyya S. Genetic counselors’ utilization of ChatGPT in professional practice: a cross-sectional study. Am J Med Genet A. 2024; 194: e63493.
21Brett GR, Ward A, Bouffler SE, Palmer EE, Boggs K, Lynch F, et al. Co-design, implementation, and evaluation of plain language genomic test reports. NPJ Genom Med. 2022; 7: 61.
22Farmer GD, Gray H, Chandratillake G, Raymond FL, Freeman ALJ. Recommendations for designing genetic test reports to be understood by patients and non-specialists. Eur J Hum Genet. 2020; 28: 885-95.
23Haga SB, Mills R, Pollak KI, Rehder C, Buchanan AH, Lipkus IM, et al. Developing patient-friendly genetic and genomic test reports: formats to promote patient engagement and understanding. Genome Med. 2014; 6: 58.
24Coen E, Del Fiol G, Kaphingst KA, Borsato E, Shannon J, Smith H, et al. Chatbot for the return of positive genetic screening results for hereditary cancer syndromes: prompt engineering project. JMIR Cancer. 2025; 11: e65848.
25Meekins-Doherty L, Dive L, McEwen A, Sexton A. Generative AI and the profession of genetic counseling. J Genet Couns. 2025; 34: e2009.
26Tıbbi Genetik Derneği. Spinal Musküler Atrofi El Kitabı [Internet]. Ankara: Tıbbi Genetik Derneği; 2024. 20 p. Available from: https://yonetim.citius.technology/files/kurum/kurum75/menu/spinal-muskuler-atrofi-el-kitabi--bitmis-hali-15x23-olacak---1-.pdf