ÖZET
Amaç:
Yapay zeka alanındaki son gelişmelerde, OpenAI tarafından geliştirilen ChatGPT çeşitli görevleri yerine getirebilen çok yönlü bir araç olarak ortaya çıkmıştır, ancak tıp alanındaki uygulaması karmaşıklıklar ve doğruluk sınırlamaları nedeniyle zorlanmaktadır. Bu makale, ChatGPT’nin performansını Gazi Üniversitesi’ndeki ortopedi asistanları ile çoktan seçmeli bir sınavda karşılaştırarak ortopedi alanında uygulanabilirliğini ve güvenilirliğini değerlendirmeyi amaçlamaktadır.
Yöntemler:
Gazi Üniversitesi’nde yapılan bu gözlemsel çalışmada, 31 ortopedi asistanı deneyim düzeyine göre sınıflandırılmış ve çeşitli ortopedik konularda 50 soruluk çoktan seçmeli bir test kullanılarak değerlendirilmiştir. Çalışmada ayrıca ChatGPT 3.5’in aynı sorulara verdiği yanıtlar, yanıtların hem doğruluğuna hem de arkasındaki mantığa odaklanılmıştır.
Bulgular:
Deneyimleri 6 ay ile 5 yıl arasında değişen ortopedi asistanları, çoktan seçmeli bir sınavda 50 üzerinden 23 ile 40 arasında puan aldı ve kıdeme göre değişmekle birlikte ortalama puan 30,81 oldu. ChatGPT, farklı dillerde ve zamanlarda tutarlılık göstererek 50 sorudan 25’ine doğru yanıt vermiş, ancak yanlış yanıtlar vererek veya bazı sorular için doğru yanıtın seçenekler arasında olmadığını belirterek sınırlamalar da sergilemiştir.
Sonuç:
Çalışma, ChatGPT’nin bazı teorik soruları doğru bir şekilde yanıtlayabilse de, yorumlayıcı senaryolarda ve çok değişkenli durumlarda etkinliğinin sınırlı olduğu, ancak zaman içinde kişiselleştirilmiş güncellemelerle doğruluğunun artabileceği sonucuna varmaktadır.