ÖZ
Amaç
Göğüs bilgisayarlı tomografi şiddet skoru (BT-SS), koronavirüs hastalığı-19 (COVID-19) hastalarında hastalığın şiddeti ve sonrasında yoğun bakım ünitesine (YBÜ) yatışla önemli ölçüde ilişkilidir. Ancak, COVID-19 hastalarının YBÜ yatışını ve YBÜ’de kalış süresini (LOS) (YBÜ LOS) tahmin etmek için demografik özellikler, klinik belirtiler ve laboratuvar öngörücüleriyle birlikte radyolojik bulguların prognostik rolü hakkında bilgi eksikliği vardı. Makine öğrenimi (ML) yaklaşımı, klinik sorunlar için etkili bir risk tahmin modeli sunabilen yeni ve invaziv olmayan bir dijital teknolojidir. Mevcut çalışmanın amacı, görüntüleme bulgularını içeren daha kapsamlı bir veri seti kullanarak COVID-19 hastaları için YBÜ yatışını ve YBÜ’de kalış süresini tahmin etmek için etkili bir ML modeli geliştirmekti.
Yöntemler
Altı bin sekiz yüz elli dört hastanın tıbbi kayıtlarını içeren bir COVID-19 hastane tabanlı kayıt veritabanı retrospektif olarak incelendi. %70’ten fazla eksik değere sahip eksik kayıtlar hariç tutuldu ve kalan eksik değerler, sürekli ve ayrık değişkenler için sırasıyla ortalama ve mod değerleri kullanılarak hesaplandı. Grupların veri sayılarındaki dengesizlik, sentetik azınlık örnekleme tekniği algoritması kullanılarak çözüldü. COVID-19 hastalarının YBÜ yatışını ve YBÜ'de kalış sürelerini tahmin etmek için ayrı ayrı iki tahmin modeli seti geliştirildi. Boruta özellik seçimi yöntemi ile seçilen en önemli ve ilgili tahmin ediciler, ML tahmin modellerini geliştirmek için kullanıldı. Karışıklık matrisinden elde edilen parametreler, tahmin modellerinin performansını değerlendirmek için kullanıldı. Hastaların YBÜ kalış sürelerini tahmin etmek için geliştirilen ML modellerinin performans değerlendirmesinde korelasyon katsayısı, ortalama mutlak hata ve kök ortalama kare hata ölçümleri kullanıldı.
Bulgular
Dahil etme/dışlama kriterleri uygulandıktan sonra 815 pozitif ters transkripsiyon polimeraz zincir reaksiyonu (RT-PCR) hastasının kayıtları çalışmaya dahil edildi. Sekiz yüz on beş pozitif RT-PCR hastasından yalnızca 185 hasta yoğun bakıma alınmak üzere YBÜ'ye yatırıldı. YBÜ kabul grubundaki kayıt sayısı, veri dengesizliği sorunuyla başa çıkmak için 630’a çıkarıldı. COVID-19 hastalarının YBÜ kabulünü tahmin etmek için k-NN, J48, destek vektör makinesi, çok katmanlı algılayıcı, Naïve Bayes, lojistik regresyon, rastgele orman (RF) ve XGBoost tabanlı ML modellerinden daha iyi performans gösterdi. k-NN algoritmasının duyarlılığı, özgüllüğü, doğruluğu, kesinliği, F-ölçüsü ve eğri altında kalan alanı sırasıyla %97,0, %89,7, %93,3, %90,4, %93,6 ve %99,1 idi. Sonuçlar, 0,42 korelasyon katsayısı, 2,01 ortalama mutlak hata ve 4,11 kök ortalama kare hatası ile 0,42 korelasyon katsayısı, 2,01 ortalama mutlak hata ve 4,11 kök ortalama kare hatası olan RF algoritmasının COVID-19 hastalarının YBÜ kalış süresini tahmin etmede en iyi performansı gösterdiğini gösterdi.
Sonuç
BT-SS'yi içeren daha kapsamlı bir veri setini kullanan ML yaklaşımı, COVID-19 hastalarının YBÜ yatışını ve YBÜ kalış süresini etkili bir şekilde tahmin edebilir. COVID-19 hastalarının YBÜ yatışının ve YBÜ kalış süresinin zamanında tahmin edilmesi hasta sonuçlarını iyileştirecek ve sınırlı hastane kaynaklarının optimum şekilde kullanılmasını sağlayacaktır.