AI for Medical Diagnosis
Ai sekarang ini sudah banyak
dikembangkan di dunia termasuk di bidang Medic, saya membanyangkan jika AI
sudah bisa mendiagnosis seluruh penyakit dengan kecepatan mesin sangat dapat
memudahkan dan dapat menjadi perubahan besar. Jika AI ini benar-benar mencapai
tahap sempurna dan dapat dimasukkan ke dalam perangkat yang bisa di beli oleh
masyarakat menengah kebawah akan menjadi
dampak besar bagi seluruh orang dan juga memudahkan tugas dokter dan radiologi.
Bagaimana AI Berkerja di Medical Diagnosis
Diagnosis : Kanker Payudara
Langkah 1: Membagi Kumpulan Data
Untuk memulai pemodelan, kumpulan data dibagi menjadi dua
bagian:
1.
Train set (70%), untuk memilih dan memvalidasi
model, dan
2.
Kumpulan uji (30%), tahan data yang akan kita
lihat seberapa baik model dapat digeneralisasi pada data yang tidak terlihat.
Langkah 2: Menentukan Metrik
Selanjutnya, kita perlu mendefinisikan metrik kunci untuk
mengukur efisiensi model. Untuk menggambarkan kinerja pengklasifikasi dalam
masalah diagnosis digital, kami memiliki empat karakteristik dasar (angka) yang
dengannya kami dapat mendefinisikan metrik pengukuran turunan . Keempat angka
tersebut adalah:
TP (True Positive) - jumlah pasien yang diklasifikasikan
dengan benar yang memiliki penyakit,
TN (True Negative) - jumlah pasien yang diklasifikasikan
dengan benar yang sehat,
FP (False Positive) - jumlah pasien dengan kesalahan
klasifikasi yang sehat,
FN (False Negative) - jumlah pasien yang salah klasifikasi
yang menderita penyakit tersebut.
Berdasarkan angka-angka ini kami mendefinisikan metrik
sebagai berikut:
Akurasi - rasio pasien yang diklasifikasikan dengan benar
terhadap jumlah total pasien (Akurasi = (TP + TN) / (TP + FP + FN + TN))
Rasio presisi dari pasien yang diklasifikasikan dengan benar
dengan penyakit terhadap total pasien yang diklasifikasikan memiliki penyakit.
Intuisi di balik presisi adalah berapa banyak pasien yang diklasifikasikan
memiliki penyakit benar-benar memiliki penyakit (Precision = TP / TP + FP).
Ingat - rasio pasien yang sakit diklasifikasikan dengan
benar untuk pasien yang memiliki penyakit. Intuisi di balik ingatan adalah
berapa banyak pasien yang memiliki penyakit diklasifikasikan sebagai memiliki
penyakit. (Ingat = TP / TP + FN).
Langkah 3: Mengevaluasi Model
Langkah selanjutnya melibatkan menggunakan metrik presisi
dan mengingat untuk mengevaluasi model. Demi menyederhanakan perbandingan
berbagai model, kami akan menggunakan rata-rata harmonik presisi dan recall
yang disebut skor F1 (Skor F1 = 2 * (Panggil * Presisi) / (Panggil ulang +
Presisi)).
Setelah bereksperimen dengan algoritma yang berbeda, nilai rata-rata F1, dalam cross-validation, yang diperoleh oleh setiap classifier disajikan di bawah ini. Mengingat keakuratan dianggap sebagai ukuran yang paling intuitif, itu juga telah diplot pada grafik.
aplikasi kecerdasan buatan dalam diagnosis medis: skor validasi silang Model Pembelajaran Mesin
Skor validasi silang dari model Machine Learning.
Seperti yang dapat Anda lihat dari grafik, pengklasifikasi
menunjukkan hasil yang cukup baik dalam hal dapat membedakan pasien yang
memiliki kanker dengan yang lebih baik dibandingkan mereka yang sehat dengan
mencapai skor 0,94 F1. Di mana nilai terbaik untuk F1 adalah 1, dan nilai
terburuk adalah 0. Untuk mendapatkan skor yang lebih tinggi, ansambel model ini
dibuat dengan menggunakan teknik mengantongi .
aplikasi kecerdasan buatan dalam diagnosis medis: Skor
validasi silang model ansambel Machine Learning
Skor validasi silang dari model Pembelajaran Mesin ensembel.
Seperti yang ditunjukkan dalam grafik, ansambel model tampil
lebih baik dengan mencapai skor 0,95 F1.
Langkah 4: Membuat Model Jaringan Saraf Tiruan
Selain model diagnostik yang disebutkan di atas, model Jaringan Saraf Tiruan dibuat dan disetel menggunakan arsitektur yang ditunjukkan di bawah ini.
aplikasi kecerdasan buatan dalam diagnosis medis: arsitektur
model jaringan saraf
Arsitektur model Jaringan Saraf Tiruan.
Klasifikasi jaringan saraf ini telah menghasilkan nilai
rata-rata F1 0,97 pada cross-validation. Skor F1 model jaringan saraf baru ini
lebih baik dibandingkan dengan skor model terbaik yang diperoleh di Langkah 3.
Berikut adalah tiga hasil model teratas sejauh ini.
aplikasi kecerdasan buatan dalam diagnosis medis: hasil validasi
silang tiga model teratas
Hasil validasi silang dari tiga model teratas.
Sekarang mari kita evaluasi model-model ini pada set data
uji yang sebelumnya tidak ditampilkan ke pengklasifikasi meniru data baru. Di
bawah ini adalah hasil yang menunjukkan seberapa baik kinerja model ini pada
set data uji.
aplikasi kecerdasan buatan dalam diagnosis medis: kinerja model pada set data uji.
Seperti yang ditunjukkan dalam grafik, pengklasifikasi
jaringan saraf telah berkinerja lebih baik dengan mendapatkan skor 0,97 F1 pada
set tes.
Langkah 5: Mengevaluasi Kualitas Output Melalui Kurva
Operasi Penerima
Untuk mengevaluasi kualitas output pengklasifikasi lebih
lanjut, mari lihat kurva karakteristik pengoperasian penerima (ROC) .
aplikasi pembelajaran mesin dalam kedokteran: roc
Efisiensi grafik ROC diukur oleh area di bawah kurva. Area 1
merepresentasikan classifier sempurna, area 0,5 mewakili classifier tidak
berharga (warna navy, garis putus-putus dalam grafik). Berikut adalah sistem
poin akademik untuk menilai efisiensi pengklasifikasi yang diberikan pada area
di bawah kurva.
0,90-1 = luar biasa (A)
0,80-0,90 = baik (B)
0,70-0,80 = adil (C)
0,60-0,70 = buruk (D)
0,50-0,60 = gagal (F)
Seperti yang ditunjukkan dalam grafik, ketiga classifier
memiliki area di atas 0,99 di bawah kurva yang dianggap sangat baik.
Langkah 6: Mengevaluasi Kualitas Output Melalui Kurva
Presisi-Recall
Mari kita juga melihat kurva presisi-recall yang terkait
dengan pengklasifikasi ini. aplikasi pembelajaran mesin dalam kedokteran:
recall presisi
Garis putus-putus navy mewakili garis dasar, di mana model
yang sempurna adalah yang dengan 1 presisi rata-rata. Seperti yang Anda lihat,
ketepatan rata-rata ketiga model hampir mendekati 1, yang merupakan skor sangat
baik.
Langkah 7: Memvisualisasikan Batas Keputusan
Terakhir, catatan tambahan tentang batas keputusan model:
Untuk mendapatkan intuisi visual tentang kumpulan data dan batas keputusan algoritma, kami akan mengurangi dimensi ruang fitur 9D menjadi 2D menggunakan teknik PCA dan memvisualisasikan batas keputusan. aplikasi pembelajaran mesin dalam kedokteran: batas keputusan
Tantangan
Menerapkan Pembelajaran Mesin di Kesehatan
Ada beberapa kendala yang menghambat integrasi pembelajaran
mesin yang lebih cepat dalam layanan kesehatan saat ini. Salah satu tantangan
terbesar adalah kemampuan untuk mendapatkan set data pasien yang memiliki
ukuran dan kualitas sampel yang diperlukan untuk melatih model pembelajaran
mesin yang canggih. Karena data pasien dilindungi oleh aturan privasi dan
keamanan yang ketat, data tidak mudah dikumpulkan, dibagikan, dan
didistribusikan. Selain itu, ada tantangan dengan format dan kualitas data yang
biasanya membutuhkan upaya signifikan untuk membersihkan dan mempersiapkan
analisis pembelajaran mesin.
Ketika pembelajaran mesin dan ilmu data mulai diadopsi
sebagai alat dalam aplikasi perawatan kesehatan, industri perlahan mendorong
batasan tentang apa yang dapat dilakukannya. Fungsi utamanya kemungkinan besar
akan melibatkan analisis data berdasarkan fakta bahwa setiap pasien
menghasilkan volume besar data kesehatan seperti hasil sinar-X, vaksinasi,
sampel darah, tanda-tanda vital, urutan DNA, obat saat ini, riwayat medis masa
lalu lainnya, dan banyak lagi lebih lanjut .
0 Comments