AI for Medical Diagnosis
Ai sekarang ini sudah banyak dikembangkan di dunia termasuk di bidang Medic, saya membanyangkan jika AI sudah bisa mendiagnosis seluruh penyakit dengan kecepatan mesin sangat dapat memudahkan dan dapat menjadi perubahan besar. Jika AI ini benar-benar mencapai tahap sempurna dan dapat dimasukkan ke dalam perangkat yang bisa di beli oleh masyarakat  menengah kebawah akan menjadi dampak besar bagi seluruh orang dan juga memudahkan tugas dokter dan radiologi.

Bagaimana AI Berkerja di Medical Diagnosis
Diagnosis : Kanker Payudara
Langkah 1: Membagi Kumpulan Data
Untuk memulai pemodelan, kumpulan data dibagi menjadi dua bagian:
1.       Train set (70%), untuk memilih dan memvalidasi model, dan
2.       Kumpulan uji (30%), tahan data yang akan kita lihat seberapa baik model dapat digeneralisasi pada data yang tidak terlihat.
Langkah 2: Menentukan Metrik
Selanjutnya, kita perlu mendefinisikan metrik kunci untuk mengukur efisiensi model. Untuk menggambarkan kinerja pengklasifikasi dalam masalah diagnosis digital, kami memiliki empat karakteristik dasar (angka) yang dengannya kami dapat mendefinisikan metrik pengukuran turunan . Keempat angka tersebut adalah:

TP (True Positive) - jumlah pasien yang diklasifikasikan dengan benar yang memiliki penyakit,
TN (True Negative) - jumlah pasien yang diklasifikasikan dengan benar yang sehat,
FP (False Positive) - jumlah pasien dengan kesalahan klasifikasi yang sehat,
FN (False Negative) - jumlah pasien yang salah klasifikasi yang menderita penyakit tersebut.
Berdasarkan angka-angka ini kami mendefinisikan metrik sebagai berikut:

Akurasi - rasio pasien yang diklasifikasikan dengan benar terhadap jumlah total pasien (Akurasi = (TP + TN) / (TP + FP + FN + TN))
Rasio presisi dari pasien yang diklasifikasikan dengan benar dengan penyakit terhadap total pasien yang diklasifikasikan memiliki penyakit. Intuisi di balik presisi adalah berapa banyak pasien yang diklasifikasikan memiliki penyakit benar-benar memiliki penyakit (Precision = TP / TP + FP).
Ingat - rasio pasien yang sakit diklasifikasikan dengan benar untuk pasien yang memiliki penyakit. Intuisi di balik ingatan adalah berapa banyak pasien yang memiliki penyakit diklasifikasikan sebagai memiliki penyakit. (Ingat = TP / TP + FN).
Langkah 3: Mengevaluasi Model
Langkah selanjutnya melibatkan menggunakan metrik presisi dan mengingat untuk mengevaluasi model. Demi menyederhanakan perbandingan berbagai model, kami akan menggunakan rata-rata harmonik presisi dan recall yang disebut skor F1 (Skor F1 = 2 * (Panggil * Presisi) / (Panggil ulang + Presisi)).

Setelah bereksperimen dengan algoritma yang berbeda, nilai rata-rata F1, dalam cross-validation, yang diperoleh oleh setiap classifier disajikan di bawah ini. Mengingat keakuratan dianggap sebagai ukuran yang paling intuitif, itu juga telah diplot pada grafik.








aplikasi kecerdasan buatan dalam diagnosis medis: skor validasi silang Model Pembelajaran Mesin



Skor validasi silang dari model Machine Learning.



Seperti yang dapat Anda lihat dari grafik, pengklasifikasi menunjukkan hasil yang cukup baik dalam hal dapat membedakan pasien yang memiliki kanker dengan yang lebih baik dibandingkan mereka yang sehat dengan mencapai skor 0,94 F1. Di mana nilai terbaik untuk F1 adalah 1, dan nilai terburuk adalah 0. Untuk mendapatkan skor yang lebih tinggi, ansambel model ini dibuat dengan menggunakan teknik mengantongi .
aplikasi kecerdasan buatan dalam diagnosis medis: Skor validasi silang model ansambel Machine Learning
Skor validasi silang dari model Pembelajaran Mesin ensembel.
Seperti yang ditunjukkan dalam grafik, ansambel model tampil lebih baik dengan mencapai skor 0,95 F1.
Langkah 4: Membuat Model Jaringan Saraf Tiruan

Selain model diagnostik yang disebutkan di atas, model Jaringan Saraf Tiruan dibuat dan disetel menggunakan arsitektur yang ditunjukkan di bawah ini.



aplikasi kecerdasan buatan dalam diagnosis medis: arsitektur model jaringan saraf
Arsitektur model Jaringan Saraf Tiruan.
Klasifikasi jaringan saraf ini telah menghasilkan nilai rata-rata F1 0,97 pada cross-validation. Skor F1 model jaringan saraf baru ini lebih baik dibandingkan dengan skor model terbaik yang diperoleh di Langkah 3. Berikut adalah tiga hasil model teratas sejauh ini.
aplikasi kecerdasan buatan dalam diagnosis medis: hasil validasi silang tiga model teratas




Hasil validasi silang dari tiga model teratas.
Sekarang mari kita evaluasi model-model ini pada set data uji yang sebelumnya tidak ditampilkan ke pengklasifikasi meniru data baru. Di bawah ini adalah hasil yang menunjukkan seberapa baik kinerja model ini pada set data uji.

aplikasi kecerdasan buatan dalam diagnosis medis: kinerja model pada set data uji.



Seperti yang ditunjukkan dalam grafik, pengklasifikasi jaringan saraf telah berkinerja lebih baik dengan mendapatkan skor 0,97 F1 pada set tes.



Langkah 5: Mengevaluasi Kualitas Output Melalui Kurva Operasi Penerima
Untuk mengevaluasi kualitas output pengklasifikasi lebih lanjut, mari lihat kurva karakteristik pengoperasian penerima (ROC) .



aplikasi pembelajaran mesin dalam kedokteran: roc
Efisiensi grafik ROC diukur oleh area di bawah kurva. Area 1 merepresentasikan classifier sempurna, area 0,5 mewakili classifier tidak berharga (warna navy, garis putus-putus dalam grafik). Berikut adalah sistem poin akademik untuk menilai efisiensi pengklasifikasi yang diberikan pada area di bawah kurva.
0,90-1 = luar biasa (A)
0,80-0,90 = baik (B)
0,70-0,80 = adil (C)
0,60-0,70 = buruk (D)
0,50-0,60 = gagal (F)
Seperti yang ditunjukkan dalam grafik, ketiga classifier memiliki area di atas 0,99 di bawah kurva yang dianggap sangat baik.

Langkah 6: Mengevaluasi Kualitas Output Melalui Kurva Presisi-Recall
Mari kita juga melihat kurva presisi-recall yang terkait dengan pengklasifikasi ini. aplikasi pembelajaran mesin dalam kedokteran: recall presisi
Garis putus-putus navy mewakili garis dasar, di mana model yang sempurna adalah yang dengan 1 presisi rata-rata. Seperti yang Anda lihat, ketepatan rata-rata ketiga model hampir mendekati 1, yang merupakan skor sangat baik.

Langkah 7: Memvisualisasikan Batas Keputusan
Terakhir, catatan tambahan tentang batas keputusan model:

Untuk mendapatkan intuisi visual tentang kumpulan data dan batas keputusan algoritma, kami akan mengurangi dimensi ruang fitur 9D menjadi 2D menggunakan teknik PCA dan memvisualisasikan batas keputusan. aplikasi pembelajaran mesin dalam kedokteran: batas keputusan




Tantangan Menerapkan Pembelajaran Mesin di Kesehatan
Ada beberapa kendala yang menghambat integrasi pembelajaran mesin yang lebih cepat dalam layanan kesehatan saat ini. Salah satu tantangan terbesar adalah kemampuan untuk mendapatkan set data pasien yang memiliki ukuran dan kualitas sampel yang diperlukan untuk melatih model pembelajaran mesin yang canggih. Karena data pasien dilindungi oleh aturan privasi dan keamanan yang ketat, data tidak mudah dikumpulkan, dibagikan, dan didistribusikan. Selain itu, ada tantangan dengan format dan kualitas data yang biasanya membutuhkan upaya signifikan untuk membersihkan dan mempersiapkan analisis pembelajaran mesin.

Ketika pembelajaran mesin dan ilmu data mulai diadopsi sebagai alat dalam aplikasi perawatan kesehatan, industri perlahan mendorong batasan tentang apa yang dapat dilakukannya. Fungsi utamanya kemungkinan besar akan melibatkan analisis data berdasarkan fakta bahwa setiap pasien menghasilkan volume besar data kesehatan seperti hasil sinar-X, vaksinasi, sampel darah, tanda-tanda vital, urutan DNA, obat saat ini, riwayat medis masa lalu lainnya, dan banyak lagi lebih lanjut .