Mengenal TP, FP, FN, TN pada Classification Model
Pada suatu sistem klasifikasi/classifier/classification model, ada metric (unit ukur) yang digunakan untuk mengevaluasi sistem tersebut. Terdapat 4 nilai yang perlu diketahui dalam hal ini:
- True Positive — TP: Kondisi sitem memprediksi BENAR terhadap hasil NILAI POSITIF.
- False Positive — FP: Kondisi sistem memprediksi SALAH suatu NILAI POSITIF.
- False Negative — FN: Kondisi sistem memprediksi SALAH terhadap hasil NILAI NEGATIF.
- True Negative — TN: Kondisi sistem memprediksi BENAR terhadap hasil NILAI NEGATIF.
Untuk mengenal lebih lanjut keempat hal tersebut, kita bisa melihat dari penjelasan yang diambil dari machine learning crash course by Google yang menjabarkan keempat parameter ini berdasarkan cerita rakyat “The Boy Who Cried Wolf”.
Seorang penggembala biri-biri yang bosan, ingin membuat kericuhan dengan berbohong dan meneriakkan “ada serigala!” kepada penduduk desa. Penduduk desa panik mendengarnya. Mereka pun bersiap untuk melawan serigala. Akan tetapi, mereka merasakan kegusaran & marah karena mengetahui teriakan itu adalah kebohongan.
Berkali-kali hal ini terjadi, hingga penduduk desa tidak lagi percaya teriakan si gembala.
Suatu ketika, serigala benar-benar datang dan gembala meneriakkan “ada serigala!” kepada penduduk desa. Sekarang, penduduk desa berasumsi bahwa mereka dibohongi lagi dan mengabaikan teriakan itu. Pengabaian ini membuat serigala bebas memakan ternak. Ternak yang merupakan makanan penduduk desa kini telah dimakan serigala. Penduduk desa pun kelaparan karena tidak ada lagi makanan. Kepanikan juga kian menjadi.. semua diawali dari teriakan kebohongan dari penggembala biri-biri.
Berdasarkan cerita di atas, kita dapat mengasumsikan bahwa:
- “Ada serigala!” merupakan class POSITIF
- “Tidak ada Serigala!” merupakan class NEGATIF
Dari asumsi di atas, keempat parameter TP, FP, FN, dan TN dapat diartikan dengan kondisi berikut:
Contoh kasus lain, dari hasil tes covid. Kondisi positif covid merupakan class positif, dan kondisi negatif covid merupakan class negatif.
Jadi bisa dilihat bahwa TP, FP, FN, dan TN merupakan nilai kebenaran prediksi terhadap hasil positif dan negatif. Cara mengingatnya, True atau False merupakan keberhasilan suatu prediksi; sedangkan Positive atau Negative merupakan label/class prediksi. Jadi True Positive artinya, hasil prediksi: class positive, dan ternyata hal ini benar. False Negative artinya, hasil prediksi: class negative, tetapi prediksinya salah (karena label aktualnya adalah class positive).
Keempat nilai ini tersusun seperti hal di atas dalam bentuk matrix confusion berukuran 2x2. Kita akan lebih lanjut membahas matrix confusion pada tulisan selanjutnya. (Semoga)..
Level prediksi dari keempat parameter ini memiliki “cost” masing-masing. Contohnya, dalam kasus prediksi penyakit diabetes, level prediksi dinyatakan sebagai berikut:
- True Positive (TP): pasien positif diabetes diprediksi dengan hasil positif. Hal ini merupakan yang diinginkan dari sistem prediksi. Nilainya harus dimaksimalkan.
- True Negative (TN): pasien negatif diabetes diprediksi dengan hasil negatif. Hal ini juga merupakan kondisi yang diinginkan.
- False Positive (FP): pasien negatif diabetes diprediksi dengan hasil positif. Hal ini merupakan false alarm. Sebisa mungkin diminimalkan nilainya.
- False Negative (FN): pasien positif diabetes diprediksi dengan hasil negatif. Hal ini merupakan kondisi terburuk karena pasien tidak mendapat perawatan yang semestinya. Nilai ini harus diminimalkan secara maksimal.
“Cost” dari setiap parameter ini akan berdampak pada pemilihan nilai kinerja sistem yang dapat dihitung dari 4 parameter ini. Ada accuracy, precision, recall, f1-score, dan specificity. Contohnya, untuk sistem spam detection, bisa dilihat dari nilai precision yang dihasilkan. Sedangkan untuk sistem character recognition diperlukan nilai accuracy yang baik sebagai kinerjanya. Kita akan bahas lebih lanjut hal ini di tulisan selanjutnya. (Semoga)..