Computer Vision

Tomato Leaf Disease Detection Using ResNet50 and CBAM Attention Mechanism

Tomato Leaf Disease Detection Using ResNet50 and CBAM Attention Mechanism - jasa machine learning joki ML

Penyakit pada tanaman tomat merupakan salah satu faktor utama yang menurunkan produktivitas pertanian secara global. Identifikasi dini yang akurat sangat krusial untuk mencegah penyebaran patogen dan meminimalkan kerugian ekonomi bagi petani. Riset ini mengeksplorasi penggunaan arsitektur ResNet50 yang dikombinasikan dengan mekanisme Convolutional Block Attention Module (CBAM) untuk meningkatkan fokus model pada area daun yang terinfeksi. Pelatihan model dilakukan menggunakan GPU NVIDIA RTX A4000 untuk mempercepat proses komputasi serta menangani kompleksitas parameter dari arsitektur deep learning yang digunakan.

+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 550.144.03             Driver Version: 550.144.03     CUDA Version: 12.4     |
|-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|=========================================+========================+======================|
|   0  NVIDIA RTX A4000               Off |   00000000:00:05.0 Off |                  Off |
| 41%   43C    P8             15W /  140W |       2MiB /  16376MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+-----------------------------------------------------------------------------------------+
| Processes:                                                                              |
|  GPU   GI   CI        PID   Type   Process name                              GPU Memory |
|        ID   ID                                                               Usage      |
|=========================================================================================|
|  No running processes found                                                             |
+-----------------------------------------------------------------------------------------+

Metodologi

Alur kerja riset ini dimulai dengan tahap koleksi data dari dataset PlantVillage yang berisi ribuan citra daun tomat dalam berbagai kondisi kesehatan. Citra kemudian melalui tahap pre-processing berupa normalisasi nilai piksel dan resizing menjadi resolusi 224x224 piksel sesuai standar input arsitektur ResNet. Tahap augmentasi data diaplikasikan secara dinamis menggunakan rotation, shifting, zoom, dan horizontal flip untuk meningkatkan variasi citra dan mencegah terjadinya overfitting. Model dikembangkan dengan teknik transfer learning di mana weights dari ImageNet digunakan sebagai inisialisasi pada backbone ResNet50 yang kemudian digabungkan dengan blok CBAM. Tahap akhir melibatkan proses fine tuning pada lapisan fully connected untuk menyesuaikan output dengan 10 kelas penyakit daun tomat yang berbeda.

Visualisasi Metodologi

Model & Arsitektur

Arsitektur model ini menggunakan ResNet50 sebagai ekstraktor fitur utama (backbone) karena kemampuannya dalam menangani masalah vanishing gradient pada jaringan saraf yang dalam melalui koneksi residual. Inovasi utama terletak pada integrasi blok Convolutional Block Attention Module (CBAM) yang terdiri dari dua sub-modul utama:
1. Channel Attention Module: Membantu model untuk mengidentifikasi saluran fitur (features channel) mana yang paling informatif dengan menerapkan average pooling dan max pooling secara paralel.
2. Spatial Attention Module: Fokus pada lokasi spasial dalam citra di mana fitur penyakit muncul, sehingga model lebih sensitif terhadap bercak atau pola infeksi pada daun.
Setelah melalui blok attention, fitur tersebut diproses oleh lapisan Global Average Pooling 2D untuk mereduksi dimensi sebelum diteruskan ke lapisan Dense dengan 128 neuron (ReLU) dan lapisan Softmax sebagai output klasifikasi 10 kelas.

Visualisasi Arsitektur Machine Learning

Dataset

Dataset yang digunakan berasal dari dataset publik PlantVillage yang secara spesifik difokuskan pada komoditas tomat. Dataset ini mencakup 14.531 citra yang terbagi ke dalam 10 kategori, termasuk 9 jenis penyakit (seperti Bacterial Spot, Early Blight, Late Blight, Leaf Mold, dll.) dan 1 kategori daun sehat. Data dibagi dengan proporsi 80% untuk pelatihan dan 20% untuk validasi. Proses augmentasi citra sangat krusial dalam riset ini mengingat variasi pencahayaan dan latar belakang pada dataset asli, sehingga model dapat belajar fitur yang lebih robust dan invarian terhadap perubahan lingkungan.

Sampel Dataset

Nama Kelas Penyakit Deskripsi Singkat Jumlah Sampel (Val)
Bacterial Spot Bercak bakteri 283 samples
Early Blight Hawar dini 305 samples
Late Blight Hawar lambat 59 samples
Leaf Mold Kapang daun 254 samples
Septoria Leaf Spot Bercak Septoria 268 samples
Spider Mites Tungau laba-laba 857 samples
Target Spot Bercak target 224 samples
Mosaic Virus Virus mosaik 340 samples
Yellow Leaf Curl Virus daun keriting 160 samples
Healthy Sehat 152 samples

Results

Model mencapai performa yang sangat impresif dengan skor akurasi sebesar 96% pada data validasi. Melalui grafik pelatihan, terlihat proses konvergensi yang stabil di mana tingkat loss menurun secara signifikan dalam 40 epoch pertama sebelum program dihentikan oleh mekanisme early stopping untuk mencegah degradasi performa pada data baru. Metrik Precision, Recall, dan F1-Score untuk hampir seluruh kelas menunjukkan nilai di atas 0.90, menandakan bahwa model tidak hanya akurat secara keseluruhan tetapi juga seimbang dalam mendeteksi setiap jenis penyakit secara spesifik.

Grafik Pelatihan

Kesimpulan

Riset ini membuktikan bahwa integrasi mekanisme attention CBAM pada arsitektur ResNet50 mampu meningkatkan performa klasifikasi penyakit daun tomat secara signifikan dibandingkan model baseline standar. Temuan utama menunjukkan bahwa spatial attention sangat membantu model dalam mendeteksi pola penyakit yang seringkali berukuran kecil dan Samar pada permukaan daun. Meskipun model sudah sangat akurat, riset masa depan dapat dikembangkan dengan mencoba arsitektur yang lebih ringan seperti MobileNetV3 agar dapat diimplementasikan pada perangkat edge atau aplikasi mobile petani secara langsung di lapangan.


Mau dibuatin juga?

Apakah kamu sedang mengerjakan tugas akhir, skripsi, atau riset publikasi di bidang ResNet50, CNN, atau Computer Vision?
Tenang, Cordivai bisa bgt kok bantuin kamu. Cordivai udah berpengalaman selama 5 tahun membantu berbagai macam riset mulai dari tugas, paper, skripsi, thesis, disertasi bahkan kami telah menerbitkan paper di jurnal internasional Q1.

Project kamu juga mau kita bantu? Ngobrol yuk. Walaupun belum bisa jadi client kita, seenggaknya kamu bisa jadi temen kita.