Prediksi Produksi Tanaman Padi di Indonesia dengan Menggunakan Algoritma Random Forest Regressor
Abstract
Produksi padi merupakan komponen utama dalam menjaga ketahanan pangan nasional di Indonesia, mengingat beras adalah makanan pokok mayoritas penduduk. Namun, kestabilan produksi padi sering kali terganggu oleh berbagai faktor, terutama kondisi agronomis dan variabilitas iklim yang sulit diprediksi. Oleh karena itu, diperlukan pendekatan berbasis data yang mampu memodelkan kompleksitas faktor-faktor tersebut secara akurat. Penelitian ini bertujuan untuk membangun model prediksi produksi padi menggunakan algoritma Random Forest Regressor, sebuah metode pembelajaran mesin yang dikenal andal dalam menangani data non-linear dan kompleks. Dataset yang digunakan mencakup parameter pertanian seperti luas panen dan produktivitas, serta data iklim meliputi suhu, kelembaban udara, dan curah hujan, yang dikumpulkan dari sumber terbuka seperti Kaggle dan Badan Meteorologi Klimatologi dan Geofisika (BMKG) untuk rentang tahun 2018 hingga 2024. Metodologi yang diterapkan dalam penelitian ini terdiri dari beberapa tahapan, yaitu prapemrosesan data (penanganan nilai hilang dan normalisasi), analisis data eksploratif untuk memahami pola dan korelasi antar variabel, pelatihan model prediksi, serta evaluasi performa model menggunakan metrik Mean Squared Error (MSE) dan R-squared (R²). Hasil penelitian menunjukkan bahwa konfigurasi terbaik diperoleh saat data dibagi dengan rasio pelatihan dan pengujian sebesar 90:10, serta penggunaan 200 decision tree dalam model. Konfigurasi ini menghasilkan nilai MSE sebesar 0.0004 dan R² sebesar 0.9918, yang mengindikasikan tingkat akurasi prediksi yang sangat tinggi serta kemampuan model dalam merepresentasikan hubungan antar variabel dengan baik. Penelitian ini menunjukkan bahwa Random Forest Regressor efektif dalam memprediksi produksi padi dan berpotensi menjadi alat bantu pengambilan keputusan strategis bagi pemangku kepentingan di sektor pertanian.
References
Abdul Khalim, K., Hayati, U., & Bahtiar, A. (2023). PERBANDINGAN PREDIKSI PENYAKIT HIPERTENSI MENGGUNAKAN METODE RANDOM FOREST DAN NAÏVE BAYES. JATI (Jurnal Mahasiswa Teknik Informatika), 7(1), 498–504. https://doi.org/10.36040/jati.v7i1.6376
Abdurrozzaq Hasibuan, Suhela Putri Nasution, Fitri Amja Yani, Henni Adlini Hasibuan, & Nyak Firzah. (2022). Strategi Peningkatan Usaha Tani Padi Sawah Untuk Meningkatkan Perekonomian Masyarakat Desa. ABDIKAN: Jurnal Pengabdian Masyarakat Bidang Sains Dan Teknologi, 1(4), 477–490. https://doi.org/10.55123/abdikan.v1i4.1095
Apriani, A., Carsono, N., & Enjat Munajat, M. D. (2024). Prediction of Rice Production to Support Food Security in Bogor Regency using Linear Regression and Support Vector Machine (SVM). Jurnal Teknika, 16(1), 13–18. https://doi.org/10.30736/jt.v16i1.1192
Chicco, D., Warrens, M. J., & Jurman, G. (2021). The coefficient of determination R-squared is more informative than SMAPE, MAE, MAPE, MSE and RMSE in regression analysis evaluation. PeerJ Computer Science, 7, e623. https://doi.org/10.7717/peerj-cs.623
Da Poian, V., Theiling, B., Clough, L., McKinney, B., Major, J., Chen, J., & Hörst, S. (2023). Exploratory data analysis (EDA) machine learning approaches for ocean world analog mass spectrometry. Frontiers in Astronomy and Space Sciences, 10. https://doi.org/10.3389/fspas.2023.1134141
Darmawan, A. K., Al Wajieh, M. W., Setyawan, M. B., Yandi, T., & Hoiriyah, H. (2023). Hoax News Analysis for the Indonesian National Capital Relocation Public Policy with the Support Vector Machine and Random Forest Algorithms. Journal of Information Systems and Informatics, 5(1), 150–173. https://doi.org/10.51519/journalisi.v5i1.438
Erlin, Yunianta, A., Wulandhari, L. A., Desnelita, Y., Nasution, N., & Junadhi. (2024). Enhancing Rice Production Prediction in Indonesia Using Advanced Machine Learning Models. IEEE Access, 12, 151161–151177. https://doi.org/10.1109/ACCESS.2024.3478738
Gde Agung Brahmana Suryanegara, Adiwijaya, & Mahendra Dwifebri Purbolaksono. (2021). Peningkatan Hasil Klasifikasi pada Algoritma Random Forest untuk Deteksi Pasien Penderita Diabetes Menggunakan Metode Normalisasi. Jurnal RESTI (Rekayasa Sistem Dan Teknologi Informasi), 5(1), 114–122. https://doi.org/10.29207/resti.v5i1.2880
Handayani, D. N., & Qutub, S. (2025). Penerapan Random Forest Untuk Prediksi Dan Analisis Kemiskinan. RIGGS: Journal of Artificial Intelligence and Digital Business, 4(2), 405–412. https://doi.org/10.31004/riggs.v4i2.512
Ibrahim, M., Perwira Negara, H. R., & Syaharuddin, S. (2021). Prediction of Land Area Harvest, Production, Rice Productivity: A Accuracy Analysis of ARIMA Methods. Protech Biosystems Journal, 1(1), 1. https://doi.org/10.31764/protech.v1i1.4776
Lai, S., Hu, X., Xu, H., Ren, Z., & Liu, Z. (2023). Multimodal sentiment analysis: A survey. Displays, 80, 102563. https://doi.org/10.1016/j.displa.2023.102563
Mulyo, H., & Maori, N. A. (2024). PENINGKATAN AKURASI PREDIKSI PEMILIHAN PROGRAM STUDI CALON MAHASISWA BARU MELALUI OPTIMASI ALGORITMA DECISION TREE DENGAN TEKNIK PRUNING DAN ENSEMBLE. Jurnal Disprotek, 15(1), 15–25. https://doi.org/10.34001/jdpt.v15i1.5585
Nizami, T., Mustaqiim, M. A., & Ariannor, W. (2025). Analisis Kinerja Model Machine learning dalam Prediksi Gagal Panen Gabah.
Rasyid, A., Muharam, A. B., & Solichin, A. (2025). PREDIKSI HARGA SAHAM SYARIAH INDONESIA BERDASARKAN ANALISIS FUNDAMENTAL, TEKNIKAL DAN BANDARMOLOGY MENGGUNAKAN METODE RANDOM FOREST. JIPI (Jurnal Ilmiah Penelitian Dan Pembelajaran Informatika), 10(2), 1663–1677. https://doi.org/10.29100/jipi.v10i2.7855
Satria, A., Badri, R. M., & Safitri, I. (2023). Prediksi Hasil Panen Tanaman Pangan Sumatera dengan Metode Machine Learning. Digital Transformation Technology, 3(2), 389–398. https://doi.org/10.47709/digitech.v3i2.2852
Siahaan, M. (2025). ANALYSIS OF RICE YIELD PREDICTION WITH MLPREGRESSOR AND LONG SHORT-TERM MEMORY MODELS ANALISIS PREDIKSI HASIL PADI DENGAN MODEL MLPREGRESSOR DAN LONG SHORT-TERM MEMORY. 10(1), 2025.
Speiser, J. L. (2021). A random forest method with feature selection for developing medical prediction models with clustered and longitudinal data. Journal of Biomedical Informatics, 117, 103763. https://doi.org/10.1016/j.jbi.2021.103763
Waladi, A. (2025). Peningkatan Akurasi Klasifikasi Tutupan Lahan Menggunakan Random Forest pada Data Sentinel-2 di Jambi. JURNAL FASILKOM, 15(1), 17–24. https://doi.org/10.37859/jf.v15i1.8886
Wulandari, D. (2023). Pemodelan dan Prediksi Produksi Padi Menggunakan Regresi Linear. https://www.kaggle.com/datasets/ardikasatria/datasettanamanpadisumatera
Copyright (c) 2025 DIONIKXON MANURUNG, Billiam Zealtiel, Andre Hasudungan Lubis

This work is licensed under a Creative Commons Attribution 4.0 International License.
Authors who publish with this journal agree to the following terms:
- Authors retain copyright and grant the journal right of first publication with the work simultaneously licensed under Creative Commons Attribution 4.0 International License that allows others to share the work with an acknowledgment of the work's authorship and initial publication in this journal.
- Authors are able to enter into separate, additional contractual arrangements for the non-exclusive distribution of the journal's published version of the work (e.g., post it to an institutional repository or publish it in a book), with an acknowledgment of its initial publication in this journal.
- Authors are permitted and encouraged to post their work online (e.g., in institutional repositories or on their website) prior to and during the submission process, as it can lead to productive exchanges, as well as earlier and greater citation of published work (Refer to The Effect of Open Access).


