Serverless Named Entity Recognition untuk Teks Instruksional Pertanian Kota

Isi Artikel Utama

Trisna Gelar
Aprianti Nanda
Akhmad Bakhrun

Abstrak

Named Entity Recognition(NER) merupakan bagian dari pengembangan perangkuman dokumen, klasifikasi dan pencarian informasi. Implementasi NER pada domain pertanian, khususnya teks instruksional atau transkripsi video tutorial, akan memudahkan masyarakat umum memahami konsep dan istilah khusus dari kegiatan pertanian kota seperti proses dan prosedur produksi tanaman, metode dan alat pertanian, siklus panen, dan penanganan hama atau penyakit tanaman. Spacy merupakan alat bantu NLP, memiliki dua metode pengembangan model NER, yaitu dengan Toc2Vec dan Transformer. Kedua metode memiliki kelebihan dan kekurangan, yaitu ukuran, performansi dan kecepatan prediksi yang berbeda beda sesuai kebutuhan. Model NER dapat diimplementasikan menjadi aplikasi Serverless, dengan menggunakan pendekatan Fungsional as Services (FaaS) dan Backend as Services (BaaS). Pada penelitian ini telah dikembangkan tiga model NER untuk data teks instruksional pertanian sub topik budidaya tanaman buah. Model berbasis Toc2Vec dengan optimasi efisiensi, Model Toc2Vec dengan optimasi akurasi dan Model berbasis IndoBERT. Model berbasis Transformer memiliki nilai f1-score terbaik sebesar 0.71 disusul Model Toc2Vec Efisiensi sebesar 0.60 dan Model Toc2Vec Efektif dan 0.57. Model Toc2Vec tidak dapat memprediksi entitas numerik dengan baik, Prediksi entitas COUNT, PERIOD dan VERIETAS selalu tertukar. Selain itu Ukuran model berbanding lurus dengan kecepatan prediksi kata per detik, dalam hal ini Model Toc2Vec optimasi efisiensi unggul, model tersebut mudah diimplementasikan menjadi Serverless berbasis FaaS dan BaaS. Fungsionalitas dari Serverless ML telah berhasil diuji menggunakan metode Blackbox.

Unduhan

Data unduhan belum tersedia.

Rincian Artikel

Cara Mengutip
[1]
T. Gelar, A. Nanda, dan A. Bakhrun, “Serverless Named Entity Recognition untuk Teks Instruksional Pertanian Kota”, JuTISI, vol. 8, no. 3, hlm. 597 –, Des 2022.
Bagian
Articles