Pelabelan Data Otomatis dan Tantangannya dalam Perkembangan AI

Sejak satu dekade terakhir, Artificial Intelligence (AI) telah membawa kemajuan di hampir setiap aspek bisnis dan industri. Dengan demikian, pemberdayaan AI maupun turunannya seperti machine Learning terus dilakukan untuk tujuan-tujuan yang berkaitan dengan manusia baik individu maupun organisasi. Satu hal yang penting untuk pengembangan AI ada pada data yang dibutuhkan. Itulah mengapa pelabelan data otomatis dilihat sebagai solusi yang lebih baik. 

Mengapa perlu pelabelan data otomatis atau automated data labelling? Sebab, pelabelan data manual kurang efektif dalam pengembangan sistem AI/ML yang akan memperlambat siklus pengembangannya. 

Apa Itu Pelabelan Data Otomatis?

Singkatnya, ini adalah proses mengubah data mentah menjadi data yang dapat dibaca mesin dengan menambahkan label atau tag ke dalamnya. Model AI/ML modern membutuhkan kumpulan data yang besar dan beragam untuk dikembangkan dan ditingkatkan. 

Dalam berbagai kasus, pelabelan dilakukan secara manual dapat menyebabkan:

  • Kesalahan humanoid. Hal ini sudah jadi masalah umum apalagi jika staf bekerja dalam rentang waktu panjang dengan intensitas fokus tinggi. Satu kesalahan pada input dapat membuat mata rantai kesalahan dalam sistem jika tidak dikoreksi. 
  • Mengurangi kualitas dan efisiensi proses pelabelan. Pekerjaan manual tidak sepenuhnya memetakan mana hasil pelabelan yang berkualitas dan mana yang perlu perbaikan. Sekali lagi, karena retensi kerja menggunakan tenaga manusia tidak sekuat tenaga mesin. 
  • Keterlambatan jadwal proyek. Banyaknya kesalahan dan mandeknya pekerjaan selalu berdampak pada mundurnya sebuah project. 
  • Kurangnya keseragaman. Berbeda dari mesin yang mampu menciptakan keseragaman berdasarkan model atau skrip, tenaga manusia tidak se-konsisten itu. 
  • Membutuhkan biaya besar ketika diperlukan banyak data tambahan yang perlu disewa atau dibayar. 

Meskipun manusia dapat membuat label berkualitas tinggi pada kumpulan data kecil, tetapi tidak dapat memberikan kualitas yang sama pada kumpulan data besar. Di sinilah pelabelan data otomatis berperan. Pelabelan data yang sebelumnya dilakukan manusia secara manual dapat diotomatisasi dengan mengintegrasikan model AI maupun ML yang mempelajari cara memberi label pada data untuk menandainya secara otomatis. 

Kelemahan Sistem Automated Data Labelling

Karena sistem automated data labelling telah memberikan dampak instan dalam pengembangan AI maka sistem tersebut sudah banyak diadopsi khususnya oleh pengembang perangkat lunak. Akan tetapi, dalam penerapan masih ada celah yang wajib diperhatikan. Beberapa diantaranya adalah:

Butuh Waktu Pelatihan Yang Cukup Lama

Biasanya, otomatisasi pelabelan data terbukti lebih efisien dalam jangka panjang daripada metode manual; namun, satu hal yang perlu diperhatikan adalah bahwa model pelabelan juga memerlukan pelatihan.

Misalnya, pengembangan menemukan sebuah kasus yang mana model pelatihan yang lama tidak cocok dengan kasus tersebut. Sehingga mau tidak mau harus membuat model pelatihan yang baru. 

Dalam hal ini, tim pengembangan mungkin harus menghabiskan waktu dan upaya ekstra untuk melatih ulang model pelabelan otomatis agar sesuai dengan spesifikasi proyek. Misalnya, jika model pelabelan otomatis hanya dilatih untuk memberi label pada gambar di siang hari, model tersebut tidak akan dapat memberi label pada gambar gelap yang diambil pada malam hari.

Masalah Akurasi

Tingkat keakuratan model pelabelan otomatis tergantung pada keakuratan kumpulan data sampel yang diberikan kepadanya. Annotator manusia melabeli kumpulan data sampel ini. Jika kualitas kumpulan data sampel buruk, maka label yang dibuat oleh model otomatis juga akan cacat. 

Untuk menghindari masalah seperti itu, tim pelabelan harus berupaya ekstra untuk menyiapkan kumpulan data sampel. Set data ini harus dibuat secara ketat untuk melatih model pelabelan data otomatis. Tim dapat membuat kumpulan data standar yang dibuat melalui proses manual yang efisien.

Tidak Melakukan Koreksi Otomatis

Pada sistem pelabelan data otomatis, terdapat mekanisme dimana sistem tetap bekerja meskipun terjadi kesalahan input. Ini berbeda dengan sistem pelabelan manual dimana staf dapat berhenti untuk melakukan koreksi terlebih dahulu. Karena mekanisme yang seperti ini maka selalu ada kemungkinan bahwa sistem bakal menciptakan rangkaian kesalahan pada proses labelling sebagai akibat dari kesalahan awal yang tidak dikoreksi.

Kesimpulan

Pelabelan data otomatis telah meningkatkan kualitas sekaligus kuantitas pengembangan AI dan ML untuk setiap sektor industri. Akan tetapi, banyaknya celah yang perlu diperhatikan membuat tim pengembang harus mengkolaborasikan tenaga manual dengan sistem otomatisasi.