ZONAUTARA.com – Dalam membantu perkembangan kecerdasan buatan atau artificial intelligence (AI), sekelompok ilmuwan telah mempelajari 100 miliar twit untuk membantu algoritma computer.

Cuitan di Twitter memang sangatlah unik. Sekarang, coba buka twitter anda dan baca apa saja hal yang pernah anda twit beserta kalimatnya. Pengulangan kata, penekanan pada huruf-huruf tertentu, bahkan bisa jadi juga anda mengetik menggunakan bahasa gaul atau kata-kata yang sengaja salah eja dan tidak sesuai dengan standard.

Kita seringkali memadukan ejaan dalam komunikasi digital dengan emosi yang sedang kita rasakan. Hal ini menjadi tantangan utama juga dalam kecerdasan buatan dalam memproses bahasa.

Selama beberapa dekade terakhir, media sosial telah memberikan para ilmuwan banyak informasi tentang perilaku dan bahasa yang digunakan oleh manusia. Para ilmuwan dari University of Vermont salah satunya, yang meneliti bagaimana anak muda berkomunikasi lewat Twitter.

Studi yang mereka lakukan telah diterbitkan di jurnal PLOS One. Studi ini menganalisis sekitar 100 miliar twit yang dihasilkan dalam rentang waktu antara 2008 hingga 2016.

Mereka mengembangkan dua pengukuran untuk menilai pola dalam twit, yaitu keseimbangan dan peregangan. Sebagai contoh, kata “hahahahaha” akan masuk dalam kategori yang tinggi dalam keseimbangan. Sedangkan “lolllllllll?” dengan huruf a yang berderet berkontribusi pada jenis peregangan. Di mana ia memberi penekanan dalam huruf a.

Hal menarik lainnya yang ditemukan adalah kata-kata memanjang ditemukan dalam berbagai bahasa. Misalnya penggunaan “kkkkkk” merupakan ungkapan tertawa dalam bahasa Portugis Brazil, sementara “wkwkwkwkwk” merupakan ungkapan tawa dalam bahasa Indonesia.

Pada akhirnya, analisis yang dilakukan dapat membantu kecerdasan buatan memahami makna intrinsic yang terkandung dalam variasi teks digital yang komunikatif, dan juga symbol linguistic lainnya.

Definisi yang ada di dalam kamus benar-benar tidak mencerminkan cara berkomunikasi dalam dunia digital. Peneliti juga menemukan bahwa terdapat distribusi berpola seperti bagian mana yang direntangkan dan berapa banyak jumlahnya.

Dari sini, pembelajaran yang dilakukan kecerdasan buatan untuk memahami istilah digital manusia, dapat memungkinkan adanya alat baru di masa depan untuk pemrosesan bahasa alami, mesin pencarian dengan bahasa gaul, dan juga meningkatkan kinerja filter spam.

Teknologi ini juga tentunya dapat meningkatkan terjemahan daring atau otomatis oleh Twitter dan kamus, tak hanya dengan bahsa baku saja.