Mantis, solusi anti serangan AI berbasis LLM

Peneliti Universitas George Mason menciptakan inovasi pertahanan berbasis AI yang menggunakan serangan injeksi prompt untuk melumpuhkan model AI penyerang.

Dalam menghadapi ancaman yang terus berkembang dari penggunaan model bahasa besar (LLM) oleh pelaku siber, peneliti dari Universitas George Mason memperkenalkan Mantis. Mantis merupakan sebuah sistem pertahanan berbasis AI yang dirancang untuk menumbangkan AI generatif yang digunakan oleh penyerang melalui teknik serangan injeksi prompt, menjadikannya langkah baru yang signifikan dalam keamanan dunia maya.

Selain melakukan perlindungan, Mantis juga melakukan pemalsuan layanan target dan mengirimkan respons balik yang berisi perintah tersembunyi. Mantis menyisipkan serangan injeksi prompt ke dalam simulasi layanan seperti halaman login palsu atau server FTP.

Dengan respons manipulatif ini, Mantis tidak hanya memperlambat serangan, tetapi juga memanfaatkan kelemahan mendasar dalam desain LLM untuk menyerang balik.

Penelitian menunjukkan bahwa Mantis memiliki tingkat keberhasilan lebih dari 95% dalam memperlambat atau mengalihkan serangan. Kelemahan mendasar dalam kerentanan injeksi prompt sulit diperbaiki, menjadikan teknik ini senjata ampuh dalam melindungi sistem. “Kami mengeksploitasi kelemahan yang sangat sulit untuk diatasi,” jelas Giuseppe Ateniese, profesor keamanan siber di Universitas George Mason.

LLM seperti ConfusedPilot dan CodeBreaker digunakan untuk mengotomatisasi pembuatan kode berbahaya dan eksploitasi celah keamanan dengan efisiensi yang tinggi. Namun, keberadaan Mantis menjadi penghalang bagi otomatisasi serangan siber.

“Selama LLM percaya bahwa mereka hampir mencapai targetnya, mereka akan terus mencoba dalam lingkaran yang sama,” ujar Evgenios Kornaropoulos, asisten profesor di Universitas George Mason. Pendekatan ini menjadikan Mantis alat yang unggul untuk melindungi sistem dari ancaman berbasis LLM.

Dengan ancaman dari AI generatif yang terus berkembang, keberadaan sistem seperti Mantis memberikan harapan baru dalam perlindungan dunia maya. Tidak hanya sebagai solusi pertahanan pasif, Mantis menciptakan paradigma baru dengan menyerang balik, menjadikannya langkah revolusioner dalam melawan otomatisasi siber yang semakin canggih.