Kerangka kerja SophosAI untuk meningkatkan kinerja Model Bahasa Besar (LLM) untuk tugas keamanan siber (atau tugas spesifik lainnya) kini telah menjadi sumber terbuka.
Sophos adalah satu-satunya vendor yang dinobatkan sebagai Pilihan Pelanggan di tiga kategori: Platform Perlindungan Titik Akhir, Firewall Jaringan, dan Managed Detection and Response.
Model Bahasa Besar (LLM) memiliki potensi untuk mengotomatiskan dan mengurangi beban kerja dari berbagai jenis tugas, termasuk tugas analis keamanan siber dan respons insiden. Namun, LLM generik tidak memiliki pengetahuan spesifik domain yang diperlukan untuk menangani tugas-tugas ini dengan baik. Meskipun LLM mungkin dibangun dengan data pelatihan yang mencakup beberapa sumber daya terkait keamanan siber, itu seringkali tidak cukup untuk menangani tugas-tugas yang lebih spesialistik yang memerlukan pengetahuan yang lebih mutakhir dan, dalam beberapa kasus, pengetahuan yang bersifat kepemilikan untuk dapat bekerja dengan baik—pengetahuan yang tidak tersedia bagi LLM ketika mereka dilatih.
Ada beberapa solusi yang ada untuk menyempurnakan LLM “stok” (yang tidak dimodifikasi) untuk jenis tugas tertentu. Namun sayangnya, solusi-solusi ini tidak cukup untuk jenis aplikasi LLM yang sedang coba diimplementasikan oleh Sophos X-Ops. Untuk alasan itu, SophosAI telah menyusun sebuah kerangka kerja yang memanfaatkan DeepSpeed, sebuah pustaka yang dikembangkan oleh Microsoft yang dapat digunakan untuk melatih dan menyempurnakan inferensi model dengan (secara teori) triliunan parameter dengan memperbesar daya komputasi dan jumlah unit pemrosesan grafis (GPU) yang digunakan selama pelatihan. Kerangka kerja ini dilisensikan sebagai sumber terbuka dan dapat ditemukan di repositori GitHub kami.
Meskipun banyak bagian dari kerangka kerja ini tidaklah baru dan memanfaatkan pustaka sumber terbuka yang ada, SophosAI telah menyintesis beberapa komponen kunci untuk memudahkan penggunaannya. Kami terus bekerja untuk meningkatkan kinerja kerangka kerja ini.
Alternatif yang (tidak memadai)
Ada beberapa pendekatan yang ada untuk menyesuaikan LLM stok dengan pengetahuan spesifik domain. Masing-masing pendekatan memiliki kelebihan dan keterbatasannya sendiri.Top of Form