Dalam tempoh seminggu, dua makmal AI terbesar di dunia masing-masing mendedahkan model khusus untuk keselamatan siber. Di satu pihak, [Anthropic](https://anthropic.com) dengan [Claude Mythos Preview](/blog/claude-mythos-project-glasswing-keselamatan-siber) — model frontier baharu sepenuhnya yang menemui beribu-ribu kerentanan zero-day. Di pihak lain, [OpenAI](https://openai.com) dengan [GPT-5.4-Cyber](/blog/openai-gpt-5-4-cyber-keselamatan-siber) — fine-tuning khusus GPT-5.4. Dua falsafah yang berbeza secara radikal untuk objektif yang sama: mengamankan dunia digital sebelum penyerang merebut alat yang sama.
Dua pendekatan, satu kecemasan
Kebetulan masa ini bukan secara rawak. Kedua-dua syarikat mengenal pasti fenomena yang sama: model AI semasa telah menjadi cukup berkuasa untuk menemui dan mengeksploitasi kerentanan perisian pada skala yang belum pernah berlaku. Jangka masa antara penemuan kelemahan dan eksploitasinya oleh musuh telah menurun daripada bulan kepada minit. Anthropic dan OpenAI menghadapi dilema yang sama: bagaimana menggunakan kuasa ini untuk mempertahankan dan bukannya menyerang?
Pertembungan teknikal
| Kriteria | Claude Mythos Preview | GPT-5.4-Cyber |
|---|---|---|
| Jenis model | Model frontier baharu sepenuhnya | Fine-tuning GPT-5.4 sedia ada |
| Nama kod | Capybara | N/A |
| Tarikh pengumuman | 8 April 2026 | 14 April 2026 |
| Program akses | Project Glasswing (konsortium) | Trusted Access for Cyber (pengesahan) |
| Organisasi bertauliah | ~50 (AWS, Apple, Google, Microsoft...) | Profesional disahkan secara individu |
| Pelaburan diumumkan | 100J$ kredit + 4J$ sumber terbuka | Tidak didedahkan |
| Pagar keselamatan | Terhad oleh model paling berkuasa pernah dicipta | Dikurangkan sengaja untuk tugas keselamatan |
| Zero-day ditemui | Beribu-ribu (semua OS dan pelayar utama) | Tidak didedahkan |
| SWE-bench Verified | 93.9% | N/A (GPT-5.4 standard tersedia) |
| CyberGym | 83.1% | Tidak diterbitkan |
| Harga | 25$/125$ per juta token | Tidak didedahkan |
| Ketersediaan awam | Tidak dirancang | Tidak dirancang |
Claude Mythos Preview vs GPT-5.4-Cyber: perbandingan lengkap
Anthropic: laluan konsortium
Pendekatan Anthropic tidak pernah berlaku sebelum ini dalam sejarah AI. Daripada mengedarkan Mythos melalui program biasa, syarikat itu mencipta [Project Glasswing](/blog/claude-mythos-project-glasswing-keselamatan-siber) — konsortium pertahanan yang menghimpunkan nama-nama terbesar dalam teknologi dan kewangan. AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, JPMorgan Chase, Palo Alto Networks dan Linux Foundation bekerjasama untuk mengimbas dan mengamankan perisian paling kritikal di dunia.
Hasilnya mengagumkan: dalam beberapa minggu, Mythos menemui beribu-ribu kerentanan zero-day, termasuk kelemahan berusia 27 tahun dalam OpenBSD dan satu lagi berusia 16 tahun dalam FFmpeg. Model ini malah secara autonomi merantai beberapa kerentanan kernel Linux untuk mencipta eksploit lengkap peningkatan keistimewaan.
OpenAI: laluan program pengesahan
OpenAI mengambil pendekatan yang lebih konvensional tetapi berpotensi lebih berskala. GPT-5.4-Cyber diedarkan melalui versi lanjutan program Trusted Access for Cyber, yang mengesahkan setiap profesional keselamatan secara individu. Kelebihannya: saluran akses yang lebih lancar. Kekurangannya: kurang penyelarasan antara peserta.
Perbezaan teknikal juga asasi: GPT-5.4-Cyber ialah fine-tuning GPT-5.4, bukan model baharu. Ia diselaraskan untuk mengurangkan penolakan pada tugas keselamatan yang sah. Mythos, sebaliknya, mempunyai keupayaan siber yang muncul — ia tidak ditambah melalui fine-tuning tetapi timbul secara semula jadi daripada kuasa model.
Siapa yang menang?
Di atas kertas, Anthropic jelas mendahului pusingan pertama ini. Mythos ialah model yang secara asasnya lebih berkuasa, keputusan keselamatan sibernya didokumentasikan dan mengagumkan, dan pendekatan konsortium Glasswing lebih bercita-cita tinggi. OpenAI tidak menerbitkan penanda aras untuk GPT-5.4-Cyber, menjadikan perbandingan langsung mustahil.
Tetapi perlumbaan baru sahaja bermula. OpenAI mempunyai kelebihan pengedaran — program pengesahannya lebih mudah diakses berbanding konsortium eksklusif Glasswing. Dan fine-tuning mempunyai kelebihan boleh diulang dengan cepat: setiap versi baharu GPT-5.x boleh dikhususkan untuk siber dalam beberapa minggu.
Bagaimana pula yang lain?
Google dan Microsoft tidak ketinggalan. Google ialah rakan kongsi Project Glasswing (melalui alatnya Big Sleep dan CodeMender), manakala Microsoft turut menyertai dengan penanda aras CTI-REALM. Keselamatan siber AI menjadi usaha kolektif — walaupun model asas saling bersaing.
Bagi pengguna akhir, hasilnya sudah tiba. Claude Opus 4.7 menyepadukan pagar siber pertama yang diwarisi daripada Mythos, dan versi model OpenAI dan Google pada masa depan akan mendapat manfaat daripada pengajaran perlumbaan ini.
Bandingkan pembantu AI
Soalan lazim
Kekal maklum tentang perlumbaan AI
Terima analisis kami mengenai kemajuan terkini dalam kecerdasan buatan.
Tiada spam. Berhenti langgan dalam 1 klik.
Claude Mythos dan Project Glasswing
Model AI paling berkuasa di dunia dan konsortium yang menggunakannya untuk mengamankan dunia.
Baca artikelGPT-5.4-Cyber: jawapan balas OpenAI
OpenAI melancarkan model keselamatan siber khusus dengan akses terhad.
Baca artikel




