Claude Mythos vs GPT-5.4-Cyber: Perbandingan Model AI Keselamatan Siber 2026

Dalam tempoh seminggu, dua makmal AI terbesar di dunia masing-masing mendedahkan model khusus untuk keselamatan siber. Di satu pihak, [Anthropic](https://anthropic.com) dengan [Claude Mythos Preview](/blog/claude-mythos-project-glasswing-keselamatan-siber) — model frontier baharu sepenuhnya yang menemui beribu-ribu kerentanan zero-day. Di pihak lain, [OpenAI](https://openai.com) dengan [GPT-5.4-Cyber](/blog/openai-gpt-5-4-cyber-keselamatan-siber) — fine-tuning khusus GPT-5.4. Dua falsafah yang berbeza secara radikal untuk objektif yang sama: mengamankan dunia digital sebelum penyerang merebut alat yang sama.

Intipati dalam 30 saat

Anthropic mencipta model frontier baharu sepenuhnya (Mythos) yang melampaui manusia terbaik dalam keselamatan siber. OpenAI melakukan fine-tune model sedia ada (GPT-5.4) dengan pagar keselamatan dikurangkan. Mythos diedarkan melalui konsortium elit (Project Glasswing, 50+ organisasi, 100J$ kredit). GPT-5.4-Cyber melalui program pengesahan individu (Trusted Access). Pada penanda aras siber, Mythos mendominasi dengan ketara (CyberGym: 83.1% vs 66.6% untuk Opus 4.6). Keputusan GPT-5.4-Cyber tidak diterbitkan.

Dua pendekatan, satu kecemasan

Kebetulan masa ini bukan secara rawak. Kedua-dua syarikat mengenal pasti fenomena yang sama: model AI semasa telah menjadi cukup berkuasa untuk menemui dan mengeksploitasi kerentanan perisian pada skala yang belum pernah berlaku. Jangka masa antara penemuan kelemahan dan eksploitasinya oleh musuh telah menurun daripada bulan kepada minit. Anthropic dan OpenAI menghadapi dilema yang sama: bagaimana menggunakan kuasa ini untuk mempertahankan dan bukannya menyerang?

Pertembungan teknikal

Kriteria	Claude Mythos Preview	GPT-5.4-Cyber
Jenis model	Model frontier baharu sepenuhnya	Fine-tuning GPT-5.4 sedia ada
Nama kod	Capybara	N/A
Tarikh pengumuman	8 April 2026	14 April 2026
Program akses	Project Glasswing (konsortium)	Trusted Access for Cyber (pengesahan)
Organisasi bertauliah	~50 (AWS, Apple, Google, Microsoft...)	Profesional disahkan secara individu
Pelaburan diumumkan	100J$ kredit + 4J$ sumber terbuka	Tidak didedahkan
Pagar keselamatan	Terhad oleh model paling berkuasa pernah dicipta	Dikurangkan sengaja untuk tugas keselamatan
Zero-day ditemui	Beribu-ribu (semua OS dan pelayar utama)	Tidak didedahkan
SWE-bench Verified	93.9%	N/A (GPT-5.4 standard tersedia)
CyberGym	83.1%	Tidak diterbitkan
Harga	25$/125$ per juta token	Tidak didedahkan
Ketersediaan awam	Tidak dirancang	Tidak dirancang

Claude Mythos Preview vs GPT-5.4-Cyber: perbandingan lengkap

Anthropic: laluan konsortium

Pendekatan Anthropic tidak pernah berlaku sebelum ini dalam sejarah AI. Daripada mengedarkan Mythos melalui program biasa, syarikat itu mencipta [Project Glasswing](/blog/claude-mythos-project-glasswing-keselamatan-siber) — konsortium pertahanan yang menghimpunkan nama-nama terbesar dalam teknologi dan kewangan. AWS, Apple, Google, Microsoft, Nvidia, CrowdStrike, JPMorgan Chase, Palo Alto Networks dan Linux Foundation bekerjasama untuk mengimbas dan mengamankan perisian paling kritikal di dunia.

Hasilnya mengagumkan: dalam beberapa minggu, Mythos menemui beribu-ribu kerentanan zero-day, termasuk kelemahan berusia 27 tahun dalam OpenBSD dan satu lagi berusia 16 tahun dalam FFmpeg. Model ini malah secara autonomi merantai beberapa kerentanan kernel Linux untuk mencipta eksploit lengkap peningkatan keistimewaan.

OpenAI: laluan program pengesahan

OpenAI mengambil pendekatan yang lebih konvensional tetapi berpotensi lebih berskala. GPT-5.4-Cyber diedarkan melalui versi lanjutan program Trusted Access for Cyber, yang mengesahkan setiap profesional keselamatan secara individu. Kelebihannya: saluran akses yang lebih lancar. Kekurangannya: kurang penyelarasan antara peserta.

Perbezaan teknikal juga asasi: GPT-5.4-Cyber ialah fine-tuning GPT-5.4, bukan model baharu. Ia diselaraskan untuk mengurangkan penolakan pada tugas keselamatan yang sah. Mythos, sebaliknya, mempunyai keupayaan siber yang muncul — ia tidak ditambah melalui fine-tuning tetapi timbul secara semula jadi daripada kuasa model.

Siapa yang menang?

Di atas kertas, Anthropic jelas mendahului pusingan pertama ini. Mythos ialah model yang secara asasnya lebih berkuasa, keputusan keselamatan sibernya didokumentasikan dan mengagumkan, dan pendekatan konsortium Glasswing lebih bercita-cita tinggi. OpenAI tidak menerbitkan penanda aras untuk GPT-5.4-Cyber, menjadikan perbandingan langsung mustahil.

Tetapi perlumbaan baru sahaja bermula. OpenAI mempunyai kelebihan pengedaran — program pengesahannya lebih mudah diakses berbanding konsortium eksklusif Glasswing. Dan fine-tuning mempunyai kelebihan boleh diulang dengan cepat: setiap versi baharu GPT-5.x boleh dikhususkan untuk siber dalam beberapa minggu.

Idealnya bagi profesional keselamatan siber ialah mempunyai akses kepada kedua-duanya. Mythos untuk penemuan kerentanan kompleks, GPT-5.4-Cyber untuk kerja keselamatan harian. Persaingan antara Anthropic dan OpenAI menguntungkan semua orang.

Bagaimana pula yang lain?

Google dan Microsoft tidak ketinggalan. Google ialah rakan kongsi Project Glasswing (melalui alatnya Big Sleep dan CodeMender), manakala Microsoft turut menyertai dengan penanda aras CTI-REALM. Keselamatan siber AI menjadi usaha kolektif — walaupun model asas saling bersaing.

Bagi pengguna akhir, hasilnya sudah tiba. Claude Opus 4.7 menyepadukan pagar siber pertama yang diwarisi daripada Mythos, dan versi model OpenAI dan Google pada masa depan akan mendapat manfaat daripada pengajaran perlumbaan ini.

Bandingkan pembantu AI

Soalan lazim

Kekal maklum tentang perlumbaan AI

Terima analisis kami mengenai kemajuan terkini dalam kecerdasan buatan.

Tiada spam. Berhenti langgan dalam 1 klik.

Claude Mythos dan Project Glasswing

Model AI paling berkuasa di dunia dan konsortium yang menggunakannya untuk mengamankan dunia.

Baca artikel

GPT-5.4-Cyber: jawapan balas OpenAI

OpenAI melancarkan model keselamatan siber khusus dengan akses terhad.