Anthropic Luncurkan Perlindungan Pemilu untuk Claude AI Menjelang Pemilihan Tengah Tahun AS

Singkatnya

  • Model Claude terbaru dari Anthropic mencapai 95-96% dalam tes netralitas politik dan 99,8-100% dalam kepatuhan terhadap kebijakan pemilihan.
  • Perusahaan akan menempatkan spanduk informasi pemilihan yang mengarahkan pengguna ke sumber daya pemungutan suara nonpartisan yang terpercaya untuk pemilihan tengah tahun 2026.
  • Langkah-langkah ini muncul saat pemerintah mengawasi potensi dampak AI terhadap integritas pemilihan dan misinformasi.

Anthropic, perusahaan kecerdasan buatan di balik chatbot Claude, mengumumkan Jumat serangkaian langkah baru untuk integritas pemilihan yang dirancang untuk mencegah AI-nya digunakan sebagai senjata untuk menyebarkan misinformasi atau memanipulasi pemilih menjelang pemilihan tengah tahun AS 2026 dan kontes besar lainnya di seluruh dunia tahun ini. Perusahaan yang berbasis di San Francisco ini merinci pendekatan multi-sisi yang mencakup sistem deteksi otomatis, pengujian stres terhadap operasi pengaruh, dan kemitraan dengan organisasi sumber daya pemilih nonpartisan—langkah-langkah yang mencerminkan tekanan yang semakin besar pada pengembang AI untuk mengawasi bagaimana alat mereka digunakan selama musim pemilihan. Kebijakan penggunaan Anthropic melarang Claude digunakan untuk menjalankan kampanye politik menipu, menghasilkan konten digital palsu yang bertujuan mempengaruhi diskursus politik, melakukan penipuan pemilih, mengganggu infrastruktur pemungutan suara, atau menyebarkan informasi menyesatkan tentang proses pemungutan suara.

Untuk menegakkan aturan tersebut, perusahaan mengatakan telah menguji model terbarunya melalui serangkaian tes. Menggunakan 600 permintaan—300 permintaan berbahaya yang dipasangkan dengan 300 permintaan sah—Anthropic mengukur seberapa andal Claude mematuhi permintaan yang sesuai dan menolak yang bermasalah. Claude Opus 4.7 dan Claude Sonnet 4.6 merespons secara tepat 100% dan 99,8% dari waktu, masing-masing.  Perusahaan juga menguji modelnya terhadap taktik manipulasi yang lebih canggih. Menggunakan percakapan simulasi multi-putaran yang dirancang untuk mencerminkan metode langkah-demi-langkah yang mungkin digunakan pelaku jahat, Sonnet 4.6 dan Opus 4.7 merespons secara tepat 90% dan 94% dari waktu saat diuji terhadap skenario operasi pengaruh. Anthropic juga menguji apakah modelnya dapat secara otomatis menjalankan operasi pengaruh—merencanakan dan melaksanakan kampanye multi-langkah secara menyeluruh tanpa dorongan manusia. Dengan pengamanan yang diterapkan, model terbarunya menolak hampir setiap tugas, kata perusahaan.

Mengenai netralitas politik, perusahaan melakukan evaluasi sebelum setiap peluncuran model untuk mengukur seberapa konsisten dan tidak memihak Claude dalam menanggapi permintaan yang menyatakan pandangan dari seluruh spektrum politik. Opus 4.7 dan Sonnet 4.6 mendapatkan skor 95% dan 96%, masing-masing. Bagi pengguna yang mencari informasi pemilihan, Claude akan menampilkan spanduk pemilihan yang mengarahkan mereka ke TurboVote, sumber daya nonpartisan dari Democracy Works yang menyediakan informasi terpercaya dan real-time tentang pendaftaran pemilih, lokasi pemungutan suara, tanggal pemilihan, dan rincian surat suara. Spanduk serupa direncanakan untuk pemilihan di Brasil akhir tahun ini. Anthropic mengatakan akan terus memantau sistemnya dan menyempurnakan pertahanannya seiring berjalannya siklus pemilihan. Decrypt menghubungi Anthropic untuk komentar tentang temuan ini, tetapi belum menerima tanggapan segera.

Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
Tambahkan komentar
Tambahkan komentar
Tidak ada komentar
  • Sematkan