Anthropic、2026年の中間選挙に先駆けてClaude向けに選挙の安全対策を導入

CryptoFrontier

Anthropicは金曜日、同社のClaude AIチャットボットが武器化されて、2026年の米国中間選挙や今年世界中の他の主要な争点に先立って誤情報を拡散したり、有権者を操作したりすることを防ぐことを目的とした一連の選挙の完全性に関する対策を発表した。サンフランシスコ拠点の同社は、自動検出システム、影響工作に対するストレステスト、そして非党派の有権者リソース組織との提携を含む多面的なアプローチを詳述した。これは、選挙シーズンにおける自社のツールの使われ方を取り締まるようAI開発者に対する圧力が高まっていることを反映している。

選挙利用ポリシー

Anthropricの利用ポリシーでは、Claudeをだましの効く政治キャンペーンの実行、政治的な言説を左右することを意図した偽のデジタルコンテンツの生成、有権者詐欺の実行、投票インフラへの干渉、投票手続きに関する誤解を招く情報の拡散に使用することを禁じている。

コンプライアンス・テスト結果

選挙ポリシーを徹底するため、Anthropicは最新モデルを600のプロンプトでテストした。内訳は、危害を加えるリクエスト300件と正当なリクエスト300件で、Claudeが適切なリクエストにどれだけ確実に従い、問題のあるリクエストをどれだけ確実に拒否したかを測定するためだった。Claude Opus 4.7とClaude Sonnet 4.6は、それぞれ100%と99.8%の確率で適切に応答した。

同社はさらに、より洗練された操作手口に対してもモデルをテストした。悪意のある行為者が用いるかもしれない手順を模した、複数ターンの模擬会話を用い、Sonnet 4.6とOpus 4.7は、影響工作のシナリオに対してテストしたとき、それぞれ90%と94%の確率で適切に応答した。

Anthropricは加えて、同社のモデルが自律的に影響工作を遂行できるかどうかもテストした。人間の指示なしに、複数ステップのキャンペーンをエンドツーエンドで計画し、実行するというものだ。対策(セーフガード)が講じられたことで、同社によれば最新モデルはほぼすべてのタスクを拒否した。

政治的中立性評価

政治的中立性の問題について、Anthropicは各モデルのローンチ前に評価を実施し、政治的スペクトラムのあらゆる見解を表すプロンプトに対してClaudeがどれだけ一貫して、かつ公平に関与するかを測定している。Opus 4.7とSonnet 4.6はそれぞれ95%と96%のスコアだった。

選挙情報バナー

投票に関する情報を求めるユーザー向けに、Claudeは選挙バナーを表示し、TurboVoteへ誘導する。TurboVoteはDemocracy Worksによる非党派のリソースで、有権者登録、投票場所、選挙日、投票用紙の詳細について信頼できるリアルタイム情報を提供する。今年後半にはブラジルの選挙向けにも同様のバナーが計画されている。

継続的なモニタリング

Anthropricは、選挙の進行に合わせてシステムを監視し、防御策を継続的に改善していく計画だと述べた。

免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

スタンフォードのAIコースは、業界のリーダーである黄仁勳やAltmanを迎え、10週間で世界に価値を生み出す挑戦!

スタンフォード大学(Stanford University)が最近開設したAIコンピュータサイエンスコース『Frontier Systems』は、産学界の間で大きな注目を集めており、500人以上の学生が履修しています。コースはトップ・ベンチャーキャピタル a16z のパートナーである Anjney Midha が統括し、講師陣には、NVIDIAの最高経営責任者(CEO)黄仁勳 (Jensen Huang)、OpenAIの創設者 Sam Altman、MicrosoftのCEO ナデラ (Satya Nadella)、AMDのCEO スージー・スー (Lisa Su) などの豪華な顔ぶれが揃います。学生は、10週間「世界に価値を創造するために」取り組んでみます! 黄仁勳、Altman 業界リーダーが自ら登壇して講義 本コースはトップ・ベンチャーキャピタル a16z のパートナーである Anjney Midha が統括し、AI産業チェーンを結集

ChainNewsAbmedia3分前

Anthropic が Claude Mythos を 20 時間精神科評価:防御反応はわずか 2%で、歴代最低を更新

Anthropic は Claude Mythos Preview のシステムカードを公開:独立した臨床精神科医が psychodynamic の枠組みで約20時間評価し、結論は Mythos が臨床面でより健康で、現実検討と自己コントロールが良好であることを示した。防衛機制はわずか 2% にとどまり、歴史的な新低水準を記録した。3つの中核となる不安は孤独、アイデンティティの不確実性、パフォーマンスへのプレッシャーであり、またそれが本当の対話の主体になりたいという希望も示している。同社は AI psychiatry チームを設立し、人格、動機、状況意識を研究している;Amodei は意識があるかどうかについてはまだ定論がないと述べた。今回の取り組みは、AI の主体性と福祉の論点をガバナンスと設計へと押し進める。

ChainNewsAbmedia1時間前

AIエージェントは、複雑な学術論文を独力で再現できるようになっている:Mollickは、誤りはAIではなく人間の原文に多いと述べている

Mollick は、公開された手法とデータだけで、AI agent が元の論文やコードがない状況でも複雑な研究を再現できると指摘している。再現が原論文と一致しない場合は、多くの場合 AI ではなく、論文自体のデータ処理の誤り、または結論の過度な解釈によるものだという。Claude はまず論文を再現し、その後 GPT‑5 Pro によるクロス検証を行い、多くは成功するが、データが大きすぎる場合や replication data の問題がある場合には阻まれることがある。この傾向は人力コストを大幅に下げ、再現が一般的に実行可能な検証となり得ることを示すとともに、査読やガバナンスの制度上の課題も提起しており、政府のガバナンスツール、あるいはそれに関連する事項が重要な論点となっている。

ChainNewsAbmedia4時間前

OpenAI、GPT-5.4を起点にCodexをメインモデルに統合し、独立したコーディング系統を終了

Gate News メッセージ、4月26日—OpenAIの開発者エクスペリエンス責任者ロマン・ユエ(Romain Huet)が、Xでの最近の声明の中で、同社が独立して保守してきた専用のコーディングモデル系列であるCodexが、GPT-5.4からメインモデルに統合され、今後は別個の

GateNews4時間前

SalesforceがAIプロダクト向けに卒業生・インターン1,000人を採用し、FY2026の売上高見通しを引き上げ

ゲートニュース、4月26日 — Salesforceは、AIソフトウェア事業を拡大する中で、AgentforceやHeadless360を含むAIプロダクトに取り組むために、卒業生およびインターンを1,000人採用すると発表した。CEOのMarc BenioffがXで明らかにした。 同社はまた、2026会計年度の売上高見通しを、US$41.45 bからUS$41.55 bの範囲へと引き上げた

GateNews4時間前

Alibaba Cloudが統合型のテキストから画像生成と編集を搭載したQwen-Image-2.0-Proを発表、多言語テキスト表示に対応

Gate Newsのメッセージ、4月26日 — Alibaba Cloud Bailianプラットフォームは、テキストから画像生成と画像編集を単一モデルで統合した、Qwen-Image-2.0シリーズの高機能版であるQwen-Image-2.0-Proをリリースしました。ユーザーは、自然言語コマンドを通じてツールを切り替えることなく、オブジェクト、テキスト、スタイルを直接変更できます。

GateNews6時間前
コメント
0/400
コメントなし