#Deepseek Goes Viral 中国の杭州に拠点を置くAIスタートアップDeepSeekは、2024年12月下旬に大型言語モデルDeepSeek-V3を発表し、グローバルなAI業界で注目を集めました。このモデルは6710億のパラメータを持っていますが、他の主要なテクノロジー企業に比べて訓練にかかる時間は約2ヶ月で、コストは558万ドルと著しく低いです。
DeepSeek-V3はオープンソースモデルの中で最高のパフォーマンスを発揮し、世界最先端のモデルと比較しています。同社は訓練プロセスを最適化し、AIトレーニングに必要な先進の半導体へのアクセス制限にもかかわらず、約278万時間のNvidiaのH800 GPUを使用してコストを最小限に抑えました。これにより、中国のAI企業が重要な進展を遂げたことが示されています。
DeepSeekの成功は、Nvidiaなどのテクノロジー企業の株価が急落し、米国のテクノロジー産業に懸念を引き起こしました。専門家は、DeepSeekがオープンソース技術と効果的なトレーニング方法の利用により、米国の競合他社よりもはるかに低コストで高いパフォーマンスを達成したと信じています。
DeepSeekは、モデルのソースコードと詳細な技術的説明を公開し、世界中の研究者や開発者がこの技術にアクセスして改善できるようにしています。この透明性は、米国の主要AI