金十数据2月24日讯,DeepSeek今日启动“Mã nguồn mở周”,首个Mã nguồn mở的代码库为Flash MLA——针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计。据介绍,Flash MLA的灵感来自FlashAttention 2&3和cutlass项目。
DeepSeek启动Mã nguồn mở周
金十数据2月24日讯,DeepSeek今日启动“Mã nguồn mở周”,首个Mã nguồn mở的代码库为Flash MLA——针对Hopper GPU优化的高效MLA解码内核,专为处理可变长度序列而设计。据介绍,Flash MLA的灵感来自FlashAttention 2&3和cutlass项目。