Huawei випустила нову AI-інфраструктуру даних, прискорюючи оновлення досвіду дедукції у всіх сценаріях

Сіньлунь Техно, 17 березня ввечері, у повідомленні на конференції з нових рішень зберігання даних Huawei 2026, Huawei офіційно представила нову інфраструктуру даних AI для сценаріїв AI-інференції, що включає платформу даних AI для центральних сценаріїв інференції та FusionCube A1000 AI гіперконвергентний інтегрований пристрій для сценаріїв інференції на краю, що має на меті повністю оновити досвід інференції AI, суттєво знизити поріг розгортання інференції та прискорити позитивний цикл бізнесу AI.

Щоб вирішити три основні проблеми в бізнесі інференції, зокрема недостатню якість знань, поганий досвід довгих послідовностей інференції та відсутність пам’яті інференції, Huawei випустила платформу даних AI, яка інтегрує базу знань, прискорення KV Cache та пам’яті, а також комбінує технологію UCM для реалізації планування та управління, знімаючи бар’єри для даних AI в компаніях та прискорюючи впровадження розумних агентів.

Платформа даних AI Huawei використовує оптимізацію розбору, оптимізацію репрезентації та оптимізацію пошуку від кінця до кінця, забезпечуючи AI-канал даних, що чутливо реагує на зміни даних на джерелі, і за допомогою багатопараметричного безвтратного розбору та кодування на рівні токенів перетворює текст, зображення, відео та інші ресурси на величезні обсяги деталей знань, комбінуючи багатовимірний пошук та повторне упорядкування, досягаючи точності пошуку знань понад 95%; платформа даних AI Huawei надає глобальні рівневі можливості кешування, дозволяючи даним пам’яті в On-chip пам’яті, DRAM та зовнішньому SSD зберігатися між трьома шарами за потребою, суттєво розширюючи сховище KV Cache, одночасно інтегруючи різноманітні алгоритми розрідженої уваги, щоб уникнути повторних обчислень, істотно розширюючи контекстне вікно, досягаючи зниження затримки першого токену на 90%; платформа даних AI Huawei забезпечує точне витягування та виклик пам’яті, зберігаючи контекстний стан та конденсуючи інформацію. Чим більше пам’яті, тим точнішим є інференція, і моделі можуть ставати “все розумнішими”.

Представлена платформа даних AI може забезпечувати два основні режими розгортання: інтегроване та незалежне. Інтегроване розгортання базується на OceanStor A800 як основі для всього стеку; незалежне розгортання використовує архітектуру “вузол даних + OceanStor Dorado”, що дозволяє додавати нові вузли даних до існуючих систем зберігання, захищаючи історичні інвестиції та підтримуючи плавний перехід бізнесу.

Сьогодні велика кількість даних генерується в сценаріях на краю. У процесі інтелектуальної трансформації традиційних сценаріїв на краю, які стикаються з проблемами складності розгортання, високих витрат та низької ефективності, Huawei випустила FusionCube A1000 AI гіперконвергентний інтегрований пристрій, що сприяє швидкому розгортанню AI та ефективній роботі через інтеграцію та інтелектуальну доставку. FusionCube A1000 використовує інтегровану архітектуру, що поєднує обчислення та інтелектуальні обчислення, забезпечуючи “готовність до використання” для розгортання AI; крім того, FusionCube A1000 підтримує співпрацю між краєм та центром, знімаючи ізоляцію даних та формуючи замкнене коло для агентів, від сприйняття до автономного прийняття рішень.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Репост
  • Поділіться
Прокоментувати
Додати коментар
Додати коментар
Немає коментарів
  • Популярні активності Gate Fun

    Дізнатися більше
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.22KХолдери:1
    0.00%
  • Рин. кап.:$2.28KХолдери:2
    0.32%
  • Рин. кап.:$2.23KХолдери:0
    0.00%
  • Рин. кап.:$2.23KХолдери:1
    0.00%
  • Закріпити