Щойно помітив щось цікаве — з’явилась нова ринкова структура під назвою The Grid, яка підходить до задач інференсу абсолютно по-новому.
Замість звичної для всіх нас моделі API, вони побудували всю свою архітектуру навколо задачо-орієнтованого інференсу. Подумайте про це: замість простого виклику API-ендпоінту, ви фактично організовуєте роботу навколо конкретних обчислювальних завдань.
Їхні технічні креслення тільки-но з’явилися, і, чесно кажучи, філософія дизайну справді освіжаюча. Це один із тих моментів «чому ніхто раніше до цього не додумався». Вся система спроєктована так, щоб обробляти запити на інференс як окремі задачі, а не як загальні виклики API.
Для всіх, хто працює у сфері децентралізованих обчислень, це може бути варте уваги. Така орієнтація на задачі справді може вирішити деякі вузькі місця з ефективністю, з якими ми стикаємось у традиційних підходах до сервінгу моделей.
Цікаво буде побачити, як це працюватиме на практиці, коли люди почнуть тестувати цю інфраструктуру під навантаженням.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Щойно помітив щось цікаве — з’явилась нова ринкова структура під назвою The Grid, яка підходить до задач інференсу абсолютно по-новому.
Замість звичної для всіх нас моделі API, вони побудували всю свою архітектуру навколо задачо-орієнтованого інференсу. Подумайте про це: замість простого виклику API-ендпоінту, ви фактично організовуєте роботу навколо конкретних обчислювальних завдань.
Їхні технічні креслення тільки-но з’явилися, і, чесно кажучи, філософія дизайну справді освіжаюча. Це один із тих моментів «чому ніхто раніше до цього не додумався». Вся система спроєктована так, щоб обробляти запити на інференс як окремі задачі, а не як загальні виклики API.
Для всіх, хто працює у сфері децентралізованих обчислень, це може бути варте уваги. Така орієнтація на задачі справді може вирішити деякі вузькі місця з ефективністю, з якими ми стикаємось у традиційних підходах до сервінгу моделей.
Цікаво буде побачити, як це працюватиме на практиці, коли люди почнуть тестувати цю інфраструктуру під навантаженням.