Изображение предоставлено: создано с помощью инструментов Unbounded AI.
Поле битвы за мегамодели ИИ фрагментируется.
В качестве предохранителя Chatgpt открыл дверь в эру ИИ 2.0, а ИИ 2.0 характеризуется «промышленным интеллектом и цифровизацией», которые могут эффективно заменить рабочую силу и широко использоваться во всех сферах жизни. уже прошел период разгона, реализация большой модели ИИ более реалистична.
Наиболее типичным проявлением является то, что большая модель ИИ выходит за пределы круга более широко, а не только на стороне Б. Например, несмотря на то, что chatGPT существует уже более полугода, автор до сих пор слышит голоса рабочих-мигрантов, говорящих о chatGPT в кофейне внизу в центральном деловом районе Шанхая; по сообщениям СМИ, некоторые компании также используют AIGC в качестве инструмент продуктивности.
Как сказал Чжан Юн, председатель и главный исполнительный директор Alibaba Group и главный исполнительный директор Alibaba Cloud Intelligence Group: «В эпоху искусственного интеллекта все продукты стоит переделывать с помощью большой модели.
Крупные заводы, научно-исследовательские институты и предприниматели подошли к концу.
Последовательно появляются крупные производители, такие как Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong и другие крупные модели, за которыми следуют Tencent Hunyuan, HKUST. линия для выхода в интернет.
У предпринимателей также есть знаменитости: Ван Сяочуань, основатель Sogou, Ван Хуэйвэнь, соучредитель Meituan, Кайфу Ли, председатель Sinovation Works, и другие громко появлялись в крупных моделях ИИ.
Увлечение крупномасштабными моделями ИИ, длившееся более нескольких месяцев, породило два пути.
Гонка ИИ, дифференциация крупных моделей
Большие модели ИИ вступили в стадию конкуренции, и пути постепенно расходятся.
По мере того, как модель ИИ постепенно нагревается, согласно статистике СМИ, в начале февраля в разделе «ChatGPT» Oriental Fortune было всего 29 акций, а сейчас оно достигло 61 акции, и число продолжает расти. . Согласно неполным статистическим данным, на данный момент более 40 компаний и учреждений в моей стране выпустили крупномасштабные модельные продукты или объявили о планах крупномасштабных моделей.
Среди них игроки, участвующие в «гонке вооружений» масштабных моделей ИИ, также разработали два направления развития. Вертикальные большие модели и общие большие модели становятся двумя основными направлениями развития в области искусственного интеллекта.
Вертикальные большие модели относятся к моделям, оптимизированным для конкретных областей или задач, таких как распознавание речи, обработка естественного языка, классификация изображений и т. д.
В настоящее время все больше компаний вступают в русло вертикальных крупномасштабных моделей. Xueersi объявила, что разрабатывает большую собственную математическую модель под названием MathGPT для энтузиастов математики и научно-исследовательских институтов по всему миру; 6 мая компания Taoyun Technology объявила о запуске большой когнитивной модели для детей — Alpha Egg Children's Cognitive Big Модель предлагает детям новый интерактивный опыт с точки зрения самовыражения, развития эмоционального интеллекта, вдохновения на творчество и помощи в обучении.
Общие большие модели относятся к моделям, которые могут обрабатывать несколько задач и доменов, таких как BERT, GPT и т. д.
Из-за преимуществ капитала и талантов крупные производители в основном нацелены на выпуск крупных моделей общего назначения.
Крупные производители нацелены на универсальные большие модели, с одной стороны, они могут совмещать возможности ИИ со своими продуктами, более представительны интернет-компании и технологические гиганты, такие как Alibaba, Huawei и Baidu.
Например, после интеграции Microsoft GPT-4 в корзину семейства Office, "Tongyi Qianwen" Али также начал получать доступ к DingTalk. Пользователи могут создавать контент в документах, а в видеоконференциях они могут создавать личные представления и контент.
Например, крупная модель Baidu также может быть объединена с собственным бизнесом. «Wen Xin Yi Yan» может иметь качественное преобразование в итерации поисковых систем. NetEase «Yuyan» и JD.com «ChatJD» могут быть использованы сначала в их собственные производства.
С другой стороны, универсальная крупная модель имеет широкое применение, и те, кто превзойдет все ожидания, смогут получить преимущество первопроходца и стать лидером в эпоху AI2.0. Ведь всем известна истина, что «кто быстро бегает, тот получает мясо, а тот, кто бежит медленно, доедает только объедки».
Модель больших вертикальных приложений можно описать как «чистый поток». Поскольку большая модель вертикальных приложений больше соответствует потребностям вертикальных сценариев и имеет более высокое качество, чем общая большая модель, многие компании также увидели возможности. Например, Shenlan, Mobvoi, Youdao и другие компании, специализирующиеся на конкретных треках ИИ.
Развитие больших вертикальных моделей в основном отражается в постоянном улучшении производительности моделей в различных областях, например, количество ошибок при распознавании речи снижается из года в год, а способность семантического понимания обработки естественного языка продолжает улучшаться. Общая большая модель добилась значительного прогресса в многозадачном обучении и трансферном обучении и стала важным направлением исследований в области обработки естественного языка.
Например, большие биологические модели могут повысить эффективность фармацевтических препаратов ИИ. Отчеты зарубежных исследований показывают, что ИИ может повысить вероятность успеха исследований и разработок новых лекарств на 16,7%, а исследования и разработки лекарств с помощью ИИ могут ежегодно экономить 54 миллиарда долларов США на затратах на исследования и разработки и экономить от 40% до 60%. время и затраты в основном процессе исследований и разработок. Согласно общедоступной информации Nvidia, использование технологии искусственного интеллекта может сократить время, необходимое для раннего обнаружения лекарств, до одной трети и сократить расходы до одной двухсотой.
С отраслевой точки зрения общая модель представляет собой «энциклопедию», способную ответить на любой вопрос и применимую к разным промышленным почвам, тогда как вертикальная модель подобна эксперту в одной области, хотя она и профессиональна, но ее аудитория суждено быть небольшому количеству людей.
Данные неустранимы
Преимущество вертикальной большой модели в том, что она недостаточно «большая»: вычислительная мощность недостаточно велика, а сложность алгоритма невысока.
После того, как Ван Сяочуань вошел в курс крупномасштабных моделей, он всегда подчеркивал, что направление будущих усилий не в том, чтобы делать AGI (общий искусственный интеллект), как OpenAI, а в том, чтобы делать крупномасштабные модели вертикально в определенных конкретных областях и реализовывать посадочные приложения. .
Большая модель в широком смысле на самом деле описывает большую модель общего назначения.Так же, как и «большая» модель, причина, по которой большая модель является «большой», заключается в большом количестве параметров и огромном объеме данных, которые имеют большое влияние на алгоритмы, вычислительную мощность и пространство для хранения данных.Большие требования, и это не только люди, которые могут составить, но и нужно много денег. Вы знаете, успех Open AI также был построен Microsoft на миллиарды долларов. Огромный спрос на капитал также является испытанием для определения основных производителей в исследованиях и разработках.
В последние пять лет количество параметров больших моделей ИИ ежегодно увеличивается на порядок, например, количество параметров ОШП-4 в 16 раз больше, чем у ОШП-3, достигая 1,6 трлн. введение мультимодальных данных, таких как изображения, аудио и видео, объем данных больших моделей также быстро увеличивается. Это означает, что если вы хотите играть с большой моделью, у вас должна быть большая вычислительная мощность.
По сравнению с крупными производителями, компании, которые производят вертикальные крупномасштабные модели, имеют относительно мало средств, вычислительной мощности и данных, поэтому они фактически не находятся на той же стартовой линии, что и производители крупномасштабных моделей общего назначения.
Точно так же, как новые энергетические автомобили неотделимы от трех основных компонентов: двигателей, аккумуляторов и электронного управления, большие модели ИИ не могут быть отделены от поддержки вычислительной мощности, алгоритмов и данных.
Среди вычислительной мощности, алгоритмов и данных данные представляют собой сложность больших вертикальных моделей.
Среди трех элементов сложность исследования и разработки алгоритма относительно невелика.Существующие компании имеют свои собственные алгоритмы пути для реализации больших моделей, и есть много проектов с открытым исходным кодом для справки.
Чип определяет вычислительную мощность.Общая большая модель ИИ нуждается в более производительном чипе для завершения обучения и построения общей нейронной сети модели.Тем не менее, текущий чип менее разработан самостоятельно, и он по-прежнему в основном поступает извне. Например, для ChatGPT больше всего подходит чип от Nvidia, флагманский чип H100 и субфлагманский чип A100.
Сложность заключается в данных. Высококачественные данные — это ключ к обучению и настройке ИИ.Достаточные и подробные данные — основа генеративных больших моделей ИИ.
Согласно предыдущему раскрытию OpenAI, количество одних только параметров ChatGPT3 достигло 175 миллиардов, а данные обучения достигли 45 ТБ.
Из-за относительно зрелого развития мобильного Интернета в Китае большое количество китайских ресурсов данных хранится на различных предприятиях или в учреждениях, что затрудняет их совместное использование.
«Поскольку многие бизнес-данные, логистические данные, финансовые данные и т. д. предприятия являются очень важными частными данными, трудно представить, что China Star Optoelectronics или PetroChina будут использовать эти данные для обучения других», — Сюй Хуэй, Генеральный директор Chuangxinqizhi недавно дал интервью по ценным бумагам В интервью Times он также прямо сказал.
Если взять в качестве примера фармацевтическую промышленность ИИ, большие биологические модели сталкиваются с проблемой «застревания» в технологиях. Стоимость получения высокоточных экспериментальных данных для исследования и разработки лекарств относительно высока, а в общедоступной базе данных имеется большое количество немаркированных данных.Необходимо эффективно использовать как большой объем немаркированных данных, так и небольшой объем высокоточных данных, поэтому к построению модели предъявляются более высокие требования.
**Кто заработает первый горшочек с золотом? **
Независимо от модели, коммерциализация является ключевым вопросом. Судя по нынешним игрокам ИИ с большими моделями, они быстро расширяют возможности и коммерциализируют.
Хотя крупномасштабная модель общего назначения и вертикальная крупномасштабная модель идут разными путями, они все же являются «семейными» по своей сути и находятся в одном и том же направлении, поэтому проблемы конкуренции не избежать.
Для общей крупномасштабной модели вертикальная крупномасштабная модель приземляется первой, и траектория общей крупномасштабной модели будет уже. Точно так же после того, как крупномасштабные модели общего назначения быстро захватят рынок, вертикальным крупномасштабным моделям с узкими бизнес-направлениями будет труднее зарабатывать деньги.
На идеальном этапе, будь то экономическая модель или универсальная ценность, крупномасштабная модель общего назначения лучше вертикальной крупномасштабной модели. Однако реальная жизнь — не утопия, кто быстрее пробежит между универсальной крупномасштабной моделью и вертикальной крупномасштабной моделью, зависит от конкуренции между различными предприятиями.
Судя по горячему AIGC в прошлом году. По сравнению с разрешением пользователям использовать ИИ для создания контента с более низким порогом на C-конце, некоторые участники рынка считают, что B-конец будет более важной бизнес-моделью AIGC.
Huawei также уделяет больше внимания собственному бизнесу ToB. На пресс-конференции Huawei заявила, что большая модель Huawei Pangu в основном использует ИИ для расширения возможностей отраслей и используется во многих отраслях, таких как электроэнергетика, финансы и сельское хозяйство.Среди них большая модель CV используется в шахтах, а NLP большая модель используется в интеллектуальном поиске документов.
Например, компания Baidu, специализирующаяся на поисковых системах, запустила Wenxin Yiyan с такими атрибутами поиска, как GPT-3.
Помимо ChatGPT, на самом деле до порыва масштабных моделей ИИ были сцены приземления.Эти "большие" модели на самом деле в основном вертикальные крупномасштабные модели.
Языковая модель: такая как GPT, BERT и т. д., в основном используется в области обработки естественного языка, например, машинного перевода, генерации текста, анализа настроений и т. д.
Модели изображений: такие как ResNet, Inception и т. д., которые в основном используются в области компьютерного зрения, например классификация изображений, обнаружение целей, сегментация изображений и т. д.
Модель рекомендаций: такие как DNN, RNN и т. д., которые в основном используются в области систем рекомендаций, таких как рекомендации по продуктам и рекомендации по рекламе.
Чат-боты: такие как Seq2Seq, Transformer и т. д., которые в основном используются в таких сценариях, как интеллектуальное обслуживание клиентов и интеллектуальные помощники.
Управление финансовыми рисками: такие как XGBoost, LightGBM и т. д., которые в основном используются в сценариях управления рисками финансовых учреждений, таких как банки и ценные бумаги, таких как кредитный скоринг и борьба с мошенничеством.
Диагностика медицинских изображений: такие как DeepLung, DeepLesion и т. д., которые в основном используются в области диагностики медицинских изображений, таких как диагностика рака легких и патологический анализ.
Зарабатывание денег важнее, чем приземление.
Согласно отчету Guosheng Securities «Сколько вычислительных мощностей необходимо для ChatGPT», стоимость обучения GPT-3 оценивается примерно в 1,4 миллиона долларов США, а для некоторых более крупных LLM (Large Language Model) стоимость обучения составляет от 2 миллиона долларов США и 12 миллионов долларов США между ними. Исходя из среднего количества уникальных посетителей ChatGPT в январе, равного 13 миллионам, соответствующий спрос на чипы составляет более 30 000 графических процессоров NVIDIA A100, первоначальные инвестиционные затраты составляют около 800 миллионов долларов США, а ежедневные затраты на электроэнергию составляют около 50 000 долларов США.
Нет сомнения, что крупномасштабные модели общего назначения более широко используются в посадочных сценариях.Для игроков, которые уверены в крупномасштабных моделях общего назначения, коммерциализация на втором месте.Вертикальные крупномасштабные модели нуждаются в более быстрой коммерциализации, чтобы покрыть дно линия, поэтому вертикальные крупномасштабные модели имеют больше преимуществ. Высокая вероятность и более высокая скорость внедрения.
Нет однозначного ответа, кто первым может сформировать абсолютное преимущество. Эта «гонка вооружений» крупных моделей ИИ похожа на смену бабочки с сети 1 на сеть 2. Предприятия соревнуются со временем, и тот, кто первым воспользуется возможностью, захватит рынок.
Посмотреть Оригинал
Содержание носит исключительно справочный характер и не является предложением или офертой. Консультации по инвестициям, налогообложению или юридическим вопросам не предоставляются. Более подробную информацию о рисках см. в разделе «Дисклеймер».
Общая вертикаль VS, большая модель подошла к первой точке совпадения
Источник: Shenmou Finance, автор | Чжан Вэй
Поле битвы за мегамодели ИИ фрагментируется.
В качестве предохранителя Chatgpt открыл дверь в эру ИИ 2.0, а ИИ 2.0 характеризуется «промышленным интеллектом и цифровизацией», которые могут эффективно заменить рабочую силу и широко использоваться во всех сферах жизни. уже прошел период разгона, реализация большой модели ИИ более реалистична.
Наиболее типичным проявлением является то, что большая модель ИИ выходит за пределы круга более широко, а не только на стороне Б. Например, несмотря на то, что chatGPT существует уже более полугода, автор до сих пор слышит голоса рабочих-мигрантов, говорящих о chatGPT в кофейне внизу в центральном деловом районе Шанхая; по сообщениям СМИ, некоторые компании также используют AIGC в качестве инструмент продуктивности.
Как сказал Чжан Юн, председатель и главный исполнительный директор Alibaba Group и главный исполнительный директор Alibaba Cloud Intelligence Group: «В эпоху искусственного интеллекта все продукты стоит переделывать с помощью большой модели.
Крупные заводы, научно-исследовательские институты и предприниматели подошли к концу.
Последовательно появляются крупные производители, такие как Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong и другие крупные модели, за которыми следуют Tencent Hunyuan, HKUST. линия для выхода в интернет.
У предпринимателей также есть знаменитости: Ван Сяочуань, основатель Sogou, Ван Хуэйвэнь, соучредитель Meituan, Кайфу Ли, председатель Sinovation Works, и другие громко появлялись в крупных моделях ИИ.
Увлечение крупномасштабными моделями ИИ, длившееся более нескольких месяцев, породило два пути.
Гонка ИИ, дифференциация крупных моделей
Большие модели ИИ вступили в стадию конкуренции, и пути постепенно расходятся.
По мере того, как модель ИИ постепенно нагревается, согласно статистике СМИ, в начале февраля в разделе «ChatGPT» Oriental Fortune было всего 29 акций, а сейчас оно достигло 61 акции, и число продолжает расти. . Согласно неполным статистическим данным, на данный момент более 40 компаний и учреждений в моей стране выпустили крупномасштабные модельные продукты или объявили о планах крупномасштабных моделей.
Среди них игроки, участвующие в «гонке вооружений» масштабных моделей ИИ, также разработали два направления развития. Вертикальные большие модели и общие большие модели становятся двумя основными направлениями развития в области искусственного интеллекта.
Вертикальные большие модели относятся к моделям, оптимизированным для конкретных областей или задач, таких как распознавание речи, обработка естественного языка, классификация изображений и т. д.
В настоящее время все больше компаний вступают в русло вертикальных крупномасштабных моделей. Xueersi объявила, что разрабатывает большую собственную математическую модель под названием MathGPT для энтузиастов математики и научно-исследовательских институтов по всему миру; 6 мая компания Taoyun Technology объявила о запуске большой когнитивной модели для детей — Alpha Egg Children's Cognitive Big Модель предлагает детям новый интерактивный опыт с точки зрения самовыражения, развития эмоционального интеллекта, вдохновения на творчество и помощи в обучении.
Общие большие модели относятся к моделям, которые могут обрабатывать несколько задач и доменов, таких как BERT, GPT и т. д.
Из-за преимуществ капитала и талантов крупные производители в основном нацелены на выпуск крупных моделей общего назначения.
Крупные производители нацелены на универсальные большие модели, с одной стороны, они могут совмещать возможности ИИ со своими продуктами, более представительны интернет-компании и технологические гиганты, такие как Alibaba, Huawei и Baidu.
Например, после интеграции Microsoft GPT-4 в корзину семейства Office, "Tongyi Qianwen" Али также начал получать доступ к DingTalk. Пользователи могут создавать контент в документах, а в видеоконференциях они могут создавать личные представления и контент.
Например, крупная модель Baidu также может быть объединена с собственным бизнесом. «Wen Xin Yi Yan» может иметь качественное преобразование в итерации поисковых систем. NetEase «Yuyan» и JD.com «ChatJD» могут быть использованы сначала в их собственные производства.
С другой стороны, универсальная крупная модель имеет широкое применение, и те, кто превзойдет все ожидания, смогут получить преимущество первопроходца и стать лидером в эпоху AI2.0. Ведь всем известна истина, что «кто быстро бегает, тот получает мясо, а тот, кто бежит медленно, доедает только объедки».
Модель больших вертикальных приложений можно описать как «чистый поток». Поскольку большая модель вертикальных приложений больше соответствует потребностям вертикальных сценариев и имеет более высокое качество, чем общая большая модель, многие компании также увидели возможности. Например, Shenlan, Mobvoi, Youdao и другие компании, специализирующиеся на конкретных треках ИИ.
Развитие больших вертикальных моделей в основном отражается в постоянном улучшении производительности моделей в различных областях, например, количество ошибок при распознавании речи снижается из года в год, а способность семантического понимания обработки естественного языка продолжает улучшаться. Общая большая модель добилась значительного прогресса в многозадачном обучении и трансферном обучении и стала важным направлением исследований в области обработки естественного языка.
Например, большие биологические модели могут повысить эффективность фармацевтических препаратов ИИ. Отчеты зарубежных исследований показывают, что ИИ может повысить вероятность успеха исследований и разработок новых лекарств на 16,7%, а исследования и разработки лекарств с помощью ИИ могут ежегодно экономить 54 миллиарда долларов США на затратах на исследования и разработки и экономить от 40% до 60%. время и затраты в основном процессе исследований и разработок. Согласно общедоступной информации Nvidia, использование технологии искусственного интеллекта может сократить время, необходимое для раннего обнаружения лекарств, до одной трети и сократить расходы до одной двухсотой.
С отраслевой точки зрения общая модель представляет собой «энциклопедию», способную ответить на любой вопрос и применимую к разным промышленным почвам, тогда как вертикальная модель подобна эксперту в одной области, хотя она и профессиональна, но ее аудитория суждено быть небольшому количеству людей.
Данные неустранимы
Преимущество вертикальной большой модели в том, что она недостаточно «большая»: вычислительная мощность недостаточно велика, а сложность алгоритма невысока.
После того, как Ван Сяочуань вошел в курс крупномасштабных моделей, он всегда подчеркивал, что направление будущих усилий не в том, чтобы делать AGI (общий искусственный интеллект), как OpenAI, а в том, чтобы делать крупномасштабные модели вертикально в определенных конкретных областях и реализовывать посадочные приложения. .
Большая модель в широком смысле на самом деле описывает большую модель общего назначения.Так же, как и «большая» модель, причина, по которой большая модель является «большой», заключается в большом количестве параметров и огромном объеме данных, которые имеют большое влияние на алгоритмы, вычислительную мощность и пространство для хранения данных.Большие требования, и это не только люди, которые могут составить, но и нужно много денег. Вы знаете, успех Open AI также был построен Microsoft на миллиарды долларов. Огромный спрос на капитал также является испытанием для определения основных производителей в исследованиях и разработках.
В последние пять лет количество параметров больших моделей ИИ ежегодно увеличивается на порядок, например, количество параметров ОШП-4 в 16 раз больше, чем у ОШП-3, достигая 1,6 трлн. введение мультимодальных данных, таких как изображения, аудио и видео, объем данных больших моделей также быстро увеличивается. Это означает, что если вы хотите играть с большой моделью, у вас должна быть большая вычислительная мощность.
По сравнению с крупными производителями, компании, которые производят вертикальные крупномасштабные модели, имеют относительно мало средств, вычислительной мощности и данных, поэтому они фактически не находятся на той же стартовой линии, что и производители крупномасштабных моделей общего назначения.
Точно так же, как новые энергетические автомобили неотделимы от трех основных компонентов: двигателей, аккумуляторов и электронного управления, большие модели ИИ не могут быть отделены от поддержки вычислительной мощности, алгоритмов и данных.
Среди вычислительной мощности, алгоритмов и данных данные представляют собой сложность больших вертикальных моделей.
Среди трех элементов сложность исследования и разработки алгоритма относительно невелика.Существующие компании имеют свои собственные алгоритмы пути для реализации больших моделей, и есть много проектов с открытым исходным кодом для справки.
Чип определяет вычислительную мощность.Общая большая модель ИИ нуждается в более производительном чипе для завершения обучения и построения общей нейронной сети модели.Тем не менее, текущий чип менее разработан самостоятельно, и он по-прежнему в основном поступает извне. Например, для ChatGPT больше всего подходит чип от Nvidia, флагманский чип H100 и субфлагманский чип A100.
Сложность заключается в данных. Высококачественные данные — это ключ к обучению и настройке ИИ.Достаточные и подробные данные — основа генеративных больших моделей ИИ.
Согласно предыдущему раскрытию OpenAI, количество одних только параметров ChatGPT3 достигло 175 миллиардов, а данные обучения достигли 45 ТБ.
Из-за относительно зрелого развития мобильного Интернета в Китае большое количество китайских ресурсов данных хранится на различных предприятиях или в учреждениях, что затрудняет их совместное использование.
«Поскольку многие бизнес-данные, логистические данные, финансовые данные и т. д. предприятия являются очень важными частными данными, трудно представить, что China Star Optoelectronics или PetroChina будут использовать эти данные для обучения других», — Сюй Хуэй, Генеральный директор Chuangxinqizhi недавно дал интервью по ценным бумагам В интервью Times он также прямо сказал.
Если взять в качестве примера фармацевтическую промышленность ИИ, большие биологические модели сталкиваются с проблемой «застревания» в технологиях. Стоимость получения высокоточных экспериментальных данных для исследования и разработки лекарств относительно высока, а в общедоступной базе данных имеется большое количество немаркированных данных.Необходимо эффективно использовать как большой объем немаркированных данных, так и небольшой объем высокоточных данных, поэтому к построению модели предъявляются более высокие требования.
**Кто заработает первый горшочек с золотом? **
Независимо от модели, коммерциализация является ключевым вопросом. Судя по нынешним игрокам ИИ с большими моделями, они быстро расширяют возможности и коммерциализируют.
Хотя крупномасштабная модель общего назначения и вертикальная крупномасштабная модель идут разными путями, они все же являются «семейными» по своей сути и находятся в одном и том же направлении, поэтому проблемы конкуренции не избежать.
Для общей крупномасштабной модели вертикальная крупномасштабная модель приземляется первой, и траектория общей крупномасштабной модели будет уже. Точно так же после того, как крупномасштабные модели общего назначения быстро захватят рынок, вертикальным крупномасштабным моделям с узкими бизнес-направлениями будет труднее зарабатывать деньги.
На идеальном этапе, будь то экономическая модель или универсальная ценность, крупномасштабная модель общего назначения лучше вертикальной крупномасштабной модели. Однако реальная жизнь — не утопия, кто быстрее пробежит между универсальной крупномасштабной моделью и вертикальной крупномасштабной моделью, зависит от конкуренции между различными предприятиями.
Судя по горячему AIGC в прошлом году. По сравнению с разрешением пользователям использовать ИИ для создания контента с более низким порогом на C-конце, некоторые участники рынка считают, что B-конец будет более важной бизнес-моделью AIGC.
Huawei также уделяет больше внимания собственному бизнесу ToB. На пресс-конференции Huawei заявила, что большая модель Huawei Pangu в основном использует ИИ для расширения возможностей отраслей и используется во многих отраслях, таких как электроэнергетика, финансы и сельское хозяйство.Среди них большая модель CV используется в шахтах, а NLP большая модель используется в интеллектуальном поиске документов.
Например, компания Baidu, специализирующаяся на поисковых системах, запустила Wenxin Yiyan с такими атрибутами поиска, как GPT-3.
Помимо ChatGPT, на самом деле до порыва масштабных моделей ИИ были сцены приземления.Эти "большие" модели на самом деле в основном вертикальные крупномасштабные модели.
Зарабатывание денег важнее, чем приземление.
Согласно отчету Guosheng Securities «Сколько вычислительных мощностей необходимо для ChatGPT», стоимость обучения GPT-3 оценивается примерно в 1,4 миллиона долларов США, а для некоторых более крупных LLM (Large Language Model) стоимость обучения составляет от 2 миллиона долларов США и 12 миллионов долларов США между ними. Исходя из среднего количества уникальных посетителей ChatGPT в январе, равного 13 миллионам, соответствующий спрос на чипы составляет более 30 000 графических процессоров NVIDIA A100, первоначальные инвестиционные затраты составляют около 800 миллионов долларов США, а ежедневные затраты на электроэнергию составляют около 50 000 долларов США.
Нет сомнения, что крупномасштабные модели общего назначения более широко используются в посадочных сценариях.Для игроков, которые уверены в крупномасштабных моделях общего назначения, коммерциализация на втором месте.Вертикальные крупномасштабные модели нуждаются в более быстрой коммерциализации, чтобы покрыть дно линия, поэтому вертикальные крупномасштабные модели имеют больше преимуществ. Высокая вероятность и более высокая скорость внедрения.
Нет однозначного ответа, кто первым может сформировать абсолютное преимущество. Эта «гонка вооружений» крупных моделей ИИ похожа на смену бабочки с сети 1 на сеть 2. Предприятия соревнуются со временем, и тот, кто первым воспользуется возможностью, захватит рынок.