Кредит зображення: створено інструментами Unbounded AI
Поле битви для мегамоделей ШІ фрагментується.
Як запобіжник, Chatgpt відкрив двері в еру AI 2.0, а AI 2.0 характеризується «промисловим інтелектом і цифровізацією», які можуть ефективно замінити працю та широко використовуватися в усіх сферах життя. Досліджуючи Метавсесвіт, який вже пройшов період невичерпності, реалізація великої моделі AI є більш реалістичною.
Найбільш типовим проявом є те, що велика модель штучного інтелекту виходить за межі кола ширше, а не лише з боку B. Наприклад, незважаючи на те, що chatGPT випущено понад півроку, автор все ще чує голоси трудових мігрантів, які говорять про chatGPT у кав’ярні внизу в центральному діловому районі Шанхая; за повідомленнями ЗМІ, деякі компанії також використовують AIGC як інструмент продуктивності.
Як сказав Чжан Йонг, голова правління та генеральний директор Alibaba Group і генеральний директор Alibaba Cloud Intelligence Group: перед обличчям ери штучного інтелекту всі продукти варто переробити з великою моделлю.
Великі заводи, науково-дослідні установи та підприємці закінчилися.
Такі великі виробники, як Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong та інші великі моделі, з’явилися послідовно, за ними Tencent Hunyuan, HKUST. Великі моделі, такі як Xunfei Xinghuo, чекають на лінію для виходу в Інтернет.
У підприємців також є знаменитості: Ван Сяочуань, засновник Sogou, Ван Хуйвен, співзасновник Meituan, Кайфу Лі, голова Sinovation Works, та інші зробили гучні виступи у великих моделях ШІ.
Захоплення великомасштабними моделями штучного інтелекту, яке тривало більше кількох місяців, породило два шляхи.
Гонка озброєнь ШІ, велика диференціація моделей
Великі моделі ШІ вийшли на етап змагань, і шляхи поступово розходяться.
Оскільки модель штучного інтелекту поступово нагрівається, згідно зі статистичними даними ЗМІ, на початку лютого в розділі «ChatGPT» Oriental Fortune було лише 29 акцій, а зараз воно досягло 61 акції, і число продовжує зростати . Згідно з неповною статистикою, на даний момент понад 40 компаній і установ у моїй країні випустили великомасштабні моделі продуктів або оголосили про плани масштабних моделей.
Серед них гравці, які беруть участь у «гонці озброєнь» великомасштабних моделей ШІ, також розвинули два напрямки розвитку. Вертикальні великі моделі та загальні великі моделі стають двома основними напрямками розвитку в області штучного інтелекту.
Вертикальні великі моделі стосуються моделей, оптимізованих для конкретних областей або завдань, таких як розпізнавання мовлення, обробка природної мови, класифікація зображень тощо.
В даний час все більше і більше компаній приєднуються до вертикальних великомасштабних моделей. Xueersi оголосив, що розробляє велику власно розроблену математичну модель під назвою MathGPT для ентузіастів математики та науково-дослідних установ у всьому світі; 6 травня Taoyun Technology оголосила про запуск великої когнітивної моделі для дітей — Alpha Egg Children's Cognitive Big Модель дає дітям новий інтерактивний досвід з точки зору практики висловлювання, розвитку EQ, надихає на творчість і допомагає навчанню.
Загальні великі моделі стосуються моделей, які можуть обробляти кілька завдань і доменів, наприклад BERT, GPT тощо.
Завдяки перевагам капіталу та таланту великі виробники в основному націлені на випуск великих моделей загального призначення.
Великі виробники націлені на великі моделі загального призначення, з одного боку, вони можуть поєднувати можливості штучного інтелекту з власними продуктами, більш представницькі інтернет-компанії та технологічні гіганти, такі як Alibaba, Huawei та Baidu.
Наприклад, після інтеграції Microsoft GPT-4 у сегмент сімейства Office, "Tongyi Qianwen" Алі також почав отримувати доступ до DingTalk. Користувачі можуть створювати вміст у документах, а під час відеоконференцій вони можуть створювати персональні перегляди та вміст.
Наприклад, велику модель Baidu також можна поєднати з власним бізнесом. «Wen Xin Yi Yan» може мати якісну трансформацію в ітерації пошукових систем. «Yuyan» NetEase і «ChatJD» JD.com можуть бути використані першими в своїх власних промислів.
З іншого боку, велика модель загального призначення має широке застосування, і ті, хто перевершить першими, можуть отримати перевагу перших і стати лідером в епоху AI2.0. Адже всім відома істина, що «хто швидко біжить, той дістає м’ясо, а хто біжить повільно, той їсть лише залишки».
Велику модель вертикального застосування можна описати як «чистий потік». Оскільки велика модель вертикального застосування більше відповідає потребам вертикальних сценаріїв і має вищу якість, ніж загальна велика модель, багато компаній також побачили можливості. Наприклад, Shenlan, Mobvoi, Youdao та інші компанії, які зосереджуються на конкретних треках ШІ.
Розвиток великих вертикальних моделей в основному відображається в безперервному вдосконаленні продуктивності моделей у різних сферах.Наприклад, рівень помилок розпізнавання мовлення з кожним роком зменшується, а здатність семантичного розуміння обробки природної мови продовжує покращуватися. Загальна велика модель досягла значного прогресу в багатозадачному навчанні та навчанні переносу, а також стала важливим напрямком досліджень у сфері обробки природної мови.
Наприклад, великі біологічні моделі можуть підвищити ефективність фармацевтичних препаратів ШІ. Звіти про іноземні дослідження показують, що штучний інтелект може підвищити рівень успіху досліджень і розробок нових ліків на 16,7%, а дослідження і розробки ліків за допомогою штучного інтелекту можуть заощаджувати 54 мільярди доларів США на дослідженнях і розробках щороку та заощаджувати від 40% до 60% час і витрати в основному процесі досліджень і розробок. Відповідно до публічної інформації Nvidia, використання технології штучного інтелекту може скоротити час, необхідний для раннього відкриття ліків, до однієї третини та заощадити витрати до однієї сотої.
З галузевої точки зору загальна модель є «енциклопедією», яка може відповісти на будь-яке запитання та застосовувати до різних промислових ґрунтів, тоді як вертикальна модель схожа на експерта в одній галузі. Хоча вона професійна, її аудиторія судилося бути невеликій кількості людей.
Дані небезпечні
Перевага вертикальної великої моделі полягає в тому, що вона недостатньо «велика»: обчислювальна потужність недостатньо велика, а складність алгоритму низька.
Після того, як Ван Сяочуань почав займатися великомасштабними моделями, він завжди наголошував, що напрямок майбутніх зусиль полягає не в створенні AGI (загального штучного інтелекту), як OpenAI, а у створенні великомасштабних вертикальних моделей у певних конкретних областях і реалізації додатків для посадки. .
Велика модель у широкому сенсі насправді описує велику модель загального призначення. Як і «велика» модель, велика модель є «великою» через велику кількість параметрів і величезну кількість даних, які мають великий вплив на алгоритми, обчислювальну потужність і простір для зберігання даних Великі вимоги, і це не тільки люди, які можуть це зробити, але й потребують багато грошей. Ви знаєте, успіх Open AI також був створений Microsoft з мільярдами доларів. Величезний попит на капітал також є випробуванням для рішучості великих виробників у дослідженнях і розробках.
Протягом останніх п’яти років обсяг параметрів великих моделей штучного інтелекту щорічно збільшувався на порядок. Наприклад, обсяг параметрів GPT-4 у 16 разів перевищує параметри GPT-3 і досяг 1,6 трильйона; а з появою мультимодальних даних, таких як зображення, аудіо та відео, обсяг даних великих моделей також швидко збільшується. Це означає, що якщо ви хочете грати з великою моделлю, ви повинні мати велику обчислювальну потужність.
Порівняно з великими виробниками, компанії, які виготовляють вертикальні великомасштабні моделі, мають відносно дефіцитні кошти, обчислювальну потужність і дані, тому вони насправді не на тій самій стартовій лінії, що й виробники великомасштабних моделей загального призначення.
Подібно до того, як транспортні засоби на новій енергії невіддільні від трьох основних компонентів двигунів, акумуляторів та електронних елементів керування, великі моделі штучного інтелекту неможливо відокремити від підтримки обчислювальної потужності, алгоритмів і даних.
Серед обчислювальної потужності, алгоритмів і даних дані становлять складність великих вертикальних моделей.
Серед цих трьох елементів, складність дослідження та розробки алгоритму є відносно низькою. Нинішні компанії мають власні алгоритми шляху для реалізації великих моделей, і є багато проектів з відкритим кодом для довідки.
Чіп визначає обчислювальну потужність. Загальна велика модель штучного інтелекту потребує високопродуктивного чіпа для завершення навчання та побудови загальної нейронної мережі моделі. Однак поточний чіп меншою мірою є саморозробленим, і він все ще в основному зовнішній. Наприклад, чіп, який найбільше підходить для ChatGPT, від Nvidia — флагманський чіп H100 і субфлагманський чіп A100.
Складність полягає в даних. Високоякісні дані – це ключ до допомоги в навчанні та налаштуванні штучного інтелекту. Достатні та багаті дані є основою генеративних великих моделей ШІ.
Згідно з попередніми даними OpenAI, кількість лише параметрів ChatGPT3 досягла 175 мільярдів, а навчальні дані досягли 45 ТБ.
Через відносно зрілий розвиток мобільного Інтернету в Китаї велика кількість китайських ресурсів даних зберігається на різних підприємствах чи в установах, що ускладнює спільний доступ.
«Оскільки багато бізнес-даних, даних про логістику, фінансових даних тощо підприємства є основними даними приватного домену, важко уявити, що China Star Optoelectronics або PetroChina використовуватимуть ці дані для навчання інших». Сюй Хуей, Генеральний директор Chuangxinqizhi, нещодавно дав інтерв'ю цінним паперам В інтерв'ю Times він також прямо сказав.
Беручи приклад фармацевтичної індустрії штучного інтелекту, великі біологічні моделі стикаються з проблемою «застрягання» технологією. Вартість отримання високоточних експериментальних даних для досліджень і розробки ліків є відносно високою, і існує велика кількість немаркованих даних у загальнодоступній базі даних. Необхідно добре використовувати як велику кількість немаркованих даних, так і невелику кількість кількість високоточних даних, тому до побудови моделі висуваються підвищені вимоги.
**Хто заробить перший горщик із золотом? **
Незалежно від моделі, комерціалізація є основною проблемою. Судячи з поточних гравців ШІ з великими моделями, вони швидко просуваються з розширення можливостей і комерціалізації.
Незважаючи на те, що широкомасштабна модель загального призначення та вертикальна великомасштабна модель йдуть різними шляхами, вони все ще є «сімейними» по суті та знаходяться на одному шляху, тому проблеми конкуренції неможливо уникнути.
Для загальної великомасштабної моделі вертикальна великомасштабна модель приземляється першою, а шлях загальної великомасштабної моделі буде вужчим. Подібним чином, після того, як великомасштабні моделі загального призначення швидко захоплять ринок, вертикальним великомасштабним моделям із вузькими бізнес-напрямками буде важче заробляти гроші.
На ідеальному етапі, будь то економічна модель чи універсальна цінність, широкомасштабна модель загального призначення краща, ніж вертикальна великомасштабна модель. Однак реальне життя — це не утопія, тому, хто швидше бігає між універсальною великомасштабною моделлю та вертикальною великомасштабною моделлю, залежить від конкуренції між різними підприємствами.
Судячи з гарячого AIGC минулого року. Порівняно з дозволом користувачам використовувати штучний інтелект для створення контенту з нижчим порогом на C-кінці, деякі учасники ринку вважають, що B-кінець буде більш важливою бізнес-моделлю AIGC.
Huawei також приділяє більше уваги власному бізнесу ToB. На прес-конференції Huawei заявила, що велика модель Huawei Pangu в основному використовує штучний інтелект для розширення можливостей промисловості та використовується в багатьох галузях, таких як електроенергетика, фінанси та сільське господарство.Серед них велика модель CV використовується в шахтах, а NLP велика модель використовується для інтелектуального пошуку документів.
Наприклад, компанія Baidu, яка спеціалізується на пошукових системах, запустила Wenxin Yiyan з такими атрибутами пошуку, як GPT-3.
На додаток до ChatGPT, фактично, до пориву великомасштабних моделей штучного інтелекту існували сцени приземлення. Ці «великі» моделі насправді є переважно вертикальними великомасштабними моделями.
Мовна модель: така як GPT, BERT тощо, в основному використовується в області обробки природної мови, як-от машинний переклад, генерація тексту, аналіз настроїв тощо.
Моделі зображень: такі як ResNet, Inception тощо, які в основному використовуються в області комп’ютерного зору, такі як класифікація зображень, виявлення цілей, сегментація зображень тощо.
Рекомендаційна модель: така як DNN, RNN тощо, яка в основному використовується в області рекомендаційних систем, таких як рекомендації продукту та реклами.
Чат-боти: такі як Seq2Seq, Transformer тощо, які в основному використовуються в таких сценаріях, як інтелектуальне обслуговування клієнтів і інтелектуальні помічники.
Контроль фінансових ризиків: такі як XGBoost, LightGBM тощо, які в основному використовуються в сценаріях контролю ризиків фінансових установ, таких як банки та цінні папери, наприклад кредитний скоринг і боротьба з шахрайством.
Медична діагностика зображень: наприклад DeepLung, DeepLesion тощо, які в основному використовуються в області діагностики медичних зображень, як-от діагностика раку легенів і патологічний аналіз.
Заробляти гроші важливіше, ніж посадка.
Відповідно до звіту Guosheng Securities «Скільки обчислювальної потужності потрібно для ChatGPT», оцінюється, що вартість навчання GPT-3 становить близько 1,4 мільйона доларів США, а для деяких більших LLM (Large Language Model) вартість навчання становить від Між ними 2 мільйони доларів США та 12 мільйонів доларів США. Виходячи із середньої кількості унікальних відвідувачів ChatGPT у січні, яка становила 13 мільйонів, відповідний попит на чіп становить понад 30 000 графічних процесорів NVIDIA A100, вартість початкових інвестицій становить близько 800 мільйонів доларів США, а щоденні витрати на електроенергію становлять близько 50 000 доларів США.
Немає сумніву, що великомасштабні моделі загального призначення ширше використовуються в сценаріях посадки. Для гравців, які впевнені у великомасштабних моделях загального призначення, комерціалізація на другому місці. Вертикальні великомасштабні моделі потребують швидшої комерціалізації, щоб охопити дно лінії, тому вертикальні великомасштабні моделі мають більше переваг. Висока ймовірність і швидший рівень впровадження.
Немає однозначної відповіді, хто може першим сформувати абсолютну перевагу. Ця «гонка озброєнь» великих моделей штучного інтелекту нагадує зміну метелика від web1 до web2.Підприємства змагаються з часом, і той, хто першим скористається нагодою, захопить ринок.
Переглянути оригінал
Контент має виключно довідковий характер і не є запрошенням до участі або пропозицією. Інвестиційні, податкові чи юридичні консультації не надаються. Перегляньте Відмову від відповідальності , щоб дізнатися більше про ризики.
General VS вертикально, велика модель наблизилася до першої точки збігу
Джерело: Shenmou Finance, автор | Чжан Вей
Поле битви для мегамоделей ШІ фрагментується.
Як запобіжник, Chatgpt відкрив двері в еру AI 2.0, а AI 2.0 характеризується «промисловим інтелектом і цифровізацією», які можуть ефективно замінити працю та широко використовуватися в усіх сферах життя. Досліджуючи Метавсесвіт, який вже пройшов період невичерпності, реалізація великої моделі AI є більш реалістичною.
Найбільш типовим проявом є те, що велика модель штучного інтелекту виходить за межі кола ширше, а не лише з боку B. Наприклад, незважаючи на те, що chatGPT випущено понад півроку, автор все ще чує голоси трудових мігрантів, які говорять про chatGPT у кав’ярні внизу в центральному діловому районі Шанхая; за повідомленнями ЗМІ, деякі компанії також використовують AIGC як інструмент продуктивності.
Як сказав Чжан Йонг, голова правління та генеральний директор Alibaba Group і генеральний директор Alibaba Cloud Intelligence Group: перед обличчям ери штучного інтелекту всі продукти варто переробити з великою моделлю.
Великі заводи, науково-дослідні установи та підприємці закінчилися.
Такі великі виробники, як Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong та інші великі моделі, з’явилися послідовно, за ними Tencent Hunyuan, HKUST. Великі моделі, такі як Xunfei Xinghuo, чекають на лінію для виходу в Інтернет.
У підприємців також є знаменитості: Ван Сяочуань, засновник Sogou, Ван Хуйвен, співзасновник Meituan, Кайфу Лі, голова Sinovation Works, та інші зробили гучні виступи у великих моделях ШІ.
Захоплення великомасштабними моделями штучного інтелекту, яке тривало більше кількох місяців, породило два шляхи.
Гонка озброєнь ШІ, велика диференціація моделей
Великі моделі ШІ вийшли на етап змагань, і шляхи поступово розходяться.
Оскільки модель штучного інтелекту поступово нагрівається, згідно зі статистичними даними ЗМІ, на початку лютого в розділі «ChatGPT» Oriental Fortune було лише 29 акцій, а зараз воно досягло 61 акції, і число продовжує зростати . Згідно з неповною статистикою, на даний момент понад 40 компаній і установ у моїй країні випустили великомасштабні моделі продуктів або оголосили про плани масштабних моделей.
Серед них гравці, які беруть участь у «гонці озброєнь» великомасштабних моделей ШІ, також розвинули два напрямки розвитку. Вертикальні великі моделі та загальні великі моделі стають двома основними напрямками розвитку в області штучного інтелекту.
Вертикальні великі моделі стосуються моделей, оптимізованих для конкретних областей або завдань, таких як розпізнавання мовлення, обробка природної мови, класифікація зображень тощо.
В даний час все більше і більше компаній приєднуються до вертикальних великомасштабних моделей. Xueersi оголосив, що розробляє велику власно розроблену математичну модель під назвою MathGPT для ентузіастів математики та науково-дослідних установ у всьому світі; 6 травня Taoyun Technology оголосила про запуск великої когнітивної моделі для дітей — Alpha Egg Children's Cognitive Big Модель дає дітям новий інтерактивний досвід з точки зору практики висловлювання, розвитку EQ, надихає на творчість і допомагає навчанню.
Загальні великі моделі стосуються моделей, які можуть обробляти кілька завдань і доменів, наприклад BERT, GPT тощо.
Завдяки перевагам капіталу та таланту великі виробники в основному націлені на випуск великих моделей загального призначення.
Великі виробники націлені на великі моделі загального призначення, з одного боку, вони можуть поєднувати можливості штучного інтелекту з власними продуктами, більш представницькі інтернет-компанії та технологічні гіганти, такі як Alibaba, Huawei та Baidu.
Наприклад, після інтеграції Microsoft GPT-4 у сегмент сімейства Office, "Tongyi Qianwen" Алі також почав отримувати доступ до DingTalk. Користувачі можуть створювати вміст у документах, а під час відеоконференцій вони можуть створювати персональні перегляди та вміст.
Наприклад, велику модель Baidu також можна поєднати з власним бізнесом. «Wen Xin Yi Yan» може мати якісну трансформацію в ітерації пошукових систем. «Yuyan» NetEase і «ChatJD» JD.com можуть бути використані першими в своїх власних промислів.
З іншого боку, велика модель загального призначення має широке застосування, і ті, хто перевершить першими, можуть отримати перевагу перших і стати лідером в епоху AI2.0. Адже всім відома істина, що «хто швидко біжить, той дістає м’ясо, а хто біжить повільно, той їсть лише залишки».
Велику модель вертикального застосування можна описати як «чистий потік». Оскільки велика модель вертикального застосування більше відповідає потребам вертикальних сценаріїв і має вищу якість, ніж загальна велика модель, багато компаній також побачили можливості. Наприклад, Shenlan, Mobvoi, Youdao та інші компанії, які зосереджуються на конкретних треках ШІ.
Розвиток великих вертикальних моделей в основному відображається в безперервному вдосконаленні продуктивності моделей у різних сферах.Наприклад, рівень помилок розпізнавання мовлення з кожним роком зменшується, а здатність семантичного розуміння обробки природної мови продовжує покращуватися. Загальна велика модель досягла значного прогресу в багатозадачному навчанні та навчанні переносу, а також стала важливим напрямком досліджень у сфері обробки природної мови.
Наприклад, великі біологічні моделі можуть підвищити ефективність фармацевтичних препаратів ШІ. Звіти про іноземні дослідження показують, що штучний інтелект може підвищити рівень успіху досліджень і розробок нових ліків на 16,7%, а дослідження і розробки ліків за допомогою штучного інтелекту можуть заощаджувати 54 мільярди доларів США на дослідженнях і розробках щороку та заощаджувати від 40% до 60% час і витрати в основному процесі досліджень і розробок. Відповідно до публічної інформації Nvidia, використання технології штучного інтелекту може скоротити час, необхідний для раннього відкриття ліків, до однієї третини та заощадити витрати до однієї сотої.
З галузевої точки зору загальна модель є «енциклопедією», яка може відповісти на будь-яке запитання та застосовувати до різних промислових ґрунтів, тоді як вертикальна модель схожа на експерта в одній галузі. Хоча вона професійна, її аудиторія судилося бути невеликій кількості людей.
Дані небезпечні
Перевага вертикальної великої моделі полягає в тому, що вона недостатньо «велика»: обчислювальна потужність недостатньо велика, а складність алгоритму низька.
Після того, як Ван Сяочуань почав займатися великомасштабними моделями, він завжди наголошував, що напрямок майбутніх зусиль полягає не в створенні AGI (загального штучного інтелекту), як OpenAI, а у створенні великомасштабних вертикальних моделей у певних конкретних областях і реалізації додатків для посадки. .
Велика модель у широкому сенсі насправді описує велику модель загального призначення. Як і «велика» модель, велика модель є «великою» через велику кількість параметрів і величезну кількість даних, які мають великий вплив на алгоритми, обчислювальну потужність і простір для зберігання даних Великі вимоги, і це не тільки люди, які можуть це зробити, але й потребують багато грошей. Ви знаєте, успіх Open AI також був створений Microsoft з мільярдами доларів. Величезний попит на капітал також є випробуванням для рішучості великих виробників у дослідженнях і розробках.
Протягом останніх п’яти років обсяг параметрів великих моделей штучного інтелекту щорічно збільшувався на порядок. Наприклад, обсяг параметрів GPT-4 у 16 разів перевищує параметри GPT-3 і досяг 1,6 трильйона; а з появою мультимодальних даних, таких як зображення, аудіо та відео, обсяг даних великих моделей також швидко збільшується. Це означає, що якщо ви хочете грати з великою моделлю, ви повинні мати велику обчислювальну потужність.
Порівняно з великими виробниками, компанії, які виготовляють вертикальні великомасштабні моделі, мають відносно дефіцитні кошти, обчислювальну потужність і дані, тому вони насправді не на тій самій стартовій лінії, що й виробники великомасштабних моделей загального призначення.
Подібно до того, як транспортні засоби на новій енергії невіддільні від трьох основних компонентів двигунів, акумуляторів та електронних елементів керування, великі моделі штучного інтелекту неможливо відокремити від підтримки обчислювальної потужності, алгоритмів і даних.
Серед обчислювальної потужності, алгоритмів і даних дані становлять складність великих вертикальних моделей.
Серед цих трьох елементів, складність дослідження та розробки алгоритму є відносно низькою. Нинішні компанії мають власні алгоритми шляху для реалізації великих моделей, і є багато проектів з відкритим кодом для довідки.
Чіп визначає обчислювальну потужність. Загальна велика модель штучного інтелекту потребує високопродуктивного чіпа для завершення навчання та побудови загальної нейронної мережі моделі. Однак поточний чіп меншою мірою є саморозробленим, і він все ще в основному зовнішній. Наприклад, чіп, який найбільше підходить для ChatGPT, від Nvidia — флагманський чіп H100 і субфлагманський чіп A100.
Складність полягає в даних. Високоякісні дані – це ключ до допомоги в навчанні та налаштуванні штучного інтелекту. Достатні та багаті дані є основою генеративних великих моделей ШІ.
Згідно з попередніми даними OpenAI, кількість лише параметрів ChatGPT3 досягла 175 мільярдів, а навчальні дані досягли 45 ТБ.
Через відносно зрілий розвиток мобільного Інтернету в Китаї велика кількість китайських ресурсів даних зберігається на різних підприємствах чи в установах, що ускладнює спільний доступ.
«Оскільки багато бізнес-даних, даних про логістику, фінансових даних тощо підприємства є основними даними приватного домену, важко уявити, що China Star Optoelectronics або PetroChina використовуватимуть ці дані для навчання інших». Сюй Хуей, Генеральний директор Chuangxinqizhi, нещодавно дав інтерв'ю цінним паперам В інтерв'ю Times він також прямо сказав.
Беручи приклад фармацевтичної індустрії штучного інтелекту, великі біологічні моделі стикаються з проблемою «застрягання» технологією. Вартість отримання високоточних експериментальних даних для досліджень і розробки ліків є відносно високою, і існує велика кількість немаркованих даних у загальнодоступній базі даних. Необхідно добре використовувати як велику кількість немаркованих даних, так і невелику кількість кількість високоточних даних, тому до побудови моделі висуваються підвищені вимоги.
**Хто заробить перший горщик із золотом? **
Незалежно від моделі, комерціалізація є основною проблемою. Судячи з поточних гравців ШІ з великими моделями, вони швидко просуваються з розширення можливостей і комерціалізації.
Незважаючи на те, що широкомасштабна модель загального призначення та вертикальна великомасштабна модель йдуть різними шляхами, вони все ще є «сімейними» по суті та знаходяться на одному шляху, тому проблеми конкуренції неможливо уникнути.
Для загальної великомасштабної моделі вертикальна великомасштабна модель приземляється першою, а шлях загальної великомасштабної моделі буде вужчим. Подібним чином, після того, як великомасштабні моделі загального призначення швидко захоплять ринок, вертикальним великомасштабним моделям із вузькими бізнес-напрямками буде важче заробляти гроші.
На ідеальному етапі, будь то економічна модель чи універсальна цінність, широкомасштабна модель загального призначення краща, ніж вертикальна великомасштабна модель. Однак реальне життя — це не утопія, тому, хто швидше бігає між універсальною великомасштабною моделлю та вертикальною великомасштабною моделлю, залежить від конкуренції між різними підприємствами.
Судячи з гарячого AIGC минулого року. Порівняно з дозволом користувачам використовувати штучний інтелект для створення контенту з нижчим порогом на C-кінці, деякі учасники ринку вважають, що B-кінець буде більш важливою бізнес-моделлю AIGC.
Huawei також приділяє більше уваги власному бізнесу ToB. На прес-конференції Huawei заявила, що велика модель Huawei Pangu в основному використовує штучний інтелект для розширення можливостей промисловості та використовується в багатьох галузях, таких як електроенергетика, фінанси та сільське господарство.Серед них велика модель CV використовується в шахтах, а NLP велика модель використовується для інтелектуального пошуку документів.
Наприклад, компанія Baidu, яка спеціалізується на пошукових системах, запустила Wenxin Yiyan з такими атрибутами пошуку, як GPT-3.
На додаток до ChatGPT, фактично, до пориву великомасштабних моделей штучного інтелекту існували сцени приземлення. Ці «великі» моделі насправді є переважно вертикальними великомасштабними моделями.
Заробляти гроші важливіше, ніж посадка.
Відповідно до звіту Guosheng Securities «Скільки обчислювальної потужності потрібно для ChatGPT», оцінюється, що вартість навчання GPT-3 становить близько 1,4 мільйона доларів США, а для деяких більших LLM (Large Language Model) вартість навчання становить від Між ними 2 мільйони доларів США та 12 мільйонів доларів США. Виходячи із середньої кількості унікальних відвідувачів ChatGPT у січні, яка становила 13 мільйонів, відповідний попит на чіп становить понад 30 000 графічних процесорів NVIDIA A100, вартість початкових інвестицій становить близько 800 мільйонів доларів США, а щоденні витрати на електроенергію становлять близько 50 000 доларів США.
Немає сумніву, що великомасштабні моделі загального призначення ширше використовуються в сценаріях посадки. Для гравців, які впевнені у великомасштабних моделях загального призначення, комерціалізація на другому місці. Вертикальні великомасштабні моделі потребують швидшої комерціалізації, щоб охопити дно лінії, тому вертикальні великомасштабні моделі мають більше переваг. Висока ймовірність і швидший рівень впровадження.
Немає однозначної відповіді, хто може першим сформувати абсолютну перевагу. Ця «гонка озброєнь» великих моделей штучного інтелекту нагадує зміну метелика від web1 до web2.Підприємства змагаються з часом, і той, хто першим скористається нагодою, захопить ринок.