Resim kredisi: Unbounded AI araçları tarafından oluşturulmuştur
AI megamodelleri için savaş alanı parçalanıyor.
Sigorta olarak Chatgpt, AI2.0 çağının kapısını açtı ve AI2.0, verimli bir şekilde emeğin yerini alabilen ve hayatın her kesiminde yaygın olarak kullanılabilen "endüstriyel zeka ve dijitalleşme" ile karakterize ediliyor. Kaçak dönemi çoktan geçti, AI büyük modelinin uygulanması daha gerçekçi.
En tipik tezahürü, büyük AI modelinin sadece B tarafında değil, daha geniş bir şekilde çemberin dışına çıkmasıdır. Örneğin, chatGPT yayınlanalı altı aydan fazla olmasına rağmen yazar, Şanghay CBD'deki alt kattaki kafede chatGPT hakkında konuşan göçmen işçilerin sesini hâlâ duyabiliyor; basında çıkan haberlere göre, bazı şirketler AIGC'yi bir araç olarak da kullanıyor. verimlilik aracı.
Alibaba Group'un başkanı ve CEO'su ve Alibaba Cloud Intelligence Group'un CEO'su Zhang Yong'un dediği gibi: AI çağıyla karşı karşıya kalındığında, tüm ürünler büyük bir modelle yeniden yapılmaya değer.
Büyük fabrikalar, bilimsel araştırma kurumları ve girişimcilerin sonu geldi.
Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong gibi büyük üreticiler ve diğer büyük modeller arka arkaya ortaya çıktı, ardından Tencent Hunyuan, HKUST Xunfei Xinghuo gibi büyük modeller bekliyor. çevrimiçi olmak için hat
Girişimcilerin de ünlüleri var: Sogou'nun kurucusu Wang Xiaochuan, Meituan'ın kurucu ortağı Wang Huiwen, Sinovation Works'ün başkanı Kaifu Li ve diğerleri, AI büyük modellerinde yüksek profilli görünümler yaptı.
Birkaç aydan fazla süren AI büyük ölçekli model çılgınlığı iki yol ortaya çıkardı.
AI silahlanma yarışı, büyük model farklılaşması
AI büyük modelleri rekabet aşamasına girdi ve yollar yavaş yavaş farklılaşıyor.
AI modeli yavaş yavaş ısınırken, medya istatistiklerine göre, Şubat ayı başında Oriental Fortune'un "ChatGPT" bölümünde sadece 29 hisse senedi vardı ve şimdi 61 hisseye ulaştı ve sayı hala artıyor . Eksik istatistiklere göre şu an itibariyle ülkemde 40'tan fazla firma ve kurum büyük ölçekli maket ürünleri piyasaya sürdü veya büyük ölçekli maket planlarını açıkladı.
Bunların arasında, AI büyük ölçekli modellerinin "silahlanma yarışına" katılan oyuncular da iki geliştirme yönü geliştirdiler. Dikey büyük modeller ve genel büyük modeller, yapay zeka alanında iki ana gelişme yönü haline geliyor.
Dikey büyük modeller, konuşma tanıma, doğal dil işleme, görüntü sınıflandırma vb. gibi belirli alanlar veya görevler için optimize edilmiş modelleri ifade eder.
Şu anda, giderek daha fazla şirket dikey büyük ölçekli modellerin yoluna katılıyor. Xueersi, dünyanın dört bir yanındaki matematik meraklıları ve bilimsel araştırma kurumları için kendi geliştirdiği MathGPT adlı büyük bir matematiksel model geliştirdiğini duyurdu; 6 Mayıs'ta Taoyun Technology, çocuklar için büyük bir bilişsel model olan Alpha Egg Children's Cognitive Big'i piyasaya sürdüğünü duyurdu. Model, ifade pratiği yapma, EQ'yu geliştirme, yaratıcılığa ilham verme ve öğrenmeye yardımcı olma açısından çocuklar için yeni bir etkileşimli deneyim getiriyor.
Genel büyük modeller, BERT, GPT vb. gibi birden çok görevi ve alanı işleyebilen modelleri ifade eder.
Sermaye ve yetenek avantajları nedeniyle, büyük üreticiler genel amaçlı büyük modellerin parkurunu hedefliyor.
Büyük üreticiler genel amaçlı büyük modelleri hedefliyor.Bir yandan yapay zeka yeteneklerini kendi ürünleriyle birleştirebiliyorlar.Daha temsili İnternet şirketleri ve Alibaba, Huawei ve Baidu gibi teknoloji devleri.
Örneğin, Microsoft'un GPT-4'ü Office aile grubuna entegre etmesinin ardından, Ali'nin "Tongyi Qianwen" cihazı da DingTalk'a erişmeye başladı. Kullanıcılar belgelerde içerik oluşturabilir ve video konferanslarda her Kişisel görünümü ve içeriği oluşturabilirler.
Örneğin, Baidu'nun büyük modeli kendi işiyle de birleştirilebilir. "Wen Xin Yi Yan", arama motorlarının yinelemesinde niteliksel bir dönüşüme sahip olabilir. kendi endüstrileri.
Öte yandan, genel amaçlı büyük modelin geniş bir uygulanabilirliği vardır ve ilk önce performans gösterenler, ilk hamle avantajını kurabilir ve AI2.0 çağında lider olabilir. Ne de olsa "hızlı koşan eti alır, yavaş koşan sadece artanı yer" gerçeğini herkes bilir.
Dikey uygulamalı büyük model "açık bir akış" olarak tanımlanabilir.Dikey uygulamalı büyük model, dikey senaryoların ihtiyaçlarına daha uygun olduğundan ve genel büyük modelden daha kaliteli olduğundan, birçok şirket de fırsatları gördü. Örneğin, belirli AI yollarına odaklanan Shenlan, Mobvoi, Youdao ve diğer şirketler.
Büyük dikey modellerin gelişimi, temel olarak çeşitli alanlarda model performansının sürekli iyileştirilmesine yansımıştır.Örneğin, konuşma tanımanın hata oranı yıldan yıla azalmıştır ve doğal dil işlemenin anlamsal anlama yeteneği gelişmeye devam etmiştir. Genel büyük model, çok görevli öğrenme ve transfer öğrenmede dikkate değer bir ilerleme kaydetmiştir ve doğal dil işleme alanında önemli bir araştırma yönü haline gelmiştir.
Örneğin, büyük biyolojik modeller yapay zeka ilaçlarının verimliliğini artırabilir. Yabancı araştırma raporları, yapay zekanın yeni ilaç araştırma ve geliştirme başarı oranını %16,7 artırabileceğini ve yapay zeka destekli ilaç araştırma ve geliştirmenin her yıl araştırma ve geliştirme maliyetlerinde 54 milyar ABD doları tasarruf sağlayabileceğini ve %40 ila %60 arasında tasarruf sağlayabileceğini gösteriyor. araştırma ve geliştirmenin ana sürecinde zaman ve maliyet. Nvidia'nın halka açık bilgilerine göre, yapay zeka teknolojisinin kullanılması, erken ilaç keşfi için gereken süreyi üçte bire kadar kısaltabilir ve maliyetleri yüzde iki oranında azaltabilir.
Sektörel bakış açısıyla genel model, her soruya cevap verebilen ve farklı endüstriyel zeminlere uygulanabilen bir "ansiklopedi" iken, dikey model ise tek bir alanda uzmana benzer.Profesyonel olmasına rağmen hedef kitlesi az sayıda insan olmaya mahkumdur.
Veriler ölümcüldür
Dikey büyük modelin avantajı, yeterince "büyük" olmamasıdır: hesaplama gücü yeterince büyük değildir ve algoritmanın zorluğu düşüktür.
Wang Xiaochuan, büyük ölçekli model parkuruna girdikten sonra, gelecekteki çabaların yönünün OpenAI gibi AGI (Genel Yapay Zeka) yapmak değil, belirli belirli alanlarda dikey olarak büyük ölçekli modeller yapmak ve iniş uygulamalarını gerçekleştirmek olduğunu her zaman vurguladı. .
Geniş anlamda bir büyük model aslında genel amaçlı bir büyük modeli tanımlar.Tıpkı "büyük" bir model gibi, büyük bir modelin "büyük" olmasının nedeni, çok sayıda parametre ve büyük miktarda veridir. algoritmalar, bilgi işlem gücü ve veri depolama alanı üzerinde büyük etkiye sahiptir.Büyük gereksinimler ve bunlar sadece telafi edebilen insanlar değil, aynı zamanda çok paraya da ihtiyaç duyan insanlar. Biliyorsunuz, Open AI'ın başarısı da Microsoft tarafından milyarlarca dolarla inşa edildi. Devasa sermaye talebi, araştırma ve geliştirmede büyük üreticilerin kararlılığı için de bir sınavdır.
Son beş yılda, AI büyük modellerin parametre hacmi her yıl büyüklük sırasına göre arttı.Örneğin, GPT-4'ün parametre hacmi GPT-3'ün 16 katı, 1,6 trilyona ulaştı; ve tanıtımıyla birlikte görüntü, ses ve video gibi çok modlu verilerin, büyük modellerin veri hacmi de hızla genişlemektedir. Bu, büyük bir modelle oynamak istiyorsanız, büyük bir bilgi işlem gücünüz olması gerektiği anlamına gelir.
Büyük üreticilerle karşılaştırıldığında, dikey büyük ölçekli modeller yapan şirketler nispeten kıt fonlara, bilgi işlem gücüne ve verilere sahiptir, bu nedenle aslında genel amaçlı büyük ölçekli model oyuncularla aynı başlangıç çizgisinde değildirler.
Tıpkı yeni enerji araçlarının motorlar, piller ve elektronik kontrollerin üç ana bileşeninden ayrılamaz olması gibi, AI büyük modelleri de bilgi işlem gücü, algoritmalar ve veri desteğinden ayrılamaz.
Hesaplama gücü, algoritmalar ve veriler arasında veri, büyük dikey modellerin zorluğudur.
Üç unsur arasında, algoritmanın araştırma ve geliştirme zorluğu nispeten düşüktür.Mevcut şirketlerin büyük modelleri uygulamak için kendi yol algoritmaları vardır ve referans için birçok açık kaynak projesi vardır.
Çip, bilgi işlem gücünü belirler. Genel olarak büyük yapay zeka modeli, genel model sinir ağının eğitimini ve yapımını tamamlamak için daha yüksek performanslı bir yongaya ihtiyaç duyar. Bununla birlikte, mevcut yonga daha az kendi kendini geliştirmiştir ve hala esas olarak harici kaynaklıdır. Örneğin, ChatGPT için en uygun çip Nvidia'dan, amiral gemisi çipi H100 ve alt amiral gemisi çipi A100.
Zorluk verilerde yatıyor. Yüksek kaliteli veriler, yapay zeka eğitimine ve ayarlamaya yardımcı olmanın anahtarıdır. Yeterli ve zengin veriler, üretken yapay zeka büyük modellerinin temelidir.
OpenAI'nin bir önceki açıklamasına göre ChatGPT3 parametre sayısı tek başına 175 milyara, eğitim verisi ise 45 TB'a ulaştı.
Çin'in mobil İnternetinin nispeten olgun gelişimi nedeniyle, büyük miktarda Çin veri kaynağı çeşitli işletmelerde veya kurumlarda depolanıyor ve bu da paylaşımı zorlaştırıyor.
"Kuruluşun birçok ticari verisi, lojistik verisi, finansal verisi vb. çok temel özel alan verileri olduğundan, China Star Optoelectronics veya PetroChina'nın verileri başkalarının eğitmesi için kullanacağını hayal etmek zor." Xu Hui, Chuangxinqizhi'nin CEO'su, geçtiğimiz günlerde menkul kıymetlerle röportaj yaptı. Times ile yaptığı bir röportajda, o da açıkça söyledi.
AI ilaç endüstrisini örnek alarak, büyük biyolojik modeller teknoloji tarafından "sıkışıp kalma" sorunuyla karşı karşıyadır. İlaç araştırma ve geliştirme için yüksek hassasiyetli deneysel veriler elde etmenin maliyeti nispeten yüksektir ve kamuya açık veri tabanlarında çok sayıda etiketlenmemiş veri vardır. yüksek hassasiyetli veri miktarı, bu nedenle model yapımı için daha yüksek gereksinimler öne sürülür.
**İlk altın potunu kim kazanacak? **
Model ne olursa olsun, ticarileştirme temel konudur. Büyük modellere sahip mevcut AI oyuncularına bakılırsa, güçlendirme ve ticarileştirme konusunda hızla ilerliyorlar.
Genel amaçlı büyük ölçekli model ve dikey büyük ölçekli model farklı yollar izlese de özünde hala bir "aile"dir ve aynı kulvardadır, bu nedenle rekabet sorunundan kaçınılamaz.
Genel büyük ölçekli model için, önce dikey büyük ölçekli model iner ve genel büyük ölçekli modelin yolu daha dar olur. Benzer şekilde, genel amaçlı büyük ölçekli modeller kısa sürede pazarı ele geçirdikten sonra, dar iş kollarına sahip dikey büyük ölçekli modellerin para kazanması daha zor olacaktır.
İdeal aşamada, ister ekonomik ister evrensel bir değer olsun, genel amaçlı büyük ölçekli model, dikey büyük ölçekli modelden daha iyidir. Ancak gerçek hayat bir ütopya değildir.Genel amaçlı büyük ölçekli model ile dikey büyük ölçekli model arasında kim daha hızlı koşarsa çalışsın, çeşitli işletmeler arasındaki rekabete bağlıdır.
Geçen yılki sıcak AIGC'ye bakılırsa. Bazı piyasa katılımcıları, kullanıcıların C ucunda daha düşük bir eşiğe sahip içerik oluşturmak için yapay zeka kullanmasına izin verilmesiyle karşılaştırıldığında, B ucunun AIGC için daha önemli iş modeli olacağına inanıyor.
Huawei ayrıca kendi ToB işine daha fazla önem veriyor. Huawei, düzenlediği basın toplantısında, Huawei Pangu büyük modelinin ağırlıklı olarak sektörleri güçlendirmek için yapay zekayı kullandığını ve elektrik, finans, tarım gibi birçok sektörde kullanıldığını belirtti.Bunlar arasında CV büyük modeli madenlerde, NLP ise akıllı belge alımında büyük model kullanılır.
Örneğin, arama motorlarında uzmanlaşan Baidu, GPT-3 gibi arama öznitelikleriyle Wenxin Yiyan'ı başlattı.
ChatGPT'ye ek olarak, aslında, AI büyük ölçekli modellerin fırtınasından önce iniş sahneleri vardı.Bu "büyük" modeller aslında esas olarak dikey büyük ölçekli modellerdir.
Dil modeli: GPT, BERT vb. gibi, çoğunlukla makine çevirisi, metin oluşturma, duygu analizi vb. gibi doğal dil işleme alanında kullanılır.
Görüntü modelleri: Görüntü sınıflandırma, hedef tespiti, görüntü bölümleme vb. gibi ağırlıklı olarak bilgisayarlı görü alanında kullanılan ResNet, Inception vb.
Tavsiye modeli: Ürün tavsiyesi ve reklam tavsiyesi gibi tavsiye sistemleri alanında ağırlıklı olarak kullanılan DNN, RNN vb.
Chatbot'lar: Seq2Seq, Transformer vb. gibi, çoğunlukla akıllı müşteri hizmetleri ve akıllı asistanlar gibi senaryolarda kullanılır.
Finansal risk kontrolü: XGBoost, LightGBM vb. gibi, esas olarak bankalar ve menkul kıymetler gibi finansal kurumların kredi puanlama ve dolandırıcılıkla mücadele gibi risk kontrol senaryolarında kullanılır.
Tıbbi görüntü teşhisi: Akciğer kanseri teşhisi ve patolojik analiz gibi tıbbi görüntü teşhisi alanında ağırlıklı olarak kullanılan DeepLung, DeepLesion vb.
Para kazanmak inişten daha önemlidir.
Guosheng Securities'in "ChatGPT için Ne Kadar Bilgi İşlem Gücü Gerekiyor" raporuna göre, GPT-3 eğitiminin maliyetinin yaklaşık 1,4 milyon ABD doları olduğu ve bazı daha büyük LLM'ler (Large Language Model) için eğitim maliyetinin 2 milyon ABD doları ile 12 milyon ABD doları arasında. 13 milyon olan Ocak ayında ChatGPT'nin ortalama tekil ziyaretçi sayısına dayanarak, buna karşılık gelen çip talebi 30.000'den fazla NVIDIA A100 GPU, ilk yatırım maliyeti yaklaşık 800 milyon ABD doları ve günlük elektrik maliyeti yaklaşık 50.000 ABD dolarıdır.
Hiç şüphe yok ki genel amaçlı büyük ölçekli modeller çıkarma senaryolarında daha yaygın olarak kullanılmaktadır.Genel amaçlı büyük ölçekli modellere güvenen oyuncular için ticarileştirme ikinci sıradadır.Dikey büyük ölçekli modellerin dibi kapatmak için daha hızlı ticarileştirilmesi gerekir. dikey büyük ölçekli modellerin daha fazla avantajı vardır. Yüksek olasılık ve daha hızlı benimseme oranı.
Önce kimin mutlak avantaj sağlayabileceğine dair kesin bir cevap yok. AI büyük modellerinin bu "silahlanma yarışı" tıpkı web1'den web2'ye kelebek değişimi gibidir. İşletmeler zamana karşı yarışıyor ve fırsatı ilk yakalayan pazarı ele geçirecek.
View Original
The content is for reference only, not a solicitation or offer. No investment, tax, or legal advice provided. See Disclaimer for more risks disclosure.
General VS dikey, büyük model ilk eşleşme noktasına yaklaştı
Kaynak: Shenmou Finance, yazar | Zhang Wei
AI megamodelleri için savaş alanı parçalanıyor.
Sigorta olarak Chatgpt, AI2.0 çağının kapısını açtı ve AI2.0, verimli bir şekilde emeğin yerini alabilen ve hayatın her kesiminde yaygın olarak kullanılabilen "endüstriyel zeka ve dijitalleşme" ile karakterize ediliyor. Kaçak dönemi çoktan geçti, AI büyük modelinin uygulanması daha gerçekçi.
En tipik tezahürü, büyük AI modelinin sadece B tarafında değil, daha geniş bir şekilde çemberin dışına çıkmasıdır. Örneğin, chatGPT yayınlanalı altı aydan fazla olmasına rağmen yazar, Şanghay CBD'deki alt kattaki kafede chatGPT hakkında konuşan göçmen işçilerin sesini hâlâ duyabiliyor; basında çıkan haberlere göre, bazı şirketler AIGC'yi bir araç olarak da kullanıyor. verimlilik aracı.
Alibaba Group'un başkanı ve CEO'su ve Alibaba Cloud Intelligence Group'un CEO'su Zhang Yong'un dediği gibi: AI çağıyla karşı karşıya kalındığında, tüm ürünler büyük bir modelle yeniden yapılmaya değer.
Büyük fabrikalar, bilimsel araştırma kurumları ve girişimcilerin sonu geldi.
Baidu Wenxin Yiyan, Huawei Pangu, 360 Zhinao, Shangtang Rixin, Ali Tongyi Qianwen, Jingdong Lingxi, Kunlun Wanwei Tiangong gibi büyük üreticiler ve diğer büyük modeller arka arkaya ortaya çıktı, ardından Tencent Hunyuan, HKUST Xunfei Xinghuo gibi büyük modeller bekliyor. çevrimiçi olmak için hat
Girişimcilerin de ünlüleri var: Sogou'nun kurucusu Wang Xiaochuan, Meituan'ın kurucu ortağı Wang Huiwen, Sinovation Works'ün başkanı Kaifu Li ve diğerleri, AI büyük modellerinde yüksek profilli görünümler yaptı.
Birkaç aydan fazla süren AI büyük ölçekli model çılgınlığı iki yol ortaya çıkardı.
AI silahlanma yarışı, büyük model farklılaşması
AI büyük modelleri rekabet aşamasına girdi ve yollar yavaş yavaş farklılaşıyor.
AI modeli yavaş yavaş ısınırken, medya istatistiklerine göre, Şubat ayı başında Oriental Fortune'un "ChatGPT" bölümünde sadece 29 hisse senedi vardı ve şimdi 61 hisseye ulaştı ve sayı hala artıyor . Eksik istatistiklere göre şu an itibariyle ülkemde 40'tan fazla firma ve kurum büyük ölçekli maket ürünleri piyasaya sürdü veya büyük ölçekli maket planlarını açıkladı.
Bunların arasında, AI büyük ölçekli modellerinin "silahlanma yarışına" katılan oyuncular da iki geliştirme yönü geliştirdiler. Dikey büyük modeller ve genel büyük modeller, yapay zeka alanında iki ana gelişme yönü haline geliyor.
Dikey büyük modeller, konuşma tanıma, doğal dil işleme, görüntü sınıflandırma vb. gibi belirli alanlar veya görevler için optimize edilmiş modelleri ifade eder.
Şu anda, giderek daha fazla şirket dikey büyük ölçekli modellerin yoluna katılıyor. Xueersi, dünyanın dört bir yanındaki matematik meraklıları ve bilimsel araştırma kurumları için kendi geliştirdiği MathGPT adlı büyük bir matematiksel model geliştirdiğini duyurdu; 6 Mayıs'ta Taoyun Technology, çocuklar için büyük bir bilişsel model olan Alpha Egg Children's Cognitive Big'i piyasaya sürdüğünü duyurdu. Model, ifade pratiği yapma, EQ'yu geliştirme, yaratıcılığa ilham verme ve öğrenmeye yardımcı olma açısından çocuklar için yeni bir etkileşimli deneyim getiriyor.
Genel büyük modeller, BERT, GPT vb. gibi birden çok görevi ve alanı işleyebilen modelleri ifade eder.
Sermaye ve yetenek avantajları nedeniyle, büyük üreticiler genel amaçlı büyük modellerin parkurunu hedefliyor.
Büyük üreticiler genel amaçlı büyük modelleri hedefliyor.Bir yandan yapay zeka yeteneklerini kendi ürünleriyle birleştirebiliyorlar.Daha temsili İnternet şirketleri ve Alibaba, Huawei ve Baidu gibi teknoloji devleri.
Örneğin, Microsoft'un GPT-4'ü Office aile grubuna entegre etmesinin ardından, Ali'nin "Tongyi Qianwen" cihazı da DingTalk'a erişmeye başladı. Kullanıcılar belgelerde içerik oluşturabilir ve video konferanslarda her Kişisel görünümü ve içeriği oluşturabilirler.
Örneğin, Baidu'nun büyük modeli kendi işiyle de birleştirilebilir. "Wen Xin Yi Yan", arama motorlarının yinelemesinde niteliksel bir dönüşüme sahip olabilir. kendi endüstrileri.
Öte yandan, genel amaçlı büyük modelin geniş bir uygulanabilirliği vardır ve ilk önce performans gösterenler, ilk hamle avantajını kurabilir ve AI2.0 çağında lider olabilir. Ne de olsa "hızlı koşan eti alır, yavaş koşan sadece artanı yer" gerçeğini herkes bilir.
Dikey uygulamalı büyük model "açık bir akış" olarak tanımlanabilir.Dikey uygulamalı büyük model, dikey senaryoların ihtiyaçlarına daha uygun olduğundan ve genel büyük modelden daha kaliteli olduğundan, birçok şirket de fırsatları gördü. Örneğin, belirli AI yollarına odaklanan Shenlan, Mobvoi, Youdao ve diğer şirketler.
Büyük dikey modellerin gelişimi, temel olarak çeşitli alanlarda model performansının sürekli iyileştirilmesine yansımıştır.Örneğin, konuşma tanımanın hata oranı yıldan yıla azalmıştır ve doğal dil işlemenin anlamsal anlama yeteneği gelişmeye devam etmiştir. Genel büyük model, çok görevli öğrenme ve transfer öğrenmede dikkate değer bir ilerleme kaydetmiştir ve doğal dil işleme alanında önemli bir araştırma yönü haline gelmiştir.
Örneğin, büyük biyolojik modeller yapay zeka ilaçlarının verimliliğini artırabilir. Yabancı araştırma raporları, yapay zekanın yeni ilaç araştırma ve geliştirme başarı oranını %16,7 artırabileceğini ve yapay zeka destekli ilaç araştırma ve geliştirmenin her yıl araştırma ve geliştirme maliyetlerinde 54 milyar ABD doları tasarruf sağlayabileceğini ve %40 ila %60 arasında tasarruf sağlayabileceğini gösteriyor. araştırma ve geliştirmenin ana sürecinde zaman ve maliyet. Nvidia'nın halka açık bilgilerine göre, yapay zeka teknolojisinin kullanılması, erken ilaç keşfi için gereken süreyi üçte bire kadar kısaltabilir ve maliyetleri yüzde iki oranında azaltabilir.
Sektörel bakış açısıyla genel model, her soruya cevap verebilen ve farklı endüstriyel zeminlere uygulanabilen bir "ansiklopedi" iken, dikey model ise tek bir alanda uzmana benzer.Profesyonel olmasına rağmen hedef kitlesi az sayıda insan olmaya mahkumdur.
Veriler ölümcüldür
Dikey büyük modelin avantajı, yeterince "büyük" olmamasıdır: hesaplama gücü yeterince büyük değildir ve algoritmanın zorluğu düşüktür.
Wang Xiaochuan, büyük ölçekli model parkuruna girdikten sonra, gelecekteki çabaların yönünün OpenAI gibi AGI (Genel Yapay Zeka) yapmak değil, belirli belirli alanlarda dikey olarak büyük ölçekli modeller yapmak ve iniş uygulamalarını gerçekleştirmek olduğunu her zaman vurguladı. .
Geniş anlamda bir büyük model aslında genel amaçlı bir büyük modeli tanımlar.Tıpkı "büyük" bir model gibi, büyük bir modelin "büyük" olmasının nedeni, çok sayıda parametre ve büyük miktarda veridir. algoritmalar, bilgi işlem gücü ve veri depolama alanı üzerinde büyük etkiye sahiptir.Büyük gereksinimler ve bunlar sadece telafi edebilen insanlar değil, aynı zamanda çok paraya da ihtiyaç duyan insanlar. Biliyorsunuz, Open AI'ın başarısı da Microsoft tarafından milyarlarca dolarla inşa edildi. Devasa sermaye talebi, araştırma ve geliştirmede büyük üreticilerin kararlılığı için de bir sınavdır.
Son beş yılda, AI büyük modellerin parametre hacmi her yıl büyüklük sırasına göre arttı.Örneğin, GPT-4'ün parametre hacmi GPT-3'ün 16 katı, 1,6 trilyona ulaştı; ve tanıtımıyla birlikte görüntü, ses ve video gibi çok modlu verilerin, büyük modellerin veri hacmi de hızla genişlemektedir. Bu, büyük bir modelle oynamak istiyorsanız, büyük bir bilgi işlem gücünüz olması gerektiği anlamına gelir.
Büyük üreticilerle karşılaştırıldığında, dikey büyük ölçekli modeller yapan şirketler nispeten kıt fonlara, bilgi işlem gücüne ve verilere sahiptir, bu nedenle aslında genel amaçlı büyük ölçekli model oyuncularla aynı başlangıç çizgisinde değildirler.
Tıpkı yeni enerji araçlarının motorlar, piller ve elektronik kontrollerin üç ana bileşeninden ayrılamaz olması gibi, AI büyük modelleri de bilgi işlem gücü, algoritmalar ve veri desteğinden ayrılamaz.
Hesaplama gücü, algoritmalar ve veriler arasında veri, büyük dikey modellerin zorluğudur.
Üç unsur arasında, algoritmanın araştırma ve geliştirme zorluğu nispeten düşüktür.Mevcut şirketlerin büyük modelleri uygulamak için kendi yol algoritmaları vardır ve referans için birçok açık kaynak projesi vardır.
Çip, bilgi işlem gücünü belirler. Genel olarak büyük yapay zeka modeli, genel model sinir ağının eğitimini ve yapımını tamamlamak için daha yüksek performanslı bir yongaya ihtiyaç duyar. Bununla birlikte, mevcut yonga daha az kendi kendini geliştirmiştir ve hala esas olarak harici kaynaklıdır. Örneğin, ChatGPT için en uygun çip Nvidia'dan, amiral gemisi çipi H100 ve alt amiral gemisi çipi A100.
Zorluk verilerde yatıyor. Yüksek kaliteli veriler, yapay zeka eğitimine ve ayarlamaya yardımcı olmanın anahtarıdır. Yeterli ve zengin veriler, üretken yapay zeka büyük modellerinin temelidir.
OpenAI'nin bir önceki açıklamasına göre ChatGPT3 parametre sayısı tek başına 175 milyara, eğitim verisi ise 45 TB'a ulaştı.
Çin'in mobil İnternetinin nispeten olgun gelişimi nedeniyle, büyük miktarda Çin veri kaynağı çeşitli işletmelerde veya kurumlarda depolanıyor ve bu da paylaşımı zorlaştırıyor.
"Kuruluşun birçok ticari verisi, lojistik verisi, finansal verisi vb. çok temel özel alan verileri olduğundan, China Star Optoelectronics veya PetroChina'nın verileri başkalarının eğitmesi için kullanacağını hayal etmek zor." Xu Hui, Chuangxinqizhi'nin CEO'su, geçtiğimiz günlerde menkul kıymetlerle röportaj yaptı. Times ile yaptığı bir röportajda, o da açıkça söyledi.
AI ilaç endüstrisini örnek alarak, büyük biyolojik modeller teknoloji tarafından "sıkışıp kalma" sorunuyla karşı karşıyadır. İlaç araştırma ve geliştirme için yüksek hassasiyetli deneysel veriler elde etmenin maliyeti nispeten yüksektir ve kamuya açık veri tabanlarında çok sayıda etiketlenmemiş veri vardır. yüksek hassasiyetli veri miktarı, bu nedenle model yapımı için daha yüksek gereksinimler öne sürülür.
**İlk altın potunu kim kazanacak? **
Model ne olursa olsun, ticarileştirme temel konudur. Büyük modellere sahip mevcut AI oyuncularına bakılırsa, güçlendirme ve ticarileştirme konusunda hızla ilerliyorlar.
Genel amaçlı büyük ölçekli model ve dikey büyük ölçekli model farklı yollar izlese de özünde hala bir "aile"dir ve aynı kulvardadır, bu nedenle rekabet sorunundan kaçınılamaz.
Genel büyük ölçekli model için, önce dikey büyük ölçekli model iner ve genel büyük ölçekli modelin yolu daha dar olur. Benzer şekilde, genel amaçlı büyük ölçekli modeller kısa sürede pazarı ele geçirdikten sonra, dar iş kollarına sahip dikey büyük ölçekli modellerin para kazanması daha zor olacaktır.
İdeal aşamada, ister ekonomik ister evrensel bir değer olsun, genel amaçlı büyük ölçekli model, dikey büyük ölçekli modelden daha iyidir. Ancak gerçek hayat bir ütopya değildir.Genel amaçlı büyük ölçekli model ile dikey büyük ölçekli model arasında kim daha hızlı koşarsa çalışsın, çeşitli işletmeler arasındaki rekabete bağlıdır.
Geçen yılki sıcak AIGC'ye bakılırsa. Bazı piyasa katılımcıları, kullanıcıların C ucunda daha düşük bir eşiğe sahip içerik oluşturmak için yapay zeka kullanmasına izin verilmesiyle karşılaştırıldığında, B ucunun AIGC için daha önemli iş modeli olacağına inanıyor.
Huawei ayrıca kendi ToB işine daha fazla önem veriyor. Huawei, düzenlediği basın toplantısında, Huawei Pangu büyük modelinin ağırlıklı olarak sektörleri güçlendirmek için yapay zekayı kullandığını ve elektrik, finans, tarım gibi birçok sektörde kullanıldığını belirtti.Bunlar arasında CV büyük modeli madenlerde, NLP ise akıllı belge alımında büyük model kullanılır.
Örneğin, arama motorlarında uzmanlaşan Baidu, GPT-3 gibi arama öznitelikleriyle Wenxin Yiyan'ı başlattı.
ChatGPT'ye ek olarak, aslında, AI büyük ölçekli modellerin fırtınasından önce iniş sahneleri vardı.Bu "büyük" modeller aslında esas olarak dikey büyük ölçekli modellerdir.
Para kazanmak inişten daha önemlidir.
Guosheng Securities'in "ChatGPT için Ne Kadar Bilgi İşlem Gücü Gerekiyor" raporuna göre, GPT-3 eğitiminin maliyetinin yaklaşık 1,4 milyon ABD doları olduğu ve bazı daha büyük LLM'ler (Large Language Model) için eğitim maliyetinin 2 milyon ABD doları ile 12 milyon ABD doları arasında. 13 milyon olan Ocak ayında ChatGPT'nin ortalama tekil ziyaretçi sayısına dayanarak, buna karşılık gelen çip talebi 30.000'den fazla NVIDIA A100 GPU, ilk yatırım maliyeti yaklaşık 800 milyon ABD doları ve günlük elektrik maliyeti yaklaşık 50.000 ABD dolarıdır.
Hiç şüphe yok ki genel amaçlı büyük ölçekli modeller çıkarma senaryolarında daha yaygın olarak kullanılmaktadır.Genel amaçlı büyük ölçekli modellere güvenen oyuncular için ticarileştirme ikinci sıradadır.Dikey büyük ölçekli modellerin dibi kapatmak için daha hızlı ticarileştirilmesi gerekir. dikey büyük ölçekli modellerin daha fazla avantajı vardır. Yüksek olasılık ve daha hızlı benimseme oranı.
Önce kimin mutlak avantaj sağlayabileceğine dair kesin bir cevap yok. AI büyük modellerinin bu "silahlanma yarışı" tıpkı web1'den web2'ye kelebek değişimi gibidir. İşletmeler zamana karşı yarışıyor ve fırsatı ilk yakalayan pazarı ele geçirecek.