Rumput - Revolusi Data

Menengah12/9/2024, 8:36:14 AM
Grass memberikan akses ke seluruh Internet sebagai dataset bagi model dan aplikasi AI, yang dikumpulkan melalui jaringan node di seluruh dunia yang menyumbangkan bandwidth Internet mereka yang tidak terpakai. Mereka memiliki daya tarik awal yang kuat dengan lebih dari 2,5 juta pengguna.

Ringkasan Eksekutif

AI Generatif adalah inovasi paling penting dalam ingatan baru-baru ini dan semakin penting seiring berjalannya waktu. AI Generatif pada dasarnya adalah produk dari tiga elemen:

Algoritma + Data + Komputasi = Keunggulan

Ini berarti bahwa Data dan Komputasi kemungkinan akan menjadi dua aset terpenting di dunia, dan akses ke keduanya akan sangat penting.

Model AI Generatif membutuhkan banyak data. Data yang paling signifikan yang dioperasikan oleh model AI Generatif adalah data sepadan dengan Internet, yang merupakan perkiraan jumlah pengetahuan manusia.

Kripto adalah tentang memberikan akses ke sumber daya digital baru di seluruh dunia dan mengasaskan hal-hal yang sebelumnya bukan aset melalui token. Grass melakukan hal ini untuk Data.

Grass memberikan model AI dan aplikasi akses ke seluruh Internet sebagai dataset, secara real-time, yang dikumpulkan melalui jaringan node di seluruh dunia yang menyumbangkan lebar pita Internet mereka yang tidak terpakai. Mereka memiliki daya tarik awal yang kuat dengan lebih dari 2,5 juta pengguna.[1]

Potensi pasar jangka panjang untuk Grass sangat besar dan relatif terhadap ukuran pasar kecerdasan buatan dan pertumbuhannya di masa depan. Di masa lalu, pengumpulan dataset sebesar ini hanya terbatas pada raksasa teknologi terbesar. Grass membawa ekonomi baru ke data, menurunkan biaya. Hal ini mendemokratisasi akses data tidak hanya untuk melayani perusahaan besar elit, tetapi juga untuk industri kecerdasan buatan yang lebih panjang.

Permasalahan

Pelatihan dan penyetelan model AI memerlukan jumlah data yang sangat besar. Secara historis, sebagian besar data tersebut telah dikumpulkan melalui pencipta model AI yang mengumpulkan data dari situs web. Proses pengumpulan data ini memiliki sejumlah tantangan:

  • Web scraping itu mahal. Hanya ada beberapa organisasi besar yang mampu melakukan pengambilan data seluruh web secara berkala. Hal ini menghalangi pengembang kecerdasan buatan (AI) skala kecil untuk mengakses data.
  • Pemblokiran IP. Telah ada permainan kucing dan tikus antara layanan pengambilan data dan pencipta konten. Sangat mudah untuk memblokir alamat IP untuk menghentikan pengambilan data, sehingga sulit untuk mencapai tujuan pengambilan data dan mengumpulkan data yang diperlukan untuk pelatihan dan penyesuaian AI.
  • Sumber daya terbuang. Mengikis web adalah tugas yang dapat memberikan manfaat bagi banyak pelanggan. Perangkat keras, bandwidth, dan daya komputasi yang diperlukan untuk ini tidak efisien jika dilakukan oleh satu pelanggan.
  • Segar data. Memindai seluruh Internet itu merepotkan dan mahal. Hal ini membuatnya tidak praktis bagi sebagian besar pengguna untuk memindai sering, yang membuat data kurang segar/baru, mempengaruhi kualitas model AI.

Solusi Grass

Grass bertujuan untuk memecahkan masalah ini dengan membuat jaringan terfederasi dari web scraper. Setiap individu yang berpartisipasi dalam jaringan Grass memberikan sebagian dari bandwidth Internet yang tidak digunakan mereka untuk menyediakan sejumlah kecil hasil scrap dari alamat IP mereka. Grass kemudian menyusun data dari masing-masing node ini untuk membentuk kumpulan data gabungan yang berguna untuk pelatihan dan penyetelan AI. Ini adalah penggunaan yang elegan dan sesuai dengan jaringan terdistribusi yang didukung oleh cryptocurrency.

Ada juga kasus bisnis lain untuk internet yang tidak terpakai, seperti:

  • Mengumpulkan data lokal/geo, seperti iklan
  • Melakukan penelitian akademis
  • Memeriksa harga lokal

Saat ini Grass mengumpulkan data menggunakan perangkat keras yang ada (laptop, desktop, dll.). Di masa depan, Grass berencana untuk menawarkan alat pengumpulan data, yang merupakan perangkat keras khusus yang didedikasikan sepenuhnya untuk pengumpulan data, menciptakan efisiensi karena alat tersebut dioptimalkan untuk tugas tertentu tersebut.

Manfaat Rumput

Ada beberapa manfaat dalam menggunakan jaringan terdistribusi untuk pengumpulan data:

  • Akses demokratisasi terhadap data web yang menjadi lebih murah saat skala bertambah. Daripada pelanggan tunggal mengumpulkan data untuk kebutuhan mereka sendiri, Grass mengumpulkan data atas nama banyak pelanggan. Data ini dapat dijual kembali berkali-kali, menciptakan ekonomi skala pada data, menurunkan biaya ekonomi dari scraping dan membuat pasar lebih efisien. Dalam skala Grass, secara hipotetis dapat menjadi solusi pengumpulan data yang paling hemat biaya bagi pelanggan, menciptakan efek jaringan ekonomi di sekitar protokol mereka. Ini berarti pengumpulan data sekarang tersedia untuk siapa saja, bukan hanya beberapa perusahaan besar yang memiliki sumber daya untuk melakukan scraping web.
  • Pemblokiran IP menjadi tidak mungkin dilakukan. Dengan mendistribusikan penyisipan data, menjadi jauh lebih sulit untuk mendeteksi dan menghentikan penyisipan data, karena setiap node hanya melakukan sejumlah kecil pengambilan data dan sulit untuk dibedakan dari lalu lintas Internet yang khas. Hal ini menghasilkan kumpulan data pelatihan yang lebih lengkap.
  • Lebar pita internet digunakan secara lebih efisien. Karena Grass efektif sebagai permainan konsumsi kolaboratif pada lebar pita internet yang tidak terpakai, maka lebih efisien daripada menyediakan lebar pita baru hanya untuk mengumpulkan data.
  • Data menjadi lebih akurat dan terbaru. Menjadikan lebih efektif secara biaya untuk melakukan pengambilan data lebih sering daripada yang biasanya dilakukan oleh pelanggan. Hal ini menghasilkan data yang lebih segar. Hal ini penting karena model AI yang dihasilkan menjadi lebih mutakhir.

Tantangan: Pembuat Konten yang Memonetisasi Data Mereka

Salah satu hal yang sulit untuk dihadapi saat mengambil data adalah pencipta konten. Ini termasuk situs seperti NY Times dan Reddit, yang telah mulai memonetisasi data mereka dengan melisensikannya kepada pihak ketiga untuk melatih model AI. Mereka secara alami melindungi data di situs mereka karena data tersebut mewakili sumber pendapatan yang sangat menguntungkan bagi mereka. Memang, Reddit telah melarang penggunaan API pengembang mereka untuk pembelajaran mesin untuk melindungi model bisnis mereka dalam melisensikan data mereka kepada pencipta model AI (lihat syarat layanan).di sini).

Apa yang akan terjadi di masa depan untuk para pencipta konten? Nah, pertimbangkan bahwa untuk konten yang dihasilkan oleh pengguna (UGC), seperti Reddit, ada argumen bahwa pengguna memiliki data mereka sendiri (bukan platform), karena konten tersebut dibuat oleh pengguna dan seharusnya dimiliki oleh pengguna tersebut. Argumen ini belum sepenuhnya dieksplorasi dari segi hukum. Menarik untuk mengawasi perkembangan ini ke depannya. Namun, jika pengguna benar-benar memiliki data yang mereka sumbangkan, maka Grass dapat mewakili jalur hipotetis untuk membantu pengguna tersebut memonetisasi data sumbangan mereka sendiri. Misalnya, Grass dapat memberikan penghargaan kepada para kontributor Reddit itu sendiri yang secara sukarela menyumbangkan data yang telah mereka buat di Reddit.

Untuk pencipta konten berbayar seperti NY Times, konten dibuat oleh penulis berbayar, dan sebagai hasilnya tidak ada argumen untuk data yang dimiliki pengguna. Oleh karena itu, Grass bisa saja mengesampingkan situs-situs tersebut dari dicuri. Sebagai alternatif, Grass mungkin berkembang hingga menjadi layak bagi Grass sendiri untuk menjadi pelanggan situs-situs tersebut dan membayar biaya lisensi. Cara ini dapat bekerja secara hipotetis di mana pelanggan Grass membayar untuk data, dan kemudian Grass membagi pendapatan kembali kepada pencipta konten, sehingga memungkinkan penciptaan model AI dengan anggaran yang fleksibel. Atau, Grass bisa mencapai skala tertentu sehingga dapat bernegosiasi kesepakatan lisensi massal atas nama semua pelanggannya.

Peluncuran Grass

Grass memiliki peluncuran yang sangat mengesankan pada awal tahun ini:

  • Rumput memiliki airdrop yang paling banyak didistribusikan dalam sejarah Solana.[2]
  • Lebih dari 2 juta dompetmengklaimairdrop, menyebabkan jaringan Solana terbebani di bawah tekanan.
  • Ada lebih dari 2,5 juta pengguna Grass di seluruh dunia.[3]
  • Grass memiliki kapasitas dan data untuk melatih model ChatGPT 3.5 milik OpenAI secara langsung.
  • Sebagai demonstrasi dari platform mereka, Grass telah open-source sebuah dataset yang terdiri dari 600 juta postingan dan komentar dari tahun 2024 di Reddit (lihat di siniuntuk pengumuman dandi siniuntuk kumpulan data).

Saat ini, token Grass memilikiaksi harga positifpost-launch (+115%), yang tidak biasa karena sebagian besar token turun dalam beberapa hari/minggu setelah daftar. Ini mungkin merupakan cerminan dari pendekatan cerdas mereka terhadap distribusi airdrop, serta keyakinan dalam masa depan dan potensi Grass. Secara keseluruhan, ini adalah awal yang bagus untuk jaringan ini dan kami percaya ini membuka jalan bagi tahun-tahun yang sukses.

Kinerja Token Grass Sejak Diluncurkan pada 28 Oktober 2024

Sumber: TradingView.

Mulai berkontribusigunakan bandwidth internet yang tidak terpakai dengan menghubungkan dompet Solana Anda dan dapatkan token Grass.

Ingin menggunakan dataset Grass untuk bisnis, penelitian, atau proyek Anda? Hubungi tim di gatediscover@grassfoundation.io.

Catatan kaki

[1] Sumber: https://www.getgrass.io/.
[2] Sumber: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Sumber: https://www.getgrass.io/.

Disclaimer:

  1. Artikel ini dicetak ulang dari [Hack VC], Seluruh hak cipta adalah milik penulis asli [ Ed Roman]. Jika ada keberatan terhadap cetak ulang ini, harap hubungi Gate Belajartim, dan mereka akan menanganinya dengan segera.
  2. Penolakan Tanggung Jawab: Pandangan dan opini yang tertera dalam artikel ini semata-mata milik penulis dan tidak merupakan nasihat investasi apa pun.
  3. Terjemahan artikel ke dalam bahasa lain dilakukan oleh tim Belajar gate. Kecuali disebutkan, menyalin, mendistribusikan, atau menjiplak artikel yang diterjemahkan dilarang.

Rumput - Revolusi Data

Menengah12/9/2024, 8:36:14 AM
Grass memberikan akses ke seluruh Internet sebagai dataset bagi model dan aplikasi AI, yang dikumpulkan melalui jaringan node di seluruh dunia yang menyumbangkan bandwidth Internet mereka yang tidak terpakai. Mereka memiliki daya tarik awal yang kuat dengan lebih dari 2,5 juta pengguna.

Ringkasan Eksekutif

AI Generatif adalah inovasi paling penting dalam ingatan baru-baru ini dan semakin penting seiring berjalannya waktu. AI Generatif pada dasarnya adalah produk dari tiga elemen:

Algoritma + Data + Komputasi = Keunggulan

Ini berarti bahwa Data dan Komputasi kemungkinan akan menjadi dua aset terpenting di dunia, dan akses ke keduanya akan sangat penting.

Model AI Generatif membutuhkan banyak data. Data yang paling signifikan yang dioperasikan oleh model AI Generatif adalah data sepadan dengan Internet, yang merupakan perkiraan jumlah pengetahuan manusia.

Kripto adalah tentang memberikan akses ke sumber daya digital baru di seluruh dunia dan mengasaskan hal-hal yang sebelumnya bukan aset melalui token. Grass melakukan hal ini untuk Data.

Grass memberikan model AI dan aplikasi akses ke seluruh Internet sebagai dataset, secara real-time, yang dikumpulkan melalui jaringan node di seluruh dunia yang menyumbangkan lebar pita Internet mereka yang tidak terpakai. Mereka memiliki daya tarik awal yang kuat dengan lebih dari 2,5 juta pengguna.[1]

Potensi pasar jangka panjang untuk Grass sangat besar dan relatif terhadap ukuran pasar kecerdasan buatan dan pertumbuhannya di masa depan. Di masa lalu, pengumpulan dataset sebesar ini hanya terbatas pada raksasa teknologi terbesar. Grass membawa ekonomi baru ke data, menurunkan biaya. Hal ini mendemokratisasi akses data tidak hanya untuk melayani perusahaan besar elit, tetapi juga untuk industri kecerdasan buatan yang lebih panjang.

Permasalahan

Pelatihan dan penyetelan model AI memerlukan jumlah data yang sangat besar. Secara historis, sebagian besar data tersebut telah dikumpulkan melalui pencipta model AI yang mengumpulkan data dari situs web. Proses pengumpulan data ini memiliki sejumlah tantangan:

  • Web scraping itu mahal. Hanya ada beberapa organisasi besar yang mampu melakukan pengambilan data seluruh web secara berkala. Hal ini menghalangi pengembang kecerdasan buatan (AI) skala kecil untuk mengakses data.
  • Pemblokiran IP. Telah ada permainan kucing dan tikus antara layanan pengambilan data dan pencipta konten. Sangat mudah untuk memblokir alamat IP untuk menghentikan pengambilan data, sehingga sulit untuk mencapai tujuan pengambilan data dan mengumpulkan data yang diperlukan untuk pelatihan dan penyesuaian AI.
  • Sumber daya terbuang. Mengikis web adalah tugas yang dapat memberikan manfaat bagi banyak pelanggan. Perangkat keras, bandwidth, dan daya komputasi yang diperlukan untuk ini tidak efisien jika dilakukan oleh satu pelanggan.
  • Segar data. Memindai seluruh Internet itu merepotkan dan mahal. Hal ini membuatnya tidak praktis bagi sebagian besar pengguna untuk memindai sering, yang membuat data kurang segar/baru, mempengaruhi kualitas model AI.

Solusi Grass

Grass bertujuan untuk memecahkan masalah ini dengan membuat jaringan terfederasi dari web scraper. Setiap individu yang berpartisipasi dalam jaringan Grass memberikan sebagian dari bandwidth Internet yang tidak digunakan mereka untuk menyediakan sejumlah kecil hasil scrap dari alamat IP mereka. Grass kemudian menyusun data dari masing-masing node ini untuk membentuk kumpulan data gabungan yang berguna untuk pelatihan dan penyetelan AI. Ini adalah penggunaan yang elegan dan sesuai dengan jaringan terdistribusi yang didukung oleh cryptocurrency.

Ada juga kasus bisnis lain untuk internet yang tidak terpakai, seperti:

  • Mengumpulkan data lokal/geo, seperti iklan
  • Melakukan penelitian akademis
  • Memeriksa harga lokal

Saat ini Grass mengumpulkan data menggunakan perangkat keras yang ada (laptop, desktop, dll.). Di masa depan, Grass berencana untuk menawarkan alat pengumpulan data, yang merupakan perangkat keras khusus yang didedikasikan sepenuhnya untuk pengumpulan data, menciptakan efisiensi karena alat tersebut dioptimalkan untuk tugas tertentu tersebut.

Manfaat Rumput

Ada beberapa manfaat dalam menggunakan jaringan terdistribusi untuk pengumpulan data:

  • Akses demokratisasi terhadap data web yang menjadi lebih murah saat skala bertambah. Daripada pelanggan tunggal mengumpulkan data untuk kebutuhan mereka sendiri, Grass mengumpulkan data atas nama banyak pelanggan. Data ini dapat dijual kembali berkali-kali, menciptakan ekonomi skala pada data, menurunkan biaya ekonomi dari scraping dan membuat pasar lebih efisien. Dalam skala Grass, secara hipotetis dapat menjadi solusi pengumpulan data yang paling hemat biaya bagi pelanggan, menciptakan efek jaringan ekonomi di sekitar protokol mereka. Ini berarti pengumpulan data sekarang tersedia untuk siapa saja, bukan hanya beberapa perusahaan besar yang memiliki sumber daya untuk melakukan scraping web.
  • Pemblokiran IP menjadi tidak mungkin dilakukan. Dengan mendistribusikan penyisipan data, menjadi jauh lebih sulit untuk mendeteksi dan menghentikan penyisipan data, karena setiap node hanya melakukan sejumlah kecil pengambilan data dan sulit untuk dibedakan dari lalu lintas Internet yang khas. Hal ini menghasilkan kumpulan data pelatihan yang lebih lengkap.
  • Lebar pita internet digunakan secara lebih efisien. Karena Grass efektif sebagai permainan konsumsi kolaboratif pada lebar pita internet yang tidak terpakai, maka lebih efisien daripada menyediakan lebar pita baru hanya untuk mengumpulkan data.
  • Data menjadi lebih akurat dan terbaru. Menjadikan lebih efektif secara biaya untuk melakukan pengambilan data lebih sering daripada yang biasanya dilakukan oleh pelanggan. Hal ini menghasilkan data yang lebih segar. Hal ini penting karena model AI yang dihasilkan menjadi lebih mutakhir.

Tantangan: Pembuat Konten yang Memonetisasi Data Mereka

Salah satu hal yang sulit untuk dihadapi saat mengambil data adalah pencipta konten. Ini termasuk situs seperti NY Times dan Reddit, yang telah mulai memonetisasi data mereka dengan melisensikannya kepada pihak ketiga untuk melatih model AI. Mereka secara alami melindungi data di situs mereka karena data tersebut mewakili sumber pendapatan yang sangat menguntungkan bagi mereka. Memang, Reddit telah melarang penggunaan API pengembang mereka untuk pembelajaran mesin untuk melindungi model bisnis mereka dalam melisensikan data mereka kepada pencipta model AI (lihat syarat layanan).di sini).

Apa yang akan terjadi di masa depan untuk para pencipta konten? Nah, pertimbangkan bahwa untuk konten yang dihasilkan oleh pengguna (UGC), seperti Reddit, ada argumen bahwa pengguna memiliki data mereka sendiri (bukan platform), karena konten tersebut dibuat oleh pengguna dan seharusnya dimiliki oleh pengguna tersebut. Argumen ini belum sepenuhnya dieksplorasi dari segi hukum. Menarik untuk mengawasi perkembangan ini ke depannya. Namun, jika pengguna benar-benar memiliki data yang mereka sumbangkan, maka Grass dapat mewakili jalur hipotetis untuk membantu pengguna tersebut memonetisasi data sumbangan mereka sendiri. Misalnya, Grass dapat memberikan penghargaan kepada para kontributor Reddit itu sendiri yang secara sukarela menyumbangkan data yang telah mereka buat di Reddit.

Untuk pencipta konten berbayar seperti NY Times, konten dibuat oleh penulis berbayar, dan sebagai hasilnya tidak ada argumen untuk data yang dimiliki pengguna. Oleh karena itu, Grass bisa saja mengesampingkan situs-situs tersebut dari dicuri. Sebagai alternatif, Grass mungkin berkembang hingga menjadi layak bagi Grass sendiri untuk menjadi pelanggan situs-situs tersebut dan membayar biaya lisensi. Cara ini dapat bekerja secara hipotetis di mana pelanggan Grass membayar untuk data, dan kemudian Grass membagi pendapatan kembali kepada pencipta konten, sehingga memungkinkan penciptaan model AI dengan anggaran yang fleksibel. Atau, Grass bisa mencapai skala tertentu sehingga dapat bernegosiasi kesepakatan lisensi massal atas nama semua pelanggannya.

Peluncuran Grass

Grass memiliki peluncuran yang sangat mengesankan pada awal tahun ini:

  • Rumput memiliki airdrop yang paling banyak didistribusikan dalam sejarah Solana.[2]
  • Lebih dari 2 juta dompetmengklaimairdrop, menyebabkan jaringan Solana terbebani di bawah tekanan.
  • Ada lebih dari 2,5 juta pengguna Grass di seluruh dunia.[3]
  • Grass memiliki kapasitas dan data untuk melatih model ChatGPT 3.5 milik OpenAI secara langsung.
  • Sebagai demonstrasi dari platform mereka, Grass telah open-source sebuah dataset yang terdiri dari 600 juta postingan dan komentar dari tahun 2024 di Reddit (lihat di siniuntuk pengumuman dandi siniuntuk kumpulan data).

Saat ini, token Grass memilikiaksi harga positifpost-launch (+115%), yang tidak biasa karena sebagian besar token turun dalam beberapa hari/minggu setelah daftar. Ini mungkin merupakan cerminan dari pendekatan cerdas mereka terhadap distribusi airdrop, serta keyakinan dalam masa depan dan potensi Grass. Secara keseluruhan, ini adalah awal yang bagus untuk jaringan ini dan kami percaya ini membuka jalan bagi tahun-tahun yang sukses.

Kinerja Token Grass Sejak Diluncurkan pada 28 Oktober 2024

Sumber: TradingView.

Mulai berkontribusigunakan bandwidth internet yang tidak terpakai dengan menghubungkan dompet Solana Anda dan dapatkan token Grass.

Ingin menggunakan dataset Grass untuk bisnis, penelitian, atau proyek Anda? Hubungi tim di gatediscover@grassfoundation.io.

Catatan kaki

[1] Sumber: https://www.getgrass.io/.
[2] Sumber: https://www.google.com/url?q=https://www.theblock.co/post/323805/grass-becomes-most-distributed-solana-airdrop-as-nearly-1-5-million-addresses-claim-tokens&sa=D&source=docs&ust=1732646335082707&usg=AOvVaw0oVvhJL661rmE1ABmJqOyP.
[3] Sumber: https://www.getgrass.io/.

Disclaimer:

  1. Artikel ini dicetak ulang dari [Hack VC], Seluruh hak cipta adalah milik penulis asli [ Ed Roman]. Jika ada keberatan terhadap cetak ulang ini, harap hubungi Gate Belajartim, dan mereka akan menanganinya dengan segera.
  2. Penolakan Tanggung Jawab: Pandangan dan opini yang tertera dalam artikel ini semata-mata milik penulis dan tidak merupakan nasihat investasi apa pun.
  3. Terjemahan artikel ke dalam bahasa lain dilakukan oleh tim Belajar gate. Kecuali disebutkan, menyalin, mendistribusikan, atau menjiplak artikel yang diterjemahkan dilarang.
Розпочати зараз
Зареєструйтеся та отримайте ваучер на
$100
!