## Dilema Hak Kekayaan Intelektual dalam Pelatihan Model AI: Kasus Adobe dan Lebih Jauh Lagi



Penggunaan data masif untuk melatih sistem kecerdasan buatan telah menjadi praktik standar di industri teknologi, tetapi juga telah menimbulkan konflik hukum yang belum pernah terjadi sebelumnya. Inti dari masalah ini terletak pada bagaimana model-model ini memperoleh kemampuannya: melalui pemrosesan kumpulan data besar yang, dalam banyak kasus, berisi karya yang dilindungi hak cipta tanpa izin eksplisit dari pencipta asli.

### Adobe di bawah pengawasan: SlimLM dan warisan Books3

Adobe, perusahaan perangkat lunak yang telah berinvestasi secara signifikan dalam kecerdasan buatan sejak 2023 dengan produk seperti Firefly, kini menghadapi gugatan class action yang mempertanyakan metode di balik teknologi SlimLM mereka. Elizabeth Lyon, penulis dari Oregon yang ahli dalam panduan penulisan non-fiksi, memimpin gugatan tersebut dengan menyatakan bahwa karya-karyanya dimasukkan tanpa izin ke dalam data pelatihan model ini.

Tuduhan tersebut mengarah pada rangkaian derivasi kumpulan data yang menggambarkan kompleksitas masalah ini. SlimLM dilatih sebelumnya menggunakan SlimPajama-627B, sebuah kumpulan data sumber terbuka yang dirilis oleh Cerebras. Masalahnya adalah bahwa SlimPajama dibuat sebagai derivasi yang diproses dari RedPajama, yang pada gilirannya berisi Books3: koleksi besar 191.000 buku yang telah menjadi sumber berbagai kontroversi hukum. Setiap subkumpulan data secara potensial mewarisi kerentanan hak kekayaan intelektual dari pendahulunya, menciptakan rantai tanggung jawab yang kabur tetapi nyata.

### Pola yang Berulang di Seluruh Industri

Apa yang terjadi dengan Adobe bukanlah insiden terisolasi, melainkan bagian dari tren yang lebih luas yang mulai runtuh di bawah beban tuntutan hukum. Pada September, Apple menghadapi tuduhan serupa karena menggunakan materi yang dilindungi hak cipta untuk melatih Apple Intelligence, kembali dengan RedPajama disebut sebagai sumbernya. Secara paralel, Salesforce juga digugat berdasarkan argumen yang hampir identik.

Momen paling signifikan terjadi ketika Anthropic menyepakati perjanjian sebesar 1,5 juta dolar dengan para penulis yang menuntut karena penggunaan karya mereka tanpa izin dalam pelatihan Claude. Perjanjian ini, yang dilaporkan pada September, secara luas dianggap sebagai titik balik dalam litigasi mengenai hak cipta pada data pelatihan AI.

### Ke Mana Industri Menuju?

Akumulasi gugatan class action menunjukkan bahwa model saat ini dalam memperoleh data untuk melatih AI tidak dapat dipertahankan secara hukum. Perusahaan teknologi menghadapi dilema: melatih model yang kuat membutuhkan volume data yang besar, tetapi memperoleh data tersebut secara legal dan dengan kompensasi masih belum memiliki kerangka yang jelas di sebagian besar yurisdiksi. Kasus Adobe, khususnya cara SlimLM mewarisi data bermasalah dari subkumpulan sebelumnya, menyoroti bagaimana tanggung jawab dapat dilacak melalui berbagai lapisan pemrosesan data, bahkan ketika perusahaan mengklaim menggunakan kumpulan data "sumber terbuka".

Industri berada pada titik kritis di mana preseden hukum mulai menentukan apa yang dapat diterima dan apa yang tidak dalam pelatihan AI.
Lihat Asli
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • Komentar
  • Posting ulang
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan

Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)