News Teknologi

Penggunaan hak cipta untuk latih AI

×

Penggunaan hak cipta untuk latih AI

Sebarkan artikel ini



Dalam contoh terbaru dari pola industri yang meresahkan, NVIDIA tampaknya telah mengambil banyak sekali konten berhak cipta untuk pelatihan AI.

Dalam contoh terbaru dari pola industri yang meresahkan, NVIDIA tampaknya telah mengambil banyak sekali konten berhak cipta untuk pelatihan AI. Pada hari Senin, Samantha Cole dari 404 Media melaporkan bahwa perusahaan senilai $2,4 triliun itu meminta para pekerja untuk mengunduh video dari YouTube, Netflix, dan kumpulan data lainnya untuk mengembangkan proyek AI komersial.

Pembuat kartu grafis itu adalah salah satu perusahaan teknologi yang tampaknya telah mengadopsi etos “bergerak cepat dan memecahkan banyak hal” saat mereka berlomba untuk membangun dominasi dalam demam emas AI yang terlalu sering memalukan ini.

Dilansir dari Engadget (6/8), pelatihan itu dilaporkan untuk mengembangkan model bagi produk-produk seperti generator dunia 3D Omniverse, sistem mobil self-driving, dan upaya “manusia digital”.

Seorang juru bicara NVIDIA mengatakan penelitiannya “sepenuhnya mematuhi hukum hak cipta” sambil mengklaim hukum IP melindungi ekspresi tertentu “tetapi bukan fakta, ide, data, atau informasi.” Perusahaan ini menyamakan praktik tersebut dengan hak seseorang untuk “mempelajari fakta, ide, data, atau informasi dari sumber lain dan menggunakannya untuk membuat ekspresi mereka sendiri.” Manusia, komputer… apa bedanya?

YouTube tampaknya tidak setuju. Juru bicara Jack Malon mengarahkan ke sebuah cerita Bloomberg dari bulan April, mengutip CEO Neal Mohan yang mengatakan bahwa menggunakan YouTube untuk melatih model AI akan menjadi “pelanggaran yang jelas” terhadap ketentuannya. “Komentar kami sebelumnya masih berlaku,” tulis manajer komunikasi kebijakan YouTube.

Kutipan dari Mohan pada bulan April itu menanggapi laporan bahwa OpenAI melatih generator teks-ke-video Sora pada video YouTube tanpa izin. Bulan lalu, sebuah laporan menunjukkan bahwa perusahaan startup Runway AI mengikuti hal yang sama.

Karyawan NVIDIA yang mengemukakan masalah etika dan hukum tentang praktik tersebut dilaporkan diberi tahu oleh manajer mereka bahwa hal itu telah mendapat lampu hijau dari level tertinggi perusahaan. “Ini adalah keputusan eksekutif,” jawab Ming-Yu Liu, wakil presiden penelitian di NVIDIA. “Kami memiliki persetujuan umum untuk semua data.” Pihak lain di perusahaan tersebut diduga menggambarkan pengikisan data tersebut sebagai “masalah hukum terbuka” yang akan mereka tangani di kemudian hari.

Semuanya terdengar mirip dengan motto lama Facebook (Meta) “bergerak cepat dan memecahkan banyak hal”, yang telah berhasil memecahkan banyak hal. Termasuk privasi jutaan orang.

Selain video YouTube dan Netflix, NVIDIA dilaporkan menginstruksikan para pekerja untuk berlatih menggunakan basis data cuplikan film MovieNet, pustaka internal rekaman gim video, dan kumpulan data video Github WebVid (sekarang ditutup) dan InternVid-10M. Yang terakhir adalah kumpulan data yang berisi 10 juta ID video YouTube.

Beberapa data yang diduga digunakan NVIDIA untuk melatih data hanya ditandai sebagai data yang memenuhi syarat untuk penggunaan akademis (atau nonkomersial). HD-VG-130M, pustaka berisi 130 juta video YouTube, menyertakan lisensi penggunaan yang menyatakan bahwa data tersebut hanya dimaksudkan untuk penelitian akademis. NVIDIA dilaporkan menepis kekhawatiran tentang istilah-istilah akademis saja, bersikeras bahwa batch mereka adalah sasaran yang adil untuk produk AI komersialnya.

Untuk menghindari deteksi dari YouTube, NVIDIA dilaporkan mengunduh konten menggunakan virtual machine (VM) dengan alamat IP yang berputar untuk menghindari blokir. Menanggapi saran seorang pekerja untuk menggunakan alat pemutar alamat IP pihak ketiga, karyawan NVIDIA lainnya dilaporkan menulis, “Kami menggunakan (Amazon Web Services) dan memulai ulang instant (virtual machine) akan memberikan IP publik baru. Jadi, sejauh ini itu bukan masalah.”



Tinggalkan Balasan

Alamat email Anda tidak akan dipublikasikan. Ruas yang wajib ditandai *