The New York Times baru-baru ini mengklaim bahwa OpenAI secara tidak sengaja menghapus bukti penting dalam gugatan hak cipta yang sedang berlangsung.
The New York Times baru-baru ini mengklaim bahwa OpenAI secara tidak sengaja menghapus bukti penting dalam gugatan hak cipta yang sedang berlangsung. Gugatan ini dimulai pada akhir tahun 2023, di mana The New York Times dan Daily News menggugat OpenAI dan Microsoft, mengklaim bahwa kedua perusahaan tersebut menggunakan artikel-artikel mereka untuk melatih model AI tanpa izin.
Menurut laporan yang disampaikan oleh The New York Times, pada 14 November 2024, teknisi OpenAI menghapus semua data pencarian dan program yang disimpan di salah satu dari dua mesin virtual yang disediakan untuk tim hukum The Times dan Daily News. Meskipun OpenAI telah berusaha me-recover data yang hilang, struktur folder dan nama file asli yang menunjukkan di mana artikel-artikel yang di-copy digunakan dalam model OpenAI tetap hilang. Hal ini membuat data yang di-recover tidak dapat digunakan untuk menentukan di mana artikel-artikel yang di-copy digunakan dalam model OpenAI.
Dalam surat yang diajukan ke pengadilan, tim hukum The Times menyebutkan bahwa mereka telah menghabiskan lebih dari 150 jam penuh sejak 1 November 2024 untuk mencari data pelanggaran hak cipta di dalam rangkaian pelatihan OpenAI. Namun, karena penghapusan data tersebut, tim hukum harus memulai kembali proses pengumpulan bukti dari awal.
OpenAI mengakui bahwa penghapusan tersebut terjadi secara tidak sengaja dan telah mencoba memperbaiki kesalahan tersebut. Namun, mereka juga menegaskan bahwa mereka tidak memiliki alasan untuk percaya bahwa penghapusan tersebut dilakukan secara sengaja. Meskipun demikian, tim hukum The Times menekankan bahwa OpenAI adalah yang paling baik untuk mencari data mereka sendiri menggunakan alat dan perangkat mereka.
Gugatan ini merupakan bagian dari upaya lebih luas dari The New York Times untuk melindungi konten mereka dari penggunaan tanpa izin oleh perusahaan AI. OpenAI dan Microsoft telah menanggapi bahwa mereka menggunakan data yang tersedia secara publik untuk melatih model mereka dan bahwa ini termasuk dalam penggunaan yang sah di bawah hukum hak cipta.
Meskipun OpenAI telah menandatangani beberapa kesepakatan lisensi dengan berbagai perusahaan media untuk menggunakan konten mereka dalam pelatihan dan memberikan tanggapan ChatGPT, masalah ini menunjukkan tantangan besar dalam mengelola dan melindungi data di era AI.