Pengacara The New York Times dan Daily News, yang menggugat OpenAI karena diduga menghapus karya mereka untuk melatih model AI-nya tanpa izin, mengatakan bahwa para insinyur OpenAI secara tidak sengaja menghapus data yang mungkin relevan dengan kasus tersebut.
Awal musim gugur ini, OpenAI setuju untuk menyediakan dua mesin virtual sehingga penasihat The Times dan Daily News dapat melakukan penelusuran konten berhak cipta dalam kumpulan data pelatihannya. Dalam sebuah surat, pengacara penerbit mengatakan bahwa mereka dan para ahli telah menghabiskan lebih dari 150 jam sejak 1 November untuk mencari data pelatihan OpenAI.
Namun pada tanggal 14 November, para insinyur OpenAI menghapus semua data pencarian penerbit yang disimpan di salah satu mesin virtual, menurut surat yang disebutkan di atas, yang diajukan ke Pengadilan Distrik AS untuk Distrik Selatan New York pada Kamis malam.
OpenAI mencoba memulihkan data — dan cukup berhasil. Namun, karena struktur folder dan nama file “tidak dapat diambil kembali” hilang, data yang dipulihkan “tidak dapat digunakan untuk menentukan di mana artikel yang disalin oleh penggugat berita digunakan untuk membuat [OpenAI’s] model, ”sesuai surat itu.
“Penggugat berita telah dipaksa untuk membuat ulang karya mereka dari awal dengan menggunakan waktu kerja dan waktu pemrosesan komputer yang signifikan,” tulis pengacara The Times dan Daily News. “Penggugat berita baru mengetahui kemarin bahwa data yang dipulihkan tidak dapat digunakan dan bahwa data tersebut bernilai satu minggu penuh…