Gegara melatih model artificial intelligence (AI) atau kecerdasan buatan dengan teks yang ditranskripsi dari video YouTube, OpenAI dan Google berpotensi melanggar hak cipta.
The New York Times (NYT), melaporkan, di mana mereka menjelaskan sejauh mana OpenAI, Google, dan Meta, telah berupaya memaksimalkan jumlah data yang dapat mereka berikan ke produk AI yang dibuatnya.
Menurut NYT, OpenAI menggunakan alat pengenalan ucapan Whisper untuk menyalin lebih dari satu juta jam video YouTube, yang kemudian digunakan untuk melatih GPT-4.
Informasi sebelumnya melaporkan bahwa OpenAI telah menggunakan video dan podcast YouTube untuk melatih kedua sistem AI tersebut.
Dilaporkan, di antara orang-orang di tim ini, salah satunya adalah Presiden OpenAI Greg Brockman.
"Sesuai aturan Google, pengambilan atau pengunduhan konten YouTube tanpa izin tidak diperbolehkan," kata Juru Bicara Google kepada NYT, Matt Bryant.
Bryant mengatakan, perusahaan tidak mengetahui adanya penggunaan semacam itu oleh OpenAI.
Laporan tersebut datang hanya beberapa hari setelah CEO YouTube Neal Mohan mengatakan dalam sebuah wawancara dengan Bloomberg Originals bahwa dugaan penggunaan video YouTube oleh OpenAI untuk melatih generator teks-ke-video barunya, Sora, akan melanggar kebijakan platform.
Laporan NYT juga mengklaim Google meminta tim untuk mengubah kebijakan privasinya pada Juni 2023 agar mencakup penggunaan konten yang tersedia untuk umum secara lebih luas, termasuk Google Dokumen dan Google Spreadsheet, untuk melatih model dan produk AI-nya.
Perubahan tersebut, yang menurut Google dilakukan demi kejelasan, dipublikasikan pada bulan Juli.
Bryant kepada NYT mengatakan, jenis data ini hanya digunakan dengan izin dari pengguna yang ikut serta dalam pengujian fitur eksperimental Google. []
© Copyright 2024, All Rights Reserved