Grup, firmaların büyük lisan modellerini müsaade almadan yayınladıkları eserler de dahil olmak üzere telif hakkıyla korunan malzemeler üzerinde eğittiklerini tez ediyor.
Şikayetler, ChatGPT ve LLaMA’yı eğitmek için kullanıldığı argüman edilen OpenAI ve Meta data kümeleri etrafında toplanıyor. OpenAI kelam konusu olduğunda, “Books1” data kümesi yaklaşık olarak, güzel bilinen bir telif hakkı içermeyen kitap deposu olan Project Gutenberg’in boyutuna uygun olsa da, davacıların avukatları, “Books2” data kümelerinin Library Genesis ve Sci-Hub üzere yasa dışı olarak temin edilebilen telif hakkıyla korunan malzemelerin kelamda “gölge kitaplıkları” üzere öbür rastgele bir yerden elde edilemeyecek kadar büyük olduğunu argüman ediyor.
OpenAI ve Meta’nın başı bir sefer daha belada!
Gündelik korsanlar bu gereçlere direkt indirmeler yoluyla erişebiliyor fakat büyük lisan modelleri oluşturanlar için tahminen daha faydalı bir formda, birçok gölge kitaplığı ayrıyeten yazılı gereci toplu torrent paketlerinde kullanıma sunuyor. Silverman’ın davasından bir argüman, komedyenin avukatları ile ChatGPT ortasındaki bir değiş tokuşu da içeriyor. Silverman’ın hukuk grubu, sohbet robotundan 2010 yılında yayınladığı bir anı kitabı olan The Bedwetter’ı özetlemesini istemişti.
Silverman, Golden ve Kadrey, telif hakkı ihlali nedeniyle OpenAI’ye dava açan birinci müellifler değil. Aslında firma, ChatGPT eğitiminin nasıl gittiği konusunda bir dizi yasal zorlukla karşı karşıya. Sırf Haziran ayında şirkete iki başka şikayet bildirim edildi. Bunlardan biri, OpenAI’nin ChatGPT ve DALL-E’nin ardındaki büyük lisan modellerini eğitmek için bilgileri toplayarak federal ve eyalet zımnilik maddelerini ihlal ettiğini sav eden kapsamlı bir toplu dava.