Anthropic, Yapay Zeka Araştırmacılarını ‘Sabote Edecek’ Politikasından Vazgeçti
WIRED'a açıklama yapan Anthropic, araştırmacıların, Claude’un rakip yapay zeka modelleri geliştirme yeteneğini gizlice kısıtlayacak olan bu politikaya karşı çıkmasının ardından yön değiştirdi.
Görsel: demelzaandreoli/gettyimages (Wired ekibi tarafından düzenlenmiştir)
Anthropic, rakiplerinin yeni yapay zeka modeli Claude Fable 5’i kullanarak başka yapay zeka modelleri geliştirmesini gizlice kısıtlayacak olan bir politikadan geri adım atıyor. Şirket, bu hamlesinin AI araştırma camiasından büyük tepki görmesi üzerine rotasını değiştirdi.
Anthropic, WIRED'e yaptığı açıklamada, “Fable 5'in öncü LLM geliştirme için uyguladığı güvenlik önlemlerini, daha görünür hale getirmek üzere değiştiriyoruz,” dedi. “Yanlış bir tercih yaptık ve dengeyi doğru kuramadığımız için özür dileriz.”
Anthropic, kötüye kullanımı önlemek için ek güvenlik önlemleri içeren en yeni AI modelinin bir versiyonu olan Claude Fable 5'i bu hafta başında piyasaya sürdü. Anthropic'in belirlediği bazı güvenlik önlemleri şaşırtıcı değildi: Şirket, siber güvenlik, biyoloji veya kimya hakkında soru soran kullanıcıları, gelişmiş AI'yı siber saldırı gerçekleştirmek veya biyolojik silah geliştirmek için kullanma olasılığını azaltmak amacıyla daha az yetenekli bir AI modeline yönlendireceğini açıkladı.
Ancak, Claude Fable 5'i öncü AI geliştirme için kullanmaya çalışan araştırmacılar için Anthropic farklı bir yaklaşım ortaya koydu. Şirket, kullanıcının göremeyeceği şekillerde modelin performansını kasıtlı olarak düşürecekti. Bu hamle, Claude'u rakip AI modellerini eğitmek için kullanmaya çalışan araştırmacıları fiilen sabote edecekti; ki Anthropic bunu hizmet şartlarında açıkça engelliyor.
Anthropic şimdi rotasını değiştirdiğini ve Claude Fable 5'in yapay zeka geliştirmeye yönelik güvenlik önlemlerinin kullanıcılar tarafından görülebileceğini söylüyor. Şirket, bir kullanıcının Claude'u yüksek kapasiteli bir yapay zeka geliştirmek için kullanmaya çalıştığından şüphelenirse, talebi reddettiğini veya kullanıcıyı daha düşük kapasiteli bir modele yönlendirdiğini bildirecek.
Anthropic, yapay zeka araştırma topluluğundan şiddetli tepki aldıktan sonra politikasını geri çekti. Anthropic, rakiplerin Claude'u kapalı ve açık kaynaklı yapay zeka modelleri oluşturmak için kullanmasını sınırlamak için zaten adımlar atmıştı, ancak eleştirmenler, belirli kullanıcılar için modelin performansını sessizce düşürmenin bir adım fazla ileri gittiğini söylüyor. Claude'un kodlama ajanı, açık kaynaklı yapay zeka araştırma projelerinde çalışanlar da dahil olmak üzere geliştiriciler arasında tercih edilen bir araç haline geldi ve araştırmacılar WIRED'e, şirketin son politikasının, yalnızca bir avuç önde gelen yapay zeka laboratuvarının gelişmiş yapay zeka araştırmaları yapabileceği endişe verici bir geleceğe yol açabileceğini söylüyor.
Amerikan İnovasyon Vakfı'nda kıdemli araştırmacı ve Beyaz Saray'ın eski AI danışmanı olan Dean Ball, X'te yaptığı bir paylaşımda, “kullanıcıya haber vermeden makine öğrenimi araştırmalarında performansı düşürmek şok edici derecede düşmanca ve çok kötü bir izlenim bırakıyor” diye yazdı. Ball, başka bir paylaşımda, bu “gizli sabotaj” politikasının Anthropic'in genel duruşunu zedelediğini, çünkü AI araştırmacılarının AI güvenliği konusunda işbirliği yapmasını engellediğini belirtti.
“Anthropic, kamuoyuna ‘AI araştırması yapması için başka kimseye güvenmiyoruz. AI araştırması yapması gereken tek taraf biziz’ diyor gibi geldi,” diyor açık kaynaklı AI girişimi Prime Intellect'in araştırma lideri Will Brown. “Sanki arkalarından merdiveni çekmeye başlıyorlarmış gibi geliyor.”
Brown, şirketin güvenlik önlemleri devreye girdiğinde geliştiricileri uyarmayacağı için, bu politikanın geliştiricileri Anthropic'in kurallarını ihlal edip etmedikleri konusunda karanlıkta bırakacağını söyledi. Kısıtlamaların geniş kapsamlı sonuçları olabileceğini de ekledi. Örneğin, öncü modellerin güvenlik, performans ve güvenilirlik açısından testlerini yapan üçüncü taraf değerlendirme firmalarının büyüyen ekosistemine işaret etti; Anthropic modelini gizlice bozmuş olsaydı bu çalışmalar engellenebilirdi.
Anthropic, Claude'un AI araştırmalarını hızlandırmada giderek daha etkili hale geldiği için bu önlemleri uyguladığını söyledi. Şirket, yakın zamanda yayınladığı bir blog yazısında, AI'nın yeteneklerini toplumun bunlara uyum sağlayabileceğinden daha hızlı geliştirebileceğinden endişe duyduğunu belirtti. Anthropic, “toplumsal yapıların ve uyum araştırmalarının ayak uydurabilmesi için öncü AI geliştirmesini yavaşlatma veya geçici olarak durdurma seçeneğine sahip olmanın dünya için iyi olacağını” savundu.
“Bu güvenlik önlemleri, yabancı düşmanların en yetenekli modellerimizi ciddi güvenlik riskleri oluşturan şekillerde kullanmasını engelliyor. ABD ve müttefikleri, öncü çipler ve bunları tam potansiyeliyle çalıştıran yüksek düzeyde optimize edilmiş yazılımlar konusunda bir avantaja sahip,” dedi şirket WIRED'e yaptığı açıklamada. "Bu güvenlik önlemleri, Claude'un bu avantajı zedelemek için kullanılmamasını sağlıyor (örneğin, bu rakipler tarafından geliştirilen çipleri optimize ederek…) Bunları görünür mü yoksa görünmez mi yapacağımıza karar verirken bir seçimle karşı karşıya kaldık. Gizli bir güvenlik önlemi, araştırılması ve aşılması daha zordur. Bu, güvenlik önlemlerinin çok daha dar bir şekilde hedeflenebileceği anlamına gelir.”
Anthropic, AI geliştirmeyle ilgili bu güvenlik önleminin artık görünür olduğu için daha geniş bir ağ oluşturması gerektiğini, yani daha zararsız isteklerin bile güvenlik önlemlerini tetikleyebileceğini söylüyor. Şirket, sınıflandırıcılarını mümkün olduğunca çabuk daha hassas hale getirmek için çalıştığını belirtiyor.
'Bu haber ilk olarak WIRED tarafından yayınlanmış olup Mahmut Karslıoğlu tarafından İngilizceden çevrilmiştir'
WIRED dergisinde yapay zeka sektörünü takip eden kıdemli bir yazardır. Daha önce TechCrunch’ta kıdemli muhabir olarak görev yapmış ve yapay zeka patlamasına öncülük eden girişimler ve liderler hakkında haberler yapmıştır. Bundan önce Zeff, Gizmodo’da yapay zeka politikaları ve içerik denetimi konularını ele almış ve stajyer olarak Bloomberg’de Silikon Vadisi Bankası kriziyle ilgili ilk haberlerden bazılarını kaleme almıştır. San Francisco’da yaşamaktadır.