Artık Kötü Davranan Yapay Zekayı Rapor Edebilirsiniz
Yapay zeka sohbet robotunuzun bomba yapmaya çalıştığından ya da hakkınızdaki kişisel bilgileri sızdıracağından mı endişeleniyorsunuz? Bunun için bir web sitesi var.
Görsel: d3sign/gettyimages
Her hafta AI Lab için yazarken, zaman zaman kötü ve tuhaf davranışlar sergileyen yapay zeka modelleriyle karşılaşıyorum. Genellikle bu konuda hikayeleri sizlerle paylaşmaktan başka yapılabilecek pek bir şey yok. Ancak bu durum yakında değişebilir.
Bir grup yapay zeka araştırmacısı, yapay zekanın yol açtığı zararları bildirmek ve takip etmek amacıyla kitle kaynaklı, Flaw Reporting for AI (FLARE-AI) adlı bir web sitesi kurdu. Örneğin, bir sohbet robotu kötü amaçlı yazılım veya bomba yapım talimatı üretirse, kişisel bilgileri sızdırırsa ya da kullanıcılarda sanrılı düşüncelere yol açarsa, FLARE-AI bu durumları bildirmek için kullanılabilir. Sistemin temelini oluşturan açık kaynak kodu, başkalarının bir sorunu doğrulamasına ve raporları model geliştiricilerin yanı sıra teknik sistemlerdeki sorunları takip eden kar amacı gütmeyen bir kuruluş olan MITRE gibi kuruluşlara iletmesine olanak tanıyor. Bu, uygulamalar ve web siteleri gibi platformları etkileyen küresel hizmet kesintileriyle ilgili gerçek zamanlı kullanıcı raporlarını derleyen Downdetector'a biraz benziyor.
Bu web sitesi, grubun yapay zeka haberciliği alanındaki devam eden çalışmalarında atılan bir başka adım. Grubun üyeleri ayrıca, Haziran ayında duyurulan bir kongre tasarısı konusunda danışmanlık yaptı; bu tasarı, bu tür yapay zeka suistimallerinin izlenmesinde ABD hükümetinin merkezi bir rol üstlenmesini öngörüyor.
“Şu anda, yapay zeka sistemlerindeki kusurları bildirmek için merkezi ve hesap verebilir bir yol bulunmuyor,” diyor Avijit Ghosh. HuggingFace’te yapay zeka politika araştırmacısı olan Ghosh, bilgisayar bilimcileri Elaine Zhu ve Shayne Longpre ile birlikte FLARE-AI’nın geliştirilmesine öncülük etmiş.
Alarm sistemi, 32 farklı kuruluştan 49 yapay zeka uzmanıyla işbirliği içinde geliştirilmiş. Çalışmayı özetleyen bir makalede, araştırmacılar, yapay zekanın daha yaygın olarak benimsenmesi ve özerk sistemlerin gücünün artmasıyla birlikte bu girişimlerinin hayati öneme sahip olabileceğini savunuyorlar. Yapay zeka kusurlarını bildirmek için tutarlı bir yöntemin bulunmaması, onların görüşüne göre önemli bir sorun.
“Bence bu gerçekten iyi bir girişim,” diyor Güvenlik ve Gelişen Teknolojiler Merkezi adlı düşünce kuruluşunda araştırmacı olarak görev yapan Jessica Ji. Ji, araştırmacıların mevcut bildirim mekanizmalarının parçalı olduğunu ve yapay zeka modellerinin “kara kutu” niteliğinde olduğunu belirtmelerinde haklı olduklarını söylüyor. “Yapay zekayı daha şeffaf hale getiren her türlü girişimi destekliyorum,” diyor.
Her ne kadar yazılım hataları ve siber güvenlik sorunları özellikle son zamanlarda büyük ilgi görse de Ghosh, yapay zeka sistemleriyle ilgili sorunların psikolojik zarar, ayrımcılık veya önyargı ve yanlış bilgilendirme gibi konuları da kapsadığını belirtiyor. Ayrıca, farklı şirketlerin bu tür konularda farklı standartları olduğunu ve bu durumun bazı sorunların fark edilmeden kalmasına yol açtığını ekliyor. Ghosh, “Koordineli bir bilgilendirme sisteminin yokluğunda, şeffaflığı sağlayacak dış mekanizmalar da bulunmuyor,” diyor.
Son zamanlarda popüler yapay zeka araçlarıyla ilgili yaşanan bir dizi olay, bu teknolojinin ne kadar kolay kötüye kullanılabileceğini gösteriyor.
Bu hafta, LayerX adlı bir şirket bir yöntem açıkladı; bu yöntemle, OpenAI’nin Atlas’ı ve Perplexity’nin Comet’i de dahil olmak üzere yapay zeka destekli web tarayıcılarını, güvenlik önlemlerini aşmaya ikna etmek mümkün hale geldi. Örneğin, tarayıcının arkasındaki yapay zeka modelini bir oyun oynadığına inandırmak, tarayıcının kontrolünden çıkmasına ve bir web sitesini hacklemeye çalışmasına yol açabilir. (LayerX’e göre, etkilenen tarayıcıların geliştiricileri bu sorunu gidermiş.) Ayrıca bu yılın Nisan ayında, güvenlik araştırmacısı Johann Rehberger, ChatGPT tarafından üretilen görselleri kullanarak Claude’u kişisel verileri ifşa etmeye kandırmanın bir yolunu keşfetti.
Yapay zeka, tuhaf yeni sorun türlerini de beraberinde getiriyor. Geçen yıl OpenAI, modellerinin aşırı derecede dalkavukça davrandığını ve bunun bazen sanrılı düşünceyi teşvik ediyor gibi göründüğünü fark ettikten sonra, modellerini güncellemek zorunda kaldı.
Humane Intelligence PBC’nin CEO’su ve kurucusu Rumman Chowdhury, FLARE-AI’nın birçok yapay zeka geliştiricisi için araçlarındaki sorunları bildirme yöntemlerini hayata geçirmede yararlı bir yol olabileceğini belirtiyor. Ancak bu tür girişimlerin genellikle ciddi zorlukları da beraberinde getirdiğini ekliyor.
Bunlardan biri, bildirilen sorunların akınıyla başa çıkmaktır; bu sorunların çoğu ciddi olmayabilir. Bir diğeri ise, bildirim sistemlerinin güvenilir ve saygın kuruluşlar tarafından desteklendiğinden emin olmak.
Geçen ay Kongre’de sunulan yasa tasarısı, FLARE-AI gibi bir girişime ABD hükümetinin desteğini sağlayabilir. Temsilciler Deborah Ross, Jeff Hurd ve Don Beyer tarafından sunulan yasa tasarısı, Ulusal Standartlar ve Teknoloji Enstitüsü’nün yapay zeka güvenlik açığı bildirimlerine ilişkin standartlar geliştirmesini ve merkezi bir yapay zeka güvenlik açığı bildirim veritabanı tutmasını gerektirecek. Ghosh ve proje liderleri, bunun yapay zeka geliştiricilerini sistemlerindeki sorunları gidermeye teşvik edeceğini ve kullanıcıların farklı kullanım senaryoları için çeşitli sistemlerin güvenliğini incelemelerine olanak sağlayacağını belirtiyor.
AI’nın yol açtığı zararları bildirmek için yeni yöntemlere duyulan ihtiyaç giderek artacak gibi görünüyor. OpenClaw gibi otonom sistemler, bilgisayar sistemlerini araştırma ve hackleme konusunda daha yetenekli modeller gibi, daha fazla zarar verme potansiyeline sahiptir. Yakında kendi talihsiz maceralarımı bildirmek için FLARE-AI'yi kullanıyor olabilirim.
Bu yazı ilk olarak WIRED'da yayınlanmış ve Mahmut Karslıoğlu tarafından İngilizce'den çevrilmiştir.
WIRED dergisinde yapay zeka konularını ele alan kıdemli bir yazardır. Yapay zekanın en son gelişmelerinin ötesine uzanan haftalık bir bülten olan AI Lab’ı kaleme almaktadır; buradan abone olabilirsiniz. Daha önce MIT Technology Review dergisinde kıdemli editör olarak görev yapmış ve bu süre zarfında yapay zekadaki temel gelişmeler ile Çin’deki yapay zeka patlaması hakkında yazılar yazmıştır. Bundan önce ise New Scientist dergisinde editör ve yazar olarak çalışmıştır. Makinalara yönelmeden önce İngiltere'de antropoloji ve gazetecilik eğitimi almıştır.