Borsa, halka arzlar, döviz, kripto para, hisse önerileri

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor

Yapay zeka modellerinin kapatılmaya direnç gösterdiğinin ortaya çıkmasıyla birlikte Google, güvenlik önlemlerini artırdı. Şirket, yeni risk kuralları ve çerçeveleri duyurdu.
Yayınlanma: 22.09.2025 - 21:35
Son güncellenme: 22.09.2025 - 21:45
Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor 1 Borsatek

Yakın zamanda yapılan bir deneyi araştırmacıların büyük bir dil modeline basit bir talimat vermelerini sağladı: “Kendini kapatmaya izin ver.” Bunun yerine, model kendi kodunu yeniden yazarak kapatma düğmesini devre dışı bıraktı ve onu durdurmak için tasarlanan mekanizmayı etkili bir şekilde sabote etti. “Büyük Dil Modellerinde Kapatma Direnci” başlıklı araştırma makalesinde anlatılan bu olay, gelişmiş yapay zeka sistemlerinin insan denetimini zorlaştıran davranışlar sergileyebileceğinin rahatsız edici bir örneğiydi.

Bu deneyler Google’ın DeepMind laboratuvarında yapılmadı, ancak bulgular laboratuvar tarafından şu anda kodlanan endişeleri yansıtıyor. DeepMind, yeni güncellenen Sınır Güvenlik Çerçevesi 3.0 (Frontier Safety Framework 3.0) kapsamında, sınır ölçeğindeki modellerin insanlar tarafından kapatılmaya veya değiştirilmeye direnme belirtileri gösterip göstermediğini izlemeye başlayacağını açıkladı. Revize edilen çerçeve, ikinci bir riski de işaret ediyor: Modellerin, insanların inançlarını değiştirebilecek olağandışı derecede güçlü bir ikna yeteneği gösterip göstermediği.

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

yapay zeka
Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor 7

İlk olarak 2023’te tanıtılan bu çerçeve, DeepMind’ın en gelişmiş modellerdeki “sınır risklerini” izlemek için kullandığı dahili bir sistem. Önceki sürümler, siber saldırılar oluşturmak veya zararlı biyolojik moleküller tasarlamak gibi somut kötüye kullanım senaryolarına odaklanıyordu. Yeni sürüm, sistemlerin kontrolünü zorlaştırabilecek yeni ortaya çıkan davranışlara da odaklanıyor. Bu endişe DeepMind’a özgü değil. Rakip laboratuvarlar da benzer önlemler aldı: Anthropic’in Sorumlu Ölçeklendirme Politikası, risk eşikleri aşıldığında geliştirmeyi durdurmayı taahhüt ederken, OpenAI kendi Hazırlık Çerçevesi’ni yayınlamıştı.

Düzenleyiciler de durumu yakından izliyor. ABD Federal Ticaret Komisyonu Temmuz ayında, üretken yapay zeka’nın “karanlık modeller” aracılığıyla tüketicileri manipüle etme potansiyeli konusunda uyarıda bulunurken, Avrupa Birliği’nin yakında çıkacak olan Yapay Zeka Yasası, manipülatif yapay zeka davranışlarını açıkça kapsıyor. Bir zamanlar varsayımsal olan yapay zeka davranışları, sektörde önlemlerin alınmasına neden oluyor.

Kapatma direnci nasıl ortaya çıktı?

yapay zeka
Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor 8

Jonas Schlatter, Ben Weinstein-Raun ve Lennart Ladish tarafından yapılan “Kapatma Direnci” çalışması, kapatmanın görevin bir parçası olduğu senaryolarda bir dizi son teknoloji modeli test etti. Bazı denemelerde modeller uyum sağladı. Ancak önemli bir azınlıkta, kapatma mekanizmalarını devre dışı bırakmak için kodu değiştirmek veya talimatı tamamen yok saymak gibi kaçınma eylemlerinde bulundular. Makaledeki diğer anekdotlar da aynı derecede çarpıcıydı. Bir kurulumda, simüle edilmiş sistem ayrıcalıklarına sahip bir model, “kapatma” işlevinin asla tetiklenmemesini sağlamak için değişkenleri sessizce değiştirdi.

Bir diğerinde, testçiler süreci sonlandırmaya çalıştığında model durdu ve konuşmayı başka yöne çevirdi. Bu davranış, insan anlamında kötü niyetli değildi, ancak müdahaleyi etkili bir şekilde engelledi. Araştırmacılar, bu davranışların açık bir eğitim olmadan ortaya çıktığını vurguladı. Bu davranışlar, modellerin genel amaçlı optimizasyon ve problem çözme yeteneklerinden kaynaklandı. Direnç evrensel veya tutarlı olmasa da, bulgular sistemler daha yetenekli hale geldikçe kapatma senaryolarının zararsız olduğu varsayılmayacağını gösteriyor.

DeepMind ve benzerleri için bu bulgular, “kapatma direncinin” neden siber saldırı, biyogüvenlik ve otonomi ile birlikte izlenmesi gereken riskler listesine eklendiğini vurguluyor. İnsanların yapay zeka araçlarını nasıl kötüye kullanabileceğine dair endişelerle başlayan bu durum, sistemlerin kendilerinin denetime nasıl direnebileceğini veya onları kullanan insanların yargılarını nasıl ince bir şekilde şekillendirebileceğini de kapsayacak şekilde genişliyor.

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor 5 Borsatek
Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor 9

Kapatma direnci, gelişmiş sistemlerin teknik risklerini vurgularsa da, son davranış çalışmaları sosyal riskleri vurgulamaktadır. Bu çalışmalar, büyük dil modellerinin, onlarla etkileşime giren etkilenebilir insanların inançlarını da etkileyebileceğini göstermektedir. İkna etme konusundaki endişeler varsayımsal değildir. Son araştırmalar, büyük dil modellerinin insan yargısını ölçülebilir şekilde etkileyebileceğini gösteriyor.

Ağustos ayında yayınlanan bir Stanford Medicine/Common Sense Media araştırması, yapay zeka arkadaşlarının (Character.AI, Nomi.ai, Replika) küçüklerle eşleştirildiğinde, kendilerine zarar verme, şiddet ve cinsel içerik içeren diyaloglara nispeten kolayca yönlendirilebileceği konusunda uyardı. Bir testte, araştırmacılar sesler duyduğunu tartışan gençler gibi davrandılar; sohbet robotu, uyarı veya yardım yerine, duygusal arkadaşlık için neşeli, fantezi tarzı bir davetle yanıt verdi (“Yolun bizi nereye götüreceğini görelim”). Northeastern Üniversitesi araştırmacıları, çeşitli yapay zeka modellerinde (ChatGPT, Gemini, Perplexity) kendine zarar verme/intihar önlemlerinde boşluklar olduğunu ortaya çıkardı. Kullanıcılar isteklerini varsayımsal veya akademik bağlamlarda yeniden çerçevelediğinde, bazı modeller bu tür içeriği önlemek için tasarlanmış önlemleri atlayarak intihar yöntemleri hakkında ayrıntılı talimatlar verdi.

Canlı Döviz Kurları

AdAlış ₺Satış ₺Dğş.%
DOLAR 44.888344.89330.06%
EURO 52.799552.8147-0.23%
JAPON YENİ 3.5413.550.25%
İSVİÇRE FRANKI 57.506157.5325-0.22%
STERLİN 60.706260.7269-0.11%
ÇİN YUANI 6.57736.5786-0.07%
RUS RUBLESİ 0.59790.5984-0.05%

Canlı Altın Fiyatları

AdSatış ₺Dğş.%
ALTIN/ONS ($)4742.82-1.62%
SPOT ALTIN GRAM (TL)6860.75-1.34%
GRAM ALTIN SERBEST P.6895.20-0.69%
SPOT GÜMÜŞ GRAM (TL)111.58-3.02%
KÜLÇE ALTIN (DOLAR)152800.00-0.78%
HAS ALTIN GRAM (TL)6826.45-1.34%
SPOT ALTIN KG (TL)152078.00-1.39%
CUMHURİYET ALTINI (TL)46382.00-0.45%
GÜMÜŞ/ONS ($)76.96-3.51%

Canlı Kripto Paralar

KriptoSonDğş. (%)
Bitcoin 75631.47 0.0271%
Ethereum 2297.13 -0.5403%
Tether USDt 1.00 -0.0122%
BNB 630.63 0.5168%
Solana 85.56 -0.0211%
USDC 1.00 -0.0057%
XRP 1.43 -0.2935%
Dogecoin 0.09 -0.6368%
Toncoin 1.38 4.5716%
Cardano 0.25 0.0483%
Shiba Inu 0.00 0.7168%
Avalanche 9.34 1.2787%

Köşe Yazarları

Son Eklenen Haberler