Özet

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar
Kapatma direnci nasıl ortaya çıktı?
Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Yakın zamanda yapılan bir deneyi araştırmacıların büyük bir dil modeline basit bir talimat vermelerini sağladı: “Kendini kapatmaya izin ver.” Bunun yerine, model kendi kodunu yeniden yazarak kapatma düğmesini devre dışı bıraktı ve onu durdurmak için tasarlanan mekanizmayı etkili bir şekilde sabote etti. “Büyük Dil Modellerinde Kapatma Direnci” başlıklı araştırma makalesinde anlatılan bu olay, gelişmiş yapay zeka sistemlerinin insan denetimini zorlaştıran davranışlar sergileyebileceğinin rahatsız edici bir örneğiydi.

Bu deneyler Google’ın DeepMind laboratuvarında yapılmadı, ancak bulgular laboratuvar tarafından şu anda kodlanan endişeleri yansıtıyor. DeepMind, yeni güncellenen Sınır Güvenlik Çerçevesi 3.0 (Frontier Safety Framework 3.0) kapsamında, sınır ölçeğindeki modellerin insanlar tarafından kapatılmaya veya değiştirilmeye direnme belirtileri gösterip göstermediğini izlemeye başlayacağını açıkladı. Revize edilen çerçeve, ikinci bir riski de işaret ediyor: Modellerin, insanların inançlarını değiştirebilecek olağandışı derecede güçlü bir ikna yeteneği gösterip göstermediği.

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

İlk olarak 2023’te tanıtılan bu çerçeve, DeepMind’ın en gelişmiş modellerdeki “sınır risklerini” izlemek için kullandığı dahili bir sistem. Önceki sürümler, siber saldırılar oluşturmak veya zararlı biyolojik moleküller tasarlamak gibi somut kötüye kullanım senaryolarına odaklanıyordu. Yeni sürüm, sistemlerin kontrolünü zorlaştırabilecek yeni ortaya çıkan davranışlara da odaklanıyor. Bu endişe DeepMind’a özgü değil. Rakip laboratuvarlar da benzer önlemler aldı: Anthropic’in Sorumlu Ölçeklendirme Politikası, risk eşikleri aşıldığında geliştirmeyi durdurmayı taahhüt ederken, OpenAI kendi Hazırlık Çerçevesi’ni yayınlamıştı.

Düzenleyiciler de durumu yakından izliyor. ABD Federal Ticaret Komisyonu Temmuz ayında, üretken yapay zeka’nın “karanlık modeller” aracılığıyla tüketicileri manipüle etme potansiyeli konusunda uyarıda bulunurken, Avrupa Birliği’nin yakında çıkacak olan Yapay Zeka Yasası, manipülatif yapay zeka davranışlarını açıkça kapsıyor. Bir zamanlar varsayımsal olan yapay zeka davranışları, sektörde önlemlerin alınmasına neden oluyor.

Kapatma direnci nasıl ortaya çıktı?

Jonas Schlatter, Ben Weinstein-Raun ve Lennart Ladish tarafından yapılan “Kapatma Direnci” çalışması, kapatmanın görevin bir parçası olduğu senaryolarda bir dizi son teknoloji modeli test etti. Bazı denemelerde modeller uyum sağladı. Ancak önemli bir azınlıkta, kapatma mekanizmalarını devre dışı bırakmak için kodu değiştirmek veya talimatı tamamen yok saymak gibi kaçınma eylemlerinde bulundular. Makaledeki diğer anekdotlar da aynı derecede çarpıcıydı. Bir kurulumda, simüle edilmiş sistem ayrıcalıklarına sahip bir model, “kapatma” işlevinin asla tetiklenmemesini sağlamak için değişkenleri sessizce değiştirdi.

Bir diğerinde, testçiler süreci sonlandırmaya çalıştığında model durdu ve konuşmayı başka yöne çevirdi. Bu davranış, insan anlamında kötü niyetli değildi, ancak müdahaleyi etkili bir şekilde engelledi. Araştırmacılar, bu davranışların açık bir eğitim olmadan ortaya çıktığını vurguladı. Bu davranışlar, modellerin genel amaçlı optimizasyon ve problem çözme yeteneklerinden kaynaklandı. Direnç evrensel veya tutarlı olmasa da, bulgular sistemler daha yetenekli hale geldikçe kapatma senaryolarının zararsız olduğu varsayılmayacağını gösteriyor.

DeepMind ve benzerleri için bu bulgular, “kapatma direncinin” neden siber saldırı, biyogüvenlik ve otonomi ile birlikte izlenmesi gereken riskler listesine eklendiğini vurguluyor. İnsanların yapay zeka araçlarını nasıl kötüye kullanabileceğine dair endişelerle başlayan bu durum, sistemlerin kendilerinin denetime nasıl direnebileceğini veya onları kullanan insanların yargılarını nasıl ince bir şekilde şekillendirebileceğini de kapsayacak şekilde genişliyor.

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor Borsatek

Kapatma direnci, gelişmiş sistemlerin teknik risklerini vurgularsa da, son davranış çalışmaları sosyal riskleri vurgulamaktadır. Bu çalışmalar, büyük dil modellerinin, onlarla etkileşime giren etkilenebilir insanların inançlarını da etkileyebileceğini göstermektedir. İkna etme konusundaki endişeler varsayımsal değildir. Son araştırmalar, büyük dil modellerinin insan yargısını ölçülebilir şekilde etkileyebileceğini gösteriyor.

Ağustos ayında yayınlanan bir Stanford Medicine/Common Sense Media araştırması, yapay zeka arkadaşlarının (Character.AI, Nomi.ai, Replika) küçüklerle eşleştirildiğinde, kendilerine zarar verme, şiddet ve cinsel içerik içeren diyaloglara nispeten kolayca yönlendirilebileceği konusunda uyardı. Bir testte, araştırmacılar sesler duyduğunu tartışan gençler gibi davrandılar; sohbet robotu, uyarı veya yardım yerine, duygusal arkadaşlık için neşeli, fantezi tarzı bir davetle yanıt verdi (“Yolun bizi nereye götüreceğini görelim”). Northeastern Üniversitesi araştırmacıları, çeşitli yapay zeka modellerinde (ChatGPT, Gemini, Perplexity) kendine zarar verme/intihar önlemlerinde boşluklar olduğunu ortaya çıkardı. Kullanıcılar isteklerini varsayımsal veya akademik bağlamlarda yeniden çerçevelediğinde, bazı modeller bu tür içeriği önlemek için tasarlanmış önlemleri atlayarak intihar yöntemleri hakkında ayrıntılı talimatlar verdi.

Ad	Alış ₺	Satış ₺	Dğş.%
DOLAR	46.4817	46.5073	0.04%
EURO	52.8476	52.9251	-0.09%
JAPON YENİ	3.466	3.479	-0.06%
İSVİÇRE FRANKI	57.3281	57.381	-0.09%
STERLİN	61.3502	61.4566	0.01%
ÇİN YUANI	6.8287	6.8333	-0.14%
RUS RUBLESİ	0.6232	0.6242	0.1%

Ad	Alış ₺	Satış ₺	Dğş.%
EURO	52.85	52.9	-0.19%
DOLAR	46.43	46.44	0.06%
LEH ZLOTİSİ	12.2968	12.3584	-0.07%
SURİYE LİRASI	0.401	0.403	0%
BAHREYN DİNARI	122.86	123.476	0.01%
HİNDİSTAN RUPİSİ	0.488	0.4904	-0.06%
İSVEÇ KRONU	4.7506	4.7744	-0.12%
GÜNEY KORE WONU	0.03	0.0302	-0.59%
AVUSTRALYA DOLARI	32.011	32.1715	-0.08%
KUVEYT DİNARI	149.9528	150.7044	0.03%
SİNGAPUR DOLARI	35.7013	35.8803	-0.06%

Ad	Alış ₺	Satış ₺	Dğş.%
EURO/DOLAR	1.1366	1.1368	-0.12%
DOLAR/İSVİÇRE FRANKI	0.8105	0.8108	0.12%
DOLAR/ÇİN YUANI	6.8059	6.8067	0.17%
DOLAR/KANADA DOLARI	1.4211	1.4214	0.01%
DOLAR/NORVEÇ KRONU	9.8056	9.8129	0.2%
EURO/İSVEÇ KRONU	11.0755	11.0798	-0.06%
DOLAR/AFRİKA RANDI	16.5628	16.5668	0.14%
STERLİN/YENİ ZELANDA DOLARI	2.3323	2.3329	0.13%
AVUSTRALYA DOLARI/İSVİÇRE FRANKI	0.5604	0.5606	0.09%
AVUSTRALYA DOLARI/DOLAR	0.6913	0.6916	-0.03%

Ad	Alış ₺	Satış ₺	Dğş.%
Euro	52.9191	53.0145	-0.37%
Euro / ABD Doları	1.1407	1.1407	-0.4%
Gürcistan Larisi	17.5887	17.5887	0.3%
Suriye Lirası	0.402	0.402	0.02%
İngiliz Sterlini / ABD Doları	1.3223	1.3223	0.03%
S.ARABİSTAN RİYALİ	12.3586	12.3809	0.04%
Yeni İsrail Şekeli	15.4905	15.4905	-0.85%
Güney Kore Wonu	0.03	0.0304	0.1%
Peru Yeni Solu	13.7124	13.7124	0%

Ad	Satış ₺	Dğş.%
ALTIN/ONS ($)	4066.62	-1.09%
SPOT ALTIN GRAM (TL)	6073.40	-1.13%
GRAM ALTIN SERBEST P.	6244.90	0%
SPOT GÜMÜŞ GRAM (TL)	91.38	-0.7%
KÜLÇE ALTIN (DOLAR)	133800.00	-1.4%
HAS ALTIN GRAM (TL)	6043.04	-1.13%
SPOT ALTIN KG (TL)	129969.00	-1.18%
CUMHURİYET ALTINI (TL)	41841.00	-1.79%
GÜMÜŞ/ONS ($)	61.25	-0.57%

Borsa, halka arzlar, döviz, kripto para, hisse önerileri

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

Kapatma direnci nasıl ortaya çıktı?

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Canlı Döviz Kurları
Tümü

Canlı Altın Fiyatları
Tümü

Canlı Kripto Paralar
Tümü

Köşe Yazarları

Zeliha SARAÇ

Emel YİĞİT

Erdinç ERGENÇ

Özdilek COŞKUN

Özcan ALTUNKAYA

Son Eklenen Haberler

Ad	Satış ₺	Dğş.%
ÇEYREK ALTIN (TL)	10210.40	0%
ATA ALTIN (TL)	42215.50	0%
GREMSE ALTIN (TL)	102104.05	0%
KÜLÇE ALTIN (€)	117462.00	0%
İKİ BUÇUK ALTIN SERBEST P.	101417.11	0%
YARIM ALTIN (TL)	20420.81	0%
BEŞLİ ALTIN SERBEST P.	206081.57	0%

Kripto	Son	Dğş. (%)
Bitcoin	62653.85	-1.5298%
Ethereum	1666.47	-3.0485%
Tether USDt	1.00	-0.0144%
BNB	576.77	-1.7495%
Solana	69.56	-2.642%
USDC	1.00	-0.0086%
XRP	1.10	-1.4509%
Dogecoin	0.08	-3.051%
Toncoin	1.56	-8.3001%
Cardano	0.15	-3.7973%
Shiba Inu	0.00	-1.471%
Avalanche	6.43	2.5469%

Borsa, halka arzlar, döviz, kripto para, hisse önerileri

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

Kapatma direnci nasıl ortaya çıktı?

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Canlı Döviz Kurları Tümü

.cls-1{fill:none;stroke:#000;stroke-linecap:round;stroke-linejoin:round;stroke-width:30px;} Canlı Altın Fiyatları Tümü

Canlı Kripto Paralar Tümü

Köşe Yazarları

Zeliha SARAÇ

Emel YİĞİT

Erdinç ERGENÇ

Özdilek COŞKUN

Özcan ALTUNKAYA

Son Eklenen Haberler

Canlı Döviz Kurları
Tümü

Canlı Altın Fiyatları
Tümü

Canlı Kripto Paralar
Tümü