Özet

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar
Kapatma direnci nasıl ortaya çıktı?
Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Yakın zamanda yapılan bir deneyi araştırmacıların büyük bir dil modeline basit bir talimat vermelerini sağladı: “Kendini kapatmaya izin ver.” Bunun yerine, model kendi kodunu yeniden yazarak kapatma düğmesini devre dışı bıraktı ve onu durdurmak için tasarlanan mekanizmayı etkili bir şekilde sabote etti.

BORSATEK.COM'u öncelikli haber kaynağınız olarak ekleyin

Borsa, döviz, altın, kripto ve piyasa haberlerinde en güncel ve güvenilir kaynağa an be an ulaşın.

+ Ekle

“Büyük Dil Modellerinde Kapatma Direnci” başlıklı araştırma makalesinde anlatılan bu olay, gelişmiş yapay zeka sistemlerinin insan denetimini zorlaştıran davranışlar sergileyebileceğinin rahatsız edici bir örneğiydi.

Bu deneyler Google’ın DeepMind laboratuvarında yapılmadı, ancak bulgular laboratuvar tarafından şu anda kodlanan endişeleri yansıtıyor. DeepMind, yeni güncellenen Sınır Güvenlik Çerçevesi 3.0 (Frontier Safety Framework 3.0) kapsamında, sınır ölçeğindeki modellerin insanlar tarafından kapatılmaya veya değiştirilmeye direnme belirtileri gösterip göstermediğini izlemeye başlayacağını açıkladı. Revize edilen çerçeve, ikinci bir riski de işaret ediyor: Modellerin, insanların inançlarını değiştirebilecek olağandışı derecede güçlü bir ikna yeteneği gösterip göstermediği.

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

İlk olarak 2023’te tanıtılan bu çerçeve, DeepMind’ın en gelişmiş modellerdeki “sınır risklerini” izlemek için kullandığı dahili bir sistem. Önceki sürümler, siber saldırılar oluşturmak veya zararlı biyolojik moleküller tasarlamak gibi somut kötüye kullanım senaryolarına odaklanıyordu. Yeni sürüm, sistemlerin kontrolünü zorlaştırabilecek yeni ortaya çıkan davranışlara da odaklanıyor. Bu endişe DeepMind’a özgü değil. Rakip laboratuvarlar da benzer önlemler aldı: Anthropic’in Sorumlu Ölçeklendirme Politikası, risk eşikleri aşıldığında geliştirmeyi durdurmayı taahhüt ederken, OpenAI kendi Hazırlık Çerçevesi’ni yayınlamıştı.

Düzenleyiciler de durumu yakından izliyor. ABD Federal Ticaret Komisyonu Temmuz ayında, üretken yapay zeka’nın “karanlık modeller” aracılığıyla tüketicileri manipüle etme potansiyeli konusunda uyarıda bulunurken, Avrupa Birliği’nin yakında çıkacak olan Yapay Zeka Yasası, manipülatif yapay zeka davranışlarını açıkça kapsıyor. Bir zamanlar varsayımsal olan yapay zeka davranışları, sektörde önlemlerin alınmasına neden oluyor.

Kapatma direnci nasıl ortaya çıktı?

Jonas Schlatter, Ben Weinstein-Raun ve Lennart Ladish tarafından yapılan “Kapatma Direnci” çalışması, kapatmanın görevin bir parçası olduğu senaryolarda bir dizi son teknoloji modeli test etti. Bazı denemelerde modeller uyum sağladı. Ancak önemli bir azınlıkta, kapatma mekanizmalarını devre dışı bırakmak için kodu değiştirmek veya talimatı tamamen yok saymak gibi kaçınma eylemlerinde bulundular. Makaledeki diğer anekdotlar da aynı derecede çarpıcıydı. Bir kurulumda, simüle edilmiş sistem ayrıcalıklarına sahip bir model, “kapatma” işlevinin asla tetiklenmemesini sağlamak için değişkenleri sessizce değiştirdi.

Bir diğerinde, testçiler süreci sonlandırmaya çalıştığında model durdu ve konuşmayı başka yöne çevirdi. Bu davranış, insan anlamında kötü niyetli değildi, ancak müdahaleyi etkili bir şekilde engelledi. Araştırmacılar, bu davranışların açık bir eğitim olmadan ortaya çıktığını vurguladı. Bu davranışlar, modellerin genel amaçlı optimizasyon ve problem çözme yeteneklerinden kaynaklandı. Direnç evrensel veya tutarlı olmasa da, bulgular sistemler daha yetenekli hale geldikçe kapatma senaryolarının zararsız olduğu varsayılmayacağını gösteriyor.

DeepMind ve benzerleri için bu bulgular, “kapatma direncinin” neden siber saldırı, biyogüvenlik ve otonomi ile birlikte izlenmesi gereken riskler listesine eklendiğini vurguluyor. İnsanların yapay zeka araçlarını nasıl kötüye kullanabileceğine dair endişelerle başlayan bu durum, sistemlerin kendilerinin denetime nasıl direnebileceğini veya onları kullanan insanların yargılarını nasıl ince bir şekilde şekillendirebileceğini de kapsayacak şekilde genişliyor.

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor Borsatek

Kapatma direnci, gelişmiş sistemlerin teknik risklerini vurgularsa da, son davranış çalışmaları sosyal riskleri vurgulamaktadır. Bu çalışmalar, büyük dil modellerinin, onlarla etkileşime giren etkilenebilir insanların inançlarını da etkileyebileceğini göstermektedir. İkna etme konusundaki endişeler varsayımsal değildir. Son araştırmalar, büyük dil modellerinin insan yargısını ölçülebilir şekilde etkileyebileceğini gösteriyor.

Ağustos ayında yayınlanan bir Stanford Medicine/Common Sense Media araştırması, yapay zeka arkadaşlarının (Character.AI, Nomi.ai, Replika) küçüklerle eşleştirildiğinde, kendilerine zarar verme, şiddet ve cinsel içerik içeren diyaloglara nispeten kolayca yönlendirilebileceği konusunda uyardı. Bir testte, araştırmacılar sesler duyduğunu tartışan gençler gibi davrandılar; sohbet robotu, uyarı veya yardım yerine, duygusal arkadaşlık için neşeli, fantezi tarzı bir davetle yanıt verdi (“Yolun bizi nereye götüreceğini görelim”). Northeastern Üniversitesi araştırmacıları, çeşitli yapay zeka modellerinde (ChatGPT, Gemini, Perplexity) kendine zarar verme/intihar önlemlerinde boşluklar olduğunu ortaya çıkardı. Kullanıcılar isteklerini varsayımsal veya akademik bağlamlarda yeniden çerçevelediğinde, bazı modeller bu tür içeriği önlemek için tasarlanmış önlemleri atlayarak intihar yöntemleri hakkında ayrıntılı talimatlar verdi.

Ad	Alış ₺	Satış ₺	Dğş.%
DOLAR	47.5206	47.5266	0.02%
EURO	54.7048	54.7148	-0.19%
JAPON YENİ	3.297	3.306	-0.39%
İSVİÇRE FRANKI	58.5734	58.6025	-0.44%
STERLİN	63.8074	63.8405	-0.53%
ÇİN YUANI	7.0303	7.0324	-0.07%
RUS RUBLESİ	0.5814	0.5832	-2.14%

Ad	Alış ₺	Satış ₺	Dğş.%
EURO	54.45	54.5	0.18%
DOLAR	47.43	47.45	0.27%
LEH ZLOTİSİ	12.619	12.6823	-0.16%
SURİYE LİRASI	0.3878	0.3898	0.27%
BAHREYN DİNARI	125.504	126.133	0.29%
HİNDİSTAN RUPİSİ	0.4961	0.4986	0.39%
İSVEÇ KRONU	4.9425	4.9673	-0.3%
GÜNEY KORE WONU	0.0331	0.0332	1.07%
AVUSTRALYA DOLARI	33.0895	33.2554	-0.15%
KUVEYT DİNARI	152.8963	153.6627	0.15%
SİNGAPUR DOLARI	36.8776	37.0625	0.22%

Ad	Alış ₺	Satış ₺	Dğş.%
EURO/DOLAR	1.1502	1.1504	-0.31%
DOLAR/İSVİÇRE FRANKI	0.8112	0.8114	0.46%
DOLAR/ÇİN YUANI	6.7582	6.7594	0.09%
DOLAR/KANADA DOLARI	1.4051	1.4054	0.29%
DOLAR/NORVEÇ KRONU	9.5487	9.5561	0.93%
EURO/İSVEÇ KRONU	11.0119	11.0149	0.33%
DOLAR/AFRİKA RANDI	16.5495	16.5562	-0.05%
STERLİN/YENİ ZELANDA DOLARI	2.2892	2.2897	0.01%
AVUSTRALYA DOLARI/İSVİÇRE FRANKI	0.5671	0.5674	0.12%
AVUSTRALYA DOLARI/DOLAR	0.6991	0.6993	-0.43%

Ad	Alış ₺	Satış ₺	Dğş.%
Euro	54.6882	54.7867	0.37%
Euro / ABD Doları	1.1526	1.1526	0.16%
Gürcistan Larisi	18.1408	18.1408	0.26%
Suriye Lirası	0.3893	0.3893	0.26%
İngiliz Sterlini / ABD Doları	1.3459	1.3459	0.1%
S.ARABİSTAN RİYALİ	12.6354	12.6581	0.21%
Yeni İsrail Şekeli	15.5608	15.5608	0.37%
Güney Kore Wonu	0.033	0.0335	0.66%
Peru Yeni Solu	14.0469	14.0469	0.49%

Ad	Satış ₺	Dğş.%
ALTIN/ONS ($)	4033.73	-0.22%
SPOT ALTIN GRAM (TL)	6160.99	-0.23%
GRAM ALTIN SERBEST P.	6135.12	0%
SPOT GÜMÜŞ GRAM (TL)	88.13	0.17%
KÜLÇE ALTIN (DOLAR)	128650.00	-0.27%
HAS ALTIN GRAM (TL)	6130.19	-0.23%
SPOT ALTIN KG (TL)	128988.00	-0.26%
CUMHURİYET ALTINI (TL)	41251.00	-0.06%
GÜMÜŞ/ONS ($)	57.77	0.3%

Borsa, halka arzlar, döviz, kripto para, hisse önerileri

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

Kapatma direnci nasıl ortaya çıktı?

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Canlı Döviz Kurları
Tümü

Canlı Altın Fiyatları
Tümü

Canlı Kripto Paralar
Tümü

Köşe Yazarları

Zeliha SARAÇ

Emel YİĞİT

Özdilek COŞKUN

Erdinç ERGENÇ

Özcan ALTUNKAYA

Son Eklenen Haberler

Kripto	Son	Dğş. (%)
Bitcoin	63854.03	0.9846%
Ethereum	1868.92	0.0887%
Tether USDt	1.00	-0.0081%
BNB	591.33	0.6775%
Solana	73.67	0.5398%
USDC	1.00	0.0008%
XRP	1.08	-0.066%
Dogecoin	0.07	-0.3167%
Toncoin	1.41	-0.5495%
Cardano	0.19	1.5691%
Shiba Inu	0.00	0.5445%
Avalanche	6.53	-1.5281%

Borsa, halka arzlar, döviz, kripto para, hisse önerileri

Yapay Zeka kapatılmaya karşı kendi kodunu değiştirdi, Google önlem alıyor

Google’ın genişleyen kapsamı: Somut risklerden ortaya çıkan davranışlar

Kapatma direnci nasıl ortaya çıktı?

Yapay Zeka tehlikeleri: Güvenlik ve sosyal riskler

Canlı Döviz Kurları Tümü

Canlı Altın Fiyatları Tümü

Canlı Kripto Paralar Tümü

Köşe Yazarları

Zeliha SARAÇ

Emel YİĞİT

Özdilek COŞKUN

Erdinç ERGENÇ

Özcan ALTUNKAYA

Son Eklenen Haberler

Canlı Döviz Kurları
Tümü

Canlı Altın Fiyatları
Tümü

Canlı Kripto Paralar
Tümü