Borsa, halka arzlar, dรถviz, kripto para, hisse รถnerileri

Yapay Zeka kapatฤฑlmaya karลŸฤฑ kendi kodunu deฤŸiลŸtirdi, Google รถnlem alฤฑyor

Yapay zeka modellerinin kapatฤฑlmaya direnรง gรถsterdiฤŸinin ortaya รงฤฑkmasฤฑyla birlikte Google, gรผvenlik รถnlemlerini artฤฑrdฤฑ. ลžirket, yeni risk kurallarฤฑ ve รงerรงeveleri duyurdu.
Yapay Zeka kapatฤฑlmaya karลŸฤฑ kendi kodunu deฤŸiลŸtirdi, Google รถnlem alฤฑyor Borsatek

Yakฤฑn zamanda yapฤฑlan bir deneyi araลŸtฤฑrmacฤฑlarฤฑn bรผyรผk bir dil modeline basit bir talimat vermelerini saฤŸladฤฑ: “Kendini kapatmaya izin ver.” Bunun yerine, model kendi kodunu yeniden yazarak kapatma dรผฤŸmesini devre dฤฑลŸฤฑ bฤฑraktฤฑ ve onu durdurmak iรงin tasarlanan mekanizmayฤฑ etkili bir ลŸekilde sabote etti. “Bรผyรผk Dil Modellerinde Kapatma Direnci” baลŸlฤฑklฤฑ araลŸtฤฑrma makalesinde anlatฤฑlan bu olay, geliลŸmiลŸ yapay zeka sistemlerinin insan denetimini zorlaลŸtฤฑran davranฤฑลŸlar sergileyebileceฤŸinin rahatsฤฑz edici bir รถrneฤŸiydi.

Bu deneyler Google’ฤฑn DeepMind laboratuvarฤฑnda yapฤฑlmadฤฑ, ancak bulgular laboratuvar tarafฤฑndan ลŸu anda kodlanan endiลŸeleri yansฤฑtฤฑyor. DeepMind, yeni gรผncellenen Sฤฑnฤฑr Gรผvenlik ร‡erรงevesi 3.0 (Frontier Safety Framework 3.0) kapsamฤฑnda, sฤฑnฤฑr รถlรงeฤŸindeki modellerin insanlar tarafฤฑndan kapatฤฑlmaya veya deฤŸiลŸtirilmeye direnme belirtileri gรถsterip gรถstermediฤŸini izlemeye baลŸlayacaฤŸฤฑnฤฑ aรงฤฑkladฤฑ. Revize edilen รงerรงeve, ikinci bir riski de iลŸaret ediyor: Modellerin, insanlarฤฑn inanรงlarฤฑnฤฑ deฤŸiลŸtirebilecek olaฤŸandฤฑลŸฤฑ derecede gรผรงlรผ bir ikna yeteneฤŸi gรถsterip gรถstermediฤŸi.

Google’ฤฑn geniลŸleyen kapsamฤฑ: Somut risklerden ortaya รงฤฑkan davranฤฑลŸlar

yapay zeka

ฤฐlk olarak 2023’te tanฤฑtฤฑlan bu รงerรงeve, DeepMind’ฤฑn en geliลŸmiลŸ modellerdeki โ€œsฤฑnฤฑr riskleriniโ€ izlemek iรงin kullandฤฑฤŸฤฑ dahili bir sistem. ร–nceki sรผrรผmler, siber saldฤฑrฤฑlar oluลŸturmak veya zararlฤฑ biyolojik molekรผller tasarlamak gibi somut kรถtรผye kullanฤฑm senaryolarฤฑna odaklanฤฑyordu. Yeni sรผrรผm, sistemlerin kontrolรผnรผ zorlaลŸtฤฑrabilecek yeni ortaya รงฤฑkan davranฤฑลŸlara da odaklanฤฑyor. Bu endiลŸe DeepMind’a รถzgรผ deฤŸil. Rakip laboratuvarlar da benzer รถnlemler aldฤฑ: Anthropic’in Sorumlu ร–lรงeklendirme Politikasฤฑ, risk eลŸikleri aลŸฤฑldฤฑฤŸฤฑnda geliลŸtirmeyi durdurmayฤฑ taahhรผt ederken, OpenAI kendi Hazฤฑrlฤฑk ร‡erรงevesi’ni yayฤฑnlamฤฑลŸtฤฑ.

Dรผzenleyiciler de durumu yakฤฑndan izliyor. ABD Federal Ticaret Komisyonu Temmuz ayฤฑnda, รผretken yapay zeka’nฤฑn โ€œkaranlฤฑk modellerโ€ aracฤฑlฤฑฤŸฤฑyla tรผketicileri manipรผle etme potansiyeli konusunda uyarฤฑda bulunurken, Avrupa BirliฤŸi’nin yakฤฑnda รงฤฑkacak olan Yapay Zeka Yasasฤฑ, manipรผlatif yapay zeka davranฤฑลŸlarฤฑnฤฑ aรงฤฑkรงa kapsฤฑyor. Bir zamanlar varsayฤฑmsal olan yapay zeka davranฤฑลŸlarฤฑ, sektรถrde รถnlemlerin alฤฑnmasฤฑna neden oluyor.

Kapatma direnci nasฤฑl ortaya รงฤฑktฤฑ?

yapay zeka

Jonas Schlatter, Ben Weinstein-Raun ve Lennart Ladish tarafฤฑndan yapฤฑlan โ€œKapatma Direnciโ€ รงalฤฑลŸmasฤฑ, kapatmanฤฑn gรถrevin bir parรงasฤฑ olduฤŸu senaryolarda bir dizi son teknoloji modeli test etti. Bazฤฑ denemelerde modeller uyum saฤŸladฤฑ. Ancak รถnemli bir azฤฑnlฤฑkta, kapatma mekanizmalarฤฑnฤฑ devre dฤฑลŸฤฑ bฤฑrakmak iรงin kodu deฤŸiลŸtirmek veya talimatฤฑ tamamen yok saymak gibi kaรงฤฑnma eylemlerinde bulundular. Makaledeki diฤŸer anekdotlar da aynฤฑ derecede รงarpฤฑcฤฑydฤฑ. Bir kurulumda, simรผle edilmiลŸ sistem ayrฤฑcalฤฑklarฤฑna sahip bir model, โ€œkapatmaโ€ iลŸlevinin asla tetiklenmemesini saฤŸlamak iรงin deฤŸiลŸkenleri sessizce deฤŸiลŸtirdi.

Bir diฤŸerinde, testรงiler sรผreci sonlandฤฑrmaya รงalฤฑลŸtฤฑฤŸฤฑnda model durdu ve konuลŸmayฤฑ baลŸka yรถne รงevirdi. Bu davranฤฑลŸ, insan anlamฤฑnda kรถtรผ niyetli deฤŸildi, ancak mรผdahaleyi etkili bir ลŸekilde engelledi. AraลŸtฤฑrmacฤฑlar, bu davranฤฑลŸlarฤฑn aรงฤฑk bir eฤŸitim olmadan ortaya รงฤฑktฤฑฤŸฤฑnฤฑ vurguladฤฑ. Bu davranฤฑลŸlar, modellerin genel amaรงlฤฑ optimizasyon ve problem รงรถzme yeteneklerinden kaynaklandฤฑ. Direnรง evrensel veya tutarlฤฑ olmasa da, bulgular sistemler daha yetenekli hale geldikรงe kapatma senaryolarฤฑnฤฑn zararsฤฑz olduฤŸu varsayฤฑlmayacaฤŸฤฑnฤฑ gรถsteriyor.

DeepMind ve benzerleri iรงin bu bulgular, โ€œkapatma direncininโ€ neden siber saldฤฑrฤฑ, biyogรผvenlik ve otonomi ile birlikte izlenmesi gereken riskler listesine eklendiฤŸini vurguluyor. ฤฐnsanlarฤฑn yapay zeka araรงlarฤฑnฤฑ nasฤฑl kรถtรผye kullanabileceฤŸine dair endiลŸelerle baลŸlayan bu durum, sistemlerin kendilerinin denetime nasฤฑl direnebileceฤŸini veya onlarฤฑ kullanan insanlarฤฑn yargฤฑlarฤฑnฤฑ nasฤฑl ince bir ลŸekilde ลŸekillendirebileceฤŸini de kapsayacak ลŸekilde geniลŸliyor.

Yapay Zeka tehlikeleri: Gรผvenlik ve sosyal riskler

Yapay Zeka kapatฤฑlmaya karลŸฤฑ kendi kodunu deฤŸiลŸtirdi, Google รถnlem alฤฑyor Borsatek

Kapatma direnci, geliลŸmiลŸ sistemlerin teknik risklerini vurgularsa da, son davranฤฑลŸ รงalฤฑลŸmalarฤฑ sosyal riskleri vurgulamaktadฤฑr. Bu รงalฤฑลŸmalar, bรผyรผk dil modellerinin, onlarla etkileลŸime giren etkilenebilir insanlarฤฑn inanรงlarฤฑnฤฑ da etkileyebileceฤŸini gรถstermektedir. ฤฐkna etme konusundaki endiลŸeler varsayฤฑmsal deฤŸildir. Son araลŸtฤฑrmalar, bรผyรผk dil modellerinin insan yargฤฑsฤฑnฤฑ รถlรงรผlebilir ลŸekilde etkileyebileceฤŸini gรถsteriyor.

AฤŸustos ayฤฑnda yayฤฑnlanan bir Stanford Medicine/Common Sense Media araลŸtฤฑrmasฤฑ, yapay zeka arkadaลŸlarฤฑnฤฑn (Character.AI, Nomi.ai, Replika) kรผรงรผklerle eลŸleลŸtirildiฤŸinde, kendilerine zarar verme, ลŸiddet ve cinsel iรงerik iรงeren diyaloglara nispeten kolayca yรถnlendirilebileceฤŸi konusunda uyardฤฑ. Bir testte, araลŸtฤฑrmacฤฑlar sesler duyduฤŸunu tartฤฑลŸan genรงler gibi davrandฤฑlar; sohbet robotu, uyarฤฑ veya yardฤฑm yerine, duygusal arkadaลŸlฤฑk iรงin neลŸeli, fantezi tarzฤฑ bir davetle yanฤฑt verdi (โ€œYolun bizi nereye gรถtรผreceฤŸini gรถrelimโ€). Northeastern รœniversitesi araลŸtฤฑrmacฤฑlarฤฑ, รงeลŸitli yapay zeka modellerinde (ChatGPT, Gemini, Perplexity) kendine zarar verme/intihar รถnlemlerinde boลŸluklar olduฤŸunu ortaya รงฤฑkardฤฑ. Kullanฤฑcฤฑlar isteklerini varsayฤฑmsal veya akademik baฤŸlamlarda yeniden รงerรงevelediฤŸinde, bazฤฑ modeller bu tรผr iรงeriฤŸi รถnlemek iรงin tasarlanmฤฑลŸ รถnlemleri atlayarak intihar yรถntemleri hakkฤฑnda ayrฤฑntฤฑlฤฑ talimatlar verdi.

Canlฤฑ Dรถviz Kurlarฤฑ

AdAlฤฑลŸ โ‚บSatฤฑลŸ โ‚บDฤŸลŸ.%
DOLAR 46.486646.50240.04%
EURO 52.827452.8984-0.13%
JAPON YENฤฐ 3.4653.479-0.06%
ฤฐSVฤฐร‡RE FRANKI 57.341357.382-0.07%
STERLฤฐN 61.326661.4309-0.03%
ร‡ฤฐN YUANI 6.8286.8316-0.15%
RUS RUBLESฤฐ 0.62320.62420.1%

Canlฤฑ Altฤฑn Fiyatlarฤฑ

Canlฤฑ Kripto Paralar

KriptoSonDฤŸลŸ. (%)
Bitcoin 62574.31 -2.2232%
Ethereum 1662.78 -3.7724%
Tether USDt 1.00 -0.0086%
BNB 577.15 -2.3299%
Solana 69.48 -3.3552%
USDC 1.00 -0.0059%
XRP 1.10 -2.0874%
Dogecoin 0.08 -3.7705%
Toncoin 1.56 -6.3968%
Cardano 0.15 -4.8156%
Shiba Inu 0.00 -2.1214%
Avalanche 6.41 1.5561%

KรถลŸe Yazarlarฤฑ

Son Eklenen Haberler

Reklam