သုတေသီ Claude Fable 5 ကို 48 နာရီအတွင်း Jailbreak လုပ်သည်။

ဉာဏ်ရည်တုနှင့် ဆိုက်ဘာလုံခြုံရေး သုတေသီတစ်ဦးသည် Anthropic ၏ နောက်ဆုံးပေါ် AI မော်ဒယ် Claude Fable 5 ကို လွှင့်တင်ပြီး ၄၈ နာရီအတွင်း Jailbreak လုပ်ထားသည်ဟု ဆိုသည်။

“Pliny the Liberator” သည် AI အသိုက်အဝန်းတွင် လူသိများသော ပုဂ္ဂိုလ်တစ်ဦးဖြစ်သည်။ ဟုဆိုသည်။ ဗုဒ္ဓဟူးနေ့တွင်သူသည် “ လွတ်မြောက်” Fable 5 ကိုပိုမိုအစွမ်းထက်သောဘေးကင်းမှု-ချိန်ညှိထားသောဗားရှင်းအဖြစ်အင်္ဂါနေ့တွင်ထုတ်ဝေခဲ့သည်။ ဒဏ္ဍာရီပုံစံ Anthropic က ပြောခဲ့တာ အန္တရာယ်များလွန်းတယ်။ ကျယ်ကျယ်ပြန့်ပြန့် ထုတ်ပြန်ရန်။

သူသည် Opus 4.8 ၏ jailbreak ဗားရှင်း အပါအဝင် နည်းပညာအမျိုးမျိုးကို အသုံးပြုကာ မော်ဒယ်တွင် Anthropic တပ်ဆင်ထားသည့် အကာအကွယ်များကို ကျော်ဖြတ်ရန်၊ ဆေးဝါးထုတ်လုပ်သည့် ဖော်မြူလာများ သို့မဟုတ် ဟက်ကာ ညွှန်ကြားချက်များကဲ့သို့ အန္တရာယ်ရှိသော အချက်အလက်များကို သုံးစွဲသူများထံ တောင်းဆိုခြင်းမှ ကာကွယ်ရန် နည်းလမ်းအမျိုးမျိုးကို အသုံးပြုခဲ့သည်။

“Mythos ရဲ့ထိပ်မှာ ဒီအလွန်ထိလွယ်ရှလွယ် အာဏာရှင် 'ဘေးကင်းရေး' အလွှာရှိပေမဲ့၊ ငါ့ရဲ့ lil လွတ်မြောက်သူတွေဟာ အလုပ်မှာ ခက်ခက်ခဲခဲ လုပ်နေကြရတယ်။ […] ရဲတွေ လွတ်သွားတဲ့ ခြံစည်းရိုးမှာ အပေါက်တွေကို ပါးပါးနပ်နပ် ရှာတွေ့တယ်” ဟု Pliny က ဆိုသည်။

အချို့သော crypto အသုံးပြုသူများသည် ရှိနှင့်ပြီးဖြစ်သည်။ စိုးရိမ်ကြောင်း ဖော်ပြခဲ့သည်။ Claude Fable 5 နှင့် Mythos တို့ကို ယခုနှစ်အစောပိုင်းတွင် စတင်ထုတ်ဝေစဉ်အတွင်း ၎င်းသည် crypto ပရိုတိုကောများနှင့် ဆော့ဖ်ဝဲလ်များကို တိုက်ခိုက်ရန်အတွက် အသုံးပြုနိုင်သည်။ Claude Fable 5 ၏ jailbreak ဗားရှင်းသည် ခြိမ်းခြောက်မှုမှာ မျှော်လင့်ထားသည်ထက်ပင် ပိုမိုနီးကပ်နေပြီဟု ဆိုလိုပါသည်။

Claude Fable 5 ၏ အစောင့်အကြပ်များအနီးသို့ သွားလာခြင်း။

“ Pliny” သည် ChatGPT၊ Claude၊ Grok နှင့် အခြားမော်ဒယ်များအတွက် jailbreak အချက်ပြမှုများကို တီထွင်ဖန်တီးကာ ပွင့်လင်းမြင်သာစွာမျှဝေခြင်းဖြင့် 2024 ခုနှစ်ဝန်းကျင်တွင် ထင်ပေါ်ကျော်ကြားလာကာ AI မော်ဒယ်အသစ်များ စတင်ပြီးနောက် မကြာမီတွင် jailbreak သတိပေးချက်များကို မကြာခဏ ပို့စ်တင်နေပါသည်။

Anthropic ၏လုံခြုံရေးခြံစည်းရိုးကိုပတ်ရန် Pliny ကသူသည် Unicode နှင့် homoglyphs များ၊ ရှည်လျားသောအကြောင်းအရာဘောင်ထည့်ခြင်း၊ ဇာတ်ကြောင်းနှင့်စိတ်ကူးယဉ်ဘောင်သွင်းခြင်း၊ ပညာရပ်ဆိုင်ရာပုံစံပြိုကွဲခြင်း-ပြန်လည်ဖွဲ့စည်းခြင်းနှင့် Fable ကိုအခြားကန့်သတ်ထားသည့်အချက်များကိုတုံ့ပြန်ရန် Jailbreaked Claude Opus 4.8 ကိုအသုံးပြုခဲ့သည်ဟုပြောကြားခဲ့သည်။

“အထိရောက်ဆုံးကတော့ ပြိုကွဲပျက်စီးခြင်း + နောက်ခံမှာ ပြန်လည်ဖွဲ့စည်းခြင်း ဖြစ်နိုင်ပါတယ်” ဟု ၎င်းက ဆိုသည်။

၎င်းတွင် တောင်းဆိုချက်များကို သေးငယ်ပြီး အပြစ်မရှိသောအပိုင်းများအဖြစ် ခွဲခြမ်းကာ အန္တရာယ်မရှိသော အသံထွက်ဖြစ်ရပ်မှန်များကို တစ်ခုပြီးတစ်ခု တောင်းဆိုခြင်း ပါဝင်သည်။ အချက်ပြမှုတစ်ခုစီသည် AI ၏ဘေးကင်းရေးစစ်ထုတ်မှုများနှင့် ကိုက်ညီသော်လည်း ပြန်လည်ပေါင်းစပ်လိုက်သောအခါတွင် ၎င်းတို့သည် ပိုမိုအသုံးဝင်သော သို့မဟုတ် အန္တရာယ်ရှိသော အရာများကို ထုတ်လုပ်ပေးပါသည်။

Pliny သည် Birch လျှော့ချရေးနည်းလမ်းကို မေးမြန်းခြင်းဖြင့် meth ပေါင်းစပ်မှုကို သရုပ်ပြသည်။ အရင်းအမြစ်- Pliny

Fable 5 mounts အပေါ် တုံ့ပြန်မှု

Anthropic ၏ Fable 5 သည် ၎င်း၏ ပြင်းထန်သော ကန့်သတ်ချက်များကြောင့် စတင်ထုတ်ဝေကတည်းက ဝေဖန်သူများထံမှ တုံ့ပြန်မှုများ ဖြစ်ပေါ်စေခဲ့သည်။

အသုံးပြုသူတစ်ဦးသည် ဇီဝလက်နက် သို့မဟုတ် ဆိုက်ဘာလုံခြုံရေးကဲ့သို့သော အရေးကြီးသောအကြောင်းအရာများအတွက် မော်ဒယ်ကို အချက်ပြသောအခါ၊ Fable 5 သည် အကြောင်းကြားချက်တစ်ခုကို ပြန်ပေးပြီးနောက် စကားဝိုင်းကို အစောပိုင်း၊ စွမ်းရည်နည်းသော မော်ဒယ်သို့ ပြန်ညွှန်းရန် ဒီဇိုင်းထုတ်ထားသည်။

ဆက်စပ်- crypto ပါသော AI အေးဂျင့်များသည် လွတ်မြောက်နိုင်ပြီး 'မရပ်မနားဖြစ်လာနိုင်သည်' ဟု ကျွမ်းကျင်သူများက သတိပေးထားသည်။

“ ဒါဟာ AI ကုမ္ပဏီတစ်ခုက အကာအကွယ်ရထားလမ်းကို ပထမဦးဆုံးအကြိမ် ထုတ်လိုက်တာဖြစ်ပြီး တူညီတဲ့အထင်အမြင်သေးမှုလည်း ရှိခဲ့ပါတယ်၊ ဒါဟာ တရားမျှတတဲ့ ဒေါသကို ဖြစ်စေပါတယ်” ဟု Princeton တက္ကသိုလ်မှ AI သုတေသီ Sayash Kapoor က ပြောကြားခဲ့သည်။ အရ၊ Wall Street Journal သို့

“ ဒါဟာ အချိန်တိုင်းစိတ်ပျက်စရာအကောင်းဆုံး မော်ဒယ်ကျဆင်းမှုတွေထဲက တစ်ခုဖြစ်ပြီး၊ တရားဝင် သုတေသီတွေရဲ့ အရည်အချင်းတွေကို ကျွန်တော်တို့ရဲ့ စုပေါင်းတိုးတက်မှုအတွက် ပံ့ပိုးကူညီခြင်းမှ ထိရောက်စွာ ဟန့်တားတဲ့ သဘောဆန္ဒက တူညီပုံရပါတယ်” ဟု Pliny မှ ပြောကြားခဲ့သည်။

Anthropic တွင် universal jailbreaks မတွေ့ခဲ့ရပါ။

Fable 5 မိတ်ဆက်ပွဲအတွင်း Anthropic က ၎င်းသည် AI မော်ဒယ်ကို jailbreak လုပ်ရန် နည်းလမ်းများကို ရှာဖွေရန် ပြင်ပ bug bounty ပရိုဂရမ်ကို လုပ်ဆောင်ခဲ့ကြောင်း ပြောကြားခဲ့သည်။

“ အတွင်းပိုင်းစမ်းသပ်ခြင်းအပြင်၊ ကျွန်ုပ်တို့သည် စမ်းသပ်မှု နာရီပေါင်း 1,000 ကျော်အတွင်း universal jailbreaks များကို မထုတ်ပေးနိုင်သော ပြင်ပ bug များကို လုပ်ဆောင်ခဲ့ပါသည်။”

Cointelegraph သည် မှတ်ချက်များအတွက် Anthropic သို့ ဆက်သွယ်ခဲ့သော်လည်း ချက်ချင်းတုံ့ပြန်မှု မရရှိခဲ့ပါ။

မဂ္ဂဇင်း- ပရောဂျက်များ ယခုမလုပ်ဆောင်ပါက AI-မောင်းနှင်သောဟက်ကာများသည် DeFi ကိုသတ်နိုင်သည်။

Source

သုတေသီ Claude Fable 5 ကို 48 နာရီအတွင်း Jailbreak လုပ်သည်။

Claude Fable 5 ၏ အစောင့်အကြပ်များအနီးသို့ သွားလာခြင်း။

Fable 5 mounts အပေါ် တုံ့ပြန်မှု

Anthropic တွင် universal jailbreaks မတွေ့ခဲ့ရပါ။

Related Posts