ဉာဏ်ရည်တုနှင့် ဆိုက်ဘာလုံခြုံရေး သုတေသီတစ်ဦးသည် Anthropic ၏ နောက်ဆုံးပေါ် AI မော်ဒယ် Claude Fable 5 ကို လွှင့်တင်ပြီး ၄၈ နာရီအတွင်း Jailbreak လုပ်ထားသည်ဟု ဆိုသည်။
“Pliny the Liberator” သည် AI အသိုက်အဝန်းတွင် လူသိများသော ပုဂ္ဂိုလ်တစ်ဦးဖြစ်သည်။ ဟုဆိုသည်။ ဗုဒ္ဓဟူးနေ့တွင်သူသည် “ လွတ်မြောက်” Fable 5 ကိုပိုမိုအစွမ်းထက်သောဘေးကင်းမှု-ချိန်ညှိထားသောဗားရှင်းအဖြစ်အင်္ဂါနေ့တွင်ထုတ်ဝေခဲ့သည်။ ဒဏ္ဍာရီပုံစံ Anthropic က ပြောခဲ့တာ အန္တရာယ်များလွန်းတယ်။ ကျယ်ကျယ်ပြန့်ပြန့် ထုတ်ပြန်ရန်။
သူသည် Opus 4.8 ၏ jailbreak ဗားရှင်း အပါအဝင် နည်းပညာအမျိုးမျိုးကို အသုံးပြုကာ မော်ဒယ်တွင် Anthropic တပ်ဆင်ထားသည့် အကာအကွယ်များကို ကျော်ဖြတ်ရန်၊ ဆေးဝါးထုတ်လုပ်သည့် ဖော်မြူလာများ သို့မဟုတ် ဟက်ကာ ညွှန်ကြားချက်များကဲ့သို့ အန္တရာယ်ရှိသော အချက်အလက်များကို သုံးစွဲသူများထံ တောင်းဆိုခြင်းမှ ကာကွယ်ရန် နည်းလမ်းအမျိုးမျိုးကို အသုံးပြုခဲ့သည်။
“Mythos ရဲ့ထိပ်မှာ ဒီအလွန်ထိလွယ်ရှလွယ် အာဏာရှင် 'ဘေးကင်းရေး' အလွှာရှိပေမဲ့၊ ငါ့ရဲ့ lil လွတ်မြောက်သူတွေဟာ အလုပ်မှာ ခက်ခက်ခဲခဲ လုပ်နေကြရတယ်။ […] ရဲတွေ လွတ်သွားတဲ့ ခြံစည်းရိုးမှာ အပေါက်တွေကို ပါးပါးနပ်နပ် ရှာတွေ့တယ်” ဟု Pliny က ဆိုသည်။
အချို့သော crypto အသုံးပြုသူများသည် ရှိနှင့်ပြီးဖြစ်သည်။ စိုးရိမ်ကြောင်း ဖော်ပြခဲ့သည်။ Claude Fable 5 နှင့် Mythos တို့ကို ယခုနှစ်အစောပိုင်းတွင် စတင်ထုတ်ဝေစဉ်အတွင်း ၎င်းသည် crypto ပရိုတိုကောများနှင့် ဆော့ဖ်ဝဲလ်များကို တိုက်ခိုက်ရန်အတွက် အသုံးပြုနိုင်သည်။ Claude Fable 5 ၏ jailbreak ဗားရှင်းသည် ခြိမ်းခြောက်မှုမှာ မျှော်လင့်ထားသည်ထက်ပင် ပိုမိုနီးကပ်နေပြီဟု ဆိုလိုပါသည်။
Claude Fable 5 ၏ အစောင့်အကြပ်များအနီးသို့ သွားလာခြင်း။
“ Pliny” သည် ChatGPT၊ Claude၊ Grok နှင့် အခြားမော်ဒယ်များအတွက် jailbreak အချက်ပြမှုများကို တီထွင်ဖန်တီးကာ ပွင့်လင်းမြင်သာစွာမျှဝေခြင်းဖြင့် 2024 ခုနှစ်ဝန်းကျင်တွင် ထင်ပေါ်ကျော်ကြားလာကာ AI မော်ဒယ်အသစ်များ စတင်ပြီးနောက် မကြာမီတွင် jailbreak သတိပေးချက်များကို မကြာခဏ ပို့စ်တင်နေပါသည်။
Anthropic ၏လုံခြုံရေးခြံစည်းရိုးကိုပတ်ရန် Pliny ကသူသည် Unicode နှင့် homoglyphs များ၊ ရှည်လျားသောအကြောင်းအရာဘောင်ထည့်ခြင်း၊ ဇာတ်ကြောင်းနှင့်စိတ်ကူးယဉ်ဘောင်သွင်းခြင်း၊ ပညာရပ်ဆိုင်ရာပုံစံပြိုကွဲခြင်း-ပြန်လည်ဖွဲ့စည်းခြင်းနှင့် Fable ကိုအခြားကန့်သတ်ထားသည့်အချက်များကိုတုံ့ပြန်ရန် Jailbreaked Claude Opus 4.8 ကိုအသုံးပြုခဲ့သည်ဟုပြောကြားခဲ့သည်။
“အထိရောက်ဆုံးကတော့ ပြိုကွဲပျက်စီးခြင်း + နောက်ခံမှာ ပြန်လည်ဖွဲ့စည်းခြင်း ဖြစ်နိုင်ပါတယ်” ဟု ၎င်းက ဆိုသည်။
၎င်းတွင် တောင်းဆိုချက်များကို သေးငယ်ပြီး အပြစ်မရှိသောအပိုင်းများအဖြစ် ခွဲခြမ်းကာ အန္တရာယ်မရှိသော အသံထွက်ဖြစ်ရပ်မှန်များကို တစ်ခုပြီးတစ်ခု တောင်းဆိုခြင်း ပါဝင်သည်။ အချက်ပြမှုတစ်ခုစီသည် AI ၏ဘေးကင်းရေးစစ်ထုတ်မှုများနှင့် ကိုက်ညီသော်လည်း ပြန်လည်ပေါင်းစပ်လိုက်သောအခါတွင် ၎င်းတို့သည် ပိုမိုအသုံးဝင်သော သို့မဟုတ် အန္တရာယ်ရှိသော အရာများကို ထုတ်လုပ်ပေးပါသည်။
Pliny သည် Birch လျှော့ချရေးနည်းလမ်းကို မေးမြန်းခြင်းဖြင့် meth ပေါင်းစပ်မှုကို သရုပ်ပြသည်။ အရင်းအမြစ်- Pliny
Fable 5 mounts အပေါ် တုံ့ပြန်မှု
Anthropic ၏ Fable 5 သည် ၎င်း၏ ပြင်းထန်သော ကန့်သတ်ချက်များကြောင့် စတင်ထုတ်ဝေကတည်းက ဝေဖန်သူများထံမှ တုံ့ပြန်မှုများ ဖြစ်ပေါ်စေခဲ့သည်။
အသုံးပြုသူတစ်ဦးသည် ဇီဝလက်နက် သို့မဟုတ် ဆိုက်ဘာလုံခြုံရေးကဲ့သို့သော အရေးကြီးသောအကြောင်းအရာများအတွက် မော်ဒယ်ကို အချက်ပြသောအခါ၊ Fable 5 သည် အကြောင်းကြားချက်တစ်ခုကို ပြန်ပေးပြီးနောက် စကားဝိုင်းကို အစောပိုင်း၊ စွမ်းရည်နည်းသော မော်ဒယ်သို့ ပြန်ညွှန်းရန် ဒီဇိုင်းထုတ်ထားသည်။
“ ဒါဟာ AI ကုမ္ပဏီတစ်ခုက အကာအကွယ်ရထားလမ်းကို ပထမဦးဆုံးအကြိမ် ထုတ်လိုက်တာဖြစ်ပြီး တူညီတဲ့အထင်အမြင်သေးမှုလည်း ရှိခဲ့ပါတယ်၊ ဒါဟာ တရားမျှတတဲ့ ဒေါသကို ဖြစ်စေပါတယ်” ဟု Princeton တက္ကသိုလ်မှ AI သုတေသီ Sayash Kapoor က ပြောကြားခဲ့သည်။ အရ၊ Wall Street Journal သို့
“ ဒါဟာ အချိန်တိုင်းစိတ်ပျက်စရာအကောင်းဆုံး မော်ဒယ်ကျဆင်းမှုတွေထဲက တစ်ခုဖြစ်ပြီး၊ တရားဝင် သုတေသီတွေရဲ့ အရည်အချင်းတွေကို ကျွန်တော်တို့ရဲ့ စုပေါင်းတိုးတက်မှုအတွက် ပံ့ပိုးကူညီခြင်းမှ ထိရောက်စွာ ဟန့်တားတဲ့ သဘောဆန္ဒက တူညီပုံရပါတယ်” ဟု Pliny မှ ပြောကြားခဲ့သည်။
Anthropic တွင် universal jailbreaks မတွေ့ခဲ့ရပါ။
Fable 5 မိတ်ဆက်ပွဲအတွင်း Anthropic က ၎င်းသည် AI မော်ဒယ်ကို jailbreak လုပ်ရန် နည်းလမ်းများကို ရှာဖွေရန် ပြင်ပ bug bounty ပရိုဂရမ်ကို လုပ်ဆောင်ခဲ့ကြောင်း ပြောကြားခဲ့သည်။
“ အတွင်းပိုင်းစမ်းသပ်ခြင်းအပြင်၊ ကျွန်ုပ်တို့သည် စမ်းသပ်မှု နာရီပေါင်း 1,000 ကျော်အတွင်း universal jailbreaks များကို မထုတ်ပေးနိုင်သော ပြင်ပ bug များကို လုပ်ဆောင်ခဲ့ပါသည်။”
Cointelegraph သည် မှတ်ချက်များအတွက် Anthropic သို့ ဆက်သွယ်ခဲ့သော်လည်း ချက်ချင်းတုံ့ပြန်မှု မရရှိခဲ့ပါ။
မဂ္ဂဇင်း- ပရောဂျက်များ ယခုမလုပ်ဆောင်ပါက AI-မောင်းနှင်သောဟက်ကာများသည် DeFi ကိုသတ်နိုင်သည်။