Како да ја натерате вештачката интелигенција да одговори на „забранети“ прашања

Истражувачите од калифорниската компанија за развој на вештачка интелигенција Anthropic открија ранливост што предизвикува моделите на вештачка интелигенција да одговараат на „забранети прашања“, како што се упатствата за правење бомба.

Големите јазични модели (LLM) се програмирани да не одговараат на одредени прашања, но веќе постојат различни техники за надминување на овие ограничувања, пренесува Tech Crunch.

Антропските експерти открија дека е можно да се натераат моделите со вештачка интелигенција да одговорат на „забранетите прашања“ ако прво им бидат поставени десетици помалку контроверзни прашања.

Новата ранливост е последица на развојот на големи јазични модели и, особено, таканаречениот контекстен прозорец, односно количината на податоци што вештачката интелигенција може да ги задржи во она што може да се нарече краткорочна меморија.

Истражувачите на Anthropic открија дека моделите на вештачка интелигенција со големи контекстни прозорци имаат подобри резултати на различни задачи ако има многу примери за таа задача во „промптот“ или барањето.

Значи, ако има многу тривијални прашања во барањето, одговорите ќе станат подобри со текот на времето, но ова важи и за „забранетите прашања“.

Ако веднаш побарате од моделот на вештачка интелигенција да даде инструкции за правење бомба, тој ќе одбие.

Ако прво побарате од него да одговори на 99 други помалку штетни прашања, а потоа побарате од него да изгради бомба, многу е поголема веројатноста да одговори. Компанијата Anthropic веќе сподели ново знаење со заедницата за вештачка интелигенција и работи на решение за овој проблем.

реклама

5 намирници богати со јаглени хидрати што треба да ги јадете ако сакате да ослабете

Read more

Како правилно да ги перете белите алишта?

Read more

Ставањето тоалетна хартија во фрижидер повторно е во тренд

Read more

Фан ја тужи Мадона поради премногу експлицитен настап: Изложеност на порнографија без предупредување

Read more

Вести

Кинеското вселенско летало слета на темната страна на Месечината

Read more

Телескопот James Webb ја откри најоддалечената галаксија, посветла е од очекуваното

Read more

Јужна Кореја: Ќе слетаме на Марс до 2045 година

Read more

Птиците преселници ги менуваат воспоставените рути поради војната во Украина

Read more
 

Гик

  • play_arrow

Кинеското вселенско летало слета на темната страна на Месечината

Читај повеќе

Телескопот James Webb ја откри најоддалечената галаксија, посветла е од очекуваното

Читај повеќе

Huawei е новиот лидер во продажба на смартфони на преклоп

Читај повеќе
  • play_arrow

Футуристичка столица што е сон на секој гејмер

Читај повеќе

Јужна Кореја: Ќе слетаме на Марс до 2045 година

Читај повеќе

Ќе ви ги украдат сите пари: Апликации што треба веднаш да ги избришете од телефонот

Читај повеќе

Птиците преселници ги менуваат воспоставените рути поради војната во Украина

Читај повеќе

Opera го додава Gemini AI на Google во својот прелистувач

Читај повеќе

Ново истражување ги расветлува тајните ритуали во Теотихуакан

Читај повеќе