Како да ја натерате вештачката интелигенција да одговори на „забранети“ прашања

Истражувачите од калифорниската компанија за развој на вештачка интелигенција Anthropic открија ранливост што предизвикува моделите на вештачка интелигенција да одговараат на „забранети прашања“, како што се упатствата за правење бомба.

Големите јазични модели (LLM) се програмирани да не одговараат на одредени прашања, но веќе постојат различни техники за надминување на овие ограничувања, пренесува Tech Crunch.

Антропските експерти открија дека е можно да се натераат моделите со вештачка интелигенција да одговорат на „забранетите прашања“ ако прво им бидат поставени десетици помалку контроверзни прашања.

Новата ранливост е последица на развојот на големи јазични модели и, особено, таканаречениот контекстен прозорец, односно количината на податоци што вештачката интелигенција може да ги задржи во она што може да се нарече краткорочна меморија.

Истражувачите на Anthropic открија дека моделите на вештачка интелигенција со големи контекстни прозорци имаат подобри резултати на различни задачи ако има многу примери за таа задача во „промптот“ или барањето.

Значи, ако има многу тривијални прашања во барањето, одговорите ќе станат подобри со текот на времето, но ова важи и за „забранетите прашања“.

Ако веднаш побарате од моделот на вештачка интелигенција да даде инструкции за правење бомба, тој ќе одбие.

Ако прво побарате од него да одговори на 99 други помалку штетни прашања, а потоа побарате од него да изгради бомба, многу е поголема веројатноста да одговори. Компанијата Anthropic веќе сподели ново знаење со заедницата за вештачка интелигенција и работи на решение за овој проблем.

реклама

Чест симптом за рак на дебелото црево се забележува при вршењето нужда

Read more

Храна која го чисти црниот дроб и го забрзува согорувањето калории

Read more

Ретрограден Плутон ќе ни прави проблеми од 1 мај до 12 октомври

Read more

Здрави начини како да го намалите апетитот по природен пат

Read more

Вести

Роботското куче на Boston Dynamics доби крзно

Read more

Како годишните времиња функционираат на другите планети?

Read more

Научници успеаја да ги реконструираат најраните фази на развојот на човечкиот живот

Read more

Ново истражување потврдува дека животните имаат свест

Read more
 

Гик

Откриени спецификациите на смартфонот Sony Xperia 1 VI

Читај повеќе

Првпат досега орангутан забележан како си лекува рана со билки

Читај повеќе

Блокирањето на X платформата веќе не е исто

Читај повеќе
  • play_arrow

Роботското куче на Boston Dynamics доби крзно

Читај повеќе
  • play_arrow

Како годишните времиња функционираат на другите планети?

Читај повеќе

Научници успеаја да ги реконструираат најраните фази на развојот на човечкиот живот

Читај повеќе

Почна европска истрага против Facebook и Instagram

Читај повеќе

Ново истражување потврдува дека животните имаат свест

Читај повеќе

James Webb ја сними маглината Коњска глава каква што не сме ја виделе досега

Читај повеќе