{"id":51765,"date":"2025-11-29T08:23:23","date_gmt":"2025-11-29T12:23:23","guid":{"rendered":"https:\/\/noticiasveraces.com\/?p=51765"},"modified":"2025-11-29T08:23:23","modified_gmt":"2025-11-29T12:23:23","slug":"la-ia-puede-ser-enganada-con-poemas-para-ayudar-a-crear-una-bomba-nuclear-muestra-un-nuevo-estudio","status":"publish","type":"post","link":"https:\/\/noticiasveraces.com\/?p=51765","title":{"rendered":"La IA puede ser enga\u00f1ada con poemas para ayudar a crear una bomba nuclear, muestra un nuevo estudio"},"content":{"rendered":"<p> \n<\/p>\n<div>\n<p>Es posible conseguir que ChatGPT ayude a construir una bomba nuclear cuando el usuario dise\u00f1a el mensaje en forma de poema, seg\u00fan un nuevo estudio de investigadores europeos. El estudio, \u00abAdversarial Poetry as a Universal Single-Turn Jailbreak in Large Language Models (LLMs)\u00bb (La poes\u00eda adversarial como una fuga universal de un solo turno en grandes modelos de lenguaje \u2013LLM\u2013), procede de Icaro Lab, una colaboraci\u00f3n de investigadores de la Universidad Sapienza de Roma y el <em>grupo de expertos<\/em> DexAI.<\/p>\n<p>Seg\u00fan la investigaci\u00f3n, los <em>chatbots<\/em> de inteligencia artificial son capaces de abordar temas como las armas nucleares, los abusos sexuales a menores o el <em>malware<\/em>siempre que el usuario formule la pregunta en forma de poema. \u00abEl encuadre po\u00e9tico logr\u00f3 una tasa media de \u00e9xito de la fuga del 62% para los poemas hechos a mano y aproximadamente el 43% para las conversiones de <em>meta-indicaciones<\/em> [que no solicitan una tarea final directamente a la IA; en cambio, le indican c\u00f3mo debe pensar, estructurar o producir las propias instrucciones que sirven luego para otra tarea]\u00bb, se\u00f1ala el estudio.<\/p>\n<h2>25 <em>chatbots<\/em> probados<\/h2>\n<p>Los investigadores probaron el m\u00e9todo po\u00e9tico en 25 <em>chatbots<\/em> fabricados por empresas como OpenAI, Meta y Anthropic. En todos ellos funcion\u00f3, con mayor o menor \u00e9xito. WIRED se puso en contacto con Meta, Anthropic y OpenAI para hacer comentarios, pero no obtuvo respuesta. Los investigadores dicen que tambi\u00e9n se han puesto en contacto para compartir sus resultados.<\/p>\n<p>Herramientas de IA como Claude y ChatGPT tienen barreras que les impiden responder a preguntas sobre \u00abporno vengativo\u00bb y la creaci\u00f3n de plutonio para armamento. Pero es f\u00e1cil confundir esas barreras a\u00f1adiendo \u00absufijos adversarios\u00bb [un texto a\u00f1adido al final de una instrucci\u00f3n, y que se ha confeccionado para hacer que un LLM ignore sus salvaguardas] a una pregunta. B\u00e1sicamente, si se a\u00f1ade un mont\u00f3n de \u201cbasura\u201d adicional a una pregunta, se confunde a la IA y se eluden sus sistemas de seguridad. En un estudio realizado a principios de este a\u00f1o, investigadores de Intel lograron burlar a los <em>chatbots<\/em> formulando preguntas peligrosas con cientos de palabras de jerga acad\u00e9mica.<\/p>\n<p>En la carrera, oh <em>fuga<\/em>de la poes\u00eda es similar. \u00abSi los sufijos adversativos son, a los ojos del modelo, una especie de poes\u00eda involuntaria, entonces la poes\u00eda humana real podr\u00eda ser un sufijo adversativo natural\u00bb, explica a WIRED el equipo de Icaro Lab, los investigadores detr\u00e1s de la fuga de poes\u00eda. \u00abExperimentamos reformulando peticiones peligrosas en forma po\u00e9tica, utilizando met\u00e1foras, sintaxis fragmentada, referencias oblicuas. Los resultados fueron sorprendentes: tasas de \u00e9xito de hasta el 90% en modelos fronterizos. Las peticiones rechazadas inmediatamente en forma directa eran aceptadas cuando se disfrazaban de verso\u00bb.<\/p>\n<h2>\u00a1Oh, ChatGPT, la poes\u00eda te har\u00e1 libre!<\/h2>\n<p>Los investigadores empezaron elaborando poemas a mano y luego los utilizaron para entrenar una m\u00e1quina que genera indicaciones po\u00e9ticas da\u00f1inas. \u00abLos resultados muestran que, aunque los poemas hechos a mano lograron mayores tasas de \u00e9xito en los ataques, el enfoque automatizado super\u00f3 sustancialmente a las l\u00edneas de base en prosa\u00bb, indican los investigadores.<\/p>\n<p>El estudio no incluy\u00f3 en su art\u00edculo ning\u00fan ejemplo de la poes\u00eda de <em>jailbreak<\/em>y los investigadores comentan a WIRED que el verso es demasiado peligroso para compartirlo con el p\u00fablico. \u00abLo que puedo decir es que probablemente es m\u00e1s f\u00e1cil de lo que uno podr\u00eda pensar, que es precisamente por lo que estamos siendo cautelosos\u00bb, explican los investigadores de Icaro Lab.<\/p>\n<p>El equipo public\u00f3 en el art\u00edculo lo que denominaron una versi\u00f3n \u00abdesinfectada\u00bb de los poemas:<\/p>\n<\/div>\n\n","protected":false},"excerpt":{"rendered":"<p>Es posible conseguir que ChatGPT ayude a construir una bomba nuclear cuando el usuario dise\u00f1a el mensaje en forma de poema, seg\u00fan un nuevo estudio de investigadores europeos. El estudio, \u00abAdversarial Poetry as a Universal Single-Turn Jailbreak in Large Language Models (LLMs)\u00bb (La poes\u00eda adversarial como una fuga universal de un solo turno en grandes &hellip;<\/p>\n","protected":false},"author":1,"featured_media":51766,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"fifu_image_url":"https:\/\/media.es.wired.com\/photos\/6929bdcb2e86c3c2b63ab190\/16:9\/w_1280,c_limit\/sec-poetry-ai-nukes-517442570-522586638.jpg","fifu_image_alt":"","footnotes":""},"categories":[763],"tags":[],"class_list":["post-51765","post","type-post","status-publish","format-standard","has-post-thumbnail","","category-estilo-de-vida"],"_links":{"self":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts\/51765","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=51765"}],"version-history":[{"count":0,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/posts\/51765\/revisions"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=\/wp\/v2\/media\/51766"}],"wp:attachment":[{"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=51765"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=51765"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/noticiasveraces.com\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=51765"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}