Por qué la IA generativa puede resultar muy convincente cuando se equivoca

A menudo nos preocupa que la IA se equivoque. En la práctica, el mayor riesgo surge cuando se equivoca pero suena convincente. En este artículo, Marta Dobrowolska, directora de Ciencia de Datos y Gestión del Conocimiento en Incotec, analiza este fenómeno.

Marta Dobrowolska, directora de Ciencia de Datos y Gestión del Conocimiento en Incotec

¿Qué son las «alucinaciones» de la IA?

Uno de los mayores retos de la IA generativa (GenAI) no es que a veces cometa errores. Es que esos errores a menudo se presentan de una manera que suena pulida, plausible y segura. Estos sistemas ya se utilizan ampliamente para redactar, resumir, traducir, generar ideas y apoyar el trabajo diario, lo que hace que este tema sea cada vez más relevante en la práctica.

Eso es lo que la gente suele entender por alucinaciones: momentos en los que un sistema de IA produce una respuesta que suena pulida y plausible, pero que es falsa, carece de fundamento o simplemente es inventada. El Centro Común de Investigación (JRC) de la Comisión Europea ya ha destacado problemas de calidad en los resultados de la IA generativa, incluyendo alucinaciones, sesgos y dependencia excesiva, y ha subrayado la necesidad de salvaguardias y supervisión humana.

¿Por qué alucinan los sistemas de IA generativa?

La IA generativa está diseñada para crear nuevos textos, imágenes, código, audio o video que se asemejen a los datos con los que fue entrenada. En términos técnicos, estos modelos aprenden patrones y distribuciones de probabilidad en los datos y luego generan nuevas muestras a partir de ellos. Eso es lo que los hace tan útiles y versátiles. También es la razón por la que pueden producir resultados fluidos sin ninguna garantía incorporada de que una afirmación específica sea correcta.

Por lo tanto, cuando un modelo da una respuesta incorrecta, por lo general no está «inventando» en el sentido humano. Está haciendo lo que fue diseñado para hacer: generar el resultado que mejor se ajusta a los patrones que ha aprendido de datos anteriores. Si la pregunta es ambigua, el contexto es escaso o el modelo no tiene acceso a las fuentes adecuadas, puede llenar el vacío con algo que suene correcto en lugar de algo que sea correcto. Visto de esa manera, una alucinación se parece menos a un engaño deliberado y más a una predicción estadística que se adelanta a la verificación.

¿Por qué son un riesgo las alucinaciones?

Porque la fluidez genera una falsa confianza. Una respuesta débil escrita en un lenguaje incorrecto es fácil de cuestionar. Una respuesta errónea escrita en un tono tranquilo y autoritario es mucho más difícil de detectar. Por eso las alucinaciones no son un pequeño defecto técnico; son un verdadero problema de confiabilidad y gobernanza. La Ley de IA de la UE refleja exactamente esa preocupación al poner énfasis en la precisión, la solidez, la transparencia y la supervisión humana para los usos de mayor riesgo de la IA.

En entornos regulados y con gran cantidad de evidencia, «mayoritariamente correcto» simplemente no es un estándar lo suficientemente sólido.

Ejemplos reales de errores de IA

Ya hay ejemplos de esto en entornos profesionales serios. En 2025, Deloitte Australia admitió que una revisión de garantía contratada por el gobierno del Marco de Cumplimiento Específico del país contenía referencias y citas inventadas generadas con Azure OpenAI GPT-4o y acordó proporcionar un reembolso parcial. El problema no era que el informe pareciera poco profesional. Era que parte de la evidencia en la que se basaba era inventada. Eso es exactamente lo que hace que las alucinaciones sean difíciles de detectar: el error puede estar oculto dentro de un trabajo que, por lo demás, parece creíble. En este caso, los problemas fueron detectados por un revisor humano, el académico australiano especializado en bienestar social Chris Rudge.

En el ámbito de la salud y el sector farmacéutico, lo que está en juego es aún mayor. Un estudio publicado en BMJ Quality & Safety, una revista revisada por pares centrada en la calidad de la atención médica y la seguridad del paciente, examinó las respuestas de un chatbot impulsado por IA a preguntas de pacientes sobre medicamentos comúnmente recetados. Si bien muchas respuestas eran en general precisas, los expertos consideraron que el 66 % de un subconjunto de respuestas inexactas era potencialmente dañino, y el 22 % potencialmente grave o incluso mortal si se seguía. En entornos regulados y con gran cantidad de evidencia, «mayoritariamente correcto» simplemente no es un estándar lo suficientemente sólido.

Por eso esto es importante para sectores como el farmacéutico, los asuntos médicos y la I+D. Si una herramienta de IA genera una referencia inventada, tergiversa la evidencia o da una interpretación segura pero incorrecta, el problema no es solo una redacción deficiente. Se convierte en un problema de credibilidad científica, un riesgo de cumplimiento y, potencialmente, un problema de seguridad del paciente. En términos más generales, el JRC ya ha advertido que la IA generativa plantea riesgos transversales en torno a la desinformación, la confianza y la calidad de la toma de decisiones cuando las personas confían en ella demasiado rápido.

¿Deberíamos dejar de usar la IA generativa?

La buena noticia es que esto no es una razón para dejar de usar la IA generativa. Es una razón para usarla de manera más deliberada. Cuando los hechos importan, los resultados deben basarse en material de fuentes confiables en lugar de generarse únicamente a partir de la memoria del modelo. Igualmente importante es que las organizaciones deben hacer que las personas se hagan responsables del resultado final. La pregunta más útil suele ser la más simple: ¿Cuál es la fuente de esto? Si esa pregunta no puede responderse con claridad, el resultado no debe tratarse como evidencia. Esto es particularmente cierto en la comunicación con los clientes, el trabajo legal, la redacción científica, el material regulatorio y el apoyo a la toma de decisiones.

Aun así, sigue siendo una herramienta extraordinaria. La IA generativa tiene un potencial significativo para mejorar la innovación y la productividad en todos los sectores. Pero es útil aplicar un poco de pensamiento crítico a sus resultados y tratarla un poco como a ese colega demasiado seguro de sí mismo: a menudo útil, a menudo impresionantemente rápido, ocasionalmente brillante, pero no alguien a quien citarías ciegamente sin verificar primero la fuente.

Cómo usar la IA generativa de manera responsable

Por eso debemos encontrar el equilibrio adecuado. La IA generativa es poderosa, es útil, pero si queremos usarla de manera responsable, debemos ser honestos sobre una cosa: puede ser muy convincente cuando se equivoca.

PD. Yo revisaría la referencia si fuera tú.
*Andrikyan W, Sametinger SM, Kosfeld F, et al Chatbots impulsados por inteligencia artificial en motores de búsqueda: un estudio transversal sobre la calidad y los riesgos de la información sobre medicamentos para pacientes BMJ Quality & Safety 2025; 34:100-109

Texto editado con la ayuda de M365 Copilot GTP 5.4

Publicado por

Marta Dobrowolska Haywood Directora de Ciencia de Datos y Gestión del Conocimiento en Incotec

Volver a

Incotec Noticias

Name	Typical content	Expires
cookieConsent	Used to check if your device accepts cookies and used to remember users cookie consent.	1 year
SC_ANALYTICS_GLOBAL_COOKIE	This analytics cookie is provided by Sitecore. It tracks a visitor’s multiple visits to our Website in one year. We use this information to help improve our Website. This cookie is not used to identify individuals using the Website.	10 Years
.AspNet.Cookies	This cookie is used to identify and authenticate logged-in users. It maintains secure sessions by storing an encrypted authentication token.	30 days
ASP.NET_SessionId	This cookie is used by ASP.NET to maintain an anonymous user session by assigning a unique session ID. It enables the website to store temporary information between pages, such as login status or form input.	End of session
_sample_basket	Used to store sample items added to basket by user. Contents are serialised.	30 days
sitename#lang	This cookie is provided by Sitecore. This cookie tracks a user's language selection. The name of the cookie varies based on the configured site name	End of Session
__RequestVerificationToken	An anti forgery token used to help prevent CSRF attacks.	End of Session
_form_goals	Used to check if you have previously complete a form.	2 years
lastShownMarketingConsentDate_{identifier}	Use to determine when we requested you review your marketing consent for your account. It helps ensure we limit prompting to review your marketing consent, improving user experience.	1 year
productFinderLastSearch	Used within our product finder to determine the last search performed.	1 year
shell#lang	This cookie is provided by Sitecore. This cookie tracks a user's language selection. The name of the cookie varies based on the configured site name	End of Session
mailinglistsignupbanner_{identifier}	Use to determine when whether a mailing list sign up form has been already shown within a time period. It helps ensure that users are not repeatedly prompting or shown sign up forms, improving user experience. We may create multiple cookies with different identifiers.	< 120 days
resourcesAreaLastSearch	Used within our literature finder to determine the last search performed.	1 year
isProactiveInvite	This cookie is set by the SnapEngage live chat widget to track whether a proactive chat invitation (a pop-up asking if you need help) has already been shown during your visit. It helps ensure that users are not repeatedly prompted with the same chat invite, improving user experience.	End of session
SnapABugAgentAvatar	This cookie stores the agent image URL in order to show the agent avatar on the minimize state of the chat.	16 mins
SnapABugHistory	Keeps track of the visitor visits and last chats to present history to agent	1 year
SnapABugNoProactiveChat		6-12 months
SnapABugRef	This tracks the origin and site entry	120 mins
SnapABugUserAlias	This cookie stores the visitor alias (name). This cookie is used to support subsequent chats so that once it is known, the chat agent doesn’t need to collect the information again.	1 year
SnapABugVisit	This cookie is used to keep track of the visitor visits	End of session

Name	Typical content	Expires
recentlyViewedItems	Contains a list of recently visited items including products or formulations.	30 days
lidc	Used by LinkedIn for routing.	24 hours
li_gc	Used by LinkedIn to store consent of guests regarding the use of cookies for non-essential purposes.	6 months

Name	Typical content	Expires
_gat	Used by Google Analytics to throttle request rate.	10 minutes
_ga	Contains a unique identifier used by Google Analytics to determine unique visitors to our website.	2 years
_clsk	Used by Microsoft Clarity to connect multiple page views by a user into a single Clarity session recording.	1 day
_clck	Persists the Microsoft Clarity User ID and preferences, unique to that site is attributed to the same user ID.	1 year

Name	Typical content	Expires
ANONCHK	Used by Microsoft Clarity and Microsoft Ads to store session ID for a users session to ensure that clicks are verified for reporting purposes and for personalisation.	10 mins
MUID	Identifies unique web browsers used by Microsoft. These cookies are used for advertising, site analytics, and other operational purposes.	1 year
SM	Used by Microsoft to synchronise the unique identifier across Microsoft domains for consistent user recognition and ad targeting.	End of session
MR	Used by Microsoft to support ad delivery and performance tracking.	7 days
SRM_B	Set by Microsoft Bing Ads and is used for advertising purposes. It helps deliver targeted ads and measure the effectiveness of ad campaigns across websites.	1 year
CLID	Used by Microsoft Clarity to identify the first time a user visited any site using Clarity. Helps track user behaviour and engagement across sessions for analytics purposes.	1 year