Publicidad

## Introducción

El texto de Octavio Islas, escrito el 3 de agosto de 2024, explora la dependencia de los modelos de inteligencia artificial (IA) en los datos, tanto reales como sintéticos. El texto analiza las ventajas y desventajas de utilizar datos sintéticos para entrenar modelos de IA, destacando los riesgos de la contaminación de datos y la pérdida de imparcialidad.

## Resumen con viñetas

* El desarrollo de los modelos de IA depende de los datos, que pueden ser reales o sintéticos.
* Los datos sintéticos, aunque permiten entrenar modelos de IA sin comprometer la información confidencial, no siempre garantizan los mejores resultados.
* Un estudio publicado en la revista Nature demostró que los modelos de IA entrenados con datos generados recursivamente se colapsan debido a la contaminación de los datos.
* Los investigadores de la Universidad de Oxford descubrieron que los modelos de IA entrenados con datos sintéticos pierden imparcialidad y tienden a ignorar datos minoritarios.
* Sara Hooker, directora de Cohere for AI, cuestiona la capacidad de los datos sintéticos para representar la complejidad de la experiencia humana.

## Palabras clave

* Inteligencia artificial (IA)
* Datos sintéticos
* Datos reales
* Contaminación de datos
* Imparcialidad

 Este análisis con resumen se realiza con IA (🤖) y puede tener imprecisiones. leer el texto original 📑

Publicidad

Un dato importante del resumen es que el escándalo de corrupción en la Marina salpica a dos hijos de López Obrador.

Un dato importante es que el autor afirma que el gobierno de Luis Echeverría conocía los planes de secuestro de Eugenio Garza Sada con antelación y no hizo nada para evitarlo.

Un dato importante es el descubrimiento de que integrantes de la Marina Armada operaban una red extractiva con los cárteles para contrabandear combustible y evadir impuestos.