## Introducción

El texto de Octavio Islas, escrito el 3 de agosto de 2024, explora la dependencia de los modelos de inteligencia artificial (IA) en los datos, tanto reales como sintéticos. El texto analiza las ventajas y desventajas de utilizar datos sintéticos para entrenar modelos de IA, destacando los riesgos de la contaminación de datos y la pérdida de imparcialidad.

## Resumen con viñetas

* El desarrollo de los modelos de IA depende de los datos, que pueden ser reales o sintéticos.
* Los datos sintéticos, aunque permiten entrenar modelos de IA sin comprometer la información confidencial, no siempre garantizan los mejores resultados.
* Un estudio publicado en la revista Nature demostró que los modelos de IA entrenados con datos generados recursivamente se colapsan debido a la contaminación de los datos.
* Los investigadores de la Universidad de Oxford descubrieron que los modelos de IA entrenados con datos sintéticos pierden imparcialidad y tienden a ignorar datos minoritarios.
* Sara Hooker, directora de Cohere for AI, cuestiona la capacidad de los datos sintéticos para representar la complejidad de la experiencia humana.

## Palabras clave

* Inteligencia artificial (IA)
* Datos sintéticos
* Datos reales
* Contaminación de datos
* Imparcialidad

 Este análisis con resumen se realiza con IA (🤖) y puede tener imprecisiones. leer el texto original 📑

Un dato importante del resumen es que el autor critica la falta de autonomía del fiscal Alejandro Gertz Manero y su cercanía con el poder presidencial, lo que ha impedido una verdadera reforma en el sistema de procuración de justicia.

Un dato importante es que Claudia está cambiando la estrategia de seguridad de López Obrador, reconociendo implícitamente el fracaso de la misma.

El nuevo modelo energético busca la cooperación entre Pemex y la inversión privada, compartiendo riesgos, costos y utilidades.

El autor critica la persistencia de un sistema que, según él, no responde a las necesidades de los jóvenes y perpetúa la desigualdad social.