Este texto de Alberto Muñoz, escrito el 28 de enero de 2025, analiza el modelo de inteligencia artificial DeepSeek R1, desmintiendo mitos y aclarando su impacto real. Se destaca la importancia de la transparencia y la colaboración en el desarrollo de la IA.

El costo real de entrenar DeepSeek R1 fue mucho mayor a los 6 millones de dólares inicialmente rumoreados, involucrando 50.000 GPUs de alta gama.

Resumen:

  • El modelo de IA DeepSeek R1, respaldado por High-Flyer, un fondo de cobertura chino con activos superiores a 7 mil millones de dólares, se ha convertido en un referente tecnológico.
  • El costo de entrenamiento del modelo base fue significativamente superior a los 6 millones de dólares reportados inicialmente, requiriendo aproximadamente 50.000 GPUs NVIDIA H100 y una gran inversión en infraestructura y personal.
  • DeepSeek R1 utiliza una arquitectura innovadora basada en Mixture of Experts (MoE) con 671 mil millones de parámetros, lo que lo hace eficiente y especializado.
  • A diferencia de versiones más pequeñas como Qwen o Llama, DeepSeek R1 posee una capacidad y sofisticación superiores.
  • La versión alojada en chat.deepseek.com utiliza datos de usuario para entrenar nuevos modelos, según sus términos de servicio.
  • La contribución de DeepSeek R1 al código abierto y la comunidad científica ha sido significativa. Hugging Face está trabajando en una reproducción abierta de su entrenamiento.
  • Se especula sobre una posible relación entre DeepSeek R1 y la caída de las acciones de NVIDIA entre el 25 y 26 de enero de 2025, debido a la percepción de una menor dependencia del hardware de NVIDIA.
  • La reacción en redes sociales a las acusaciones de robo de datos ("cookies") ha sido mayoritariamente de ironía y escepticismo, considerando que esta práctica es común en la industria tecnológica.

Conclusión:

  • DeepSeek R1 representa un hito en la IA, demostrando el potencial de la colaboración y la innovación.
  • Su compromiso con el código abierto promueve la democratización del acceso a tecnologías avanzadas.
  • La polémica en torno a la recopilación de datos destaca la necesidad de un debate más informado y menos sensacionalista sobre la privacidad en el mundo digital.
  • El modelo es un ejemplo de lo que se puede lograr con recursos, talento y una visión clara, desafiando los límites tecnológicos actuales.
  • La innovación en DeepSeek R1 podría reducir el consumo de energía en el futuro.
Sección: Tecnología

 Este análisis con resumen se realiza con IA (🤖) y puede tener imprecisiones. leer el texto original 📑

Gerardo Fernández Noroña enfrenta interrogatorios de seguridad adicionales en aeropuertos estadounidenses debido a su apoyo al "Grupo de Amistad México-Rusia".

Un dato importante: Decenas de miles de personas salieron a las calles de Culiacán para exigir la renuncia de Rubén Rocha Moya tras el asesinato de Antonio Sarmiento y sus hijos.

El gobernador Rubén Rocha Moya miente al afirmar que puede ser removido de su cargo mediante la revocación de mandato, ya que la ley no es retroactiva y él omitió incluir un transitorio que lo incluyera.

KPMG Cárdenas Dosal continuará como auditor del Banco de México hasta 2028.