Publicidad

Este texto de Alberto Muñoz, escrito el 28 de enero de 2025, analiza el modelo de inteligencia artificial DeepSeek R1, desmintiendo mitos y aclarando su impacto real. Se destaca la importancia de la transparencia y la colaboración en el desarrollo de la IA.

El costo real de entrenar DeepSeek R1 fue mucho mayor a los 6 millones de dólares inicialmente rumoreados, involucrando 50.000 GPUs de alta gama.

Resumen:

  • El modelo de IA DeepSeek R1, respaldado por High-Flyer, un fondo de cobertura chino con activos superiores a 7 mil millones de dólares, se ha convertido en un referente tecnológico.
  • El costo de entrenamiento del modelo base fue significativamente superior a los 6 millones de dólares reportados inicialmente, requiriendo aproximadamente 50.000 GPUs NVIDIA H100 y una gran inversión en infraestructura y personal.
  • Publicidad

  • DeepSeek R1 utiliza una arquitectura innovadora basada en Mixture of Experts (MoE) con 671 mil millones de parámetros, lo que lo hace eficiente y especializado.
  • A diferencia de versiones más pequeñas como Qwen o Llama, DeepSeek R1 posee una capacidad y sofisticación superiores.
  • La versión alojada en chat.deepseek.com utiliza datos de usuario para entrenar nuevos modelos, según sus términos de servicio.
  • La contribución de DeepSeek R1 al código abierto y la comunidad científica ha sido significativa. Hugging Face está trabajando en una reproducción abierta de su entrenamiento.
  • Se especula sobre una posible relación entre DeepSeek R1 y la caída de las acciones de NVIDIA entre el 25 y 26 de enero de 2025, debido a la percepción de una menor dependencia del hardware de NVIDIA.
  • La reacción en redes sociales a las acusaciones de robo de datos ("cookies") ha sido mayoritariamente de ironía y escepticismo, considerando que esta práctica es común en la industria tecnológica.

Conclusión:

  • DeepSeek R1 representa un hito en la IA, demostrando el potencial de la colaboración y la innovación.
  • Su compromiso con el código abierto promueve la democratización del acceso a tecnologías avanzadas.
  • La polémica en torno a la recopilación de datos destaca la necesidad de un debate más informado y menos sensacionalista sobre la privacidad en el mundo digital.
  • El modelo es un ejemplo de lo que se puede lograr con recursos, talento y una visión clara, desafiando los límites tecnológicos actuales.
  • La innovación en DeepSeek R1 podría reducir el consumo de energía en el futuro.
Sección: Tecnología

 Este análisis con resumen se realiza con IA (🤖) y puede tener imprecisiones. leer el texto original 📑

Publicidad

Un dato importante es la solicitud de investigación por corrupción contra Arturo Ávila, portavoz de Morena, presentada por legisladores del PAN.

Un dato importante es la presión de Estados Unidos para que México elimine restricciones a la exportación de maíz transgénico y permita la inversión estadounidense en la exploración y obtención de litio.

Un dato importante es la presión de Estados Unidos sobre México para cumplir con 30 acciones de política pública antes de iniciar las negociaciones del T-MEC, so pena de sanciones comerciales y políticas.