Al minuto

DeepSeek sufre tropezón por culpa de chips chinos




Las autoridades chinas alentaron a la compañía a utilizar los chips Ascend de Huawei en lugar de los de Nvidia, según Financial Times. 

 VCG / Gettyimages.ru La empresa china de inteligencia artificial DeepSeek ha pospuesto el lanzamiento de su nuevo modelo por no lograr entrenarlo con procesadores de Huawei, reporta Financial Times.

 Según tres fuentes del periódico al tanto del asunto, las autoridades chinas alentaron a DeepSeek después del lanzamiento de su modelo R1 en enero a adoptar los chips Ascend de Huawei en lugar de los de Nvidia. 

Sin embargo, durante el entrenamiento del modelo R2, la compañía se enfrentó a persistentes problemas técnicos con los procesadores de fabricación nacional. Finalmente, la empresa se vio obligada a combinar tecnologías: usar los chips de Nvidia para el entrenamiento y los de Huawei para la etapa de inferencia, es decir, el proceso en el que el modelo ya entrenado genera respuestas o realiza predicciones. 


 Esta dificultad fue la principal causa del retraso del lanzamiento del nuevo modelo R2, inicialmente previsto para mayo, lo que hizo que DeepSeek perdiera terreno frente a competidores. Otra causa que contribuyó al retraso fue el proceso de etiquetado de datos para la versión actualizada del modelo, que resultó más largo de lo previsto. El retraso coincidió con una nueva política de Pekín para reducir la dependencia tecnológica de Estados Unidos.

 Según Financial Times, el Gobierno del país asiático ha exigido a las empresas tecnológicas chinas que justifiquen sus pedidos de los chips Nvidia H20, en un intento de incentivar el uso de alternativas nacionales como las de Huawei y Cambricon.

 Expertos del sector han señalado que los procesadores chinos tienen problemas de estabilidad, menor velocidad de conexión entre chips y un 'software' menos avanzado en comparación con los productos de Nvidia. Para resolver parte de estos obstáculos, Huawei envió un equipo de ingenieros a las oficinas de DeepSeek para ayudar con el desarrollo del modelo R2, comentaron dos fuentes del periódico. 

No obstante, aseguraron que ni siquiera con ese apoyo directo se logró ejecutar con éxito una sesión completa de entrenamiento en los chips Ascend. Pese a ello, DeepSeek continúa colaborando con Huawei para que el modelo pueda ser compatible con estos procesadores en la fase de inferencia, agregaron los interlocutores del medio. Internamente, el fundador de la compañía, Liang Wenfeng, ha manifestado su descontento con los avances del R2 e intenta dedicar más tiempo a construir un modelo avanzado que pueda mantener su negocio en una posición de liderazgo en el campo de la inteligencia artificial.

Comparte esto:

Publicar un comentario

 
Copyright © Al Minuto. Diseñado por Agencia Eslabom y Agencia Eslabom