Nuevas Capacidades de AMD ROCm™ 6.1: Desbloquea el Potencial de los Aceleradores AMD Instinct™

Cuando creamos la plataforma de software de código abierto AMD ROCm™ 6, nuestro objetivo era diseñar un entorno que permitiera aprovechar al máximo el rendimiento y las capacidades de los aceleradores AMD Instinct™. Al mismo tiempo, queríamos cumplir con nuestro compromiso con las soluciones de código abierto e independientes del dispositivo. Piense en ROCm 6 como el puente entre sus mayores ideas de IA y su implementación exitosa. Ofrece una compatibilidad excepcional con los marcos líderes de la industria y brinda a los desarrolladores la flexibilidad de innovar a su propio ritmo, probando e implementando aplicaciones en una amplia gama de arquitecturas de GPU.

Nuestra última actualización de la plataforma, ROCm 6.1, presenta numerosas capacidades tanto para desarrolladores como para investigadores. ROCm 6.1 amplía las fortalezas principales de ROCm 6, admitiendo las últimas GPU AMD Instinct™ y Radeon™, aumentando las optimizaciones en numerosos dominios computacionales y ampliando el soporte del ecosistema para seguir el ritmo de los rápidos avances en marcos de IA. Las nuevas funciones y correcciones proporcionadas por ROCm 6.1 están diseñadas para mejorar la estabilidad y el rendimiento de las aplicaciones, permitiendo a los desarrolladores de IA y HPC explorar los límites más lejanos de lo posible.

Presentamos rocDecode para Procesamiento de Video: Decodificación de Alto Rendimiento en GPU

QUIZAS TE PUEDA INTERESAR: AMD FSR 3.1 Ya Disponible: Próximamente en 60 Juegos

rocDecode es la nueva biblioteca ROCm que permite la decodificación de video de alto rendimiento directamente en la GPU, aprovechando los motores de medios especializados, conocidos como Video Core Next (VCN), integrados en las GPU de AMD. Estos decodificadores basados en hardware manejan transmisiones de video de manera eficiente.

rocDecode permite decodificar video comprimido directamente en la memoria de video, minimizando las transferencias de datos a través del bus PCIe y eliminando cuellos de botella comunes en el procesamiento de video. Esta capacidad permite el posprocesamiento instantáneo con el marco ROCm HIP, esencial para aplicaciones en tiempo real como escalado de video, conversión de color y aumento, cruciales para análisis avanzados, inferencias y capacitación en aprendizaje automático.

rocDecode maximiza la eficiencia y la escalabilidad de las tareas de decodificación de video. Al permitir la creación de múltiples instancias de decodificador que pueden operar en paralelo, la API aprovecha al máximo todas las VCN disponibles en un dispositivo GPU. Esta capacidad de procesamiento en paralelo ayuda a garantizar que incluso transmisiones de video de gran volumen se puedan decodificar y procesar simultáneamente. En resumen, rocDecode refuerza el flujo de procesamiento de video, permitiendo obtener ganancias de rendimiento y mejoras en la eficiencia energética esenciales para las aplicaciones modernas de IA y HPC.

Nuevo en MIGraphX: Flash Attention y Soporte de Backend de PyTorch

MIGraphX es el motor de inferencia de gráficos de AMD, diseñado para acelerar las redes neuronales de aprendizaje profundo. MIGraphX es accesible a través de interfaces como API de C++, API de Python y la herramienta de línea de comandos migraphx-driver. Esta flexibilidad permite a los desarrolladores integrar fácilmente capacidades avanzadas de inferencia de modelos en sus aplicaciones.

ROCm 6.1 mejora el rendimiento de los modelos basados en transformadores con soporte para Flash Attention, aumentando la eficiencia de la memoria en modelos populares como BERT, GPT y Stable Diffusion. Esto garantiza un procesamiento más rápido y eficiente en el uso de energía para redes neuronales complejas.

ROCm 6.1 también agrega una nueva biblioteca Torch-MIGraphX, que integra las capacidades de MIGraphX directamente en los flujos de trabajo de PyTorch. Define un backend «migraphx» que se puede usar directamente con la API de torch.compile. La biblioteca Torch-MIGraphX admite una variedad de tipos de datos, incluidos FP32, FP16 e INT8, adaptándose a diversas necesidades computacionales.

MAS INFORMACION: [AMD BLOG]