Investigación
Decodificación Especulativa: La Clave para Acelerar el Razonamiento de los Grandes Modelos de Lenguaje
Un nuevo *benchmark* revela que la decodificación especulativa, especialmente los métodos basados en n-gramas, puede acelerar significativamente el razonamiento de los **Grandes Modelos de Lenguaje (LLMs)** durante la fase de inferencia, optimizando técnicas como **Best-of-N** y el **pensamiento multi-ronda**.