Investigación
Nuevo Método SOP Mejora el Reconocimiento de Voz Multiparlante con LLMs
Investigadores presentan Serialized Output Prompting (SOP), una técnica que mejora significativamente la precisión del reconocimiento automático de voz (ASR) multiparlante basado en grandes modelos de lenguaje (LLMs). El método utiliza prompts estructurados extraídos del propio audio para guiar al LLM, logrando avances notables en escenarios complejos.