Ciencia

¡Increíble! Microsoft desarrolla una IA que resuelve problemas matemáticos como un genio

2025-01-13

Autor: Joaquín

Microsoft ha dado un paso monumental en el ámbito de la inteligencia artificial con el lanzamiento de rStar-Math, una innovadora técnica de razonamiento que promete transformar la manera en que las máquinas abordan problemas matemáticos complejos. El gigante tecnológico ha declarado que esta nueva técnica permite a los modelos de lenguaje pequeños (SLM) superar incluso a los más grandes modelos de inteligencia artificial, como el famoso GPT-3 de OpenAI.

Una publicación reciente en Hugging Face resalta que rStar-Math desafía la creencia común de que se requieren modelos enormes para lograr un razonamiento matemático efectivo. Lo más sorprendente es que esta técnica alcanza resultados sorprendentes sin depender de la costosa práctica de la destilación de conocimiento, que consume enormes recursos de computación.

Históricamente, los SLM han enfrentado retos significativos al realizar tareas de razonamiento matemático, debido a su incapacidad para llevar a cabo procesos lógicos paso a paso con justificaciones adecuadas. Sin embargo, rStar-Math aborda este problema de forma innovadora a través de la búsqueda de árbol de Monte Carlo (MCTS). Esta técnica permite que el SLM explore diversas rutas hacia la solución, simulando un profundo proceso de reflexión.

Lo que distingue a rStar-Math es su enfoque en la comprensión profunda del contenido. En lugar de simplemente proporcionar respuestas, la IA genera una cadena de pensamiento que incluye explicaciones en lenguaje natural para cada paso del proceso, junto con el código real en Python que ejecuta la solución, lo que añade un nivel de transparencia y entendimiento al funcionamiento de la IA.

Los resultados hablan por sí mismos: rStar-Math ha logrado incrementar significativamente la precisión de varios SLM en el conjunto de datos MATH. Por ejemplo, la precisión del modelo Qwen-7B ha escalado de un 58,8% a un impresionante 90,0%, mientras que Phi 3-mini ha llegado a un 86,4%. Estos logros no solo superan a sus versiones anteriores, sino que también sitúan a estos modelos al nivel de compitencia con los modelos de lenguaje de OpenAI.

¿Cómo opera rStar-Math para conseguir tales resultados? Esta innovadora técnica combina dos modelos pequeños para trabajar en sinergia. El primer modelo, denominado "SLM de política", se encarga de determinar los pasos a seguir para resolver un problema, mientras que el "modelo de preferencia de proceso" (PPM) evalúa la efectividad de cada paso sin la necesidad de etiquetado manual previo.

El secreto del éxito de rStar-Math radica en su método de entrenamiento colaborativo. Esta técnica permite que los modelos se mejoren mutuamente a través de un proceso de 'evolución' en múltiples rondas de aprendizaje, aprovechando millones de ejemplos de problemas resueltos para perfeccionar sus capacidades de razonamiento.

Con estos avances, Microsoft no solo demuestra que los modelos más pequeños y eficientes pueden ser igualmente competentes, sino que podrían superar a los modelos más grandes en tareas complejas como el razonamiento matemático. Aunque esta tecnología aún se encuentra en fase de investigación, los resultados preliminares sugieren que los SLM podrían representar una alternativa viable a los modelos de lenguaje de mayor tamaño en la resolución de problemas. ¡Prepárate para un futuro donde las IA resuelven problemas matemáticos como nunca antes!