Tian Pan
Research Engineer
Toolformer: Uso de herramientas autosupervisado y sus límites para la IA financiera
Una lectura detallada de Toolformer (Meta AI, NeurIPS 2023): cómo el entrenamiento autosupervisado filtrado por perplejidad enseña a un modelo de 6.700 millones de parámetros a llamar a APIs externas, donde supera a GPT-3 de 175.000 millones en pruebas de aritmética, y por qué su arquitectura de un solo paso no puede admitir las llamadas a herramientas encadenadas necesarias para operaciones de libros contables estructurados.
FinBen: Evaluación comparativa de LLM en 36 tareas financieras — Implicaciones para la IA contable
FinBen evalúa 15 LLM en 36 conjuntos de datos financieros en NeurIPS 2024, encontrando que GPT-4 alcanza un 0,63 de Coincidencia Exacta en preguntas y respuestas numéricas y 0,54 en la predicción del movimiento de acciones, cerca del azar. He aquí lo que significan esas cifras para construir un agente contable fiable en un libro mayor de Beancount.