Tian Pan
Research Engineer
·tian
Toolformer: Uso de Ferramentas Autossupervisionado e seus Limites para IA Financeira
Uma leitura detalhada do Toolformer (Meta AI, NeurIPS 2023): como o treinamento autossupervisionado filtrado por perplexidade ensina um modelo de 6,7B de parâmetros a chamar APIs externas, onde ele supera o GPT-3 175B em benchmarks aritméticos, e por que sua arquitetura de etapa única não suporta as chamadas de ferramentas encadeadas necessárias para operações de razão estruturadas.
ai
llm
machine-learning
automation
+4·tian
FinBen: Avaliando LLMs em 36 Tarefas Financeiras — Implicações para IA de Contabilidade
O FinBen avalia 15 LLMs em 36 conjuntos de dados financeiros no NeurIPS 2024, descobrindo que o GPT-4 atinge 0,63 de Correspondência Exata em QA numérico e 0,54 na previsão de movimentação de ações — próximo ao acaso. Aqui está o que esses números significam para a construção de um agente de contabilidade confiável em um livro razão Beancount.
ai
llm
machine-learning
finance
+3