跳到主要内容
Financial Statements

关于一切 Financial Statements

3 篇文章
Balance sheet, income statement, and cash-flow generation research

FinMaster 基准测试:为何大语言模型在金融素养上得分 96%,但在报表生成上仅为 3%

FinMaster (arXiv:2505.13533) 对 o3-mini、Claude 3.7 Sonnet 和 DeepSeek-V3 在 183 项金融任务中进行了基准测试——揭示了模型在金融素养方面得分 96%,但在报表生成方面暴跌至 3%,多步咨询任务由于错误传播导致准确率下降了 21 个百分点。