Tian Pan

Research Engineer

April 16, 2026·tian

Toolformer: استفاده از ابزار بصورت خود-نظارتی و محدودیت‌های آن برای هوش مصنوعی مالی

بررسی دقیق Toolformer (Meta AI, NeurIPS 2023): چگونه آموزش خود-نظارتی فیلتر شده با پرپلکسیتی به یک مدل ۶.۷ میلیارد پارامتری یاد می‌دهد تا APIهای خارجی را فراخوانی کند، جایی که در بنچمارک‌های محاسباتی از GPT-3 175B پیشی می‌گیرد، و چرا معماری تک‌مرحله‌ای آن نمی‌تواند از فراخوانی‌های زنجیره‌ای ابزار مورد نیاز برای عملیات دفترداری ساختاریافته پشتیبانی کند.

llm

machine-learning

April 15, 2026·tian

FinBen: ارزیابی مقایسه‌ای مدل‌های زبانی بزرگ در ۳۶ وظیفه مالی — پیامدهایی برای هوش مصنوعی در حسابداری

FinBen ۱۵ مدل زبانی بزرگ را در ۳۶ مجموعه داده مالی در NeurIPS 2024 ارزیابی می‌کند و نشان می‌دهد که GPT-4 در پرسش و پاسخ عددی به تطابق دقیق ۰.۶۳ و در پیش‌بینی حرکت سهام به ۰.۵۴ می‌رسد که نزدیک به شانس است. در اینجا معنای این اعداد برای ساخت یک عامل حسابداری قابل اعتماد در دفترکل Beancount آورده شده است.

llm

machine-learning