پرش به محتوای اصلی
Accounting

همه چیز درباره Accounting

2 مقاله
Accounting methods, workflows, and automation research

هوش مصنوعی قانون‌مند برای عوامل حسابداری: RLAIF، قوانین خط‌مشی و ریسک‌های گودهارت

مقاله هوش مصنوعی قانون‌مند آنتروپیک (بای و همکاران، ۲۰۲۲) مدل‌های زبانی بزرگ را آموزش می‌دهد تا با استفاده از بازخوردهای تولید شده توسط هوش مصنوعی به جای برچسب‌های آسیب انسانی، از قوانین پیروی کنند. این گزارش تحقیقاتی بررسی می‌کند که چگونه خط لوله نقد-بازبینی-ترجیح RLAIF بر ایمنی بازنویسی برای عوامل خودکار دفترکل Beancount منطبق می‌شود — و زمانی که «قانون اساسی» به جای مجموعه‌ای از قوانین اخلاقی، یک چارت حساب‌ها باشد، گودهارتینگ، شکست‌های کالیبراسیون و ریسک‌های استفاده دوگانه چگونه به نظر می‌رسند.

بنچ‌مارک FinMaster: چرا مدل‌های زبانی بزرگ در سواد مالی امتیاز ۹۶٪ اما در تولید صورت‌های مالی امتیاز ۳٪ کسب می‌کنند

بنچ‌مارک FinMaster (arXiv:2505.13533) مدل‌های o3-mini، Claude 3.7 Sonnet و DeepSeek-V3 را در ۱۸۳ وظیفه مالی ارزیابی می‌کند—و نشان می‌دهد که این مدل‌ها در سواد مالی امتیاز ۹۶٪ کسب می‌کنند اما در تولید صورت‌های مالی به ۳٪ سقوط می‌کنند، و در وظایف مشاوره‌ای چند مرحله‌ای به دلیل انتشار خطا، ۲۱ واحد از دقت خود را از دست می‌دهند.