4 публикации маркиран с/със "Fintech"

AILLMAutomationBeancountFintechMachine LearningReconciliation

FinMCP-Bench: Сравнителен анализ на LLM агенти за реално използване на финансови инструменти под MCP

FinMCP-Bench оценява шест LLM модела върху 613 задачи за използване на финансови инструменти в реалния свят, поддържани от 65 MCP сървъра — най-добрият модел постига 3,08% точно съвпадение при многократни задачи, разкривайки 20-кратен срив в производителността от сценарии с един инструмент към многократни такива.

LLMAIFinanceFintechAutomationBeancountMachine Learning

FinTrace: Оценка на ниво траектория при извикване на инструменти от LLM за финансови задачи

FinTrace тества 13 големи езикови модела (LLM) върху 800 експертно анотирани траектории на финансови задачи по 9 метрики, установявайки, че водещите модели постигат силен подбор на инструменти (F1 ~0.9), но получават само 3.23/5 за използване на информация — етапът, в който агентите разсъждават върху върнатите от инструментите резултати.

AILLMAutomationMachine LearningFintechBeancountComplianceData Science

FinToolBench: Оценяване на LLM агенти при използване на финансови инструменти в реалния свят

FinToolBench съчетава 760 реални финансови API инструмента с 295 изпълними заявки за тестване на LLM агенти върху финансови задачи от реалния свят – установявайки, че консервативният процент на извикване от 22,7% на GPT-4o води до по-високо качество на отговорите (CSS 0,670) спрямо агресивния TIR от 87,1% на Qwen3-8B, докато несъответствието в намеренията надвишава 50% при всички тествани модели.

LLMAIMachine LearningFinanceFintechBeancountPlain-Text Accounting

BloombergGPT и границите на специализираните LLM в областта на финансите

Bloomberg обучи LLM с 50 милиарда параметри върху корпус от 569 милиарда токена финансови данни и победи общите модели в бенчмарковете за сентимент анализ и логически изводи върху таблици — след което GPT-4 го настигна без никакво специализирано финансово обучение. Какво разкрива този експеримент за 10 милиона долара относно компромисите при тясно специализираното предварително обучение, токенизацията на числата и защо използването на външни инструменти е по-надеждно от вътрешната логика на модела за счетоводни агенти.

Всичко за Fintech

FinMCP-Bench: Сравнителен анализ на LLM агенти за реално използване на финансови инструменти под MCP

FinTrace: Оценка на ниво траектория при извикване на инструменти от LLM за финансови задачи

FinToolBench: Оценяване на LLM агенти при използване на финансови инструменти в реалния свят

BloombergGPT и границите на специализираните LLM в областта на финансите

Започнете с Beancount.io

Първи стъпки

Функции

Общност

Правни въпроси