2 публикации маркиран с/със "Multi-Agent"

AILLMMachine LearningAutomationFinanceData ScienceMulti-Agent

M3MAD-Bench: Наистина ли са ефективни дебатите между множество агенти в различни области и модалности?

M3MAD-Bench подлага на стрес-тест дебатите между множество агенти (Multi-Agent Debate) в 9 модела, 5 области и визуално-езикови среди, установявайки, че колективната заблуда причинява 65% от неуспехите, състезателният дебат намалява точността с до 12,8%, а самосъгласуваността обикновено съответства на точността на дебата при по-ниска цена на токените.

AILLMAutomationBeancountFinanceReconciliationMulti-Agent

AutoGen: Многоагентни рамки за разговори за финансов ИИ

AutoGen (Wu et al., 2023) представя многоагентна рамка за разговори, при която агенти, базирани на LLM, си обменят съобщения за изпълнение на задачи; конфигурация с два агента повишава точността при MATH бенчмарка от 55% на 69%, а специализиран SafeGuard агент подобрява откриването на небезопасен код с до 35 F1 точки — констатации, пряко приложими за изграждането на безопасни, модулни тръбопроводи за автоматизация на Beancount.

Всичко за Multi-Agent

M3MAD-Bench: Наистина ли са ефективни дебатите между множество агенти в различни области и модалности?

AutoGen: Многоагентни рамки за разговори за финансов ИИ

Започнете с Beancount.io

Първи стъпки

Функции

Общност

Правни въпроси