بررسی جامع تشخیص ناهنجاری با مدلهای زبانی بزرگ (NAACL 2025): طبقهبندی قوی، غیبت پوشش دادههای جدولی
سه مطلب قبلی در این رشته، به AnoLLM، CausalTAD و AD-LLM اختصاص داشت که هر کدام بهطور خاص تشخیص ناهنجاری در دادههای جدولی را هدف قرار داده بودند. این بررسی جامع توسط روئییاو شو و کایزه دینگ که در یافتههای NAACL 2025 پذیرفته شده است، قرار بود این رشتهها را در یک نقشه چشمانداز واحد به هم متصل کند. من انتظار طبقهبندیای را داشتم که فضای طراحی را شفاف کند؛ اما آنچه به دست آوردم عمدتاً بررسی تشخیص ناهنجاری در تصاویر و ویدئوها با لایهای نازک از کلیگویی بود.
مقاله
بررسی شو و دینگ (arXiv:2409.01980) پیشنهاد میکند که تشخیص ناهنجاری و تشخیص دادههای خارج از توزیع (OOD) مبتنی بر LLM به دو کلاس سطح بالا سازماندهی شوند: LLMها برای تشخیص (Detection)، که در آن مدل مستقیماً ناهنجاریها را شناسایی میکند، و LLMها برای تولید (Generation)، که در آن مدل دادههای آموزشی را تقویت میکند یا توضیحات به زبان طبیعی ارائه میدهد که به یک تشخیصدهنده در پاییندست خوراک میدهد. هر کلاس بیشتر تقسیم میشود. تشخیص به روشهای مبتنی بر پرامپت (LLMهای منجمد یا تنظیمشده که با پرامپتهای زبان طبیعی فراخوانی میشوند) و روشهای مبتنی بر تضاد (مدلهای خانواده CLIP که با مقایسه قطعات تصویر با توضیحات متنی، ناهنجاری را امتیازدهی میکنند) تقسیم میشود. تولید به روشهای مبتنی بر تقویت داده (تولید برچسبهای شبه-OOD یا نمونههای اقلیت مصنوعی) و روشهای مبتنی بر توضیح (تولید منطقهای زبان طبیعی برای رویدادهای علامتگذاری شده) تقسیم میشود.
لیست مطالعه همراه در گیتهاب حدود ۳۹ مقاله را پوشش میدهد: ۲۴ مقاله در تشخیص، ۱۰ مقاله در تقویت داده و ۵ مقاله در توضیح.