paint-brush
Hoe (K-)SIF beter as FIF presteer in Real-Data Anomalie Detectiondeur@computational

Hoe (K-)SIF beter as FIF presteer in Real-Data Anomalie Detection

Te lank; Om te lees

(K-)SIF toon duidelike prestasievoordele bo FIF in die opsporing van werklike data-anomalie, veral met die Brownse woordeboek. SIF blyk die mees robuuste metode te wees, wat die beste resultate op vyf datastelle behaal sonder om op sensitiewe parameters staat te maak.
featured image - Hoe (K-)SIF beter as FIF presteer in Real-Data Anomalie Detection
Computational Technology for All HackerNoon profile picture
0-item

Skrywers:

(1) Guillaume Staerman, INRIA, CEA, Univ. Parys-Saclay, Frankryk;

(2) Marta Campi, CERIAH, Institut de l'Audition, Institut Pasteur, Frankryk;

(3) Gareth W. Peters, Departement Statistiek en Toegepaste Waarskynlikheid, Universiteit van Kalifornië Santa Barbara, VSA.

Tabel van skakels

Abstrakte en 1. Inleiding

2. Agtergrond & Voorlopige

2.1. Funksionele isolasiebos

2.2. Die handtekeningmetode

3. Handtekening Isolasie Bos Metode

4. Numeriese Eksperimente

4.1. Parameters Sensitiwiteitsanalise

4.2. Voordele van (K-)SIF bo FIF

4.3. Reële data Anomalie Detection Benchmark

5. Bespreking en gevolgtrekking, impakverklarings en verwysings


Bylaag

A. Bykomende inligting oor die handtekening

B. K-SIF en SIF Algoritmes

C. Addisionele Numeriese Eksperimente

4.3. Reële data Anomalie Detection Benchmark

Om die doeltreffendheid van die voorgestelde (K-)SIF-algoritmes te evalueer en 'n vergelyking met FIF te verskaf, voer ons 'n vergelykende analise uit met behulp van tien anomalie-opsporingsdatastelle wat in Staerman et al. (2019) en verkry vanaf die UCR-bewaarplek (Chen et al., 2015). In teenstelling met Staerman et al. (2019), gebruik ons nie 'n opleiding-/toetsdeel nie, aangesien die etikette nie vir die opleiding gebruik word nie en modelle oplei en evalueer slegs op die opleidingsdata. Ons evalueer die algoritmes se prestasie deur die AUC onder die ROC-krommes te kwantifiseer.



Tabel 1: AUC van verskillende anomalie-opsporingsmetodes bereken op die toetsstel. Vet nommers stem ooreen met die beste resultaat.


Aan die een kant illustreer Figuur 4 die prestasieverskil tussen FIF en K-SIF deur die Brownse woordeboek te gebruik. Veral, K-SIF toon 'n beduidende prestasievoordeel bo FIF. Hierdie waarneming onderstreep die doeltreffendheid van die handtekeningkern in die verbetering van FIF se werkverrigting oor die meeste datastelle, en beklemtoon die voordele van die gebruik daarvan bo 'n eenvoudige innerlike produk. Aan die ander kant, met inagneming van die ingewikkeldheid van funksionele data, word daar van geen unieke metode verwag om ander universeel beter te presteer nie.


SIF toon egter sterk prestasie in die meeste gevalle, wat die beste resultate vir vyf datastelle behaal. In teenstelling met FIF en K-SIF, toon dit robuustheid teenoor die verskeidenheid datastelle terwyl dit nie drasties beïnvloed word deur die keuse van die parameters betrokke by FIF (woordeboek en binneproduk) en K-SIF (woordeboek).


Hierdie vraestel is beskikbaar op arxiv onder CC BY 4.0 DEED-lisensie.