paint-brush
Si (K-)SIF tejkalon FIF në zbulimin e anomalive të të dhënave realenga@computational

Si (K-)SIF tejkalon FIF në zbulimin e anomalive të të dhënave reale

Shume gjate; Te lexosh

(K-)SIF tregon avantazhe të qarta të performancës mbi FIF në zbulimin e anomalive të të dhënave reale, veçanërisht me fjalorin Brownian. SIF rezulton të jetë metoda më e fuqishme, duke arritur rezultatet më të mira në pesë grupe të dhënash pa u mbështetur në parametra të ndjeshëm.
featured image - Si (K-)SIF tejkalon FIF në zbulimin e anomalive të të dhënave reale
Computational Technology for All HackerNoon profile picture
0-item

Autorët:

(1) Guillaume Staerman, INRIA, CEA, Univ. Paris-Saclay, Francë;

(2) Marta Campi, CERIAH, Institut de l'Audition, Institut Pasteur, Francë;

(3) Gareth W. Peters, Departamenti i Statistikave dhe Probabiliteti i Aplikuar, Universiteti i Kalifornisë Santa Barbara, SHBA.

Tabela e lidhjeve

Abstrakt dhe 1. Hyrje

2. Sfondi & Paraprak

2.1. Pyll Funksional Izolues

2.2. Metoda e Nënshkrimit

3. Metoda e pyllit të izolimit të nënshkrimit

4. Eksperimente numerike

4.1. Analiza e ndjeshmërisë së parametrave

4.2. Avantazhet e (K-)SIF mbi FIF

4.3. Standardi i zbulimit të anomalive të të dhënave reale

5. Diskutim & Përfundim, Deklarata të Ndikimit dhe Referenca


Shtojca

A. Informacion shtesë rreth nënshkrimit

B. Algoritmet K-SIF dhe SIF

C. Eksperimente numerike shtesë

4.3. Standardi i zbulimit të anomalive të të dhënave reale

Për të vlerësuar efektivitetin e algoritmeve të propozuara (K-)SIF dhe për të ofruar një krahasim me FIF, ne kryejmë një analizë krahasuese duke përdorur dhjetë grupe të dhënash për zbulimin e anomalive të ndërtuara në Staerman et al. (2019) dhe me burim nga depoja e UCR (Chen et al., 2015). Në ndryshim nga Staerman et al. (2019), ne nuk përdorim një pjesë trajnimi/testimi pasi etiketat nuk përdoren për trajnimin dhe modelet e trajnojnë dhe vlerësojnë vetëm në të dhënat e trajnimit. Ne vlerësojmë performancën e algoritmeve duke përcaktuar sasinë e AUC nën kurbat ROC.



Tabela 1: AUC e metodave të ndryshme të zbulimit të anomalive të llogaritura në grupin e testimit. Numrat e theksuar korrespondojnë me rezultatin më të mirë.


Nga njëra anë, Figura 4 ilustron pabarazinë e performancës midis FIF dhe K-SIF duke përdorur fjalorin Brownian. Veçanërisht, K-SIF shfaq një avantazh të rëndësishëm të performancës ndaj FIF. Ky vëzhgim nënvizon efektivitetin e kernelit të nënshkrimit në përmirësimin e performancës së FIF në shumicën e grupeve të të dhënave, duke theksuar avantazhet e përdorimit të tij ndaj një produkti të thjeshtë të brendshëm. Nga ana tjetër, duke marrë parasysh ndërlikimin e të dhënave funksionale, asnjë metodë unike nuk pritet të jetë më e mirë se të tjerët në mënyrë universale.


Megjithatë, SIF demonstron performancë të fortë në shumicën e rasteve, duke arritur rezultatet më të mira për pesë grupe të dhënash. Ndryshe nga FIF dhe K-SIF, ai tregon qëndrueshmëri ndaj shumëllojshmërisë së grupeve të të dhënave, ndërsa nuk ndikohet në mënyrë drastike nga zgjedhja e parametrave të përfshirë në FIF (fjalor dhe produkt i brendshëm) dhe K-SIF (fjalor).


Ky dokument është i disponueshëm në arxiv nën licencën CC BY 4.0 DEED.


L O A D I N G
. . . comments & more!

About Author

Computational Technology for All HackerNoon profile picture
Computational Technology for All@computational
Computational: We take random inputs, follow complex steps, and hope the output makes sense. And then blog about it.

VARUR TAGS

KY ARTIKU U PARAQIT NË...