paint-brush
Kokoma na yo Ezali na empreinte ya mosapi —Mpe Modèle Oyo ya AI ya sika Ekoki Komona Yangopene@authoring
Lisolo ya sika

Kokoma na yo Ezali na empreinte ya mosapi —Mpe Modèle Oyo ya AI ya sika Ekoki Komona Yango

pene Authoring5m2025/03/07
Read on Terminal Reader

Molai mingi; Mpo na kotánga

Bolukiluki oyo ezali kokotisa lolenge ya sika ya bomonisi ya bokomi na kosalelaka ba structures grammatiques oyo euti na ba parseurs ya langue naturelle. Na ko analyser ba modèles syntaxiques basées na nzete, approche eleki ba techniques ya stylométrie ya bonkoko, epesi nzela ya makasi ya kokesenisa bakomi ya solo na texte oyo esalemi na AI to oyo emekolami.
featured image - Kokoma na yo Ezali na empreinte ya mosapi —Mpe Modèle Oyo ya AI ya sika Ekoki Komona Yango
Authoring HackerNoon profile picture
0-item

Bakomi:

(1) Todd K. Moon, Departema ya Ingénierie électrique mpe ya ordinatɛrɛ, Iniversite ya etúká ya Utah, Logan, Utah;

(2) Jacob H. Gunther, Departema ya Ingénierie électrique mpe ya ordinateur, Iniversite ya Etat ya Utah, Logan, Utah.

Tableau ya ba Liens

Abstract mpe 1 Maloba ya ebandeli mpe makambo ya kala

2 Parsing statistique mpe makambo oyo elongolami

3 Makambo ya nzete ya Parse

4 Moto oyo azali kosala classification

5 Bokiti ya Dimension

6 Mikanda ya Fédéraliste

6.1 Sanditon, oyo azali

7 Bosukisi, Masolo, mpe Mosala oyo ekosalema na mikolo ezali koya

R. Maloba ya ebandeli mokuse na ntina na bopanzi sango ya statistiki

B. Bokiti ya bonene: Mwa makambo ya mikemike ya matematiki

Ba références

Emonanaka te

Na boumeli ya bambula, bato bazali kokoba koluka koyeba bokomi ya makomi na kotalela bizaleli ya mituya ya makomi, na ndakisa na kosalelaka ba taux ya bokutani ya maloba oyo ezali na contexte te. Na misala oyo eleki, basalelaki mayele yango, na ndakisa, mpo na koyeba soki bakomi mikanda nyonso oyo babengi The Federalist Papers. Ba méthodes ya boye ekoki kozala na tina na tango ya mikolo oyo pona ko détecter faux to AI auteur. Bokoli na ba parseurs ya langue naturelle statistique ekotisaka possibilité ya kosalela structure grammatique pona ko détecter auteur. Na mokanda oyo tozali kotala likoki ya sika mpo na koyeba bokomi na kosalelaka ba sango ya structure grammatique oyo ezuami na kosalelaka parser ya langue naturelle statistique. Mokanda oyo epesi preuve ya concept, komeka classification ya mokomi oyo esalemi na structure grammatique na ensemble ya « textes de preuve », The Federalist Papers na Sanditon oyo ezalaki lokola ba cas ya test na ba études ya détection ya auteur ya kala. Ba éléments ebele oyo ezuami na parser ya langue naturelle statistique e exploré : ba sous-arbres nionso ya mwa bozindo uta na niveau nionso ; banzete ya mikemike oyo ezali na misisa ya mwa bozindo, ndambo ya elobeli, mpe ndambo ya elobeli na nivo na nzete ya parse. Emonanaki ete ezalaki na litomba mpo na kosala projection ya makambo yango na esika oyo ezali na dimension ya nse. Ba expériences statistiques na mikanda wana elakisaka que ba informations oyo ewutaka na parser statistique ekoki, en fait, kosunga na kokesenisa bakomi.

1 Maloba ya ebandeli mpe makambo oyo esalemaki

Milende mingi esalemi na boumeli ya bambula oyo etali kosalela mayele ya mituya mpo na koyeba moto oyo akomaki makomi, na kotalela bandakisa oyo euti na bakomi oyo balingi kokoma, na oyo babengaka ntango mosusu “stylométrie” to “koyeba moto oyo akomaki.” Analyse statistique ya mikanda ebandi na Augustus de Morgan na 1851 [1, lok. 282], [2, lok. 166], oyo apesaki likanisi ete bakoki kosalela mituya ya bolai ya maloba mpo na koyeba moto oyo akomaki mikanda ya Paulo. Stylométrie esalelamaki banda 1901 mpo na koluka koyeba ndenge Shakespeare akomaki [3]. Uta ntango wana, esalelami na boyekoli ndenge na ndenge ya mikanda (tala, ndakisa [4, 5, 6]), bakisa mpe zomi na mibale ya The Federalist Papers oyo ezalaki ya bokomi oyo eyebani te [7] — oyo tozali kotalela lisusu awa — mpe buku moko oyo esilaki te ya Jane Austen —oyo tozali mpe kotalela lisusu awa. Ba techniques théoriques ya information esalelami pe kala mingi te [8]. Mosala ya liboso na stylométrie esalemaki na “maloba oyo ezali na contexte te,” maloba oyo ezali kopesa ndimbola ya libosoliboso ya makomi te, kasi oyo esalaka na nsima ya makomi mpo na kopesa ebongiseli mpe koleka. Maloba oyo ezali na contexte te ezali ata moke te oyo ekoki kondimama, mpamba te mokomi akoki kolobela mitó ya makambo ndenge na ndenge, yango wana maloba ya kokesenisa bato mosusu ezali mpenza te komonisa moto oyo akomaki yango. Na boyekoli ya maloba oyo ezali na contexte te, ensemble ya maloba oyo emonanaka mingi oyo ezali na contexte te eponami [2], mpe mikanda elakisami na motango ya maloba, to ba rapports ya motango ya maloba na bolai ya mikanda. Botali lisusu ya ba méthodes statistiques ezali na [9]. Lokola mbongwana, ba ensembles ya ba rapports ya ba comptes ya ba modèles ya maloba non contextuel na ba modèles ya maloba misusu esalemi pe [10]. Analyse statistique oyo esalemi na taille ya vocabulaire ya mokomi vs. longueur ya document — « richesse ya vocabulaire » — e exploré pe [11]. Mpo na mosala mosusu oyo etali yango, talá [12, 13, 14, 15].

Mokanda moko ya sika koleka [16] etaleli bokasi ya ba ensembles ya makambo ndenge na ndenge. Ba ensembles ya ba fonctionnalités oyo etalelami kuna ezali : ba vecteurs oyo ezali na ba fréquences ya ba pronoms; maloba ya mosala (elingi koloba, masolo, bapronom, ba particules, ba explétifs); eteni ya maloba (POS); maloba oyo bato mingi basalelaka; makambo ya syntaxe (na ndakisa fraze ya nkombo, to fraze ya verbe); to ntango (ndakisa kosalela ntango ya lelo to ya kala); mongongo (actif ya passive). Na [16], ba vecteurs ya éléments esalemi na ba combinaisons ya ba histogrammes, sima ekitisami na dimensionnalité na nzela ya processus ya deux étapes ya analyse ya composante ya principe [17] elandi na réduction ya dimension na nzela ya analyse discriminante linéaire (LDA). Na LDA na bango, matrice ya bopanzani na kati ya cluster ezali singulier (na tina ya dimension ya likolo ya ba vecteurs ya fonctionnalité par rapport na nombre ya ba vecteurs ya formation oyo ezali), yango wana matrice ya dispersion na bango ezali régularisée. Mpo na komeka yango, bakomi batalelaka molongo ya ba paramètres ya régularisation, kopona moko oyo epesaka performance ya malamu koleka.


Mosala ya sika [18] elobeli anketi na [15] oyo makambo oyo esalelamaka mingi na esika ya bokomi ezali maloba mpe bilembo n-grammes. Ndenge emonisami, ezali na makama oyo ba méthodes statistiques ekoki kozala na bias na ba modèles oyo etali sujet. Lokola [18] bamoni yango, “moto oyo azali kokabola bokomi (ata oyo emonani lokola ete ezali malamu) akoki kosuka na kosala na nko te kosala identification ya sujet soki basaleli makambo oyo etali domaine. ... Mpo na kokima likambo oyo, balukiluki bakoki kopekisa bonene na bango na makambo oyo ezali polele ete ezali na ntina te na likambo, lokola maloba ya mosala to makambo ya syntaxie.” Mosala oyo elakisami awa ekoti na catégorie ya suka, kosalelaka ba structures grammatiques oyo ezuami na statistique na texte. Emonani ete ezali mpasi mpo na kosala makambo yango na lokuta. Botali ya misala misusu ya sika [19, 20] elakisi ete ezali na bosepeli oyo ezali kokoba na mayele ya koyeba mokomi, kasi moko te oyo ezali kosalela ba structures grammatiques oyo esalelami awa; ezali na momeseno ya kotya motema mingi na ba n-grammes ya bonkoko.


Na mosala oyo ba vecteurs ya ba éléments ezuami na kosalelaka ba informations ya nzete oyo ewutaka na ba nzete ya parse oyo ewutaka na esaleli ya parse ya langue naturelle [21]. Makambo yango ezalaki te kati na makambo oyo etalelamaki na [16]. Emonani ete bibongiseli ya gramere ezali na mayele mabe koleka kotánga ya pɛtɛɛ ya bakelasi ya maloba, mpe na yango ekoki kozala mingi te na makambo ya lokuta to ya kotyola motó ya likambo, mpamba te emonani ete ekoki kosalema te ete mokomi oyo azali na mokano ya komekola mosusu akozala na likoki ya kolandela na boyokani ndenge ya mindɔndɔmindɔndɔ ya kosalela, mpe makambo oyo ezali na kati ezali na maloba moko te oyo euti na mikanda yango. Emonani ete makambo oyo esalemi na nzete esalaka malamu koleka makambo ya POS na ba données ya test oyo etalelami.


Ba vecteurs ya fonctionnalités oyo ezuami boye ekoki kozala ya dimension ya likolo mingi, yango wana réduction ya dimension esalemaka pe awa. Kasi, pona kosala na bomoko ya matrice ya bopanzani na kati ya cluster, basalelaka ndenge ya SVD généralisé, oyo ezali koboya bosenga ya kopona paramètre ya régularisation.


Mokanda oyo epesi elembeteli ya makanisi ya makambo oyo esalemi na banzete mpo na kokesenisa bokomi na kosalelaka yango na mikanda oyo etalelamaki liboso, The Federalist Papers mpe Sanditon. Likoki ya ko classer na auteur e exploré pona ba vecteurs ya ba éléments ebele oyo ezuami na ba informations parsées.


Mokanda oyo ezali na arxiv na nzela ya licence CC BY 4.0 DEED.


L O A D I N G
. . . comments & more!

About Author

Authoring HackerNoon profile picture
Authoring@authoring
Shaping stories, Authoring brings ideas to life, crafting narratives that inspire and leave a lasting legacy.

KOKANGA BA ÉTIQUES

ARTICLE OYO EZALAKI PRESENTE NA...