paint-brush
OpenCitations Meta: Schlussfolgerung, Danksagungen und Referenzenvon@categorize
131 Lesungen

OpenCitations Meta: Schlussfolgerung, Danksagungen und Referenzen

Zu lang; Lesen

featured image - OpenCitations Meta: Schlussfolgerung, Danksagungen und Referenzen
Categorize.Tech: Organizing the World of Software HackerNoon profile picture
0-item

Autoren:

(1) Arcangelo Massari, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(2) Fabio Mariani, Institut für Philosophie und Kunstwissenschaften, Leuphana Universität, Lüneburg, Deutschland {[email protected]};

(3) Ivan Heibi, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien und Digital Humanities Advanced Research Centre (/DH.arc), Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(4) Silvio Peroni, Forschungszentrum für offene wissenschaftliche Metadaten, Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien und Digital Humanities Advanced Research Centre (/DH.arc), Abteilung für Klassische Philologie und Italianistik, Universität Bologna, Bologna, Italien {[email protected]};

(5) David Shotton, Oxford e-Research Centre, University of Oxford, Oxford, Vereinigtes Königreich {[email protected]}.

Linktabelle

6. Fazit

Dieser Artikel beschreibt detailliert die Methodik, die zur Entwicklung von OpenCitations Meta verwendet wurde, einer Datenbank, die bibliografische Metadaten für alle in den OpenCitations-Indizes enthaltenen Publikationen speichert und bereitstellt. Dieser Prozess umfasst zwei Hauptphasen: (1) eine automatische Kurationsanalyse, die darauf abzielt, Entitäten zu deduplizieren, Fehler zu korrigieren und Informationen anzureichern, und (2) eine Datenkonvertierung in RDF, wobei Änderungen und Provenienz in RDF nachverfolgt werden.


Informationen zu neuen Veröffentlichungen werden kontinuierlich zu Crossref, DataCite und PubMed hinzugefügt und wir werden Verfahren entwickeln, um diese neuen Metadaten regelmäßig und zeitnah in OpenCitations Meta aufzunehmen. Darüber hinaus laufen bereits Arbeiten zur Aufnahme bibliografischer Metadaten aus dem Japan Link Center und dem OpenAIRE Research Graph und weitere Quellen werden aufgenommen, wenn unsere personellen und rechnerischen Ressourcen dies zulassen. OpenCitations Meta wird also weiter wachsen.


OpenCitations Meta bietet drei wesentliche Vorteile. Erstens ermöglicht die Verwendung von OMIDs (OpenCitation Meta Identifiers) für alle gespeicherten Entitäten, dass OpenCitations Meta als Mapping-Hub für Veröffentlichungen fungiert, die möglicherweise mehr als eine externe PID haben (z. B. ein Zeitschriftenartikel, der in Crossref mit einem DOI (Digital Object Identifier) beschrieben wird, und dieselbe Veröffentlichung, die in PubMed mit einem PMID (PubMed Identifier) beschrieben wird). Gleichzeitig können Zitate mit Ressourcen ohne externe PIDs charakterisiert werden. Der zweite Vorteil besteht darin, dass OpenCitations Meta es ermöglicht, Zitate in OpenCitations-Indizes als OMID-zu-OMID zu beschreiben, wodurch Zitate zwischen Dokumenten mit unterschiedlichen Identifikationsschemata unterschieden werden, z. B. dargestellt als DOI-zu-DOI auf Crossref und PMID-zu-PMID auf PubMed. Drittens beschleunigt OpenCitations Meta Suchvorgänge zum Abrufen von Metadaten zu Veröffentlichungen, die an den in den OpenCitations Citation Indexes gespeicherten Zitaten beteiligt sind, da diese Metadaten jetzt intern gespeichert werden und nicht durch spontane API-Aufrufe an externe Ressourcen abgerufen werden müssen.


Zukünftige Herausforderungen werden darin bestehen, ein System zur Begriffsklärung für Personen ohne ORCID-Kennung zu entwickeln, die Qualität der vorhandenen Metadaten zu verbessern, die Suchvorgänge und die Speichereffizienz zu optimieren, zusätzliche Metadatenfelder für Abstracts, Funder-IDs, Finanzierungsinformationen und institutionelle Kennungen hinzuzufügen und diese dort zu füllen, wo diese Metadaten aus unseren Quellen verfügbar sind.


Schließlich wird eine Schnittstelle implementiert und vertrauenswürdigen Fachexperten zur Verfügung gestellt, um eine direkte manuelle Echtzeit-Kuration der von OpenCitations Meta gespeicherten Metadaten zu ermöglichen. Ein solches System verfolgt Änderungen und Herkunft, bewahrt die Unterschiede zwischen verschiedenen Versionen jeder Entität auf und speichert Informationen wie den für die Änderung verantwortlichen Agenten, die Primärquelle und das Datum. Auf diese Weise wollen wir OpenCitations Meta nicht nur umfassend, sondern auch zu einer genauen und vollständig offenen und wiederverwendbaren Quelle bibliografischer Metadaten machen, zu der Mitglieder der wissenschaftlichen Gemeinschaft direkt beitragen können.

7 Danksagungen

Diese Arbeit wurde teilweise durch das Forschungs- und Innovationsprogramm Horizont 2020 der Europäischen Union im Rahmen der Finanzhilfevereinbarung Nr. 101017452 (OpenAIRE-Nexus-Projekt) finanziert.

Verweise

Abramatic, J.-F., Di Cosmo, R., & Zacchiroli, S. (2018). Aufbau des universellen Quellcode-Archivs. Communications of the ACM, 61 (10), 29–31. https://doi.org/10.1145/3183558


Atzori, C., Bardi, A., Manghi, P., & Mannocci, A. (2017). Die OpenAIRE-Workflows für das Datenmanagement [Serientitel: Kommunikation in Computer- und Informationswissenschaften]. In C. Grana & L. Baraldi (Hrsg.), Digitale Bibliotheken und Archive (S. 95–107). Springer International Publishing. https://doi.org/10.1007/978-3-319-68130-6_8


Auer, S., Oelen, A., Haris, M., Stocker, M., D'Souza, J., Farfar, KE, Vogt, L., Prinz, M., Wiens, V., & Jaradeh, MY (2020). Improving Access to Scientific Literature with Knowledge Graphs. Bibliothek Forschung und Praxis, 44 (3), 516–529. https://doi.org/10.1515/bfp-2020-2042


Board, DU (2020). DCMI-Metadatenbedingungen. Abgerufen am 16. Juli 2021 von http://dublincore.org/specifications/dublin-core/dcmi-terms/2020-01- 20/


Brase, J. (2009). DataCite – Eine globale Registrierungsagentur für Forschungsdaten. 2009 Vierte Internationale Konferenz zur Zusammenarbeit und Förderung von Informationsressourcen in Wissenschaft und Technologie, 257–261. https: //doi.org/10.1109/COINFO.2009.66


Brase, J. (2010). Datacite – Eine globale Registrierungsagentur für Forschungsdaten. SSRN Electronic Journal. https://doi.org/10.2139/ssrn.1639998


Carroll, JJ, Bizer, C., Hayes, P., & Stickler, P. (2005). Benannte Graphen, Herkunft und Vertrauen. Proceedings der 14. internationalen Konferenz zum World Wide Web – WWW '05, 613. https://doi.org/10.1145/1060745. 1060835


Daquino, M., & Peroni, S. (2019). OCO, die OpenCitations Ontologie. Abgerufen am 4. September 2021 von https://w3id.org/oc/ontology/2019-09-19


Daquino, M., Peroni, S., & Shotton, D. (2020). Das OpenCitations-Datenmodell [Artwork-Größe: 836876 Bytes Herausgeber: figshare], 836876 Bytes. https: //doi.org/10.6084/M9.FIGSHARE.3443876.V7


Dhakal, K. (2019). Paywall entfernen. Zeitschrift für Medizinische Bibliotheken, 107 (2). https://doi.org/10.5195/jmla.2019.650


Europäische Kommission. Generaldirektion Forschung und Innovation. (2016). Realisierung der europäischen Open Science Cloud: Erster Bericht und Empfehlungen der hochrangigen Expertengruppe der Kommission zur europäischen Open Science Cloud. Amt für Veröffentlichungen. Abgerufen am 17. Oktober 2022 von https://data.europa.eu/doi/10.2777/940154


Falco, R., Gangemi, A., Peroni, S., Shotton, D., & Vitali, F. (2014). Modellierung von OWL-Ontologien mit Graffoo [Serientitel: Lecture Notes in Computer Science]. In V. Presutti, E. Blomqvist, R. Troncy, H. Sack, I. Papadakis, & A. Tordai (Hrsg.), The Semantic Web: ESWC 2014 Satellite Events (S. 320–325). Springer International Publishing. https://doi.org/10.1007/978-3-319-11955-7_42


Fricke, S. (2018). Semantic Scholar. Journal of the Medical Library Association, 106 (1). https://doi.org/10.5195/jmla.2018.280


Garcia, A., Lopez, F., Garcia, L., Giraldo, O., Bucheli, V., & Dumontier, M. (2018). Biotea: Semantik für Pubmed Central. PeerJ, 6, e4201. https: //doi.org/10.7717/peerj.4201


Gentile, AL, & Nuzzolese, AG (2015). cLODg-Conference Linked Open Data Generator. ISWC (Poster & Demos).


Gil, Y., Cheney, J., Groth, P., Hartig, O., Miles, S., Moreau, L., & Silva, P. (2010). Provenance XG Abschlussbericht [Typ: W3C.]. http://www.w3. org/2005/Incubator/prov/XGR-prov-20101214/


Gorraiz, J., Melero-Fuentes, D., Gumpenberger, C., & Valderrama-Zurián, J.-C. (2016). Verfügbarkeit digitaler Objektkennungen (DOIs) in Web of Science und Scopus. Journal of Informetrics, 10 (1), 98–109. https://doi.org/ 10.1016/j.joi.2015.11.008


Haak, LL, Fenner, M., Paglione, L., Pentz, E., & Ratner, H. (2012). ORCID: Ein System zur eindeutigen Identifizierung von Forschern. Learned Publishing, 25 (4), 259–264. https://doi.org/10.1087/20120404


Hammond, T., Pasin, M., & Theodoridis, E. (2017). Datenintegration und -desintegration: Springer Nature SciGraph mit SHACL und OWL verwalten. ISWC (Poster, Demos & Branchen-Tracks). http://ceur-ws.org/Vol1963/paper493.pdf


Hara, M. (2020). Einführung des Japan Link Center (JaLC) [Artwork-Größe: 2213661 Bytes Herausgeber: ORCID], 2213661 Bytes. https://doi.org/10.23640/07243.12469094.V1


Heibi, I., Peroni, S., & Shotton, D. (2019a). Crowdsourcing offener Zitate mit CROCI – Eine Analyse des aktuellen Status offener Zitate und ein Vorschlag [arXiv: 1902.02534]. arXiv:1902.02534 [cs]. Abgerufen am 15. September 2021 von http://arxiv.org/abs/1902.02534


Heibi, I., Peroni, S., & Shotton, D. (2019b). Software-Review: COCI, der OpenCitations Index offener Crossref-DOI-zu-DOI-Zitate. Scientometrics, 121 (2), 1213–1228. https://doi.org/10.1007/s11192-019-03217-6


Hendricks, G., Tkaczyk, D., Lin, J., & Feeney, P. (2020). Crossref: Die nachhaltige Quelle für gemeinschaftlich genutzte wissenschaftliche Metadaten. Quantitative Science Studies, 1 (1), 414–427. https://doi.org/10.1162/qss_a_00022


ICite, Hutchins, BI, & Santangelo, G. (2022). iCite-Datenbank-Snapshots (NIH Open Citation Collection) [Herausgeber: The NIH Figshare Archive]. https: //doi.org/10.35092/YHJC.C.4586573


Koivunen, M.-R., & Miller, E. (2001). Semantic Web Activity [Ausgabe: W3C Band: 11 02]. https://www.w3.org/2001/12/semweb-fin/w3csw


Lammey, R. (2020). Lösungen für Identifikationsprobleme: Ein Blick in das Research Organization Registry. Science Editing, 7 (1), 65–69. https://doi.org/ 10.6087/kcse.192


Lebo, T., Sahoo, S., & McGuinness, D. (2013). PROV-O: Die PROV-Ontologie [Ort: PROV-O Band: 04 30]. Abgerufen am 16. Juli 2021 von http: //www.w3.org/TR/2013/REC-prov-o-20130430/


Maloney, C., Sequeira, E., Kelly, C., Orris, R., & Beck, J. (2013). PubMed Central. Im NCBI-Handbuch.


Manghi, P., Manola, N., Horstmann, W., & Peters, D. (2010). Eine Infrastruktur zur Verwaltung von EU-finanzierten Forschungsergebnissen: Das OpenAIRE-Projekt. Grey Journal (TGJ), 6 (1).


Massari, A., & Heibi, I. (2022). So strukturieren Sie Zitatdaten und bibliografische Metadaten im von OpenCitations akzeptierten Format. Proceedings des Workshops zum Verständnis von Literaturverweisen im akademischen Volltext, 3220. http://ceur-ws.org/Vol-3220/invited-talk2.pdf


Massari, A., & Peroni, S. (2022). Durchführen von Live-Time-Traversal-Abfragen über SPARQL auf RDF-Datensätzen [Herausgeber: arXiv Versionsnummer: 2]. https: //doi.org/10.48550/ARXIV.2210.02534


Mora-Cantallops, M., Sánchez-Alonso, S., & García-Barriocanal, E. (2019). Eine systematische Literaturübersicht zu Wikidata. Datentechnologien und Anwendungen, 53 (3), 250–268. https://doi.org/10.1108/DTA-12-2018-0110


Morrison, H. (2017). Verzeichnis der Open Access Journals (DOAJ). The Charleston Advisor, 18 (3), 25–28. https://doi.org/10.5260/chara.18.3.25


Nielsen, F. Å., Mietchen, D., & Willighagen, EL (2017). Scholia, Szientometrie und Wikidata. In E. Blomqvist, K. Hose, H. Paulheim, A. Lawrynowicz, F. Ciravegna, & O. Hartig (Hrsg.), The Semantic Web: ESWC 2017 Satellite Events - ESWC 2017 Satellite Events, Portorož, Slowenien, 28. Mai – 1. Juni 2017, Überarbeitete ausgewählte Beiträge (S. 237–259). Springer. https://doi.org/10.1007/978-3-319-70407-4_36


Nuzzolese, AG, Gentile, AL, Presutti, V., & Gangemi, A. (2016). Semantic Web Conference Ontology – eine Refactoring-Lösung. Europäische Semantic Web Conference, 84–87.


OpenCitations. (2022). COCI CSV-Datensatz aller Zitierungsdaten. https://doi.org/10.6084/M9.FIGSHARE.6741422.V18


OpenCitations. (2023a). OpenCitations Meta CSV-Datensatz aller bibliografischen Metadaten. https://doi.org/10.6084/M9.FIGSHARE.21747461.V3


OpenCitations. (2023b). OpenCitations Meta RDF-Datensatz aller bibliografischen Metadaten und ihrer Herkunftsinformationen. https://doi.org/10.6084/M9. FIGSHARE.21747536.V3


Pelgrin, O., Galárraga, L., & Hose, K. (2021). Auf dem Weg zur vollwertigen Archivierung für RDF-Datensätze (A.-C. Ngonga Ngomo, M. Saleem, R. Verborgh, M. Saleem, R. Verborgh, MI Ali, & O. Hartig, Hrsg.). Semantic Web Journal, 12 (6), 903–925. https://doi.org/10.3233/SW-210434


Peroni, S., & Shotton, D. (2018). Offene Zitierung: Definition [Grafikgröße: 95436 Bytes Herausgeber: figshare], 95436 Bytes. https://doi.org/10.6084/M9. FIGSHARE.6683855.V1


Peroni, S., & Shotton, D. (2020). OpenCitations, eine Infrastrukturorganisation für offene Wissenschaft [_eprint: https://direct.mit.edu/qss/articlepdf/1/1/428/1760920/qss_a_00023.pdf]. Quantitative Science Studies, 1 (1), 428–444. https://doi.org/10.1162/qss_a_00023


Peroni, S., Shotton, D., & Vitali, F. (2012). Wissenschaftliches Publizieren und verknüpfte Daten: Beschreibung von Rollen, Status, zeitlichen und kontextuellen Ausmaßen. Proceedings der 8. Internationalen Konferenz über semantische Systeme - I-SEMANTICS '12, 9. https://doi.org/10.1145/2362499.2362502


Persiani, S., Daquino, M., & Peroni, S. (2022). Eine Programmierschnittstelle zum Erstellen von Daten gemäß den SPAR-Ontologien und dem OpenCitations-Datenmodell [Reihentitel: Lecture Notes in Computer Science]. In P. Groth, M.-E. Vidal, F. Suchanek, P. Szekley, P. Kapanipathi, C. Pesquita, H. Skaf-Molli, & M. Tamper (Hrsg.), The Semantic Web (S. 305–322). Springer International Publishing. https://doi.org/10.1007/978-3-031-06981-9_18


Pranckut˙e, R. (2021). Web of Science (WoS) und Scopus: Die Titanen der bibliografischen Information in der heutigen akademischen Welt. Publications, 9 (1), 12. https://doi.org/10.3390/publications9010012


Priem, J., Piwowar, HA, & Orr, R. (2022). OpenAlex: Ein vollständig offener Index wissenschaftlicher Arbeiten, Autoren, Veranstaltungsorte, Institutionen und Konzepte [arXiv: 2205.01833]. CoRR, abs/2205.01833. https://doi.org/10.48550/arXiv. 2205.01833


Forschung, EOFN, & OpenAIRE. (2013). Zenodo: Forschung. Geteilt. [Herausgeber: CERN]. https://doi.org/10.25495/7GXK-RD71


Sigurdsson, S. (2020). Die Zukunft von arXiv und Wissensentdeckung in der offenen Wissenschaft. Proceedings des ersten Workshops zur wissenschaftlichen Dokumentenverarbeitung, 7–9. https://doi.org/10.18653/v1/2020.sdp-1.2


Sikos, LF, & Philp, D. (2020). Herkunftsbewusste Wissensdarstellung: Eine Untersuchung von Datenmodellen und kontextualisierten Wissensgraphen. Data Science and Engineering, 5 (3), 293–316. https: / / doi. org / 10. 1007 / s41019-020-00118-0


Subramanian, S., King, D., Downey, D., & Feldman, S. (2021). S2AND: Ein Benchmark- und Bewertungssystem zur Disambiguierung von Autorennamen. 2021 ACM/IEEE Joint Conference on Digital Libraries (JCDL), 170– 179. https://doi.org/10.1109/JCDL52503.2021.00029


Tanon, TP, Vrandecic, D., Schaffert, S., Steiner, T., & Pintscher, L. (2016). Von Freebase zu Wikidata: Die große Migration. In J. Bourdeau, J. Hendler, R. Nkambou, I. Horrocks, & BY Zhao (Hrsg.), Proceedings der 25. Internationalen Konferenz zum World Wide Web, WWW 2016, Montreal, Kanada, 11. - 15. April 2016 (S. 1419–1428). ACM. https: //doi.org/10.1145/2872427.2874809


Das Europe PMC Consortium. (2015). Europe PMC: Eine Volltext-Literaturdatenbank für die Biowissenschaften und Plattform für Innovation. Nucleic Acids Research, 43 (D1), D1042–D1048. https://doi.org/10.1093/nar/gku1061


Tillett, B. (2005). Was ist FRBR? Ein konzeptionelles Modell für das bibliografische Universum. The Australian Library Journal, 54 (1), 24–30. https://doi.org/10.1080/00049670.2005.10721710


Vision, T. (2010). Das Dryad Digital Repository: Veröffentlichte Evolutionsdaten als Teil des größeren Datenökosystems. Nature Precedings. https://doi.org/10.1038/npre.2010.4595.1


Wilkinson, MD, Dumontier, M., Aalbersberg, IJ, Appleton, G., Axton, M., Baak, A., Blomberg, N., Boiten, J.-W., da Silva Santos, LB, Bourne, PE, Bouwman, J., Brookes, AJ, Clark, T., Crosas, M., Dillo, I., Dumon, O., Edmunds, S., Evelo, CT, Finkers, R., . . . Mons, B. (2016). Die FAIR-Leitprinzipien für wissenschaftliches Datenmanagement und -betreuung. Scientific Data, 3 (1), 160018. https://doi.org/10. 1038/sdata.2016.18


Wolf, M., & Wicksteed, C. (1997). Datums- und Zeitformate. Abgerufen am 9. Mai 2022 von https://www.w3.org/TR/NOTE-datetime


Zhang, Z., Nuzzolese, AG, & Gentile, AL (2017). Entity Deduplication on ScholarlyData [Serientitel: Lecture Notes in Computer Science]. In E. Blomqvist, D. Maynard, A. Gangemi, R. Hoekstra, P. Hitzler, & O. Hartig (Hrsg.), The Semantic Web (S. 85–100). Springer International Publishing. https://doi.org/10.1007/978-3-319-58068-5_6