Anwendungsbeschreibungen
Status der zugrundeliegenden Infrastrukturkomponenten
HTTP CLARIN-D project wiki UP
WebLicht POSTags Lemmas FR UP
SRU/CQL-15 UP
OAI-PMH-13 UP
OAI-PMH-4 UP
WebLicht POSTags Lemmas DE UP
OAI-PMH-3 UP
OAI-PMH-33 UP
OAI-PMH-42 UP
OAI-PMH-10 UP
CLARIN-D project web site UP
HTTP UP
MorphoDiTa UP
OAI-PMH-62 UP
BASWebService UP
OAI-PMH-51 DOWN
WebLicht Lemmas EN UP
OAI-PMH-36 UP
SRU/CQL-39 UP
WebLicht POSTags Lemmas EN UP
OAI-PMH-47 UP
HTTPS UP
OAI-PMH-46 UP
SRU/CQL-6 UP
Automatic Transcription of Dutch Speech Recordings (Wav file) WARNING
spaCy NEL UP
Spejd UP
SRU/CQL-35 UP
LINDAT Translation UP
Inkluz UP
CMDI Explorer UP
SRU/CQL-1 UP
SRU/CQL-31 UP
Voyant Tools UP
WebLicht Morphology DE UP
DARIAH-DE Geo-Browser (KML) UP
WebLicht Dep Parsing EN UP
OAI-PMH-17 UP
spaCy monolingual NER and NEL UP
SRU/CQL-34 WARNING
OAI-PMH-37 DOWN
SRU/CQL-12 UP
OAI-PMH-8 UP
OAI-PMH-5 UP
Concraft -> Nerf UP
SRU/CQL-30 UP
NER NLTK UP
WebLicht Advanced Mode UP
SRU/CQL-26 UP
OAI-PMH-31 UP
SRU/CQL-9 UP
WebSty UP
WebLicht NamedEntities DE UP
OAI-PMH-2 UP
WebLicht Morphology EN UP
WebLicht Const Parsing DE UP
SRU/CQL-22 UP
SRU/CQL-24 UP
Concraft -> Sentipejd UP
CLARIN VLO [UI][prod] UP
WebLicht POSTags Lemmas IT UP
Morfeusz 2 UP
Concraft UP
SRU/CQL-40 DOWN
Automatic Transcription of Dutch Speech Recordings (Ogg file) WARNING
HTTP UP
SRU/CQL-32 UP
SRU/CQL-36 UP
HTTP UP
SRU/CQL-13 UP
Concraft -> Bartek -> NicolasSummarizer UP
OAI-PMH-16 UP
WebLicht Lemmas DE UP
OAI-PMH-7 UP
Topic UP
HTTPS UP
WebLicht Const Parsing EN UP
SRU/CQL-4 DOWN
OAI-PMH-59 UP
MaltParser UP
SRU/CQL-42 UP
SRU/CQL-27 UP
Concraft -> DependencyParser UP
UDPipe UP
Distanbol WARNING
OAI-PMH-28 UP
OAI-PMH-9 UP
OAI-PMH-48 UP
OAI-PMH-14 DOWN
Serel UP
SRU/CQL-37 UP
spaCy bilingual NER and Geoparsing (for TMX) UP
OAI-PMH-38 UP
OAI-PMH-32 UP
SRU/CQL-10 UP
SRU/CQL-38 UP
Tagger NLTK UP
Concraft -> Bartek UP
spaCy bilingual NER (for TMX) UP
WebLicht-Batch UP
SRU/CQL-7 UP
Handle resolve /10932/00-017B-E190-A83E-6F01-5?noredirect UP
CLARIN VCR [UI][prod] UP
spaCy binlingual NER and NEL (for TMX) UP
OAI-PMH-18 UP
OAI-PMH-21 DOWN
OAI-PMH-41 UP
SRU/CQL-28 UP
Handle retrieve /10932/00-017B-E190-A83E-6F01-5 UP
ReSpa UP
OAI-PMH-11 UP
Concraft->Spejd UP
SRU/CQL-21 DOWN
SRU/CQL-11 DOWN
WebLicht All In One (NL) UP
WoSeDon UP
OAI-PMH-19 UP
WCRFT2 UP
OAI-PMH-27 UP
spaCy monolingual NER and Geoparsing UP
OAI-PMH-50 UP
OAI-PMH-29 UP
OAI-PMH-49 UP
CLARIN OAI-PMH Validator UP
SRU/CQL-16 UP
SRU/CQL-29 UP
OAI-PMH-43 WARNING
OAI-PMH-30 UP
HTTPS UP
SRU/CQL-17 UP
NLP-HUB (multiple NER tools) UP
Summarize UP
OAI-PMH-45 WARNING
Liner2 UP
OAI-PMH-56 UP
CLARIN Centre Registry [UI][prod] UP
SRU/CQL-3 UP
OAI-PMH-6 UP
HTTPS CLARIN-D project wiki UP
IMS Fedora Commons UP
SRU/CQL-44 UP
SRU/CQL-8 UP
OAI-PMH-53 UP
WebLicht NamedEntities EN UP
HTTP UP
TF-IDF UP
OAI-PMH-57 WARNING
OAI-PMH-34 UP
spaCy monolingual NER UP
Iobber UP
Automatic Transcription of Dutch Speech Recordings (MP3 file) WARNING
OAI-PMH-39 UP
WebLicht All In One (DE) UP
SRU/CQL-14 UP
WebLicht Tokenization TUR UP
OAI-PMH-44 UP
OAI-PMH-63 UP
Sonatype Nexus UP
OAI-PMH-54 UP
OAI-PMH-12 UP
SRU/CQL-5 UP
OAI-PMH-61 UP
Text Tonsorium - Advanced mode. UP
Spatial UP
WebLicht Dep Parsing DE UP
OAI-PMH-35 DOWN
TermoPL UP
NameTag UP
SRU/CQL-41 UP
spaCy bilingual NEL (for TMX) UP
SRU/CQL-25 UP
Text Tonsorium - Lemmas. UP
SRU/CQL-33 UP
NagVis access UP
Data from monitoring.clarin.eu
Liste der über die CLARIAH-DE-Partner zugänglichen Analysewerkzeuge zur Verarbeitung von Forschungsdaten
Alpino (Plaintext document (untokenised)) Annotieren: Niederländisch

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- application/zipZIP-Archiv
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Gertjan van Noord (Rijksuniversieit Groningen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Alpino (Plaintext tokenised input, one sentence per line) Annotieren: Niederländisch

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- application/zipZIP-Archiv
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Gertjan van Noord (Rijksuniversieit Groningen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Alpino Annotieren: Niederländisch

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- alpinooutput
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- tokoutput
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Gertjan van Noord (University of Groningen), Maarten van Gompel (webservice only, CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Apache Stanbol Enhancer Enriching: Englisch

Apache Stanbol provides a set of reusable components for semantic content management. A number of EnhancementEngines extract features from passed content, for details see https://stanbol.apache.org. The resulting RDF enhancements are returned in JSON format.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- application/jsonJSON-Daten
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inacdh-tech@oeaw.ac.at, Matej Durco
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Apache Foundation (software), Austrian Centre of Digital Humanities (enhancement chains and configuration)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Ariadne Visual Media Service Veröffentlichen

The Visual Media Service provides easy publication and presentation on the web of complex visual media assets. It is an automatic service that allows to upload visual media files on an server and to transform them into an efficient web format, making them ready for web-based visualization.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- model/prs.ply
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inponchio@gmail.com, Federico Ponchio
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Visual Computing Lab of CNR-ISTI
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Automatic Transcription of Dutch Speech Recordings (MP3 file) Speech Recognizing: Niederländisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/mpeg
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Automatic Transcription of Dutch Speech Recordings (Ogg file) Speech Recognizing: Niederländisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/vorbis
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Automatic Transcription of Dutch Speech Recordings (Wav file) Speech Recognizing: Niederländisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/vnd.wave
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
CMDI Explorer Exploration

The Explorer helps you explore CMDI metadata and process the resources they describe.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/x-cmdi+xml
- application/zipZIP-Archiv
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inwlsupport@sfs.uni-tuebingen.de, CLARIN WebLicht Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
CLARIN-D Centre at the University of Tuebingen, Germany
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Colibri Core (FoLiA XML document) Analyzing

A tool for pattern extraction and analysis on corpus data.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- application/octet-streambeliebige Binär-Dateien
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Colibri Core (folia+xml) Analyzing: Deutsch, Englisch, Französisch…

Colibri core is an NLP tool as well as a C++ and Python library for working with basic linguistic constructions such as n-grams and skipgrams (i.e patte rns with one or more gaps, either of fixed or dynamic size) in a quick and memory-efficient way.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch, Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- Tadpole Columned Output Format
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Colibri Core (Plain text input (tokenised)) Analyzing

A tool for pattern extraction and analysis on corpus data.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/plainPlain-Text-Datei
- application/octet-streambeliebige Binär-Dateien
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Colibri Core (Plain text input (untokenised)) Analyzing: Deutsch, Englisch, Französisch…

A tool for pattern extraction and analysis on corpus data.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
- text/plainPlain-Text-Datei
- application/octet-streambeliebige Binär-Dateien
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Colibri Core (plain text) Analyzing: Deutsch, Englisch, Französisch…

Colibri core is an NLP tool as well as a C++ and Python library for working with basic linguistic constructions such as n-grams and skipgrams (i.e patterns with one or more gaps, either of fixed or dynamic size) in a quick and memory-efficient way.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch, Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
- text/plainPlain-Text-Datei
- Tadpole Columned Output Format
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Collection Registry Sammeln: Deutsch
Collection Registry - dient als Katalog von Sammlungen, die im Rahmen von Forschungsprojekten entstanden sind oder als Grundlage für diese dienen. - verknüpft Daten, deren Datenmodelle und die Beschreibung einer Sammlung zur technischen Wiederverwendung durch Dienste wie Such- oder Analysewerkzeuge. - dient auch der Verwaltung von Sammlungsbeschreibungen. Dazu können neben digital zugänglichen auch analoge, geschützte oder Offline-Sammlungen gehören.
Der Zweck der Collection Registry ist
- verteilte Sammlungen an einer Stelle zu beschreiben und sie gemeinsam in anderen Diensten (z.B. Generische Suche, Cosmotool) zu bearbeiten.
- Sammlungen, die sonst nur schwer auffindbar sind, im Sammlungsregister sichtbar zu machen.
- eigene Sammlungen zu dokumentieren und für andere Wissenschaftler nachweisbar zu machen.
- um relevante Sammlungen im Sinne eines internen Katalogs verwalten zu können.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- application/xmlXTML-Datei, Schema
- json, application/xml
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intobias.gradl@uni-bamberg.de, Tobias Gradl (Developer)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft -> Bartek -> NicolasSummarizer Analyzing: Polnisch

Java coreference-based summarization tool; its creation was cofunded by the European Union from resources of the European Social Fund -- Project PO KL 'Information technologies: Research and their interdisciplinary applications'. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft -> Bartek Analyzing: Polnisch

A statistical tool chain for performing Coreference Resolution. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft -> DependencyParser Annotieren: Polnisch

The Polish dependency parser is trained on the extended version of the Polish dependency treebank (Składnica zależnościowa) with the publicly available parsing systems – MaltParser or MateParser. MaltParser is a transition-based dependency parser that uses a deterministic parsing algorithm. The deterministic parsing algorithm builds a dependency structure of an input sentence based on transitions (shift-reduce actions) predicted by a classifier. The classifier learns to predict the next transition given training data and the parse history. MateParser, in turn, is a graph-based parser that defines a space of well-formed candidate dependency trees for an input sentence, scores them given an induced parsing model, and selects the highest scoring dependency tree as a correct analysis of the input sentence. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft -> Nerf Analyzing: Polnisch

Statistical named entity recognition tool based on linear-chain conditional random fields. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft -> Sentipejd Analyzing: Polnisch

A morphosyntactic tagger extended with a semantic category, expressing properties of positive or negative sentiment. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft Analyzing: Polnisch

Morphosyntactic tagger for Polish based on constrained conditional random fields. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Concraft->Spejd Annotieren: Polnisch

Tool for partial parsing and rule-based morphosyntactic disambiguation. Part of: Multiservice, a robust linguistic Web service for Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- text/htmlHTML-Datei
- application/jsonJSON-Daten
- CoNLL format
- Visualization
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inrjawor@amu.edu.pl, MultiService
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Computer Science, Polish Academy of Sciences, Poland
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
ConedaKOR Archivieren
ConedaKOR erleichtert die Verwaltung und Präsentation akademischer Sammlungen von Objekten aus den bildbasierten Kultur- und Geisteswissenschaften. Sie erlaubt es, beliebige Dokumente zu speichern und sie mit Beziehungen zu verknüpfen. Sie können riesige semantische Netzwerke für eine unbegrenzte Anzahl von Domänen aufbauen. ConedaKOR integriert ein hochentwickeltes Ontologie-Verwaltungstool mit einer einfach zu bedienenden Mediendatenbank.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- Prozessor2
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@coneda.net, info@wendig.io, info@daasi.de, info@de.dariah.eu, Moritz Schepp (Developer)
- inhaltliche*r Ansprechpartner*ininfo@wendig.io
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
- Coneda UG in Frankfurt, GitHub
- Moritz Schepp
- Thorsten Wübbena
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Content Search Suchen

The CLARIN Content Search is a simple service that enables researchers to search for specific patterns across collections of data. The service is powered by a search engine that connects to the local data collections that are available in the centres. The data itself stays at the centre where it is hosted – therefore the underlying technique is called federated content search. The service summarizes and displays what is available. An easy next step is to go to the centre's specialised search interface to perform a more sophisticated query.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- Sprachengeneric
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infcs@clarin.eu, Content Search Contact
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
https://contentsearch.clarin.eu/ws/fcs/2.0/aggregator/about
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
COSMAS II Suchen
COSMAS II ist eine am IDS konzipierte Datenbank (Corpus Search, Management and Analysis System) für die korpusbasierte Erforschung der Sprache
- in umfangreichen Korpora (über 13 Mrd. Wortformen, zur Verfügung gestellt vom Projekt DEREKO);
- in linguistisch und strukturell annotierten Korpora; z.B. Wortklassen (über 1,7 Mrd. Nomen), Überschriften etc.;
- in benutzerdefinierten Korpusquerschnitten (anhand von bis zu acht bibliografischen Kriterien);
- in unterschiedlichen Sprachkorpora mit eigenen Tagsets, die in einem grafischen Assistenten eingebettet sind;
- mittels zahlreicher Such-, Abstands- und Bereichsoperatoren, die einfache bis komplexe Sachverhalte bzw. grammatikalische Muster formulieren können.
Die Ergebnisse werden
- anhand von bibliografischen Kriterien zusammengefasst und sortiert;
- mittels Häufigkeitsmaßen in Bezug auf ihre Verteilung bewertet;
- mittels einer Kookkurrenzanalyse analysiert, sortiert und tabellarisch dargestellt;
- als KWIC und Belege sortiert, analysiert und präsentiert;
- (auf Wunsch) mittels eines Zufallsgenerators auf eine repräsentative überschaubare Menge reduziert.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- text/plain+cosmas2Cosmas II Anfrage
- application/rtf
- text/plainPlain-Text-Datei
Lokalisierung
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*incosmas2@ids-mannheim.de, https://www.ids-mannheim.de/cosmas2/
- inhaltliche*r Ansprechpartner*incosmas@ids-mannheim.de, https://www.ids-mannheim.de/cosmas2/
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Franck Bodmer Mory (Developer)
- Helge Stallkamp (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
CosmoTool Spatial Analysis: Deutsch
CosmoTool ist ein digitales Werkzeug, das biographische Informationen aus verschiedenen Quellen zu inter- und nationalen Bewegungsprofilen historischer Persönlichkeiten kombiniert. Daraus sollen Rückschlüsse auf Merkmale und Regeln gezogen werden, die als internationale Kriterien angesehen werden können. Das CosmoTool basiert auf der Verbandsarchitektur von DARIAH-DE und erlaubt die Extraktion von Daten aus unstrukturiertem Text. Zur Zeit befindet sich CosmoTool in der Entwicklungsphase und bietet noch eingeschränkte Funktionalität.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- application/xmlXTML-Datei
- json
- txt/csv
- json
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intobias.gradl@uni-bamberg.de, Tobias Gradl (Developer)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
CSTLemma (hosted by D4Science) Analyzing: Englisch

This is an experimental integration of a D4Science NLP processing service (CSTLemma). The CSTLemma Lemmatizer for English reduces all words in a text to their base form, the lemma.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Bart Jongejan (tool), D4Science staff (WAR upload)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Cyril Belica: Kookkurrenzdatenbank CCDB Analyzing
Vor dem Hintergrund eines korpusgeleiteten empirisch-linguistischen Ansatzes ist es von grundlegender Bedeutung, eine wissenschaftsmethodisch kohärente Methodik zu konzipieren, die es ermöglicht, die im Sprachgebrauch manifesten emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu interpretieren und theoretisch zu begründen. Als empirische Basis für dieses Forschungsvorhaben wurde im Programmbereich Korpuslinguistik des Leibniz-Instituts für Deutsche Sprache auf der Grundlage eines Korpus geschriebener Gegenwartssprache von ca. 2,2 Milliarden laufenden Textwörtern eine große Sammlung von Kookkurrenzprofilen zu ca. 220.000 verschiedenen Lemmata aufgebaut. Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.
Durch die explorative Analyse dieses Sprachmaterials geleitet bemühen wir uns, neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen. Derzeit konzentrieren wir uns dabei auf Themenbereiche wie Ähnlichkeit von Kookkurrenzprofilen und semantische Nähe, auf die Wechselbeziehungen zwischen lokalen, lexikalischen und globalen, situativen Kontexten und auf diverse Untersuchungen zur Quasisynonymie.
Über diese Webseite möchten wir Teile unserer Denk- und Experimentierplattform im Sinne eines "gläsernen Labors" auch allen interessierten Fachkollegen zugänglich machen.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- text/plain; format-variant=ccdbCCDB Anfrage
- image/svg+xml
- image/x-wmf
- text/htmlHTML-Datei
Lokalisierung
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inbelica@ids-mannheim.de, http://corpora.ids-mannheim.de/ccdb/
- inhaltliche*r Ansprechpartner*inbelica@ids-mannheim.de, http://corpora.ids-mannheim.de/ccdb/
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Hoster
Nutzungseinschränkungen für Nutzer*innen
D4Science NER (GATE's Annie) Analyzing: Englisch

This is an experimental integration of a D4Science NLP processing service (based on GATE's ANNIE). This service identifies names of persons, locations, organizations, as well as money amounts, time and date expressions in English texts automatically.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
D4Science staff
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Constituency Parsing DE Annotieren: Deutsch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Constituency Parsing EN Annotieren: Englisch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Depency Parsing DE Annotieren: Deutsch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Depency Parsing EN Annotieren: Englisch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Hyphenation DE Analyzing: Deutsch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Hyphenation EN Analyzing: Englisch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Named Entity Recognition DE Annotieren: Deutsch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: Named Entity Recognition EN Annotieren: Englisch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: POS-Tagging und Lemmatization DE Annotieren: Deutsch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH DKPro-Wrapper: POS-Tagging und Lemmatization EN Annotieren: Englisch
Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.
Kurzbeschreibung
Dokumentation
- User Guide (Sprache: Deutsch)
- Tutorium (Sprache: Englisch)
- Handbuch (Sprache: Englisch)
- Beispiel
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Arbeitsspeicherbedarf4GB
- LaufzeitumgebungJava 1.8 or higher, 64bit
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*ininfo@de.dariah.eu
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH-DE Geo-Browser (CSV) Data Visualization
The DARIAH-DE Geo-Browser allows a comparative visualization of several requests and facilitates the representation of data and their visualization in a correlation of geographic spatial relations at corresponding points of time and sequences. Thus, researchers can analyze space-time relations of data and collections of source material and simultaneously establish correlations between them.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/csvTabularische Daten, kommasepariert
- text/comma-separated-value
- application/vnd.dariahde.geobrowser.csv
- nonekeine
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*insupport@de.dariah.eu, DARIAH-DE Helpdesk
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
DARIAH-DE
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH-DE Geo-Browser (KML) Analyzing
The DARIAH-DE Geo-Browser allows a comparative visualization of several requests and facilitates the representation of data and their visualization in a correlation of geographic spatial relations at corresponding points of time and sequences. Thus, researchers can analyze space-time relations of data and collections of source material and simultaneously establish correlations between them.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/vnd.google-earth.kml+xml
- application/vnd.google-earth.kmz
- application/vnd.dariahde.geobrowser.kml+xml
- nonekeine
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*insupport@de.dariah.eu, DARIAH-DE Helpdesk
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
DARIAH-DE
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH-DE GeoBrowser Entdecken: Deutsch, Englisch
Der DARIAH-DE Geo-Browser ermöglicht eine vergleichende Visualisierung mehrerer Abfragen und erleichtert die Darstellung von Daten und deren Visualisierung in einer Korrelation von geographischen Raumbeziehungen zu entsprechenden Zeitpunkten und Sequenzen.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch, Englisch
- text/csvTabularische Daten, kommasepariert
- application/vnd.google-earth.kml+xml
- application/vnd.google-earth.kmz
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infunk@sub.uni-goettingen.de, veentjer@sub.uni-goettingen.de,
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Authentifizierung
Autor*innen
- DARIAH-DE Association, Responsibilities
- Ubbo Veentjer
- Stefan Funnk
Hoster
- SUB, Göttingen Germany
- GWDG, Göttingen Germany
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH-DE Publikator Veröffentlichen
Der DARIAH-DE Publikator bietet die Möglichkeit, Forschungsdaten für einen Import in das DARIAH-DE Repository vorzubereiten, sie zu beschreiben, zu verwalten und schließlich in das Repository einzuspielen und somit für andere Forschenden auffindbar und nachnutzbar zu machen.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
Lokalisierung
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*insupport@de.dariah.eu,
- inhaltliche*r Ansprechpartner*insupport@de.dariah.eu, https://de.dariah.eu,
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Authentifizierung
Autor*innen
Hoster
- Göttingen State and University Library (SUB), Göttingen Germany
- Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DARIAH-DE Repository Veröffentlichen
Der Einstiegspunkt zum Einspielen von Kollektionen und Daten in das DARIAH-DE Repository ist der DARIAH-DE Publikator, der Ihnen die Möglichkeit bietet, Ihre Kollektionen für einen Import in das DARIAH-DE Repository vorzubereiten, zu verwalten, und diese schließlich in das Repository einzuspielen.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/xml+tei
- text/plainPlain-Text-Datei
- application/epub+zip
- text/htmlHTML-Datei
- application/zipZIP-Archiv
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*insupport@de.dariah.eu,
- inhaltliche*r Ansprechpartner*insupport@de.dariah.eu, https://de.dariah.eu,
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Authentifizierung
Autor*innen
Hoster
- Göttingen State and University Library (SUB), Göttingen Germany
- Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Data Modelling Environment (DME) Modellieren: Deutsch
Die Datenmodellierungsumgebung (DME) von DARIAH-DE ist ein Werkzeug zur Modellierung und Assoziierung von Daten. Eine wesentliche Besonderheit der DME ist die forschungsorientierte Ausrichtung und die zugrundeliegenden Konzepte für die Explikation von Domänenwissen.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenDeutsch
- text/xmlXML-Datei
- text/json
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
- text/json
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intobias.gradl@uni-bamberg.de, Tobias Gradl (Developer)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Deutsches Textarchiv Archivieren: Deutsch

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Das DTA ist das größte Einzelkorpus historischer neuhochdeutscher Texte für den Zeitraum vom 16. bis zum frühen 20. Jahrhundert und umfasst mehr als 350 Millionen Marken auf 1,34 Millionen digitalisierten Seiten. Der Schwerpunkt des DTA liegt auf (digitalisierten) Druckschriften, doch umfasst das DTA auch eine wachsende Zahl handschriftlicher Dokumente. Zu den speziellen Teilkorpora gehören historische Zeitungen und andere Zeitschriften. Das DTA als Ganzes umfasst eine reiche Vielfalt von Belletristik und Sachbüchern, wobei letztere sowohl akademische als auch nicht-akademische Schriften umfassen.
Das DTA besteht aus dem sogenannten DTA-Kernkorpus (DTAK, "DTA-Kernkorpus") mit ca. 1500 Erstausgaben aus dem 16. bis 19. Jahrhundert.
Zusätzlich enthält das Modul DTA-Erweiterungen (DTAE) Fachkorpora und Einzeltexte, die im Rahmen von CLARIN-D und anderen Projekten kuratiert wurden.
Die von Digitalisierungsprojekten und anderen fachspezifischen Initiativen bereitgestellten Volltextquellen wurden (manuell oder halbautomatisch) in ein
TEI-kompatibles XML-Format nach den Richtlinien des DTA-Basisformats (DTABf, "DTA Base Format") konvertiert, einschließlich umfangreicher Metadaten zu den
Originalquellen und der Datenaufbereitung. OCR-Texte im DTA Core Corpus - sowie zahlreiche zusätzliche Textressourcen - wurden manuell korrigiert.
Ein kontinuierlicher Qualitätssicherungsprozess wird durch die kollaborative webbasierte Plattform DTAQ mit derzeit rund 2000 registrierten Benutzern ermöglicht.
Alle DTA-Korpora werden durch automatisierte computerlinguistische Analyseverfahren für den Nutzerkonsum aufbereitet. Dazu gehören nicht nur PoS-Tagging und
Lemmatisierung, sondern unter anderem auch die orthographische Normalisierung historischer Schreibvarianten, so dass die Nutzer Abfragen in moderner Orthographie
formulieren können.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
Lokalisierung
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- BetriebssystemLinux
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inwiegand@bbaw.de, Frank Wiegand (Developer)
- inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Deutsches Textarchiv – Qualitätssicherung Archivieren: Deutsch

Kollaborative Qualitätssicherung im Deutschen Textarchiv DTAQ (Deutsches Textarchiv – Qualitätssicherung) ist eine webbasierte Anwendung, um in XML/TEI-annotierten Textdigitalisaten verschiedene Arten von Fehlern zu finden, zu kategorisieren und zu korrigieren. Die Oberfläche von DTAQ ist durch jeden Nutzer individuell anpassbar, so dass verschiedene Ansichten der Quelldigitalisate und Texttranskriptionen einstellbar sind.
DTAQ ist nach der Registrierung frei für jeden nutzbar.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
Lokalisierung
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- BetriebssystemLinux
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inwiegand@bbaw.de, Frank Wiegand (Developer)
- inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DGD – Datenbank für Gesprochenes Deutsch Analyzing
Die DGD wird für Forschung und Lehre bereitgestellt. Das System ermöglicht Ihnen den Zugriff auf ausgewählte Korpora des Archivs für Gesprochenes Deutsch (AGD), u.a. auf:
-
das "Forschungs und Lehrkorpus gesprochenes Deutsch" (FOLK)
-
das Korpus "Deutsche Mundarten" (Zwirner-Korpus)
-
das Korpus "Deutsche Umgangssprachen" (Pfeffer-Korpus)
-
das Korpus "Gesprochene Wissenschaftssprache Kontrastiv" (GeWiss, GWSS)
-
das Korpus "Deutsch Heute" (DH)
Aus rechtlichen Gründen bitten wir Sie um eine einmalige kostenlose Registrierung.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- text/plain; format-variant=dgdDGD Suchanfrage
- text/csvTabularische Daten, kommasepariert
- application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
- application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*indgd@ids-mannheim.de
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Hoster
Nutzungseinschränkungen für Nutzer*innen
DiaCollo Analyzing: Deutsch, Englisch

DiaCollo ist ein Werkzeug für das Auffinden von typischen Wortverbindungen (Kollokationen) zu einem Stichwort in einem bestimmten Zeitraum und die visuell aufbereitete Darstellung der Ergebnisse. Als Kollokation wird eine gemeinsame Verwendung zweier Inhaltswörter bezeichnet, wobei a) das gemeinsame Vorkommen in Texten auffällig, d.h. deutlich häufiger als statistisch erwartbar, ist, und b) die beiden Wörter in einer grammatischen Beziehung zueinander stehen, zum Beispiel als Nomen und modifizierendes Adjektiv (brennbare Flüssigkeit) oder als Koordination von zwei Nomen (Umwelt und Reaktorsicherheit). Eine Kollokation besteht aus einer Basis (auch Stichwort genannt) und einem Kollokator.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
Lokalisierung
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- BetriebssystemLinux
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*injurish@bbaw.de, Bryan Jurish (Developer)
- inhaltliche*r Ansprechpartner*inBryan Jurish (Linguist)
Wartungsdokumentation
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Distanbol Analyzing: Englisch

Distanbol analyses texts semantically. For this, it passes the input text to an Apache Stanbol web service that executes a NLP chain yielding named entities. This is followed by Entity Linking on the text. The resulting enhancements are rendered as human-readable HTML-page. In short, Distanbol is adding a human-readable rendering to the JSON-LD output produced by Stanbol.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- application/xhtml+xmlXHTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inacdh-tech@oeaw.ac.at, Matej Durco
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Apache Foundation (software), Austrian Centre of Digital Humanities (enhancement chains and configuration)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
DTA-Basisformat Archivieren: Deutsch
Die folgende Darstellung dokumentiert das XML-Basisformat des DTA, welches die Grundlage für die Annotation der DTA-Volltexte bildet. Das DTA-Basisformat folgt den P5-Richtlinien der Text Encoding Initiative (TEI). Da diese Richtlinien jedoch Lösungen für sämtliche Bedürfnisse bei der Textaufbereitung anbieten sollen und daher entsprechend vielfältig und umfangreich sind, bedürfen sie im konkreten Einzelfall einer näheren Spezifikation. Daher wurde aus den P5-Richtlinien für die Textstrukturierung im DTA-Korpus eine Tag-Auswahl getroffen (Tagset), die das DTA-Basisformat bildet. Dieses Tagset ist mit den P5-Richtlinien der TEI vollständig konform; auf Erweiterungen (tei.extensions) durch davon abweichende Elemente wurde verzichtet.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
Lokalisierung
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- BetriebssystemLinux
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inhaaf@bbaw.de, Susanne Haaf-Dumont (Developer)
- inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
English Automatic Speech Recognition System (MP3 file) Speech Recognizing: Englisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- audio/mpeg
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
English Automatic Speech Recognition System (Ogg file) Speech Recognizing: Englisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- audio/ogg
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
English Automatic Speech Recognition System (Wav file) Speech Recognizing: Englisch

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- audio/wav
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
EXMARaLDA Annotieren
EXMARaLDA ist ein System für das computergestützte Arbeiten mit (vor allem) mündlichen Korpora. Es besteht aus einem Transkriptions- und Annotationseditor (Partitur-Editor), einem Tool zum Verwalten von Korpora (Corpus-Manager) und einem Such- und Analysewerkzeug (EXAKT).
Vorteile des EXMARaLDA-Systems umfassen zum Beispiel:
- zeitalignierte Transkription von Audio- oder Videodaten;
- flexible Annotation nach frei wählbaren Analysekategorien;
- systematische Dokumentation eines Korpus durch Metadaten;
- flexible Ausgabe von Transkriptdaten in verschiedenen Formen und Formaten (Notation, Dokument);
- computergestützte Recherche in Transkriptions-, Annotations und Metadaten;
- interoperabel, da das System mit XML-basierten Dateiformaten arbeitet, die einen Datenaustausch mit anderen Tools (wie Praat, ELAN, Transcriber etc.) sowie eine flexible Verarbeitung und eine nachhaltige Nutzung der Daten ermöglichen.
EXMARaLDA wird weltweit von Forschern in unterschiedlichsten Zusammenhängen zur Analyse gesprochener Sprache eingesetzt, z.B.:
- Gesprächsforschung (Diskurs- und Konversationsanalyse),
- Mehrsprachigkeits- und Spracherwerbsforschung,
- Phonetik und Phonologie
- Dialektologie und Soziolinguistik.
EXMARaLDA wurde ursprünglich im Teilprojekt "Computergestützte Erfassungs- und Analysemethoden multilingualer Daten" des Sonderforschungsbereichs "Mehrsprachigkeit" (SFB 538) der Universität Hamburg entwickelt. Seit Juli 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora, seit November 2011 in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim, weitergeführt.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/xml; format-variant=weblicht-tcfDatei im Text Corpus Format (*.tcf)
- application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)
- application/xml; format-variant=transcriber-trsTranscriber-Aannotations-Datei (*.trs)
- application/xml; format-variant=folker-flnFOLKER-Transkription (*.flk / *.fln)
- application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
- application/xml; format-variant=clan-chaCHAT-Transkriptions-Datei (*.cha)
- text/plain; format-variant=praat-textgridPraat TextGrid (*.textGrid)
- audio/mp3MP3-Audio
- audio/oggOGG-Audio
- audio/wavWAV-Audio
- video/mp4MP4-Video
- audio/aiffAIFF-Audio
- audio/mpegMPEG-Audio
- video/mpegMPEG-Audio
- video/oggOGG-Video
- video/aviAVI-Video
- video/x-divxDIVX-Video
- video/movQuicktime-Video
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/xml; format-variant=weblicht-tcfDatei im Text Corpus Format (*.tcf)
- application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)
- application/xml; format-variant=transcriber-trsTranscriber-Aannotations-Datei (*.trs)
- application/xml; format-variant=folker-flnFOLKER-Transkription (*.flk / *.fln)
- application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
- application/xml; format-variant=clan-chaCHAT-Transkriptions-Datei (*.cha)
- application/plain+praatPraat-TextGrid (*.textGrid)
- different video formats
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- BetriebssystemWindows, macOS, Linux
- LaufzeitumgebungJava (included in newer versions)
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inhttps://exmaralda.org/en/contact/
- inhaltliche*r Ansprechpartner*inhttps://exmaralda.org/en/contact/
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- EXMARaLDA Developer Group, GitHub
- Thomas Schmidt (Entwickler*in)
- Kai Wörner (Entwickler*in)
- Timm Lehmberg (Entwickler*in)
- Hanna Hedeland (Entwickler*in)
Hoster
- Leibniz-Institut für Deutsche Sprache, Mannheim, Germany
- HZSK Hamburg, Hamburg Germany
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
FoLiA-stats Analyzing: generic, Niederländisch

N-gram frequency list generation on FoLiA input.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch, generic
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- wordfreqlist
- lemmafreqlist
- lemmaposfreqlist
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Ko van der Sloot (TiCC, Tilburg University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Fowlt (plain text) Analyzing: Englisch

Fowlt is an online, free-to-use context-sensitive English spelling checker. It follows the setup of the Dutch spelling checker Valkuil.net. Both Valkuil and Fowlt are unlike the typical spelling checkers: whereas the latter mostly try to find errors by comparing all words to a built-in dictionary and flag the word as an error if they can't find a match, Fowlt is context sensitive, taking into account the words around every word. Fowlt makes use of language models. These models are created by giving lots of texts to machine learning software (TiMBL and WOPR).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Fowlt (xml+folia) Analyzing: Englisch

Fowlt is an online, free-to-use context-sensitive English spelling checker. It follows the setup of the Dutch spelling checker Valkuil.net. Both Valkuil and Fowlt are unlike the typical spelling checkers: whereas the latter mostly try to find errors by comparing all words to a built-in dictionary and flag the word as an error if they can't find a match, Fowlt is context sensitive, taking into account the words around every word. Fowlt makes use of language models. These models are created by giving lots of texts to machine learning software (TiMBL and WOPR).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Frog (FoLiA XML document) Natural Language Processing: Niederländisch

Frog is a suite containing a tokeniser, Part-of-Speech tagger, lemmatiser, morphological analyser, shallow parser, and dependency parser for Dutch.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Ko van der Sloot, Antal van den Bosch, Maarten van Gompel, Bertjan Busser (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Frog (folia+xml) Natural Language Processing: Niederländisch

Frog's current version will tokenize, tag, lemmatize, and morphologically segment word tokens in Dutch text files, will assign a dependency graph to each sentence, will identify the base phrase chunks in the sentence, and will attempt to find and label all named entities.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- Tadpole Columned Output Format
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Ko van der Sloot, Maarten van Gompel (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Frog (plain text) Annotieren: Niederländisch

Frog's current version will tokenize, tag, lemmatize, and morphologically segment word tokens in Dutch text files, will assign a dependency graph to each sentence, will identify the base phrase chunks in the sentence, and will attempt to find and label all named entities.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- Tadpole Columned Output Format
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Ko van der Sloot, Maarten van Gompel (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Frog (Text document) Natural Language Processing: Niederländisch

Frog is a suite containing a tokeniser, Part-of-Speech tagger, lemmatiser, morphological analyser, shallow parser, and dependency parser for Dutch.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inlamasoftware@science.ru.nl, lamasoftware@science.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Ko van der Sloot, Antal van den Bosch, Maarten van Gompel, Bertjan Busser (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Glem (Text to lemmatize) Annotieren: Griechisch

GLEM is a lemmatizer for Ancient Greek.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenGriechisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inc.bary@ftr.ru.nl, c.bary@ftr.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Corien Bary, Peter Berck, Iris Hendrickx, Wessel Stoop (Faculty of Philosophy, Theology and Religious Studies and Centre for Language and Speech Technology, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Grapheme to Phoneme converter (Word List) Transformation: Englisch, Niederländisch

Grapheme to Phoneme converter using phonetisaurus
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch, Englisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inl.tenbosch@let.ru.nl, l.tenbosch@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Louis ten Bosch
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Inkluz Analyzing: Polnisch

Inkluz - detects foreign language inclusions in Polish texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/octet-streambeliebige Binär-Dateien
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Iobber Annotieren: Polnisch

Chunker for Polish. It recognises shallow syntactic structure (up to three levels) of phrases (chunks) in Polish texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
KorAP (REST) Suchen
KorAP ist eine neue Korpusanalyseplattform, optimiert für große, mehrfach annotierte Korpora und komplexe Suchmechanismen.
KorAP unterstützt die Abfragesprachen (von) COSMAS II, ANNIS, Poliqarp, Poliqarp+, CQL and FCQL.
KorAP wird am Leibniz-Institut für Deutsche Sprache in Mannheim entwickelt. Die einzelnen Module werden als Open Source auf GitHub veröffentlicht.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/jsonJSON-Daten
- application/jsonJSON-Daten
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inkorap@ids-mannheim.de, https://www1.ids-mannheim.de/s/corpus-linguistics/projects/korap.html?L=1, https://www1.ids-mannheim.de/kl/projekte/korap.html?L=0
- inhaltliche*r Ansprechpartner*inkorap@ids-mannheim.de, https://www1.ids-mannheim.de/s/corpus-linguistics/projects/korap.html?L=1, https://www1.ids-mannheim.de/kl/projekte/korap.html?L=0
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Marc Kupietz (Developer)
- Franck Bodmer Mory (Developer)
- Peter Harders (Developer)
- Eliza Margaretha (Developer)
- Helge Stallkamp (Developer)
- Piotr Bański (Developer)
- Elena Frick (Developer)
- Michael Hanl (Developer)
- Carsten Schnober (Developer)
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
KorAP (Web) Analyzing
KorAP ist eine neue Korpusanalyseplattform, optimiert für große, mehrfach annotierte Korpora und komplexe Suchmechanismen.
KorAP unterstützt die Abfragesprachen (von) COSMAS II, ANNIS, Poliqarp, Poliqarp+, CQL and FCQL.
KorAP wird am Leibniz-Institut für Deutsche Sprache in Mannheim entwickelt. Die einzelnen Module werden als Open Source auf GitHub veröffentlicht.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- text/plain; format-variant=cosmas2COSMAS II query
- text/plain; format-variant=annisANNIS query
- text/plain; format-variant=poliqarpPoliqarp query
- text/plain; format-variant=poliqarpplusPoliqarp+ query
- text/plain; format-variant=cqlCQL query
- text/plain; format-variant=fcqlFCQL query
- text/htmlHTML-Datei
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inkorap@ids-mannheim.de, https://www1.ids-mannheim.de/s/corpus-linguistics/projects/korap.html?L=1, https://www1.ids-mannheim.de/kl/projekte/korap.html?L=0
- inhaltliche*r Ansprechpartner*inkorap@ids-mannheim.de, https://www1.ids-mannheim.de/s/corpus-linguistics/projects/korap.html?L=1, https://www1.ids-mannheim.de/kl/projekte/korap.html?L=0
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Marc Kupietz (Developer)
- Franck Bodmer Mory (Developer)
- Peter Harders (Developer)
- Eliza Margaretha (Developer)
- Helge Stallkamp (Developer)
- Piotr Bański (Developer)
- Elena Frick (Developer)
- Michael Hanl (Developer)
- Carsten Schnober (Developer)
Hoster
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
LINDAT Translation Translating: Tschechisch, Deutsch, Englisch…

The input file size is limited to 100kB.
Translates from->to:
Czech->English, Hindi, French, Russian, German
English->Russsian, German, Czech, Hindi, French
Russian->German, French, Czech, Hindi, English
German->Russian, Hindi, Czech, English, French
French->Russian, German, Czech, English, Hindi
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenDeutsch, Russisch, Tschechisch, Englisch, Französisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inkosarko@ufal.mff.cuni.cz, Ondřej Košarko
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Institute of Formal and Applied Linguistics
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Liner2 (hosted by D4Science) Annotieren: Polnisch

This is an experimental integration of a D4Science NLP processing service (NER Liner 2). This service identifies names of persons, locations, organizations, as well as money amounts, time and date expressions in Polish texts automatically.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
D4Science staff
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Liner2 Annotieren: Polnisch

Name Entity and Temporal Expression recognition
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
MaltParser Annotieren: Polnisch

A language dependency parser chain for Polish. The used tools include Morfeusz-2 with SGJP dictionary (for morphological analysis), wcrft2 (for tagging), and the MaltParser with a model for Polish. The CONLL output can be visualised with DepSVG, a dependency tree and predicate-argument structure visualizer.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- CoNLL Format
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Morfeusz 2 Annotieren: Polnisch

Morphological analysis of Polish texts by Morfeusz 2 (based on the SGJP dictionary)
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
MorphoDiTa Annotieren: Polnisch

Morphological dictionary and tagger for the analysis of natural language texts in Polish.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
NER NLTK Annotieren: Englisch

Name Entity Recogniser for English by NLTK.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
NLP-HUB (multiple NER tools) Annotieren: Deutsch, Englisch, Französisch…

This is an experimental integration of a D4Science NLP processing service hub. This service runs a number of NER tools in parallel, and merges their results. It identifies names of persons, locations, organizations, as well as money amounts, time and date expressions -- and other expressions -- in English, French, Italian, Spanish and German texts automatically.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Französisch, Italienisch, Spanisch, Deutsch
- text/plainPlain-Text-Datei
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
D4Science staff
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Oersetter (FRY-NLD) Translating: Friesisch

Oersetter is a Frisian-Dutch Machine Translation system.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenFriesisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Oersetter (NLD-FRY) Translating: Niederländisch

Oersetter is a statistical machine translation (SMT) system for Frisian to Dutch and Dutch to Frisian. A parallel training corpus has been established, which has subsequently been used to automatically learn a phrase-based SMT model. The translation system is built around the open-source SMT software Moses.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Opener Tokenizer Analyzing: Deutsch, Englisch, Französisch…

Tokenizer for Dutch, English, German, French, Spanish and Italian. Consumes Plain text and produces TCF.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Italienisch, Spanisch, Französisch, Niederländisch, Deutsch
- text/plainPlain-Text-Datei
- application/tcf+xmlTCF-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inriccardo.delgratta@ilc.cnr.it, Riccardo Del Gratta
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
CLARIN-IT
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (DJVU document containing scanned pages (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- application/pdfAdobe-PDF-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (FoLiA with OCR text layer already present (no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (PDF document with embedded text (no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- application/pdfAdobe-PDF-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (PDF document with scanned pages (images) (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- application/pdfAdobe-PDF-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (Plain-text document (UTF-8, no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
PICCL (TIF image of a scanned page (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
- image/tiff
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inreynaert@uvt.nl, reynaert@uvt.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Martin Reynaert, Maarten van Gompel, Ko van der Sloot
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (Alpino XML for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/alpino+xml
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (CONLL-U format for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (Docbook for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/docbook+xml
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (EPUB for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/epub+zip
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (FoLiA XML input for conversion to HTML) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- text/htmlHTML-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (FoLiA XML input for conversion to ReStructuredText) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
- text/rst
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (FoLiA XML input for conversion to text) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (FoLiA XML input for upgrade to a newer FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (FoLiA XML input for validation) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (HTML for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/htmlHTML-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (LaTeX source for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/x-latex
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (Markdown Input for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/markdown
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (MediaWiki Markup (Wikipedia and others) for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (MS Word (Office Open XML, docx) input for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/mswordMicrosoft-Word-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (NAF XML for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/naf+xml
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (OpenDocument Text Document (odt) for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/mswordMicrosoft-Word-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (PDF with embedded text (pdf) for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/pdfAdobe-PDF-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (Plain text input for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/plainPlain-Text-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (ReStructuredText Input for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- text/rst
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Piereling (TEI P5 XML input for conversion to FoLiA) Converting

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/tei+xmlTEI-P5-konformes XML
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, proycon@anaproy.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
ReSpa Extracting: Polnisch

Keywords extraction for Polish by ReSpa based on the representation of text documents as word graphs.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Serel Analyzing: Polnisch

Detection of semantic relations between Named Entities in Polish texts by Serel.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spacy (hosted by D4Science) - DE Annotieren: Deutsch

This is an experimental integration of a D4Science NLP processing service (spaCy). This service identifies performs dependency parsing for plain German text. For more information on spaCy, see https://spacy.io.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch
- text/plainPlain-Text-Datei
- text/tab-separated-valuesTabularische Daten, tabulatorsepariert
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
D4Science staff
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spacy (hosted by D4Science) - EN Annotieren: Englisch

This is an experimental integration of a D4Science NLP processing service (spaCy). This service identifies performs dependency parsing for plain English text. For more information on spaCy, see https://spacy.io.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- text/tab-separated-valuesTabularische Daten, tabulatorsepariert
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inswitchboard@clarin.eu, D4Science Support
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
D4Science staff
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spatial Identifying: Polnisch

Recognition of spatial expressions in Polish texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/jsonJSON-Daten
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spejd Annotieren: Polnisch

Spejd - a partial, shallow parser for Polish with rule-based morphosyntactic disambiguation.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spreek2Schrijf (Flemish input HTML (very specific formatting, not just any HTML)) Speech Recognizing: Niederländisch

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/htmlHTML-Datei
- text/htmlHTML-Datei
- text/plainPlain-Text-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spreek2Schrijf (MP3 file) Speech Recognizing: Niederländisch

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/mpeg
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spreek2Schrijf (Ogg file) Speech Recognizing: Niederländisch

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/vorbis
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spreek2Schrijf (Time Marked Conversation (CTM) with punctuation) Speech Recognizing: Niederländisch

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/xmlXML-Datei
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Spreek2Schrijf (Wav file) Speech Recognizing: Niederländisch

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- audio/vnd.wave
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inh.vandenheuvel@let.ru.nl, h.vandenheuvel@let.ru.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Summarize Analyzing: Polnisch

Automated word graph based summarisation of Polish texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/octet-streambeliebige Binär-Dateien
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
T-scan (Text Input) Analyzing: Niederländisch

T-Scan is an analysis tool for dutch texts to assess the complexity of the text, and is based on original work by Rogier Kraf (Utrecht University) (see: Kraf et al., 2009). The code has been reimplemented and extended by Ko van der Sloot (Tilburg University), and is currently maintained and continued by Martijn van der Klis (Utrecht University).
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- application/xslt+xml
- text/csvTabularische Daten, kommasepariert
- text/plainPlain-Text-Datei
- text/xmlXML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inM.H.vanderKlis@uu.nl, M.H.vanderKlis@uu.nl
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/
Autor*innen
Ko van der Sloot, Martijn van der Klis, Maarten van Gompel (Utrecht University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
T-scan Analyzing: Niederländisch

T-Scan is a new tool for analyzing Dutch text. It aims at extracting text features that are theoretically interesting, in that they relate to genre and text complexity, as well as practically interesting, in that they enable users and text producers to make text-specific diagnoses. T-Scan derives it features from tools such as Frog and Alpino, and resources such as SoNaR, SUBTLEX-NL and Referentie Bestand Nederlands.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- SprachenNiederländisch
- text/plainPlain-Text-Datei
- text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
- text/xslXSLT-Stylesheet
- text/csvTabularische Daten, kommasepariert
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*inproycon@anaproy.nl, Maarten van Gompel
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Anmeldebedingungen
Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.
Autor*innen
Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen), Martijn van der Klis (Utrecht University)
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
Tagger NLTK Annotieren: Englisch

Morphological Analysis for English texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenEnglisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/xmlXTML-Datei
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
TEILicht-align Collating
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
align: Pseudo-alignment using Phonetic Transcription or Orthographic Information
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-guess Analyzing
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
guess: language-detection
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-identify Identifying
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
identify adding and removing XML IDs
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-normalize Converting
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
normalize: OrthoNormal-like Normalization of orthography
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-pos Annotieren
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
pos: POS-Tagging with the TreeTagger
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-segmentize Converting
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
segmentize: segmentation according to transcription conventions
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-text2iso Converting
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
text2iso: converting plain text in Simple EXMARaLDA format to ISO-TEI-annotated texts
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/plain; format-variant=exmaraldaSimple EXMARaLDA transcription
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-text2seg Converting
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
text2seg: converting plain text in Simple EXMARaLDA format to ISO-TEI-annotated texts, combined with segmentation according to transcription standards
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Lizenzen
Dateiformate und Sprachen
- application/plain; format-variant=exmaraldaSimple EXMARaLDA transcription
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TEILicht-unidentify Identifying
RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:
unidentify: removing XML IDs
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- untertützt mehrsprachige Dokumente
- akzeptiert jede Sprache
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
- application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
- application/tei+xmlTEI-P5-konformes XML
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer)
- inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert)
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
- Bernhard Fisseni (Developer)
- Thomas Schmidt (Developer)
Hoster
Nutzungseinschränkungen für Nutzer*innen
TermoPL Extracting: Polnisch

TermoPL is a tool for automated extraction of terminology from Polish texts.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenPolnisch
- text/plainPlain-Text-Datei
- application/mswordMicrosoft-Word-Datei
- application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
- application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
- application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
- application/vnd.oasis.opendocument.textOpenDocument-Textdatei
- application/pdfAdobe-PDF-Datei
- text/htmlHTML-Datei
- text/rtfTextverarbeitungsdatei im Rich Text Format
- application/jsonJSON-Daten
Anwendungstyp
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intomasz.walkowiak@pwr.edu.pl, Tomasz Walkowiak
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Datenübertragung: Verschlüsselung
Datenschutzrichtlinie
Authentifizierung
Autor*innen
Clarin-PL
Hoster
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
TextGrid Laboratory Bearbeiten: Deutsch, Englisch
Mit dem TextGridLab, einem kostenlosen Softwarepaket, können Sie auf Werkzeuge und Dienste zur Erstellung, Verwaltung und Bearbeitung von Forschungsdaten zugreifen. Die Open-Source-Software ist der Einstieg in die virtuelle Forschungsumgebung. Sie ist für Windows, Mac OS X und Linux erhältlich und bietet eine differenzierte Verwaltung von Zugriffsrechten innerhalb der geschützten Forschungsumgebung. Das TextGridLab ist optimiert für die XML/TEI-Entwicklung, z.B. im Zusammenhang mit digitalen Editionen.
Zu den Funktionen des **TextGridLab** gehören zum Beispiel
-
ein Editor für Text und XML mit WYSIWYG-Funktionalität - eine integrierte Unicode-Zeichentabelle aus dem Unicode-Zeichensatz
-
ein Text-Bild-Link-Editor - das Wörterbuch-Suchwerkzeug - der MEISE-Editor.
Zur Infrastruktur gehören eine leistungsfähige Projekt- und Benutzerverwaltung, ein Projekt-Browser/Navigator, ein Suchwerkzeug, Metadaten-Editor, Aggregation Composer, Import/Export-Werkzeug, Revisionen und Veröffentlichung der Sammlung (im Repository), unterstützt durch eine automatisierte Metadaten-Validierung.
TextGrid Lab wird genutzt von deutschen Forschern in verschiedenen Forschungsnetzwerken und Editionsprojekten, wie zum Beispiel:
-
Hybrid-Ausgabe der Hefte von Theodor Fontane (Fontane-Forschungsstelle der Universität Göttingen) - Textdatenbank und Wörterbuch der klassischen Maya (Universität Bonn) - die Bibliothek der Neologie (Universität Münster).
(siehe https://textgrid.de/en/web/guest/kooperationsprojekte)
TextGridLab TextGrid war ein Projekt von zehn Partnern, gefördert durch das Bundesministerium für Bildung und Forschung (BMBF) für den Zeitraum von Juni 2012 bis Mai 2015 (Förderkennzeichen: 01UG1203A). Seit 2016 ist TextGrid Teil der Forschungsinfrastruktur DARIAH-DE.
Kurzbeschreibung
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- SprachenDeutsch, Englisch
- text/plainPlain-Text-Datei
- application/xmlXTML-Datei
- image/tiff
- application/xml+tei, Schema
Anwendungstyp
Netzwerk- bzw. Sicherheitsanforderungen
- Prozessor32 / 64 bit
- BetriebssystemWindows, macOS, Linux, Linux
- LaufzeitumgebungJava Runtime Environment, JRE Version 6
- Installationslizenzhttps://textgrid.liferay.de.dariah.eu/en/web/guest/terms-of-use
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*infunk@sub.uni-goettingen.de, veentjer@sub.uni-goettingen.de, philipp.wieder@gwdg.de,
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
- TextGrid Research Association, Responsibilities
- Ubbo Veentjer
- Stefan Funnk
- Thorsten Vitt
- Philipp Wieder
Hoster
- SUB, Göttingen Germany
- GWDG, Göttingen Germany
Teil einer Anwendungssuite
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
TextGrid Repository Portal Archivieren
Das TextGrid Repository ist ein Langzeitarchiv für geisteswissenschaftliche Forschungsdaten. Es liefert einen umfangreichen, durchsuch- und nachnutzbaren Bestand an Texten und Bildern. An den Grundsätzen von Open Access und den FAIR-Prinzipien orientiert, wurde das TextGrid Repository 2020 mit dem CoreTrustSeal versehen. Für Forschende bietet das TextGrid Repository eine nachhaltige, dauerhafte und sichere Möglichkeit, zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche Metadaten. Mehr zum Thema Nachhaltigkeit, FAIR und Open Access im Mission Statement des TextGrid Repository.
Dokumentation
Beschreibung der Zielgruppe und ihrer Größe
Dateiformate und Sprachen
- application/xml+tei, Schema
- text/plainPlain-Text-Datei
- application/epub+zip
- text/htmlHTML-Datei
- application/zipZIP-Archiv
Lokalisierung
Anwendungstyp
Entwicklerdokumentation
Datenblatt (Fact sheet)
Ansprechpartner
- technische*r Ansprechpartner*intextgrid-support@gwdg.de,
- inhaltliche*r Ansprechpartner*insupport@de.dariah.eu, https://de.dariah.eu,
Version
Kategorie
Unterkategorie
Forschungstätigkeit
Quellcode verfügbar
Authentifizierung
Autor*innen
Hoster
- Göttingen State and University Library (SUB), Göttingen Germany
- Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany
Nutzungseinschränkungen für Nutzer*innen
zulässige Länder
TF-IDF Analyzing: Polnisch

TF, I