Diensteliste

Anwendungsbeschreibungen

Status der zugrundeliegenden Infrastrukturkomponenten

Dienste und Werkzeuge, die zentral angeboten werden, müssen verlässlich und verfügbar sein. Unten ein erster Eindruck dazu, wie der Status der Infrastrukturkomponenten im Moment ist. Die Grafik visualisiert interaktiv, welche Dienste derzeit im Betrieb sind, so dass sie jederzeit verwendet werden können.

HTTP CLARIN-D project wiki UP

141.58.160.14

HTTP OK: HTTP/1.1 302 Found - 509 bytes in 0.004 second response time

WebLicht POSTags Lemmas FR UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.050 second response time

SRU/CQL-15 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

OAI-PMH-13 UP

www.meertens.knaw.nl

OAI-PMH OK: valid XML

OAI-PMH-4 UP

www.ids-mannheim.de

OAI-PMH OK: valid XML

WebLicht POSTags Lemmas DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

OAI-PMH-3 UP

hdl.handle.net

OAI-PMH OK: valid XML

OAI-PMH-33 UP

www.clarin-lt.lt

OAI-PMH OK: valid XML

OAI-PMH-42 UP

clarin.eurac.edu

OAI-PMH OK: valid XML

OAI-PMH-10 UP

www.huygens.knaw.nl

OAI-PMH OK: valid XML

CLARIN-D project web site UP

141.58.160.14

HTTP OK: HTTP/1.1 200 OK - 66063 bytes in 0.167 second response time

HTTP UP

fedora.dwds.de

HTTP OK: HTTP/1.1 301 Moved Permanently - 534 bytes in 0.106 second response time

MorphoDiTa UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.155 second response time

OAI-PMH-62 UP

trolling.uit.no

OAI-PMH OK: valid XML

BASWebService UP

clarin.phonetik.uni-muenchen.de

HTTP OK: HTTP/1.1 200 200 - 304618 bytes in 7.232 second response time

OAI-PMH-51 DOWN

www.humlab.lu.se

OAI-PMH CRITICAL: HTTPSConnectionPool(host='archive.humlab.lu.se', port=443): Max retries exceeded with url: /flat/oai2?verb=Identify (Caused by NewConnectionError(': Failed to establish a new connection: [Errno 113] No route to host',))

WebLicht Lemmas EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

Web Server UP

HTTP OK: HTTP/1.1 200 OK - 10643 bytes in 0.048 second response time

OAI-PMH-36 UP

www.cedifor.de

OAI-PMH OK: valid XML

SRU/CQL-39 UP

cocoon.huma-num.fr

SRU/CQL OK: valid XML

WebLicht POSTags Lemmas EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

OAI-PMH-47 UP

worldviews.gei.de

OAI-PMH OK: valid XML

HTTPS UP

134.94.199.148

HTTP OK: HTTP/1.1 302 Found - 1077 bytes in 0.041 second response time

OAI-PMH-46 UP

www.sadilar.org

OAI-PMH OK: valid XML

SRU/CQL-6 UP

hdl.handle.net

SRU/CQL OK: valid XML

Automatic Transcription of Dutch Speech Recordings (Wav file) WARNING

github.com

HTTP WARNING: HTTP/1.1 404 Not Found - 289 bytes in 0.146 second response time

spaCy NEL UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.126 second response time

Spejd UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.153 second response time

SRU/CQL-35 UP

www.ids-mannheim.de

SRU/CQL OK: valid XML

LINDAT Translation UP

lindat.mff.cuni.cz

HTTP OK: HTTP/1.1 200 OK - 22444 bytes in 0.072 second response time

Inkluz UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.166 second response time

CMDI Explorer UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 200 OK - 1827 bytes in 0.056 second response time

SRU/CQL-1 UP

www.sfs.uni-tuebingen.de

SRU/CQL OK: valid XML

OAI-PMH-OAI-PMH provider UP

OAI-PMH OK: valid XML

SRU/CQL-31 UP

www.bbaw.de

SRU/CQL OK: valid XML

handle document access /11858/00-1778-0000-0005-896C-F UP

HTTP OK: HTTP/1.1 301 - 183 bytes in 0.138 second response time

Voyant Tools UP

voyant-tools.org

HTTP OK: HTTP/1.1 200 - 6125 bytes in 0.643 second response time

WebLicht Morphology DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.052 second response time

DARIAH-DE Geo-Browser (KML) UP

de.dariah.eu

HTTP OK: HTTP/1.1 200 OK - 6446 bytes in 0.060 second response time

WebLicht Dep Parsing EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

OAI-PMH-17 UP

www.kielipankki.fi

OAI-PMH OK: valid XML

spaCy monolingual NER and NEL UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.126 second response time

SRU/CQL-34 WARNING

www.korpus.cz

SRU/CQL WARNING: XSD validation failed :4:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element '{http://www.loc.gov/zing/srw/}record': Missing child element(s). Expected is ( {http://www.loc.gov/zing/srw/}recordSchema ). :7:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element '{http://www.loc.gov/zing/srw/diagnostic/}diagnostic': This element is not expected. Expected is ( {http://docs.oasis-open.org/ns/search-ws/diagnostic}diagnostic ).

OAI-PMH-37 DOWN

www.meertens.knaw.nl

OAI-PMH CRITICAL: HTTP Response 503

SRU/CQL-12 UP

www.ids-mannheim.de

SRU/CQL OK: valid XML

OAI-PMH-8 UP

www.corpora.uni-hamburg.de

OAI-PMH OK: valid XML

OAI-PMH-5 UP

archive.mpi.nl

OAI-PMH OK: valid XML

Concraft -> Nerf UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.081 second response time

SRU/CQL-30 UP

www.bbaw.de

SRU/CQL OK: valid XML

NER NLTK UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.159 second response time

WebLicht Advanced Mode UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.053 second response time

SRU/CQL-26 UP

www.bbaw.de

SRU/CQL OK: valid XML

OAI-PMH-31 UP

clarino.uib.no

OAI-PMH OK: valid XML

SRU/CQL-9 UP

www.bbaw.de

SRU/CQL OK: valid XML

WebSty UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.144 second response time

WebLicht NamedEntities DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.052 second response time

handle resolving /11858/00-1778-0000-0005-896C-F?noredirect UP

HTTP OK: HTTP/1.1 200 - 2065 bytes in 0.454 second response time

OAI-PMH-2 UP

repo.data.saw-leipzig.de

OAI-PMH OK: valid XML

WebLicht Morphology EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.052 second response time

WebLicht Const Parsing DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.080 second response time

SRU/CQL-22 UP

ivdnt.org

SRU/CQL OK: valid XML

SRU/CQL-SRU/FCS server UP

SRU/CQL OK: valid XML

handle resolving /11022/0000-0000-20E2-C?noredirect UP

HTTP OK: HTTP/1.1 200 - 3058 bytes in 0.236 second response time

SRU/CQL-24 UP

www.bbaw.de

SRU/CQL OK: valid XML

Concraft -> Sentipejd UP

iis.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.086 second response time

HTTPS UP

HTTP OK: HTTP/1.1 200 OK - 492 bytes in 0.095 second response time

CLARIN VLO [UI][prod] UP

vlo.clarin.eu

HTTP OK: HTTP/1.1 200 OK - 3032 bytes in 0.077 second response time

WebLicht POSTags Lemmas IT UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.055 second response time

Morfeusz 2 UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.154 second response time

Concraft UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.083 second response time

SRU/CQL-40 DOWN

www.sfs.uni-tuebingen.de

SRU/CQL CRITICAL: HTTP Response403

Automatic Transcription of Dutch Speech Recordings (Ogg file) WARNING

github.com

HTTP WARNING: HTTP/1.1 404 Not Found - 289 bytes in 0.064 second response time

HTTP UP

134.94.199.149

HTTP OK: HTTP/1.1 301 Moved Permanently - 541 bytes in 0.012 second response time

SRU/CQL-32 UP

www.bbaw.de

SRU/CQL OK: valid XML

SRU/CQL-36 UP

clarin.dk

SRU/CQL OK: valid XML

HTTP UP

clarin.eu

HTTP OK: HTTP/1.1 200 OK - 3032 bytes in 0.035 second response time

SRU/CQL-13 UP

www.ids-mannheim.de

SRU/CQL OK: valid XML

Concraft -> Bartek -> NicolasSummarizer UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.084 second response time

handle document access /11022/0000-0000-20E2-C UP

HTTP OK: HTTP/1.1 200 OK - 12646 bytes in 0.772 second response time

OAI-PMH-16 UP

nlp.pwr.wroc.pl

OAI-PMH OK: valid XML

WebLicht Lemmas DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

OAI-PMH-7 UP

www.bbaw.de

OAI-PMH OK: valid XML

Topic UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.141 second response time

HTTPS UP

clarin.eu

HTTP OK: HTTP/1.1 200 OK - 3032 bytes in 0.088 second response time

WebLicht Const Parsing EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.053 second response time

SRU/CQL-4 DOWN

lindat.cz

SRU/CQL CRITICAL: XML syntax error Opening and ending tag mismatch: body line 2 and font, line 3, column 16 (, line 3)

OAI-PMH-59 UP

dans.knaw.nl

OAI-PMH OK: valid XML

MaltParser UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.144 second response time

SRU/CQL-42 UP

www.ortolang.fr

SRU/CQL OK: valid XML

SRU/CQL-27 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

Concraft -> DependencyParser UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.214 second response time

UDPipe UP

ufal.mff.cuni.cz

HTTP OK: HTTP/1.1 200 OK - 38346 bytes in 0.085 second response time

Distanbol WARNING

www.oeaw.ac.at

HTTP WARNING: HTTP/1.1 400 - 326 bytes in 0.327 second response time

OAI-PMH-28 UP

www.nb.no

OAI-PMH OK: valid XML

OAI-PMH-9 UP

www.ims.uni-stuttgart.de

OAI-PMH OK: valid XML

OAI-PMH-48 UP

repository.de.dariah.eu

OAI-PMH OK: valid XML

OAI-PMH-14 DOWN

www.keeleressursid.ee

OAI-PMH CRITICAL: HTTP Response 404

Serel UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.141 second response time

SRU/CQL-37 UP

ilc4clarin.ilc.cnr.it

SRU/CQL OK: valid XML

spaCy bilingual NER and Geoparsing (for TMX) UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.171 second response time

OAI-PMH-38 UP

www.ru.nl

OAI-PMH OK: valid XML

OAI-PMH-32 UP

ilc4clarin.ilc.cnr.it

OAI-PMH OK: valid XML

SRU/CQL-10 UP

www.corpora.uni-hamburg.de

SRU/CQL OK: valid XML

SRU/CQL-38 UP

www.clarin.lv

SRU/CQL OK: valid XML

Tagger NLTK UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.153 second response time

Fedora Commons repository UP

HTTP OK: HTTP/1.1 200 OK - 3841 bytes in 0.082 second response time

Concraft -> Bartek UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.081 second response time

spaCy bilingual NER (for TMX) UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.126 second response time

WebLicht-Batch UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 200 OK - 1916 bytes in 0.054 second response time

SRU/CQL-7 UP

www.bbaw.de

SRU/CQL OK: valid XML

Handle resolve /10932/00-017B-E190-A83E-6F01-5?noredirect UP

clarin.ids-mannheim.de

HTTP OK: HTTP/1.1 200 - 2225 bytes in 1.534 second response time

CLARIN VCR [UI][prod] UP

clarin.ids-mannheim.de

HTTP OK: HTTP/1.1 200 OK - 2798 bytes in 0.200 second response time

spaCy binlingual NER and NEL (for TMX) UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.125 second response time

OAI-PMH-18 UP

talkbank.org

OAI-PMH OK: valid XML

OAI-PMH-21 DOWN

www.sfs.uni-tuebingen.de

OAI-PMH CRITICAL: HTTP Response 403

OAI-PMH-41 UP

lac.uni-koeln.de

OAI-PMH OK: valid XML

SRU/CQL-28 UP

spraakbanken.gu.se

SRU/CQL OK: valid XML

Handle retrieve /10932/00-017B-E190-A83E-6F01-5 UP

clarin.ids-mannheim.de

HTTP OK: HTTP/1.1 302 - 546 bytes in 0.200 second response time

ReSpa UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.155 second response time

OAI-PMH-11 UP

lindat.cz

OAI-PMH OK: valid XML

Concraft->Spejd UP

zil.ipipan.waw.pl

HTTP OK: HTTP/1.1 200 OK - 8217 bytes in 0.154 second response time

SRU/CQL-21 DOWN

nlp.pwr.wroc.pl

UNKNOWN - Plugin timed out after 10 seconds.

SRU/CQL-11 DOWN

www.ims.uni-stuttgart.de

UNKNOWN - Plugin timed out after 10 seconds.

HTTP UP

HTTP OK: HTTP/1.1 200 OK - 12976 bytes in 0.049 second response time

WebLicht All In One (NL) UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.050 second response time

WoSeDon UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.155 second response time

OAI-PMH-19 UP

llds.ling-phil.ox.ac.uk

OAI-PMH OK: valid XML

WCRFT2 UP

nlp.pwr.wroc.pl

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.155 second response time

OAI-PMH-27 UP

www.clarin.si

OAI-PMH OK: valid XML

spaCy monolingual NER and Geoparsing UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.127 second response time

OAI-PMH-50 UP

clarin.is

OAI-PMH OK: valid XML

OAI-PMH-29 UP

clarino.uib.no

OAI-PMH OK: valid XML

OAI-PMH-49 UP

zim.uni-graz.at

OAI-PMH OK: valid XML

CLARIN OAI-PMH Validator UP

clarin.eu

HTTP OK: HTTP/1.1 200 OK - 588 bytes in 0.287 second response time

TeLeMaCo UP

HTTP OK: HTTP/1.1 200 OK - 6975 bytes in 0.099 second response time

SRU/CQL-16 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

SRU/CQL-29 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

OAI-PMH-43 WARNING

clarin.dk

OAI-PMH WARNING: XSD validation failed :3:0:ERROR:SCHEMASV:SCHEMAV_CVC_PATTERN_VALID: Element '{http://www.openarchives.org/OAI/2.0/oai-identifier}repositoryIdentifier': [facet 'pattern'] The value 'repository.clarin.dk ' is not accepted by the pattern '[a-zA-Z][a-zA-Z0-9\-]*(\.[a-zA-Z][a-zA-Z0-9\-]*)+'. :3:0:ERROR:SCHEMASV:SCHEMAV_CVC_DATATYPE_VALID_1_2_1: Element '{http://www.openarchives.org/OAI/2.0/oai-identifier}repositoryIdentifier': 'repository.clarin.dk ' is not a valid value of the atomic type '{http://www.openarchives.org/OAI/2.0/oai-identifier}repositoryIdentifierType'.

OAI-PMH-30 UP

cocoon.huma-num.fr

OAI-PMH OK: valid XML

HTTPS UP

134.94.199.149

HTTP OK: HTTP/1.1 302 Found - 506 bytes in 0.059 second response time

SRU/CQL-17 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

NLP-HUB (multiple NER tools) UP

www.d4science.org

HTTP OK: HTTP/1.1 302 Found - 698 bytes in 0.202 second response time

Summarize UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.141 second response time

OAI-PMH-45 WARNING

phonotheque.mmsh.huma-num.fr

OAI-PMH WARNING: XSD validation failed :26:0:ERROR:SCHEMASV:SCHEMAV_CVC_PATTERN_VALID: Element '{http://www.openarchives.org/OAI/2.0/oai-identifier}sampleIdentifier': [facet 'pattern'] The value '' is not accepted by the pattern 'oai:[a-zA-Z][a-zA-Z0-9\-]*(\.[a-zA-Z][a-zA-Z0-9\-]*)+:[a-zA-Z0-9\-_\.!~\*'\(\);/\?:@&=\+$,%]+'. :26:0:ERROR:SCHEMASV:SCHEMAV_CVC_DATATYPE_VALID_1_2_1: Element '{http://www.openarchives.org/OAI/2.0/oai-identifier}sampleIdentifier': '' is not a valid value of the atomic type '{http://www.openarchives.org/OAI/2.0/oai-identifier}sampleIdentifierType'. :32:0:ERROR:SCHEMASV:SCHEMAV_ELEMENT_CONTENT: Element '{http://www.openarchives.org/OAI/2.0/oai_dc/}dc': This element is not expected. Expected is ( {http://www.openarchives.org/OAI/2.0/}description ).

Liner2 UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.160 second response time

OAI-PMH-56 UP

www.ortolang.fr

OAI-PMH OK: valid XML

CLARIN Centre Registry [UI][prod] UP

centres.clarin.eu

HTTP OK: HTTP/1.1 200 OK - 3032 bytes in 0.096 second response time

SRU/CQL-3 UP

lindat.cz

SRU/CQL OK: valid XML

OAI-PMH-6 UP

fedora.clarin-d.uni-saarland.de

OAI-PMH OK: valid XML

HTTPS CLARIN-D project wiki UP

141.58.160.14

HTTP OK: HTTP/1.1 301 Moved Permanently - 541 bytes in 0.019 second response time

IMS Fedora Commons UP

141.58.160.14

HTTP OK: HTTP/1.1 200 OK - 4465 bytes in 0.086 second response time

SRU/CQL-44 UP

arche.acdh.oeaw.ac.at

SRU/CQL OK: valid XML

SRU/CQL-8 UP

www.bbaw.de

SRU/CQL OK: valid XML

OAI-PMH-53 UP

www.clarin.lv

OAI-PMH OK: valid XML

WebLicht NamedEntities EN UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

HTTP UP

134.94.199.148

HTTP OK: HTTP/1.1 301 Moved Permanently - 552 bytes in 0.049 second response time

TF-IDF UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.141 second response time

OAI-PMH-57 WARNING

worldviews.gei.de

OAI-PMH WARNING: XSD validation failed :11:0:ERROR:SCHEMASV:SCHEMAV_CVC_DATATYPE_VALID_1_2_3: Element '{http://www.openarchives.org/OAI/2.0/}earliestDatestamp': '' is not a valid value of the union type '{http://www.openarchives.org/OAI/2.0/}UTCdatetimeType'.

OAI-PMH-34 UP

spraakbanken.gu.se

OAI-PMH OK: valid XML

spaCy monolingual NER UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.127 second response time

Iobber UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.164 second response time

Automatic Transcription of Dutch Speech Recordings (MP3 file) WARNING

github.com

HTTP WARNING: HTTP/1.1 404 Not Found - 289 bytes in 0.063 second response time

OAI-PMH-39 UP

www.tekstlab.uio.no

OAI-PMH OK: valid XML

WebLicht All In One (DE) UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.087 second response time

SRU/CQL-14 UP

www.ids-mannheim.de

SRU/CQL OK: valid XML

WebLicht Tokenization TUR UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.051 second response time

OAI-PMH-44 UP

portulanclarin.net

OAI-PMH OK: valid XML

OAI-PMH-63 UP

www.clarin.gr

OAI-PMH OK: valid XML

Sonatype Nexus UP

nexus.clarin.eu

HTTP OK: HTTP/1.1 200 OK - 3032 bytes in 0.098 second response time

OAI-PMH-54 UP

textgridrep.org

OAI-PMH OK: valid XML

Shibboleth SP UP

HTTP OK: HTTP/1.1 302 Found - 1740 bytes in 0.049 second response time

OAI-PMH-12 UP

ivdnt.org

OAI-PMH OK: valid XML

SRU/CQL-5 UP

repo.data.saw-leipzig.de

SRU/CQL OK: valid XML

OAI-PMH-61 UP

arche.acdh.oeaw.ac.at

OAI-PMH OK: valid XML

Text Tonsorium - Advanced mode. UP

cst.dk

HTTP OK: HTTP/1.1 200 - 4930 bytes in 0.199 second response time

Spatial UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.140 second response time

WebLicht Dep Parsing DE UP

weblicht.sfs.uni-tuebingen.de

HTTP OK: HTTP/1.1 302 Found - 1040 bytes in 0.052 second response time

OAI-PMH-35 DOWN

www.polmine.de

TermoPL UP

ws.clarin-pl.eu

HTTP OK: HTTP/1.1 200 OK - 616 bytes in 0.141 second response time

NameTag UP

ufal.mff.cuni.cz

HTTP OK: HTTP/1.1 200 OK - 36032 bytes in 0.069 second response time

SRU/CQL-41 UP

portulanclarin.net

SRU/CQL OK: valid XML

spaCy bilingual NEL (for TMX) UP

github.com

HTTP OK: HTTP/1.1 200 OK - 265 bytes in 0.334 second response time

SRU/CQL-25 UP

www.bbaw.de

SRU/CQL OK: valid XML

Text Tonsorium - Lemmas. UP

cst.dk

HTTP OK: HTTP/1.1 200 - 4930 bytes in 0.243 second response time

SRU/CQL-33 UP

fedora.clarin-d.uni-saarland.de

SRU/CQL OK: valid XML

NagVis access UP

134.94.199.148

HTTP OK: HTTP/1.1 302 Found - 1077 bytes in 0.047 second response time

Data from monitoring.clarin.eu

Liste der über die CLARIAH-DE-Partner zugänglichen Analysewerkzeuge zur Verarbeitung von Forschungsdaten

Dienste, die durch die CLARIAH-DE-Werkzeuge verfügbar sind, sind äußerst vielfältig und werden in verschiedenen Szenarien verwendet. Der Einsatz ist immer vom konkreten Forschungszusammenhang abhängig. Daher werden hier die einzelnen Komponenten mit einer kurzen Beschreibung angezeigt. Die Liste wird fortlaufenden ergänzt. Im Forschungszusammenhang sind einige Werkzeuge auch über die anderen anwendungsbezogenen Menü-Punkte zugänglich. Die Werkzeuge werden von CLARIAH-DE Partnern und verbundenen Institutionen bereitgestellt.
Alpino (Plaintext document (untokenised)) Annotieren: Niederländisch
StatusProduktion

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Lesser General Public License v2.1

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • application/zipZIP-Archiv
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Gertjan van Noord (Rijksuniversieit Groningen)

Hoster

Rijksuniversieit Groningen

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Alpino (Plaintext tokenised input, one sentence per line) Annotieren: Niederländisch
StatusProduktion

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Lesser General Public License v2.1

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • application/zipZIP-Archiv
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Gertjan van Noord (Rijksuniversieit Groningen)

Hoster

Rijksuniversieit Groningen

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Alpino Annotieren: Niederländisch
StatusEntwicklung

Alpino is a dependency parser for Dutch, developed in the context of the PIONIER Project Algorithms for Linguistic Processing, developed by Gertjan van Noord at the University of Groningen. You can upload either tokenised or untokenised files (which will be automatically tokenised for you using ucto), the output will consist of a zip file containing XML files, one for each sentence in the input document.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

LGPL 2.1

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • alpinooutput
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
  • tokoutput

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Gertjan van Noord (University of Groningen), Maarten van Gompel (webservice only, CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Apache Stanbol Enhancer Enriching: Englisch
StatusEntwicklung

Apache Stanbol provides a set of reusable components for semantic content management. A number of EnhancementEngines extract features from passed content, for details see https://stanbol.apache.org. The resulting RDF enhancements are returned in JSON format.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • application/jsonJSON-Daten

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Text Enhancement

Forschungstätigkeit

Enriching

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Apache Foundation (software), Austrian Centre of Digital Humanities (enhancement chains and configuration)

Hoster

Vienna, Austria

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Ariadne Visual Media Service Veröffentlichen
StatusEntwicklung

The Visual Media Service provides easy publication and presentation on the web of complex visual media assets. It is an automatic service that allows to upload visual media files on an server and to transform them into an efficient web format, making them ready for web-based visualization.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • model/prs.ply

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Visualisation of 3D models

Forschungstätigkeit

Veröffentlichen

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Visual Computing Lab of CNR-ISTI

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Automatic Transcription of Dutch Speech Recordings (MP3 file) Speech Recognizing: Niederländisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/mpeg
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Automatic Transcription of Dutch Speech Recordings (Ogg file) Speech Recognizing: Niederländisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/vorbis
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Automatic Transcription of Dutch Speech Recordings (Wav file) Speech Recognizing: Niederländisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in Dutch. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/vnd.wave
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz, Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
CMDI Explorer Exploration
StatusProduktion

The Explorer helps you explore CMDI metadata and process the resources they describe.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • application/x-cmdi+xml
Output
  • application/zipZIP-Archiv

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Metadata Processing

Forschungstätigkeit

Exploration

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

CLARIN-D Centre at the University of Tuebingen, Germany

Hoster

Tuebingen, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Colibri Core (FoLiA XML document) Analyzing
StatusProduktion

A tool for pattern extraction and analysis on corpus data.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • application/octet-streambeliebige Binär-Dateien
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing, Pattern Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Colibri Core (folia+xml) Analyzing: Deutsch, Englisch, Französisch…
StatusEntwicklung

Colibri core is an NLP tool as well as a C++ and Python library for working with basic linguistic constructions such as n-grams and skipgrams (i.e patte rns with one or more gaps, either of fixed or dynamic size) in a quick and memory-efficient way.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch, Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Output
  • Tadpole Columned Output Format
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Colibri Core (Plain text input (tokenised)) Analyzing
StatusProduktion

A tool for pattern extraction and analysis on corpus data.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • text/plainPlain-Text-Datei
Output
  • application/octet-streambeliebige Binär-Dateien
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing, Pattern Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Colibri Core (Plain text input (untokenised)) Analyzing: Deutsch, Englisch, Französisch…
StatusProduktion

A tool for pattern extraction and analysis on corpus data.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
  • text/plainPlain-Text-Datei
Output
  • application/octet-streambeliebige Binär-Dateien
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing, Pattern Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Colibri Core (plain text) Analyzing: Deutsch, Englisch, Französisch…
StatusEntwicklung

Colibri core is an NLP tool as well as a C++ and Python library for working with basic linguistic constructions such as n-grams and skipgrams (i.e patterns with one or more gaps, either of fixed or dynamic size) in a quick and memory-efficient way.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch, Englisch, Deutsch, Französisch, Spanisch, Portugiesisch, Friesisch
  • text/plainPlain-Text-Datei
Output
  • Tadpole Columned Output Format
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing, Pattern Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Collection Registry Sammeln: Deutsch
StatusProduktion
SchlüsselwörterSammlungskatalog

Collection Registry - dient als Katalog von Sammlungen, die im Rahmen von Forschungsprojekten entstanden sind oder als Grundlage für diese dienen. - verknüpft Daten, deren Datenmodelle und die Beschreibung einer Sammlung zur technischen Wiederverwendung durch Dienste wie Such- oder Analysewerkzeuge. - dient auch der Verwaltung von Sammlungsbeschreibungen. Dazu können neben digital zugänglichen auch analoge, geschützte oder Offline-Sammlungen gehören.

		Der Zweck der Collection Registry ist
		- verteilte Sammlungen an einer Stelle zu beschreiben und sie gemeinsam in anderen Diensten (z.B. Generische Suche, Cosmotool) zu bearbeiten.
		- Sammlungen, die sonst nur schwer auffindbar sind, im Sammlungsregister sichtbar zu machen.
		- eigene Sammlungen zu dokumentieren und für andere Wissenschaftler nachweisbar zu machen.
		- um relevante Sammlungen im Sinne eines internen Katalogs verwalten zu können.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars who want to register and catalog collections.

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • application/xmlXTML-Datei, Schema
Output
  • json, application/xml

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Gathering

Forschungstätigkeit

Sammeln

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

DARIAH Identity Provider

Hoster

Fakultät Wirtschaftsinformatik und Angewandte Informatik, Lehrstuhl für Medieninformatik, Universität Bamberg, Bamberg, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft -> Bartek -> NicolasSummarizer Analyzing: Polnisch
StatusProduktion

Java coreference-based summarization tool; its creation was cofunded by the European Union from resources of the European Social Fund -- Project PO KL 'Information technologies: Research and their interdisciplinary applications'. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Textzusammenfassung

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft -> Bartek Analyzing: Polnisch
StatusProduktion

A statistical tool chain for performing Coreference Resolution. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Koreferenzauflösung

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft -> DependencyParser Annotieren: Polnisch
StatusProduktion

The Polish dependency parser is trained on the extended version of the Polish dependency treebank (Składnica zależnościowa) with the publicly available parsing systems – MaltParser or MateParser. MaltParser is a transition-based dependency parser that uses a deterministic parsing algorithm. The deterministic parsing algorithm builds a dependency structure of an input sentence based on transitions (shift-reduce actions) predicted by a classifier. The classifier learns to predict the next transition given training data and the parse history. MateParser, in turn, is a graph-based parser that defines a space of well-formed candidate dependency trees for an input sentence, scores them given an induced parsing model, and selects the highest scoring dependency tree as a correct analysis of the input sentence. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft -> Nerf Analyzing: Polnisch
StatusProduktion

Statistical named entity recognition tool based on linear-chain conditional random fields. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Analyzing, Named Entity Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft -> Sentipejd Analyzing: Polnisch
StatusProduktion

A morphosyntactic tagger extended with a semantic category, expressing properties of positive or negative sentiment. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Sentimentanalyse

Forschungstätigkeit

Analyzing, Sentiment-Analyse

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft Analyzing: Polnisch
StatusProduktion

Morphosyntactic tagger for Polish based on constrained conditional random fields. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Wortklassenannotation

Forschungstätigkeit

Analyzing, POS-Tagging

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Concraft->Spejd Annotieren: Polnisch
StatusProduktion

Tool for partial parsing and rule-based morphosyntactic disambiguation. Part of: Multiservice, a robust linguistic Web service for Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • text/htmlHTML-Datei
Output
  • application/jsonJSON-Daten
  • CoNLL format
  • Visualization

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

flache syntaktische Analyse

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Computer Science, Polish Academy of Sciences, Poland

Hoster

Warsaw, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
ConedaKOR Archivieren
StatusProduktion
SchlüsselwörterWeb-based database system, graphbasierte Architektur

ConedaKOR erleichtert die Verwaltung und Präsentation akademischer Sammlungen von Objekten aus den bildbasierten Kultur- und Geisteswissenschaften. Sie erlaubt es, beliebige Dokumente zu speichern und sie mit Beziehungen zu verknüpfen. Sie können riesige semantische Netzwerke für eine unbegrenzte Anzahl von Domänen aufbauen. ConedaKOR integriert ein hochentwickeltes Ontologie-Verwaltungstool mit einer einfach zu bedienenden Mediendatenbank.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

The purpose of ConedaKOR is the administration and presentation of academic object collections from image-based cultural and human sciences.

Dateiformate und Sprachen

Anwendungstyp

Web-UI

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • Prozessor2

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Archivierung

Forschungstätigkeit

Archivieren, Veröffentlichen

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

DAASI, Tübingen, Germany

Teil einer Anwendungssuite

ConedaKOR

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Content Search Suchen
StatusProduktion

The CLARIN Content Search is a simple service that enables researchers to search for specific patterns across collections of data. The service is powered by a search engine that connects to the local data collections that are available in the centres. The data itself stays at the centre where it is hosted – therefore the underlying technique is called federated content search. The service summarizes and displays what is available. An easy next step is to go to the centre's specialised search interface to perform a more sophisticated query.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • Sprachengeneric
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infcs@clarin.eu, Content Search Contact

Version

Kategorie

Forschungssoftware

Unterkategorie

Dictionary

Forschungstätigkeit

Suchen

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

https://contentsearch.clarin.eu/ws/fcs/2.0/aggregator/about

Hoster

Utrecht, Netherlands

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
COSMAS II Suchen
StatusTestbetrieb

COSMAS II ist eine am IDS konzipierte Datenbank (Corpus Search, Management and Analysis System) für die korpusbasierte Erforschung der Sprache

  • in umfangreichen Korpora (über 13 Mrd. Wortformen, zur Verfügung gestellt vom Projekt DEREKO);
  • in linguistisch und strukturell annotierten Korpora; z.B. Wortklassen (über 1,7 Mrd. Nomen), Überschriften etc.;
  • in benutzerdefinierten Korpusquerschnitten (anhand von bis zu acht bibliografischen Kriterien);
  • in unterschiedlichen Sprachkorpora mit eigenen Tagsets, die in einem grafischen Assistenten eingebettet sind;
  • mittels zahlreicher Such-, Abstands- und Bereichsoperatoren, die einfache bis komplexe Sachverhalte bzw. grammatikalische Muster formulieren können.

Die Ergebnisse werden

  • anhand von bibliografischen Kriterien zusammengefasst und sortiert;
  • mittels Häufigkeitsmaßen in Bezug auf ihre Verteilung bewertet;
  • mittels einer Kookkurrenzanalyse analysiert, sortiert und tabellarisch dargestellt;
  • als KWIC und Belege sortiert, analysiert und präsentiert;
  • (auf Wunsch) mittels eines Zufallsgenerators auf eine repräsentative überschaubare Menge reduziert.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die sich mit dem Gegenwartsdeutschen beschäftigen

Dateiformate und Sprachen

Input
  • text/plain+cosmas2Cosmas II Anfrage
Output
  • application/rtf
  • text/plainPlain-Text-Datei

Lokalisierung

Deutsch

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Suche

Forschungstätigkeit

Suchen

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

Proprietär

Autor*innen

  • Franck Bodmer Mory (Developer) [GND]
  • Helge Stallkamp (Developer) [GND]

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

CosmoTool Spatial Analysis: Deutsch
StatusEntwicklung
SchlüsselwörterBiographische Information

CosmoTool ist ein digitales Werkzeug, das biographische Informationen aus verschiedenen Quellen zu inter- und nationalen Bewegungsprofilen historischer Persönlichkeiten kombiniert. Daraus sollen Rückschlüsse auf Merkmale und Regeln gezogen werden, die als internationale Kriterien angesehen werden können. Das CosmoTool basiert auf der Verbandsarchitektur von DARIAH-DE und erlaubt die Extraktion von Daten aus unstrukturiertem Text. Zur Zeit befindet sich CosmoTool in der Entwicklungsphase und bietet noch eingeschränkte Funktionalität.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars who want to research historical personalities.

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • application/xmlXTML-Datei
  • json
  • txt/csv
Output
  • json

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Spatial Analysis

Datenübertragung: Verschlüsselung

link

Datenschutzrichtlinie

link

Authentifizierung

DFN Identity Provider

Hoster

Fakultät Wirtschaftsinformatik und Angewandte Informatik, Lehrstuhl für Medieninformatik, Universität Bamberg, Bamberg, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
CSTLemma (hosted by D4Science) Analyzing: Englisch
StatusProduktion

This is an experimental integration of a D4Science NLP processing service (CSTLemma). The CSTLemma Lemmatizer for English reduces all words in a text to their base form, the lemma.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Lemmatisierung

Forschungstätigkeit

Analyzing, Lemmatizing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Bart Jongejan (tool), D4Science staff (WAR upload)

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Cyril Belica: Kookkurrenzdatenbank CCDB Analyzing
StatusTestbetrieb
SchlüsselwörterCollocation Analysis, Datenbank

Vor dem Hintergrund eines korpusgeleiteten empirisch-linguistischen Ansatzes ist es von grundlegender Bedeutung, eine wissenschaftsmethodisch kohärente Methodik zu konzipieren, die es ermöglicht, die im Sprachgebrauch manifesten emergenten Strukturen systematisch aufzudecken, zu inventarisieren, zu interpretieren und theoretisch zu begründen. Als empirische Basis für dieses Forschungsvorhaben wurde im Programmbereich Korpuslinguistik des Leibniz-Instituts für Deutsche Sprache auf der Grundlage eines Korpus geschriebener Gegenwartssprache von ca. 2,2 Milliarden laufenden Textwörtern eine große Sammlung von Kookkurrenzprofilen zu ca. 220.000 verschiedenen Lemmata aufgebaut. Die Sammlung enthält zu jedem Lemma die Ergebnisse von bis zu fünf verschiedenen Kookkurrenzanalysen in Form von Hierarchien von ähnlichen Verwendungen, mit bis zu 100.000 Verwendungsbeispielen pro Lemma und Analyse.

            Durch die explorative Analyse dieses Sprachmaterials geleitet bemühen wir uns, neue Einsichten in die Strukturen, Gesetzmäßigkeiten, Eigenschaften und Funktionen von Sprache zu erlangen. Derzeit konzentrieren wir uns dabei auf Themenbereiche wie Ähnlichkeit von Kookkurrenzprofilen und semantische Nähe, auf die Wechselbeziehungen zwischen lokalen, lexikalischen und globalen, situativen Kontexten und auf diverse Untersuchungen zur Quasisynonymie.
            
            Über diese Webseite möchten wir Teile unserer Denk- und Experimentierplattform im Sinne eines "gläsernen Labors" auch allen interessierten Fachkollegen zugänglich machen.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die sich mit dem Gegenwartsdeutschen beschäftigen

Dateiformate und Sprachen

Input
  • text/plain; format-variant=ccdbCCDB Anfrage
Output
  • image/svg+xml
  • image/x-wmf
  • text/htmlHTML-Datei

Lokalisierung

Deutsch

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Collocation Analysis

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

Proprietär

Autor*innen

Cyril Belica (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

D4Science NER (GATE's Annie) Analyzing: Englisch
StatusEntwicklung

This is an experimental integration of a D4Science NLP processing service (based on GATE's ANNIE). This service identifies names of persons, locations, organizations, as well as money amounts, time and date expressions in English texts automatically.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Analyzing, Named Entity Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

D4Science staff

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Constituency Parsing DE Annotieren: Deutsch
StatusProduktion
SchlüsselwörterParsing

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Konstituentenparsing

Forschungstätigkeit

Annotieren, Parsing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Constituency Parsing EN Annotieren: Englisch
StatusProduktion
SchlüsselwörterParsing

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Konstituentenparsing

Forschungstätigkeit

Annotieren, Parsing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Depency Parsing DE Annotieren: Deutsch
StatusProduktion
SchlüsselwörterParsing

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Depency Parsing EN Annotieren: Englisch
StatusProduktion
SchlüsselwörterParsing

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Hyphenation DE Analyzing: Deutsch
StatusProduktion
SchlüsselwörterCleanup

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Cleanup

Forschungstätigkeit

Analyzing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Hyphenation EN Analyzing: Englisch
StatusProduktion
SchlüsselwörterCleanup

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Cleanup

Forschungstätigkeit

Analyzing

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Named Entity Recognition DE Annotieren: Deutsch
StatusProduktion
SchlüsselwörterNER

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: Named Entity Recognition EN Annotieren: Englisch
StatusProduktion
SchlüsselwörterNER

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: POS-Tagging und Lemmatization DE Annotieren: Deutsch
StatusProduktion
SchlüsselwörterPOS, Lemma

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Wortklassenannotation, Lemmatisierung

Forschungstätigkeit

Annotieren

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH DKPro-Wrapper: POS-Tagging und Lemmatization EN Annotieren: Englisch
StatusProduktion
SchlüsselwörterPOS, Lemma

Der DARIAH DKPro Wrapper ist ein Wrapper für DKPro Core, einem Werkzeug für linguistische Annotation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei
Output
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Arbeitsspeicherbedarf4GB
  • LaufzeitumgebungJava 1.8 or higher, 64bit

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Wortklassenannotation, Lemmatisierung

Forschungstätigkeit

Annotieren

Quellcode verfügbar

Authentifizierung

Autor*innen

Hoster

Teil einer Anwendungssuite

DARIAH-DE DKPro-Wrapper

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH-DE Geo-Browser (CSV) Data Visualization
StatusProduktion

The DARIAH-DE Geo-Browser allows a comparative visualization of several requests and facilitates the representation of data and their visualization in a correlation of geographic spatial relations at corresponding points of time and sequences. Thus, researchers can analyze space-time relations of data and collections of source material and simultaneously establish correlations between them.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

LGPL-3.0-or-later

Dateiformate und Sprachen

Input
  • text/csvTabularische Daten, kommasepariert
  • text/comma-separated-value
  • application/vnd.dariahde.geobrowser.csv
Output
  • nonekeine

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v3.6

Kategorie

Forschungssoftware

Unterkategorie

Visualisation of Geographic Data

Forschungstätigkeit

Data Visualization

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

DARIAH-DE

Hoster

Göttingen, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH-DE Geo-Browser (KML) Analyzing
StatusProduktion

The DARIAH-DE Geo-Browser allows a comparative visualization of several requests and facilitates the representation of data and their visualization in a correlation of geographic spatial relations at corresponding points of time and sequences. Thus, researchers can analyze space-time relations of data and collections of source material and simultaneously establish correlations between them.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

LGPL-3.0-or-later

Dateiformate und Sprachen

Input
  • application/vnd.google-earth.kml+xml
  • application/vnd.google-earth.kmz
  • application/vnd.dariahde.geobrowser.kml+xml
Output
  • nonekeine

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v3.6

Kategorie

Forschungssoftware

Unterkategorie

Visualisation of Geographic Data

Forschungstätigkeit

Analyzing, Data Visualization

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

DARIAH-DE

Hoster

Göttingen, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH-DE GeoBrowser Entdecken: Deutsch, Englisch
StatusProduktion
SchlüsselwörterVisualisierung und Exploration

Der DARIAH-DE Geo-Browser ermöglicht eine vergleichende Visualisierung mehrerer Abfragen und erleichtert die Darstellung von Daten und deren Visualisierung in einer Korrelation von geographischen Raumbeziehungen zu entsprechenden Zeitpunkten und Sequenzen.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Dateiformate und Sprachen

Input
  • SprachenDeutsch, Englisch
  • text/csvTabularische Daten, kommasepariert
  • application/vnd.google-earth.kml+xml
  • application/vnd.google-earth.kmz

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Visualization

Forschungstätigkeit

Entdecken

Authentifizierung

Autor*innen

Hoster

  • SUB, Göttingen Germany
  • GWDG, Göttingen Germany

Teil einer Anwendungssuite

GeoBrowser

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DARIAH-DE Publikator Veröffentlichen
StatusProduktion
SchlüsselwörterAdministration of research collections

Der DARIAH-DE Publikator bietet die Möglichkeit, Forschungsdaten für einen Import in das DARIAH-DE Repository vorzubereiten, sie zu beschreiben, zu verwalten und schließlich in das Repository einzuspielen und somit für andere Forschenden auffindbar und nachnutzbar zu machen.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Researchers who want to digitally store and archive human and cultural-scientific research data.

Dateiformate und Sprachen

Lokalisierung

Deutsch, Englisch

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Editing

Forschungstätigkeit

Veröffentlichen

Authentifizierung

DFN Identity Provider

Autor*innen

Hoster

  • Göttingen State and University Library (SUB), Göttingen Germany
  • Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
DARIAH-DE Repository Veröffentlichen
StatusProduktion
SchlüsselwörterResearch Repository, Langzeitarchivierung

Der Einstiegspunkt zum Einspielen von Kollektionen und Daten in das DARIAH-DE Repository ist der DARIAH-DE Publikator, der Ihnen die Möglichkeit bietet, Ihre Kollektionen für einen Import in das DARIAH-DE Repository vorzubereiten, zu verwalten, und diese schließlich in das Repository einzuspielen.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Geisteswissenschaftlerinnen und Geisteswissenschaftler, die ihre Daten in einer nachhaltigen Umgebung bearbeiten, speichern und veröffentlichen wollen.

Dateiformate und Sprachen

Output
  • application/xml+tei
  • text/plainPlain-Text-Datei
  • application/epub+zip
  • text/htmlHTML-Datei
  • application/zipZIP-Archiv

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Archivierung

Forschungstätigkeit

Veröffentlichen, Archivieren

Authentifizierung

DFN Identity Provider

Autor*innen

DARIAH-DE Association, Responsibilities

Hoster

  • Göttingen State and University Library (SUB), Göttingen Germany
  • Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
Data Modelling Environment (DME) Modellieren: Deutsch
StatusProduktion
SchlüsselwörterMetadatenmodellierung und -mapping

Die Datenmodellierungsumgebung (DME) von DARIAH-DE ist ein Werkzeug zur Modellierung und Assoziierung von Daten. Eine wesentliche Besonderheit der DME ist die forschungsorientierte Ausrichtung und die zugrundeliegenden Konzepte für die Explikation von Domänenwissen.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars who want to modeling of data structures and relations between them.

Lizenzen

CC-BY

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/xmlXML-Datei
  • text/json
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei
Output
  • text/xmlXML-Datei
  • text/json
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Modeling

Forschungstätigkeit

Modellieren

Datenübertragung: Verschlüsselung

link

Datenschutzrichtlinie

link

Authentifizierung

DARIAH Identity Provider

Hoster

Fakultät Wirtschaftsinformatik und Angewandte Informatik, Lehrstuhl für Medieninformatik, Universität Bamberg, Bamberg, Germany

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Deutsches Textarchiv Archivieren: Deutsch
StatusProduktion

Das Deutsche Textarchiv stellt einen disziplinen- und gattungsübergreifenden Grundbestand deutschsprachiger Texte mit einem Schwerpunkt ab dem frühen 16. bis zum frühen 20. Jahrhundert bereit. Das DTA ist das größte Einzelkorpus historischer neuhochdeutscher Texte für den Zeitraum vom 16. bis zum frühen 20. Jahrhundert und umfasst mehr als 350 Millionen Marken auf 1,34 Millionen digitalisierten Seiten. Der Schwerpunkt des DTA liegt auf (digitalisierten) Druckschriften, doch umfasst das DTA auch eine wachsende Zahl handschriftlicher Dokumente. Zu den speziellen Teilkorpora gehören historische Zeitungen und andere Zeitschriften. Das DTA als Ganzes umfasst eine reiche Vielfalt von Belletristik und Sachbüchern, wobei letztere sowohl akademische als auch nicht-akademische Schriften umfassen.

            Das DTA besteht aus dem sogenannten DTA-Kernkorpus (DTAK, "DTA-Kernkorpus") mit ca. 1500 Erstausgaben aus dem 16. bis 19. Jahrhundert. 
            Zusätzlich enthält das Modul DTA-Erweiterungen (DTAE) Fachkorpora und Einzeltexte, die im Rahmen von CLARIN-D und anderen Projekten kuratiert wurden. 
            Die von Digitalisierungsprojekten und anderen fachspezifischen Initiativen bereitgestellten Volltextquellen wurden (manuell oder halbautomatisch) in ein 
            TEI-kompatibles XML-Format nach den Richtlinien des DTA-Basisformats (DTABf, "DTA Base Format") konvertiert, einschließlich umfangreicher Metadaten zu den 
            Originalquellen und der Datenaufbereitung. OCR-Texte im DTA Core Corpus - sowie zahlreiche zusätzliche Textressourcen - wurden manuell korrigiert. 
            Ein kontinuierlicher Qualitätssicherungsprozess wird durch die kollaborative webbasierte Plattform DTAQ mit derzeit rund 2000 registrierten Benutzern ermöglicht. 
            Alle DTA-Korpora werden durch automatisierte computerlinguistische Analyseverfahren für den Nutzerkonsum aufbereitet. Dazu gehören nicht nur PoS-Tagging und 
            Lemmatisierung, sondern unter anderem auch die orthographische Normalisierung historischer Schreibvarianten, so dass die Nutzer Abfragen in moderner Orthographie 
            formulieren können.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Das Angebot des DTA als Textsammlung, Publikations- und Forschungsplattform richtet sich sowohl an Nutzer*innen als auch an Produzent*innen von Forschungsdaten aus allen Gebieten der textbasierten Forschung, darunter insbesondere Literaturwissenschaft, Germanistik, allgemeine Philologien, Linguistik, Computerlinguistik, Religionswissenschaft, Kirchengeschichte, Philosophie, Bildungsforschung, Geschichtswissenschaft, Geschichte einzelner Disziplinen (z.B. Medizin) und Wissenschaftsgeschichte allgemein.

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema
Output
  • text/plainPlain-Text-Datei
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema
  • application/xhtml+xmlXHTML-Datei, Schema

Lokalisierung

Deutsch

Anwendungstyp

Web-UI

Netzwerk- bzw. Sicherheitsanforderungen

  • BetriebssystemLinux

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*inwiegand@bbaw.de, Frank Wiegand (Developer)
  • inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache) [GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Archivierung, Publishing

Forschungstätigkeit

Archivieren, Veröffentlichen

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Hoster

Berlin-Brandenburgische Akademie der Wissenschaften, Berlin, Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
Deutsches Textarchiv – Qualitätssicherung Archivieren: Deutsch
StatusProduktion

Kollaborative Qualitätssicherung im Deutschen Textarchiv DTAQ (Deutsches Textarchiv – Qualitätssicherung) ist eine webbasierte Anwendung, um in XML/TEI-annotierten Textdigitalisaten verschiedene Arten von Fehlern zu finden, zu kategorisieren und zu korrigieren. Die Oberfläche von DTAQ ist durch jeden Nutzer individuell anpassbar, so dass verschiedene Ansichten der Quelldigitalisate und Texttranskriptionen einstellbar sind.

DTAQ ist nach der Registrierung frei für jeden nutzbar.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Das Angebot des DTA als Textsammlung, Publikations- und Forschungsplattform richtet sich sowohl an NutzerInnen als auch an ProduzentInnen von Forschungsdaten aus allen Gebieten der textbasierten Forschung, insbesondere darunter Literaturwissenschaft, Germanistik, allgemeine Philologien, Linguistik, Computerlinguistik, Religionswissenschaft, Kirchengeschichte, Philosophie, Bildungsforschung, Geschichtswissenschaft, Geschichte einzelner Disziplinen (z.B. Medizin) und Wissenschaftsgeschichte allgemein. Die Plattform DTAQ ermöglicht es registrierten Nutzer*innen, sämtliche Texte innerhalb der Korpusinfrastruktur des DTA zu kommentieren, ggf. verbliebene Fehler über ein versioniertes Ticketsystem zu melden; ‘expert users’ mit entsprechenden Rechten können mithilfe eines Text- und eines XML-Editors die Textressourcen editieren und so auf vielfältige Weise zur Optimierung und tieferen Erschließung der gemeinsamen Korpusbasis beitragen.

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema
Output
  • text/plainPlain-Text-Datei
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema
  • application/xhtml+xmlXHTML-Datei, Schema

Lokalisierung

Deutsch

Anwendungstyp

Web-UI

Netzwerk- bzw. Sicherheitsanforderungen

  • BetriebssystemLinux

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*inwiegand@bbaw.de, Frank Wiegand (Developer)
  • inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache) [GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Archivierung, Publishing

Forschungstätigkeit

Archivieren, Veröffentlichen

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Hoster

Berlin-Brandenburgische Akademie der Wissenschaften, Berlin, Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
DGD – Datenbank für Gesprochenes Deutsch Analyzing
StatusProduktion
SchlüsselwörterCleanup

Die DGD wird für Forschung und Lehre bereitgestellt. Das System ermöglicht Ihnen den Zugriff auf ausgewählte Korpora des Archivs für Gesprochenes Deutsch (AGD), u.a. auf:

  • das "Forschungs und Lehrkorpus gesprochenes Deutsch" (FOLK)

  • das Korpus "Deutsche Mundarten" (Zwirner-Korpus)

  • das Korpus "Deutsche Umgangssprachen" (Pfeffer-Korpus)

  • das Korpus "Gesprochene Wissenschaftssprache Kontrastiv" (GeWiss, GWSS)

  • das Korpus "Deutsch Heute" (DH)

Aus rechtlichen Gründen bitten wir Sie um eine einmalige kostenlose Registrierung.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

am gesprochenen Deutsch Interessierte

Dateiformate und Sprachen

Input
  • text/plain; format-variant=dgdDGD Suchanfrage
Output
  • text/csvTabularische Daten, kommasepariert
  • application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
  • application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*indgd@ids-mannheim.de
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

other

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Autor*innen

Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

nur mit Lizenz
DiaCollo Analyzing: Deutsch, Englisch
StatusProduktion

DiaCollo ist ein Werkzeug für das Auffinden von typischen Wortverbindungen (Kollokationen) zu einem Stichwort in einem bestimmten Zeitraum und die visuell aufbereitete Darstellung der Ergebnisse. Als Kollokation wird eine gemeinsame Verwendung zweier Inhaltswörter bezeichnet, wobei a) das gemeinsame Vorkommen in Texten auffällig, d.h. deutlich häufiger als statistisch erwartbar, ist, und b) die beiden Wörter in einer grammatischen Beziehung zueinander stehen, zum Beispiel als Nomen und modifizierendes Adjektiv (brennbare Flüssigkeit) oder als Koordination von zwei Nomen (Umwelt und Reaktorsicherheit). Eine Kollokation besteht aus einer Basis (auch Stichwort genannt) und einem Kollokator.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Besonders für Forschende aus den Geschichtswissenschaften und den Politikwissenschaften sowie von Philologen und Linguisten kann DiaCollo genutzt werden. Veränderung der Sprache, die sich in einem Bedeutungswandel manifestieren können mit diesem Werkzeug erforscht werden. DiaCollo kann zu Stichworten typische Wortverbindungen (Kollokationen) in einem bestimmten Zeitraum finden. Das Rechercheergebnis kann in unterschiedlicher Weise gefiltert sowie die Suchabfragen spezifiziert und in mehreren visuellen Formen angezeigt und ausgegeben werden. Die gefundenen Wortverbindungen können z.B. für die Analyse eines Bedeutungswandels von Wörtern oder Phrasen genutzt werden. DiaCollo sucht in digitalen Textsammlungen (Korpora), die über das Deutsche Textarchiv (DTA) verfügbar sind. Das visualisierte Rechercheergebnis ist unmittelbar mit der zugrunde liegenden Korpusbasis verbunden, wodurch die Ergebnisse wissenschaftlich nachvollziehbar und verifizierbar sind.

Lizenzen

Perl 5 License

Dateiformate und Sprachen

Input
  • SprachenDeutsch, Englisch
Output
  • text/plainPlain-Text-Datei
  • application/jsonJSON-Daten, Schema
  • application/xhtml+xmlXHTML-Datei, Schema
  • text/tab-separated-valuesTabularische Daten, tabulatorsepariert

Lokalisierung

Deutsch, Englisch

Anwendungstyp

Web-UI

Netzwerk- bzw. Sicherheitsanforderungen

  • BetriebssystemLinux

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*injurish@bbaw.de, Bryan Jurish (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inBryan Jurish (Linguist) [GND]

Wartungsdokumentation

https://metacpan.org/release/DiaColloDB

Version

Kategorie

Forschungssoftware

Unterkategorie

Collocation Analysis

Forschungstätigkeit

Analyzing, Extracting

Quellcode verfügbar

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Autor*innen

Bryan Jurish (Developer) [GND]

Hoster

Berlin-Brandenburgische Akademie der Wissenschaften, Berlin, Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
Distanbol Analyzing: Englisch
StatusProduktion

Distanbol analyses texts semantically. For this, it passes the input text to an Apache Stanbol web service that executes a NLP chain yielding named entities. This is followed by Entity Linking on the text. The resulting enhancements are rendered as human-readable HTML-page. In short, Distanbol is adding a human-readable rendering to the JSON-LD output produced by Stanbol.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • application/xhtml+xmlXHTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Text Enhancement

Forschungstätigkeit

Analyzing, Semantification

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Apache Foundation (software), Austrian Centre of Digital Humanities (enhancement chains and configuration)

Hoster

Vienna, Austria

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
DTA-Basisformat Archivieren: Deutsch
StatusProduktion

Die folgende Darstellung dokumentiert das XML-Basisformat des DTA, welches die Grundlage für die Annotation der DTA-Volltexte bildet. Das DTA-Basisformat folgt den P5-Richtlinien der Text Encoding Initiative (TEI). Da diese Richtlinien jedoch Lösungen für sämtliche Bedürfnisse bei der Textaufbereitung anbieten sollen und daher entsprechend vielfältig und umfangreich sind, bedürfen sie im konkreten Einzelfall einer näheren Spezifikation. Daher wurde aus den P5-Richtlinien für die Textstrukturierung im DTA-Korpus eine Tag-Auswahl getroffen (Tagset), die das DTA-Basisformat bildet. Dieses Tagset ist mit den P5-Richtlinien der TEI vollständig konform; auf Erweiterungen (tei.extensions) durch davon abweichende Elemente wurde verzichtet.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Das DTA-Basisformat ist Teil des Deutschen Textarchivs (DTA). Das Angebot des DTA (und somit auch DTABf) als Textsammlungs-, Publikations- und Forschungsplattform richtet sich sowohl an NutzerInnen als auch an ProduzentInnen von Forschungsdaten aus allen Gebieten der textbasierten Forschung, insbesondere darunter Literaturwissenschaft, Germanistik, allgemeine Philologien, Linguistik, Computerlinguistik, Religionswissenschaft, Kirchengeschichte, Philosophie, Bildungsforschung, Geschichtswissenschaft, Geschichte einzelner Disziplinen (z.B. Medizin) und Wissenschaftsgeschichte allgemein.

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema
Output
  • application/xmlXTML-Datei, Schema
  • application/xmlXTML-Datei, Schema

Lokalisierung

Deutsch, Englisch

Anwendungstyp

not applicable

Netzwerk- bzw. Sicherheitsanforderungen

  • BetriebssystemLinux

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*inhaaf@bbaw.de, Susanne Haaf-Dumont (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inAlexander Geyken (Arbeitsstellenleiter Digitales Wörterbuch der deutschen Sprache) [GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Archivierung, Publishing, Annotating, Transcription

Forschungstätigkeit

Archivieren, Veröffentlichen

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Hoster

Berlin-Brandenburgische Akademie der Wissenschaften, Berlin, Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
English Automatic Speech Recognition System (MP3 file) Speech Recognizing: Englisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • audio/mpeg
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
English Automatic Speech Recognition System (Ogg file) Speech Recognizing: Englisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • audio/ogg
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
English Automatic Speech Recognition System (Wav file) Speech Recognizing: Englisch
StatusProduktion

This webservice uses automatic speech recognition to provide the transcriptions of recordings spoken in English recordings. You can upload and process only one file per project. For bulk processing and other questions, please contact Henk van den Heuvel at h.vandenheuvel@let.ru.nl.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • audio/wav
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Emre Yilmaz (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
EXMARaLDA Annotieren
StatusProduktion
SchlüsselwörterSpeech, Gesprochene Sprache, Transcription

EXMARaLDA ist ein System für das computergestützte Arbeiten mit (vor allem) mündlichen Korpora. Es besteht aus einem Transkriptions- und Annotationseditor (Partitur-Editor), einem Tool zum Verwalten von Korpora (Corpus-Manager) und einem Such- und Analysewerkzeug (EXAKT).

Vorteile des EXMARaLDA-Systems umfassen zum Beispiel:

  • zeitalignierte Transkription von Audio- oder Videodaten;
  • flexible Annotation nach frei wählbaren Analysekategorien;
  • systematische Dokumentation eines Korpus durch Metadaten;
  • flexible Ausgabe von Transkriptdaten in verschiedenen Formen und Formaten (Notation, Dokument);
  • computergestützte Recherche in Transkriptions-, Annotations und Metadaten;
  • interoperabel, da das System mit XML-basierten Dateiformaten arbeitet, die einen Datenaustausch mit anderen Tools (wie Praat, ELAN, Transcriber etc.) sowie eine flexible Verarbeitung und eine nachhaltige Nutzung der Daten ermöglichen.

EXMARaLDA wird weltweit von Forschern in unterschiedlichsten Zusammenhängen zur Analyse gesprochener Sprache eingesetzt, z.B.:

  • Gesprächsforschung (Diskurs- und Konversationsanalyse),
  • Mehrsprachigkeits- und Spracherwerbsforschung,
  • Phonetik und Phonologie
  • Dialektologie und Soziolinguistik.

EXMARaLDA wurde ursprünglich im Teilprojekt "Computergestützte Erfassungs- und Analysemethoden multilingualer Daten" des Sonderforschungsbereichs "Mehrsprachigkeit" (SFB 538) der Universität Hamburg entwickelt. Seit Juli 2011 wird die Entwicklung im Hamburger Zentrum für Sprachkorpora, seit November 2011 in Zusammenarbeit mit dem Archiv für Gesprochenes Deutsch am IDS Mannheim, weitergeführt.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/xml; format-variant=weblicht-tcfDatei im Text Corpus Format (*.tcf)
  • application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)
  • application/xml; format-variant=transcriber-trsTranscriber-Aannotations-Datei (*.trs)
  • application/xml; format-variant=folker-flnFOLKER-Transkription (*.flk / *.fln)
  • application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
  • application/xml; format-variant=clan-chaCHAT-Transkriptions-Datei (*.cha)
  • text/plain; format-variant=praat-textgridPraat TextGrid (*.textGrid)
  • audio/mp3MP3-Audio
  • audio/oggOGG-Audio
  • audio/wavWAV-Audio
  • video/mp4MP4-Video
  • audio/aiffAIFF-Audio
  • audio/mpegMPEG-Audio
  • video/mpegMPEG-Audio
  • video/oggOGG-Video
  • video/aviAVI-Video
  • video/x-divxDIVX-Video
  • video/movQuicktime-Video
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/xml; format-variant=weblicht-tcfDatei im Text Corpus Format (*.tcf)
  • application/xml; format-variant=exmaralda-exbEXMARaLDA-Basis-Transkription (*.exb)
  • application/xml; format-variant=transcriber-trsTranscriber-Aannotations-Datei (*.trs)
  • application/xml; format-variant=folker-flnFOLKER-Transkription (*.flk / *.fln)
  • application/xml; format-variant=elan-eafELAN-Annotations-Datei (*.eaf)
  • application/xml; format-variant=clan-chaCHAT-Transkriptions-Datei (*.cha)
  • application/plain+praatPraat-TextGrid (*.textGrid)
  • different video formats

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • BetriebssystemWindows, macOS, Linux
  • LaufzeitumgebungJava (included in newer versions)

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Annotating, Transcription

Forschungstätigkeit

Annotieren, Transcribing

Quellcode verfügbar

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Hoster

  • Leibniz-Institut für Deutsche Sprache, Mannheim, Germany
  • HZSK Hamburg, Hamburg Germany

Teil einer Anwendungssuite

EXMARaLDA

Nutzungseinschränkungen für Nutzer*innen

FoLiA-stats Analyzing: generic, Niederländisch
StatusEntwicklung

N-gram frequency list generation on FoLiA input.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch, generic
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Output
  • wordfreqlist
  • lemmafreqlist
  • lemmaposfreqlist

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

0.2

Kategorie

Forschungssoftware

Unterkategorie

n-Gramme

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Ko van der Sloot (TiCC, Tilburg University)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Fowlt (plain text) Analyzing: Englisch
StatusEntwicklung

Fowlt is an online, free-to-use context-sensitive English spelling checker. It follows the setup of the Dutch spelling checker Valkuil.net. Both Valkuil and Fowlt are unlike the typical spelling checkers: whereas the latter mostly try to find errors by comparing all words to a built-in dictionary and flag the word as an error if they can't find a match, Fowlt is context sensitive, taking into account the words around every word. Fowlt makes use of language models. These models are created by giving lots of texts to machine learning software (TiMBL and WOPR).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Rechtschreibkorrektur

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Fowlt (xml+folia) Analyzing: Englisch
StatusEntwicklung

Fowlt is an online, free-to-use context-sensitive English spelling checker. It follows the setup of the Dutch spelling checker Valkuil.net. Both Valkuil and Fowlt are unlike the typical spelling checkers: whereas the latter mostly try to find errors by comparing all words to a built-in dictionary and flag the word as an error if they can't find a match, Fowlt is context sensitive, taking into account the words around every word. Fowlt makes use of language models. These models are created by giving lots of texts to machine learning software (TiMBL and WOPR).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Output
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Rechtschreibkorrektur

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Frog (FoLiA XML document) Natural Language Processing: Niederländisch
StatusProduktion

Frog is a suite containing a tokeniser, Part-of-Speech tagger, lemmatiser, morphological analyser, shallow parser, and dependency parser for Dutch.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

maschinelle Sprachverarbeitung für das Niederländische

Forschungstätigkeit

Natural Language Processing, Analyzing, POS-Tagging, Lemmatizing, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Ko van der Sloot, Antal van den Bosch, Maarten van Gompel, Bertjan Busser (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Frog (folia+xml) Natural Language Processing: Niederländisch
StatusEntwicklung

Frog's current version will tokenize, tag, lemmatize, and morphologically segment word tokens in Dutch text files, will assign a dependency graph to each sentence, will identify the base phrase chunks in the sentence, and will attempt to find and label all named entities.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
Output
  • Tadpole Columned Output Format
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Tokenisierung, Lemmatisierung, morphologische Annotation, Dependenzparsing, Named Entity Recognition

Forschungstätigkeit

Natural Language Processing, Annotieren, POS-Tagging, Lemmatizing, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Ko van der Sloot, Maarten van Gompel (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Frog (plain text) Annotieren: Niederländisch
StatusEntwicklung

Frog's current version will tokenize, tag, lemmatize, and morphologically segment word tokens in Dutch text files, will assign a dependency graph to each sentence, will identify the base phrase chunks in the sentence, and will attempt to find and label all named entities.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • Tadpole Columned Output Format
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Tokenisierung, Lemmatisierung, morphologische Annotation, Dependenzparsing, Named Entity Recognition

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Ko van der Sloot, Maarten van Gompel (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Frog (Text document) Natural Language Processing: Niederländisch
StatusProduktion

Frog is a suite containing a tokeniser, Part-of-Speech tagger, lemmatiser, morphological analyser, shallow parser, and dependency parser for Dutch.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

maschinelle Sprachverarbeitung für das Niederländische

Forschungstätigkeit

Natural Language Processing, Annotieren, POS-Tagging, Lemmatizing, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Ko van der Sloot, Antal van den Bosch, Maarten van Gompel, Bertjan Busser (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Glem (Text to lemmatize) Annotieren: Griechisch
StatusProduktion

GLEM is a lemmatizer for Ancient Greek.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenGriechisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Lemmatisierung

Forschungstätigkeit

Annotieren, Lemmatizing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Corien Bary, Peter Berck, Iris Hendrickx, Wessel Stoop (Faculty of Philosophy, Theology and Religious Studies and Centre for Language and Speech Technology, Radboud University Nijmegen)

Hoster

Faculty of Philosophy, Theology and Religious Studies and Centre for Language and Speech Technology, Radboud University Nijmegen

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Grapheme to Phoneme converter (Word List) Transformation: Englisch, Niederländisch
StatusProduktion

Grapheme to Phoneme converter using phonetisaurus

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch, Englisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Grapheme to Phoneme Conversion

Forschungstätigkeit

Transformation

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Louis ten Bosch

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Inkluz Analyzing: Polnisch
StatusProduktion

Inkluz - detects foreign language inclusions in Polish texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/octet-streambeliebige Binär-Dateien

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Inklusionsdetektion

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Iobber Annotieren: Polnisch
StatusProduktion

Chunker for Polish. It recognises shallow syntactic structure (up to three levels) of phrases (chunks) in Polish texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

flache syntaktische Analyse

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
KorAP (REST) Suchen
StatusTestbetrieb
SchlüsselwörterCleanup, Abfragesprache, Korpusanalyse, Korpusannation

KorAP ist eine neue Korpusanalyseplattform, optimiert für große, mehrfach annotierte Korpora und komplexe Suchmechanismen.

KorAP unterstützt die Abfragesprachen (von) COSMAS II, ANNIS, Poliqarp, Poliqarp+, CQL and FCQL.

KorAP wird am Leibniz-Institut für Deutsche Sprache in Mannheim entwickelt. Die einzelnen Module werden als Open Source auf GitHub veröffentlicht.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Korpuslinguist*innen

Dateiformate und Sprachen

Input
  • application/jsonJSON-Daten
Output
  • application/jsonJSON-Daten

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Suche

Forschungstätigkeit

Suchen

Quellcode verfügbar

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

OpenAUTH-protokoll

Autor*innen

  • Marc Kupietz (Developer) [GND]
  • Franck Bodmer Mory (Developer) [GND]
  • Peter Harders (Developer) [GND]
  • Eliza Margaretha (Developer)
  • Helge Stallkamp (Developer) [GND]
  • Piotr Bański (Developer) [GND]
  • Elena Frick (Developer)
  • Michael Hanl (Developer)
  • Carsten Schnober (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Teil einer Anwendungssuite

Nutzungseinschränkungen für Nutzer*innen

KorAP (Web) Analyzing
StatusTestbetrieb
SchlüsselwörterCleanup, Abfragesprache, Korpusanalyse, Korpusannation

KorAP ist eine neue Korpusanalyseplattform, optimiert für große, mehrfach annotierte Korpora und komplexe Suchmechanismen.

KorAP unterstützt die Abfragesprachen (von) COSMAS II, ANNIS, Poliqarp, Poliqarp+, CQL and FCQL.

KorAP wird am Leibniz-Institut für Deutsche Sprache in Mannheim entwickelt. Die einzelnen Module werden als Open Source auf GitHub veröffentlicht.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Korpuslinguist*innen

Dateiformate und Sprachen

Input
  • text/plain; format-variant=cosmas2COSMAS II query
  • text/plain; format-variant=annisANNIS query
  • text/plain; format-variant=poliqarpPoliqarp query
  • text/plain; format-variant=poliqarpplusPoliqarp+ query
  • text/plain; format-variant=cqlCQL query
  • text/plain; format-variant=fcqlFCQL query
Output
  • text/htmlHTML-Datei

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Discovering

Forschungstätigkeit

Analyzing

Quellcode verfügbar

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

OpenAUTH-protokoll

Autor*innen

  • Marc Kupietz (Developer) [GND]
  • Franck Bodmer Mory (Developer) [GND]
  • Peter Harders (Developer) [GND]
  • Eliza Margaretha (Developer)
  • Helge Stallkamp (Developer) [GND]
  • Piotr Bański (Developer) [GND]
  • Elena Frick (Developer)
  • Michael Hanl (Developer)
  • Carsten Schnober (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Teil einer Anwendungssuite

KorAP

Nutzungseinschränkungen für Nutzer*innen

LINDAT Translation Translating: Tschechisch, Deutsch, Englisch…
StatusProduktion

The input file size is limited to 100kB.

Translates from->to:

Czech->English, Hindi, French, Russian, German

English->Russsian, German, Czech, Hindi, French

Russian->German, French, Czech, Hindi, English

German->Russian, Hindi, Czech, English, French

French->Russian, German, Czech, English, Hindi

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

See the [terms of use for LINDAT services](https://lindat.mff.cuni.cz/en/terms-of-use).

Dateiformate und Sprachen

Input
  • SprachenDeutsch, Russisch, Tschechisch, Englisch, Französisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

master

Kategorie

Forschungssoftware

Unterkategorie

maschinelle Übersetzung

Forschungstätigkeit

Translating

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Institute of Formal and Applied Linguistics

Hoster

Charles University, Prague, Czech Republic

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Liner2 (hosted by D4Science) Annotieren: Polnisch
StatusProduktion

This is an experimental integration of a D4Science NLP processing service (NER Liner 2). This service identifies names of persons, locations, organizations, as well as money amounts, time and date expressions in Polish texts automatically.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren, Named Entity Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

D4Science staff

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Liner2 Annotieren: Polnisch
StatusProduktion

Name Entity and Temporal Expression recognition

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren, Named Entity Recognition

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
MaltParser Annotieren: Polnisch
StatusProduktion

A language dependency parser chain for Polish. The used tools include Morfeusz-2 with SGJP dictionary (for morphological analysis), wcrft2 (for tagging), and the MaltParser with a model for Polish. The CONLL output can be visualised with DepSVG, a dependency tree and predicate-argument structure visualizer.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • CoNLL Format

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Morfeusz 2 Annotieren: Polnisch
StatusProduktion

Morphological analysis of Polish texts by Morfeusz 2 (based on the SGJP dictionary)

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

morphologische Annotation

Forschungstätigkeit

Annotieren

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
MorphoDiTa Annotieren: Polnisch
StatusProduktion

Morphological dictionary and tagger for the analysis of natural language texts in Polish.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

morphologische Annotation

Forschungstätigkeit

Annotieren

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
NER NLTK Annotieren: Englisch
StatusProduktion

Name Entity Recogniser for English by NLTK.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
NLP-HUB (multiple NER tools) Annotieren: Deutsch, Englisch, Französisch…
StatusProduktion

This is an experimental integration of a D4Science NLP processing service hub. This service runs a number of NER tools in parallel, and merges their results. It identifies names of persons, locations, organizations, as well as money amounts, time and date expressions -- and other expressions -- in English, French, Italian, Spanish and German texts automatically.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Französisch, Italienisch, Spanisch, Deutsch
  • text/plainPlain-Text-Datei
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Named Entity Recognition

Forschungstätigkeit

Annotieren

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

D4Science staff

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Oersetter (FRY-NLD) Translating: Friesisch
StatusEntwicklung

Oersetter is a Frisian-Dutch Machine Translation system.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenFriesisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

maschinelle Übersetzung

Forschungstätigkeit

Translating

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Oersetter (NLD-FRY) Translating: Niederländisch
StatusEntwicklung

Oersetter is a statistical machine translation (SMT) system for Frisian to Dutch and Dutch to Frisian. A parallel training corpus has been established, which has subsequently been used to automatically learn a phrase-based SMT model. The translation system is built around the open-source SMT software Moses.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

maschinelle Übersetzung

Forschungstätigkeit

Translating

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Opener Tokenizer Analyzing: Deutsch, Englisch, Französisch…
StatusEntwicklung

Tokenizer for Dutch, English, German, French, Spanish and Italian. Consumes Plain text and produces TCF.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Italienisch, Spanisch, Französisch, Niederländisch, Deutsch
  • text/plainPlain-Text-Datei
Output
  • application/tcf+xmlTCF-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Tokenisierung

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

CLARIN-IT

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (DJVU document containing scanned pages (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • application/pdfAdobe-PDF-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (FoLiA with OCR text layer already present (no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (PDF document with embedded text (no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • application/pdfAdobe-PDF-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (PDF document with scanned pages (images) (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • application/pdfAdobe-PDF-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (Plain-text document (UTF-8, no OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
PICCL (TIF image of a scanned page (perform OCR)) Correcting: Deutsch, Neugriechisch, Englisch…
StatusProduktion

PICCL offers a workflow for corpus building and builds on a variety of tools. The primary component of PICCL is TICCL; a Text-induced Corpus Clean-up system, which performs spelling correction and OCR post-correction (normalisation of spelling variants etc).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch, Niederländisch, Finnisch, Französisch, Deutsch, Neugriechisch, Griechisch, Isländisch, Italienisch, Latein, Polnisch, Portugiesisch, Rumänisch, Russisch, Spanisch, Schwedisch
  • image/tiff
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Normalisation

Forschungstätigkeit

Correcting, Data Cleansing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Martin Reynaert, Maarten van Gompel, Ko van der Sloot

Hoster

unknown

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (Alpino XML for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/alpino+xml
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (CONLL-U format for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (Docbook for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/docbook+xml
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (EPUB for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/epub+zip
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (FoLiA XML input for conversion to HTML) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • text/htmlHTML-Datei
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (FoLiA XML input for conversion to ReStructuredText) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/rst

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (FoLiA XML input for conversion to text) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (FoLiA XML input for upgrade to a newer FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (FoLiA XML input for validation) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (HTML for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/htmlHTML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (LaTeX source for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/x-latex
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (Markdown Input for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/markdown
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (MediaWiki Markup (Wikipedia and others) for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (MS Word (Office Open XML, docx) input for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/mswordMicrosoft-Word-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (NAF XML for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/naf+xml
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (OpenDocument Text Document (odt) for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/mswordMicrosoft-Word-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (PDF with embedded text (pdf) for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/pdfAdobe-PDF-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (Plain text input for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/plainPlain-Text-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (ReStructuredText Input for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • text/rst
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Piereling (TEI P5 XML input for conversion to FoLiA) Converting
StatusProduktion

Piereling can convert a wide variety of document formats to FoLiA XML, and from FoLiA XML to various formats. Data conversions such as these provide the groundwork for Natural Language Processing pipelines. It relies on numerous specialised conversion tools in combination with notable third-party tools such as pandoc.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • application/tei+xmlTEI-P5-konformes XML
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Data Conversion

Forschungstätigkeit

Converting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
ReSpa Extracting: Polnisch
StatusProduktion

Keywords extraction for Polish by ReSpa based on the representation of text documents as word graphs.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Schlüsselwortextraktor

Forschungstätigkeit

Extracting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Serel Analyzing: Polnisch
StatusProduktion

Detection of semantic relations between Named Entities in Polish texts by Serel.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Erkennung der Relationen zwischen named entities

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spacy (hosted by D4Science) - DE Annotieren: Deutsch
StatusProduktion

This is an experimental integration of a D4Science NLP processing service (spaCy). This service identifies performs dependency parsing for plain German text. For more information on spaCy, see https://spacy.io.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenDeutsch
  • text/plainPlain-Text-Datei
Output
  • text/tab-separated-valuesTabularische Daten, tabulatorsepariert

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

D4Science staff

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spacy (hosted by D4Science) - EN Annotieren: Englisch
StatusProduktion

This is an experimental integration of a D4Science NLP processing service (spaCy). This service identifies performs dependency parsing for plain English text. For more information on spaCy, see https://spacy.io.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
Output
  • text/tab-separated-valuesTabularische Daten, tabulatorsepariert

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

v1.0

Kategorie

Forschungssoftware

Unterkategorie

Dependenzparsing

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

D4Science staff

Hoster

Pisa, Italy

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spatial Identifying: Polnisch
StatusProduktion

Recognition of spatial expressions in Polish texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/jsonJSON-Daten

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Erkennung räumlicher Ausdrücke

Forschungstätigkeit

Identifying

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spejd Annotieren: Polnisch
StatusProduktion

Spejd - a partial, shallow parser for Polish with rule-based morphosyntactic disambiguation.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

flache syntaktische Analyse

Forschungstätigkeit

Annotieren, Parsing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spreek2Schrijf (Flemish input HTML (very specific formatting, not just any HTML)) Speech Recognizing: Niederländisch
StatusProduktion

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/htmlHTML-Datei
Output
  • text/htmlHTML-Datei
  • text/plainPlain-Text-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spreek2Schrijf (MP3 file) Speech Recognizing: Niederländisch
StatusProduktion

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/mpeg
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spreek2Schrijf (Ogg file) Speech Recognizing: Niederländisch
StatusProduktion

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/vorbis
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spreek2Schrijf (Time Marked Conversation (CTM) with punctuation) Speech Recognizing: Niederländisch
StatusProduktion

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/xmlXML-Datei
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Spreek2Schrijf (Wav file) Speech Recognizing: Niederländisch
StatusProduktion

Deze webservice gebruikt spraakherkenning om opnamen in de Tweede Kamer om te zetten in een spraaktranscriptie, en een vertaalengine om deze vervolgens naar schrijftaal om te zetten.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • audio/vnd.wave
Output
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Speech Recognition

Forschungstätigkeit

Speech Recognizing, Transcribing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Maarten van Gompel, Louis ten Bosch (Centre for Language and Speech Technology, Radboud University)

Hoster

Centre for Language and Speech Technology, Radboud University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Summarize Analyzing: Polnisch
StatusProduktion

Automated word graph based summarisation of Polish texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/octet-streambeliebige Binär-Dateien

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Textzusammenfassung

Forschungstätigkeit

Analyzing, Interpreting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
T-scan (Text Input) Analyzing: Niederländisch
StatusProduktion

T-Scan is an analysis tool for dutch texts to assess the complexity of the text, and is based on original work by Rogier Kraf (Utrecht University) (see: Kraf et al., 2009). The code has been reimplemented and extended by Ko van der Sloot (Tilburg University), and is currently maintained and continued by Martijn van der Klis (Utrecht University).

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Affero General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • application/xslt+xml
  • text/csvTabularische Daten, kommasepariert
  • text/plainPlain-Text-Datei
  • text/xmlXML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text-Analytik

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Unbekannt

Anmeldebedingungen

yes. Before tool use, Please register at https://webservices-lst.science.ru.nl/register/

Autor*innen

Ko van der Sloot, Martijn van der Klis, Maarten van Gompel (Utrecht University)

Hoster

Utrecht University

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
T-scan Analyzing: Niederländisch
StatusEntwicklung

T-Scan is a new tool for analyzing Dutch text. It aims at extracting text features that are theoretically interesting, in that they relate to genre and text complexity, as well as practically interesting, in that they enable users and text producers to make text-specific diagnoses. T-Scan derives it features from tools such as Frog and Alpino, and resources such as SoNaR, SUBTLEX-NL and Referentie Bestand Nederlands.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Lizenzen

GNU Affero General Public License v3

Dateiformate und Sprachen

Input
  • SprachenNiederländisch
  • text/plainPlain-Text-Datei
Output
  • text/folia+xmlDatei im Format Format for Linguistic Annotation (FoLiA)
  • text/xslXSLT-Stylesheet
  • text/csvTabularische Daten, kommasepariert

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

Forschungssoftware

Unterkategorie

Text-Analytik

Forschungstätigkeit

Analyzing

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

Proprietär

Anmeldebedingungen

Yes. Before tool use, please register at https://webservices-lst.science.ru.nl/register.

Autor*innen

Maarten van Gompel, Ko van der Sloot (CLST, Radboud University Nijmegen), Martijn van der Klis (Utrecht University)

Hoster

Nijmegen, The Netherlands (CLAM Webservices)

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
Tagger NLTK Annotieren: Englisch
StatusProduktion

Morphological Analysis for English texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenEnglisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/xmlXTML-Datei

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

morphologische Annotation

Forschungstätigkeit

Annotieren

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
TEILicht-align Collating
StatusProduktion
SchlüsselwörterForced Alignment, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

align: Pseudo-alignment using Phonetic Transcription or Orthographic Information

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Text Enhancement

Forschungstätigkeit

Collating

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-guess Analyzing
StatusProduktion
SchlüsselwörterCleanup, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

guess: language-detection

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Sprachenerkennung

Forschungstätigkeit

Analyzing

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-identify Identifying
StatusProduktion
SchlüsselwörterXML ID, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

identify adding and removing XML IDs

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

other

Forschungstätigkeit

Identifying

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-normalize Converting
StatusProduktion
SchlüsselwörterSpeech, Gesprochene Sprache, Transcription, Orthographische Normalisierung

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

normalize: OrthoNormal-like Normalization of orthography

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Orthographische Normalisierung

Forschungstätigkeit

Converting

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-pos Annotieren
StatusProduktion
SchlüsselwörterSpeech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

pos: POS-Tagging with the TreeTagger

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Wortklassenannotation

Forschungstätigkeit

Annotieren

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-segmentize Converting
StatusProduktion
SchlüsselwörterCleanup, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

segmentize: segmentation according to transcription conventions

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die einfache Transkriptionen in TEI/ISO-konforme Transkriptionen überführen

Dateiformate und Sprachen

Input
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Konvertierung

Forschungstätigkeit

Converting

Quellcode verfügbar

Datenübertragung: Verschlüsselung

andere

Datenschutzrichtlinie

sonstige

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-text2iso Converting
StatusProduktion
SchlüsselwörterCleanup, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

text2iso: converting plain text in Simple EXMARaLDA format to ISO-TEI-annotated texts

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die einfache Transkriptionen in TEI/ISO-konforme Transkriptionen überführen

Dateiformate und Sprachen

Input
  • application/plain; format-variant=exmaraldaSimple EXMARaLDA transcription
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Konvertierung

Forschungstätigkeit

Converting

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-text2seg Converting
StatusProduktion
SchlüsselwörterCleanup, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

text2seg: converting plain text in Simple EXMARaLDA format to ISO-TEI-annotated texts, combined with segmentation according to transcription standards

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die einfache Transkriptionen in TEI/ISO-konforme Transkriptionen überführen

Lizenzen

unknown

Dateiformate und Sprachen

Input
  • application/plain; format-variant=exmaraldaSimple EXMARaLDA transcription
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Konvertierung

Forschungstätigkeit

Converting

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TEILicht-unidentify Identifying
StatusProduktion
SchlüsselwörterXML ID, Speech, Gesprochene Sprache, Transcription

RESTful webservices for transcriptions of spoken data following the TEI guidelines. In principle, target documents are those conforming to the ISO standard ISO 24624:2016(E) Language resource management – Transcription of spoken language. The services are built on the library teispeechtools ; the source code of the services is available on GitHub. Currently, we offer:

unidentify: removing XML IDs

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Forschende, die mit Transkriptionen gesprochener Sprache arbeiten

Dateiformate und Sprachen

Input
  • untertützt mehrsprachige Dokumente
  • akzeptiert jede Sprache
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML
Output
  • application/tei+xml; format-variant=tei-iso-spokenISO-24624-konforme Transkription gesprochener Sprache
  • application/tei+xmlTEI-P5-konformes XML

Anwendungstyp

REST-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

  • technische*r Ansprechpartner*infisseni@ids-mannheim.de, Bernhard Fisseni (Developer) [GND]
  • inhaltliche*r Ansprechpartner*inThomas Schmidt (Transcription Expert) [ORCID, GND]

Version

Kategorie

Forschungssoftware

Unterkategorie

Sprachenerkennung

Forschungstätigkeit

Identifying

Quellcode verfügbar

Datenübertragung: Verschlüsselung

(nicht zutreffend)

Datenschutzrichtlinie

(nicht zutreffend)

Authentifizierung

keine Authentifizierung

Autor*innen

  • Bernhard Fisseni (Developer)
  • Thomas Schmidt (Developer)

Hoster

Leibniz-Institut für Deutsche Sprache, Mannheim, Germany

Nutzungseinschränkungen für Nutzer*innen

TermoPL Extracting: Polnisch
StatusProduktion

TermoPL is a tool for automated extraction of terminology from Polish texts.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars doing automatic analysis of texts

Dateiformate und Sprachen

Input
  • SprachenPolnisch
  • text/plainPlain-Text-Datei
  • application/mswordMicrosoft-Word-Datei
  • application/vnd.openxmlformats-officedocument.wordprocessingml.documentMicrosoft-OpenXML-Textverarbeitungs-Datei (Word)
  • application/vnd.openxmlformats-officedocument.presentationml.presentationMicrosoft-OpenXML-Präsentations-Datei (PowerPoint)
  • application/vnd.openxmlformats-officedocument.spreadsheetml.sheetMicrosoft-OpenXML-Tabellenkalkulations-Datei (Excel)
  • application/vnd.oasis.opendocument.textOpenDocument-Textdatei
  • application/pdfAdobe-PDF-Datei
  • text/htmlHTML-Datei
  • text/rtfTextverarbeitungsdatei im Rich Text Format
Output
  • application/jsonJSON-Daten

Anwendungstyp

Web-UI

Datenblatt (Fact sheet)

Ansprechpartner

Version

1.0

Kategorie

Forschungssoftware

Unterkategorie

Terminology Extraction

Forschungstätigkeit

Extracting

Datenübertragung: Verschlüsselung

unbekannt

Datenschutzrichtlinie

unbekannt

Authentifizierung

keine Authentifizierung

Autor*innen

Clarin-PL

Hoster

Wrocław, Poland

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
TextGrid Laboratory Bearbeiten: Deutsch, Englisch
StatusProduktion
SchlüsselwörterCorpus and Digital Library of TextGrid, Open Archival Information System (OAIS)

Mit dem TextGridLab, einem kostenlosen Softwarepaket, können Sie auf Werkzeuge und Dienste zur Erstellung, Verwaltung und Bearbeitung von Forschungsdaten zugreifen. Die Open-Source-Software ist der Einstieg in die virtuelle Forschungsumgebung. Sie ist für Windows, Mac OS X und Linux erhältlich und bietet eine differenzierte Verwaltung von Zugriffsrechten innerhalb der geschützten Forschungsumgebung. Das TextGridLab ist optimiert für die XML/TEI-Entwicklung, z.B. im Zusammenhang mit digitalen Editionen.

		   Zu den Funktionen des **TextGridLab** gehören zum Beispiel
  • ein Editor für Text und XML mit WYSIWYG-Funktionalität - eine integrierte Unicode-Zeichentabelle aus dem Unicode-Zeichensatz

  • ein Text-Bild-Link-Editor - das Wörterbuch-Suchwerkzeug - der MEISE-Editor.

     		Zur Infrastruktur gehören eine leistungsfähige Projekt- und Benutzerverwaltung, ein Projekt-Browser/Navigator, ein Suchwerkzeug, Metadaten-Editor, Aggregation Composer, Import/Export-Werkzeug, Revisionen und Veröffentlichung der Sammlung (im Repository), unterstützt durch eine automatisierte Metadaten-Validierung.
    

TextGrid Lab wird genutzt von deutschen Forschern in verschiedenen Forschungsnetzwerken und Editionsprojekten, wie zum Beispiel:

  • Hybrid-Ausgabe der Hefte von Theodor Fontane (Fontane-Forschungsstelle der Universität Göttingen) - Textdatenbank und Wörterbuch der klassischen Maya (Universität Bonn) - die Bibliothek der Neologie (Universität Münster).

     		(siehe https://textgrid.de/en/web/guest/kooperationsprojekte)
    

TextGridLab TextGrid war ein Projekt von zehn Partnern, gefördert durch das Bundesministerium für Bildung und Forschung (BMBF) für den Zeitraum von Juni 2012 bis Mai 2015 (Förderkennzeichen: 01UG1203A). Seit 2016 ist TextGrid Teil der Forschungsinfrastruktur DARIAH-DE.

Kurzbeschreibung

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Scholars in the humanities who wants to editing, storing and publishing their data in a sustainable environment.

Dateiformate und Sprachen

Input
  • SprachenDeutsch, Englisch
  • text/plainPlain-Text-Datei
  • application/xmlXTML-Datei
  • image/tiff
Output

Anwendungstyp

Desktop cross-platform support

Netzwerk- bzw. Sicherheitsanforderungen

  • Prozessor32 / 64 bit
  • BetriebssystemWindows, macOS, Linux, Linux
  • LaufzeitumgebungJava Runtime Environment, JRE Version 6
  • Installationslizenzhttps://textgrid.liferay.de.dariah.eu/en/web/guest/terms-of-use

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Editing

Forschungstätigkeit

Bearbeiten, Storing, Archivieren

Quellcode verfügbar

Authentifizierung

DFN Identity Provider

Autor*innen

Hoster

  • SUB, Göttingen Germany
  • GWDG, Göttingen Germany

Teil einer Anwendungssuite

TextGrid

Nutzungseinschränkungen für Nutzer*innen

nur Nutzung für Forschung und Lehre

zulässige Länder

alle
TextGrid Repository Portal Archivieren
StatusProduktion
SchlüsselwörterVirtual research environment, Digitale Editionen, Editions, Editionen

Das TextGrid Repository ist ein Langzeitarchiv für geisteswissenschaftliche Forschungsdaten. Es liefert einen umfangreichen, durchsuch- und nachnutzbaren Bestand an Texten und Bildern. An den Grundsätzen von Open Access und den FAIR-Prinzipien orientiert, wurde das TextGrid Repository 2020 mit dem CoreTrustSeal versehen. Für Forschende bietet das TextGrid Repository eine nachhaltige, dauerhafte und sichere Möglichkeit, zur zitierfähigen Publikation ihrer Forschungsdaten und zur verständlichen Beschreibung derselben durch erforderliche Metadaten. Mehr zum Thema Nachhaltigkeit, FAIR und Open Access im Mission Statement des TextGrid Repository.

Dokumentation

Beschreibung der Zielgruppe und ihrer Größe

Geisteswissenschaftlerinnen und Geisteswissenschaftler, die ihre Daten in einer nachhaltigen Umgebung bearbeiten, speichern und veröffentlichen wollen.

Dateiformate und Sprachen

Output
  • application/xml+tei, Schema
  • text/plainPlain-Text-Datei
  • application/epub+zip
  • text/htmlHTML-Datei
  • application/zipZIP-Archiv

Lokalisierung

Deutsch, Englisch

Anwendungstyp

Web-UI

Entwicklerdokumentation

Datenblatt (Fact sheet)

Ansprechpartner

Version

Kategorie

(nicht zutreffend)

Unterkategorie

Publishing

Forschungstätigkeit

Archivieren, Veröffentlichen

Quellcode verfügbar

Authentifizierung

akademisches Shibboleth-Login DFN Identity Provider eduGAIN

Autor*innen

Hoster

  • Göttingen State and University Library (SUB), Göttingen Germany
  • Gesellschaft für wissenschaftliche Datenverarbeitung mbH Göttingen (GWDG), Göttingen Germany

Nutzungseinschränkungen für Nutzer*innen

öffentlich

zulässige Länder

alle
TF-IDF Analyzing: Polnisch
StatusProduktion

TF, I