TEXTEC Software ist

                                                

Die linguistic engine EXTRAKT ist in dem Suchportal LexiQuo integriert und sorgt für optimale Suchergebnisse.

LexiQuo (deutsch)
 

Linguistic Engine EXTRAKT

 

Die linguistic engine EXTRAKT ist ein umfassendes modulares System für die Behandlung von natürlicher (geschriebener) Sprache. Dies beinhaltet sowohl einsprachige (monolinguale) als auch zwei- und mehrsprachige (multilinguale) Anwendungen in den verschiedensten Bereichen wie Indexierung, Lemmatisierung, Spracherkennung, syntaktische und morphologische Analyse, linguistische Suche, usw.

 

EXTRAKT wird zumeist als Add-on eingesetzt für die Verbesserung und Präzisierung von Suchanfragen in Internet-Suchmaschinen, Bibliothekssystemen oder in Shop-Systemen.

EXTRAKT ist seit Anfang der 90er Jahre in der Entwicklung und wurde zuerst mit seiner deutschen Komponente in dem mehrsprachigen Volltextretrieval-System EMIR (European Multilingual Information Retrieval) eingesetzt. EMIR war höchstwahrscheinlich das erste mehrsprachige Volltextretrievalsystem weltweit.


Inzwischen sind die wichtigsten europäischen Sprachen hinzugekommen, so daß mit EXTRAKT auch verschiedensprachige Komponenten angeboten werden. Für eine mehrsprachige Suche ergeben sich die Möglichkeiten einer Übersetzung von allen unterstützten Sprachen ins Englische und umgekehrt sowie zusätzlich die Sprachpaare Deutsch-Französisch und Deutsch-Italienisch.

EXTRAKT ist wörterbuchbasiert, was bedeutet, daß (fast) alle Informationen in Wörterbüchern abgelegt sind. Zudem ist unsere linguistic engine EXTRAKT sehr schnell, so daß riesige Datenmengen kein Problem darstellen. Darüberhinaus führte die für EMIR getroffene Entscheidung, Vollformenwörterbücher zu verwenden, dazu, daß in EXTRAKT oft ein einziger Wörterbuchzugriff für die Erkennung eines Wortes ausreicht - was sich ebenfalls bei der Schnelligkeit bemerkbar macht. Zugleich ergibt sich daraus die Möglichkeit, selbst private Wörterbücher anzulegen und in EXTRAKT zu integrieren, ohne vorher ein linguistisches Seminar besucht haben zu müssen.

EXTRAKT-I

bezeichnet eine integrierte EXTRAKT-Anwendung, in der die EXTRAKT-API genutzt wird.

EXTRAKT-I stellt alle linguistischen Funktionen bereit, die auf den Inhalt einer (Eingabe-) Datei angewendet werden. Die Steuerung geschieht über eine Konfigurationsdatei, in der festgelegt wird, welche Felder der Input-Datei mit welchen EXTRAKT-Funktionen bearbeitet werden sollen. Da eine Kommunikation zwischen Client und Server entfällt, wird eine noch höhere Geschwindigkeit erreicht, als mit der Server-Version.

 

Extrakt-API

 

Diese API stellt in einer DLL oder in einem S.O. alle linguistischen Funktionen bereit, so daß sie in andere Systeme integriert werden können. Dadurch entfällt die Server-Komponente und die Kommunikation zwischen Client und Server (per TCP/IP), was eine enorme Beschleunigung gegenüber der Server-Version bedeutet.

Druckversion Druckversion | Sitemap
© 1995-2017 TEXTEC Software Dr. Erwin Stegentritt

Diese Homepage wurde mit 1&1 MyWebsite erstellt. Probieren Sie es selbst aus!