TEXTEC Software ist

                                                

Die linguistic engine EXTRAKT ist in dem Suchportal LexiQuo integriert und sorgt für optimale Suchergebnisse.

LexiQuo (deutsch)
 

Linguistic Engine EXTRAKT

 

Die linguistic engine EXTRAKT ist ein umfassendes modulares System für die Behandlung von natürlicher (geschriebener) Sprache. Dies beinhaltet sowohl einsprachige (monolinguale) als auch zwei- und mehrsprachige (multilinguale) Anwendungen in den verschiedensten Bereichen wie Indexierung, Lemmatisierung, Spracherkennung, syntaktische und morphologische Analyse, linguistische Suche, usw.

 

EXTRAKT basiert ist nicht auf AI - Künstlicher Intelligenz -, sondern basiert auf natürlicher, sprich menschlicher IIntelligenz: die Grundlage und die Voraussetzung jeder möglichen Künstlichen Intelligenz: umfangreiche Wörterbücher mit Millionen von Einträgen, grammatische Regeln, wie sie im Sprachunterricht gelernt werden müssen, und schnelle Algorithmen...

 

EXTRAKT wird zumeist als Add-on eingesetzt für die Verbesserung und Präzisierung von Suchanfragen in Internet-Suchmaschinen, Bibliothekssystemen, in Shop-Systemen oder als Einstieg zu AI-Systemen...

EXTRAKT ist seit Anfang der 90er Jahre in der Entwicklung und wurde zuerst mit seiner deutschen Komponente in dem mehrsprachigen Volltextretrieval-System EMIR (European Multilingual Information Retrieval) eingesetzt. EMIR war das erste mehrsprachige Volltextretrievalsystem weltweit.


Inzwischen sind die wichtigsten europäischen Sprachen hinzugekommen, so dass mit EXTRAKT auch verschiedensprachige Komponenten angeboten werden. Für eine mehrsprachige Suche ergeben sich die Möglichkeiten einer Übersetzung von allen unterstützten Sprachen ins Englische und umgekehrt sowie zusätzlich die Sprachpaare Deutsch-Französisch und Deutsch-Italienisch.

EXTRAKT ist wörterbuchbasiert, was bedeutet, dass (fast) alle Informationen in Wörterbüchern abgelegt sind. Zudem ist unsere linguistic engine EXTRAKT sehr schnell, so daß riesige Datenmengen kein Problem darstellen. Darüberhinaus führte die bereits für EMIR getroffene Entscheidung, Vollformenwörterbücher zu verwenden, dazu, dass oft ein einziger Wörterbuchzugriff für die Erkennung eines Wortes ausreicht - was sich ebenfalls bei der Schnelligkeit bemerkbar macht.

 

Extrakt-API

 

Diese API stellt in einer DLL oder in einem S.O. alle linguistischen Funktionen bereit, so daß sie in andere Systeme integriert werden können. Dadurch entfällt die Server-Komponente und die Kommunikation zwischen Client und Server (per TCP/IP), was eine enorme Beschleunigung gegenüber der Server-Version bedeutet.

Druckversion Druckversion | Sitemap
© 1995-2020 TEXTEC Software Dr. Erwin Stegentritt