Může vyhledávací systém umět česky? Excalibur Retrieval Ware.
Pavel Kocourek, Incad s.r.o., Praha
Nová architektura verze 6.7 systému Excalibur Retrieval Ware umožňuje výrazné rozšíření možností zpracování přirozeného jazyka.
Společnost Incad ve spolupráci s brněnskou firmou Lingea vyvinula českou sémantickou síť.

Společnost Incad spolu s partnery vložila významné úsilí do “lokalizace” systému Excalibur Retrieval WareÔ , znalostního vyhledávacího systému americké společnosti Excalibur Technologies. Výsledkem dnes není jen české uživatelské prostředí, ale především sémantická síť pro češtinu, která je na Inforu_2000 v první verzi představována.

Excalibur RETRIEVAL WAREÔ

textově orientovaný znalostní vyhledávací systém. Podporuje více než 250 formátů včetně pdf, html, XML, MS Office a umožňuje indexovat také data v relačních databázích.

Základní technologie:

Systém disponujesadou Boolovských a statistických nástrojů

Od verze 6.7, uvolněné na konci roku 1999, se u produktu Retrieval Ware změnila strategie jazykové podpory vyhledávání. Současný systém využívá tzv. LPI architektury - jazykových plug-inů.

Právě tento technologický posun umožnil další krok k dokonalejšímu vyhledávání pro mnohé jazyky.

Sémantická síť pro češtinu

Plug-in zahrnuje tyto základní prvky:

Jednotlivé lexikální soubory jsou přístupné uživateli (správci systému) pro jejich modifikaci a doplňování. Nástroj pro jazykovou podporu vyhledávání tak může být upravován podle potřeb instituce, která ho využívá a neustále tak adaptovat novou terminologii.

Kam bude směřovat další vývoj v oblasti lingvistické podpory vyhledávání produktu Retrieval Ware na našem trhu?

Může tedy vyhledávací systém umět česky?

 

http://www.incad.cz

http://excalib.com

 

Standardní rozhraní systému (angličtina) s jazykovým plug-inem pro češtinu