Úvod > Články > Sémantické služby – příliš vzdálená budoucnost? (3/3)

Sémantické služby – příliš vzdálená budoucnost? (3/3)

Dnes si povíme něco o ontologiích na webu a také se podíváme, jak daleko jsou sémantické služby od komerčního nasazení.

Význam ontologií na webu

Výsledkem zapojení ontologií do zdrojů webu by byl stav, ve kterém by teoreticky byla každá informace na webu označena svým významem a dle tohoto významu by tudíž bylo možné s informacemi nakládat. Automaty (agenti) procházející web by tak mohly informace katalogizovat dle tohoto významu (z pohledu agenta by šlo spíše o jakýsi „pseudovýznam“) a tím umožnit zejména následující:

- přesné vyhledávání by nahradilo dnešní metodu hrubé síly, kdy záleží především na konstrukci dotazu pro vyhledávač. Metodika, která by shrnovala postup konstrukce takového dotazu, neexistuje, a tudíž efektivita vyhledávání je dnes přímo úměrná zkušenostem uživatele (jak bylo řečeno v úvodu). Navíc vyhledávání informací o tématech, které jsou v přirozeném jazyce zaměnitelné s jiným, mnohem frekventovanějším tématem, je velmi složitý úkol (např. síťový souborový systém NFS versus počítačová hra se stejnou zkratkou).

- Vzhledem k přesné identifikaci konkrétního objektu se mohou informace o tomto objektu doplňovat z jiných zdrojů, ačkoliv tyto na sebe nejsou nijak vázány a dokonce jejich autoři o sobě nemusí vědět (vyhledávání informací o jedné osobě tak může být spojeno z několika veřejných zdrojů zároveň; např. z obchodního rejstříku může být zjištěno, v kolika společnostech je člověk vázán, informace z katastrálních map poskytnou přehled vlastněné půdy, dokonce bude možno zjistit, jakou vysokou školu studoval, popř. nabídnout stažení jeho diplomové práce – a to vše na jediném výpisu -samozřejmě nyní abstrahujeme od problematiky ochrany soukromí).

- Vzhledem ke konstrukci ontologií, které neumožní pouze agregovat informace o jednom objektu z více zdrojů, ale i definici vztahů mezi těmito objekty, se může množina získatelných informací pomocí jediného dotazu rozšířit do rozměrů, které nejsou díky sebelepšímu technickému vybavení v dnešních podmínkách realizovatelné.

Obdobné možnosti nabídne ontologie rovněž v oblasti webových služeb.

Sémantické webové služby

Nedostatky koncepce webových služeb, tak jak byly popsány výše, jsou již ve fázi, kdy na jednotlivé problémy existují řešení. Např. problém workflow a (atomických) transakcí řeší jazyk BPEL4WS (Business Process Execution Language for Web Services), který (zjednodušeně řečeno) definuje modelovací jazyk umožňující obsluhovat interakci webových služeb. Jazyk umožňuje definovat takový průběh, ve kterém se „program“ bude větvit, probíhat v cyklu a podobně. K dispozici je rovněž systém pro zachytávání výjimek (klasické „catch“ bloky), blíže např. viz zde.

Bez zapojení sémantiky do celého modelu však některé problémy (výše zmíněné) být vyřešeny nemohou. Tak např. ve vazbě na BPEL4WS, kde odkazy na jednotlivé webové služby musí být konkrétní. Zapojením ontologie bychom získali možnost místo konkrétního odkazu pouze definovat typ služby, který se má v daném kroku volat, a rozhodnutí o použité službě by mohlo ležet mimo tuto proceduru.

Vycházíme z konceptu webových služeb, který byl popsán výše. Z definice WSDL dokumentů plyne, že struktura velmi dobře slouží potřebě popisu rozhraní služby ve smyslu definovaných operací, jejich pořadí a výčtu argumentů (parametrů). Řekněme, že WSDL dokumenty jsou součástí UDDI adresáře. Sémantické webové služby pracují s další vrstvou nad celou svou infrastrukturou (v tomto případě např. nad UDDI), která na základě žádosti konkrétní službu vyhledá a zprostředkuje komunikaci mezi klientem a nalezenou službou.

Tato vrstva pak zároveň plní funkci hierarchizování služeb v databázi. Samotný popis služby (tj. nejlépe WSDL) by musel být vybaven příslušnou značkou ontologie použité pro tento UDDI adresář a business logika tohoto adresáře by pak podle této značky mohla službu zatřídit do struktury.

V odkazu na BPEL4W v kombinaci s ontologií lze zároveň získat poměrně robustní nástroj na kompozici služeb, čímž se částečně řeší také problém granularity služeb a tím i jejich přiblížení k přímému využití ve firemních řešeních.

Tento přístup samozřejmě neřeší ostatní důvody nevhodnosti využití UBR pro globální adresář služeb; např. problém nedůvěryhodných či neaktuálních záznamů by vyřešen nebyl (odhlédneme-li od některých dílčích řešení ve specifikaci UDDI v.3, viz např. zde). Tento argument hovoří spíše pro přijetí odlišného modelu UDDI v podobě neveřejných UDDI adresářů, adresářů sdílených mezi několika partnery, popř. adresářů „poloveřejných“, tj. těch, které jsou spravovány některým subjektem a přístup do nich (popř. do jeho částí) je umožněn širšímu množství zájemců. V každém případě „znovuprosazení“ stejného modelu jako je UBR, bez snahy o vyřešení těchto základních problémů patrně nebude možné.

Odstínění „uživatele služby“ (uživatelem je v tomto případě stroj, člověk se většinou uživatelem stává pouze zprostředkovaně) od její konkrétní implementace může přinést další pozitiva; např. není-li konkrétní služba schopna poskytnout žádaná data, je teoreticky možno (zcela automaticky) vyzkoušet službu pracující nad jinou databází, která již danou informaci schopna poskytnout je.

Stav integrace ontologií a WS

Tato část seriálu se zabývá mapováním projektů, které se snaží prakticky realizovat to, co bylo nastíněno části předchozí.

Konkrétním jazykem, který pro web umožňuje zapisovat ontologie, je jazyk RDF (Resource Description Framework) konsorcia W3C. Jazyk je zaměřen na popis výroků o zdrojích webu, a to ve formátu subjekt-predikát-objekt. Subjekt reprezentuje konkrétní zdroj a predikát pak nějaký aspekt tohoto zdroje a zároveň jeho vazbu na objekt (Např. ve tvrzení „svět je hranatý“ je „svět“ subjektem, predikátem je konstatování, že vlastnost subjektu „tvar“ nabývá nějaké hodnoty, která je vyjádřená v objektu). Podrobnosti o jazyku RDF lze nalézt na stránkách konsorcia W3C.

Rozšíření se RDF jazyku dostalo na konci 90. let. 20. stol., kdy byl uveden jazyk RDF Schema (RDFS). Tento jazyk je zaměřen na reprezentaci znalostí, k čemuž používá výše popsaných RDF trojic. Umožňuje definovat třídy a jejich vlastnosti, včetně jejich oboru hodnot. Pomocí tohoto rozšíření je možno budovat webové ontologie. RDF a RDF Schema se staly hlavními zdroji při tvorbě jazyka OWL.

Sloučením několika dalších projektů, včetně RDF a RDFS, byl vytvořen jazyk OWL (Ontology Web Language), který má vyšší vyjadřovací potenciál než RDF. Součástí projektu je také OWL-S (Ontology Web Language for Services), což je dialekt tohoto jazyka pro použití v oblasti webových služeb (dříve byl jazyk znám jako DAML-S).

OWL-S je jazykem, který by měl zajistit skloubení sémantiky a webových služeb do té podoby, která byla v minulé části nastíněna, tedy popis možností a vlastností webových služeb v jednoznačné, počítačem interpretovatelné formě, viz zde. Zahrnutí jazyka OWL-S zajistí možnost plně automatického vyhledání, spuštění, řízení součinnosti, skládání a dokonce také dohledu nad průběhem webových služeb.

Propojení jazyka OWL-S s webovými službami je možné přímo ve WSDL dokumentech, a to díky rozšiřitelnosti WSDL. Zde jsou uvedeny příklady tohoto propojení, mimo vlastní uvedenou ontologii je k dispozici i ukázkový WSDL dokument s odkazy na tuto ontologii. Pro potřeby tohoto článku je uvedena pro minimální ilustraci část tohoto WSDL dokumentu (modelová situace je zasazena do oblasti webových služeb reprezentující obchod s knihami (odtud také „Congo“ - vazba na „Amazon“). Tučně jsou uvedeny vazby na OWL, resp. na definovanou ontologii):

</message>

</message>

</operation>

</portType>

Z ilustračního WSDL je zřejmé, že jeho propojení s WSDL je poměrně nenásilné a logické. Situace je složitější s tvorbou příslušné ontologie.

Závěr

Závěry vzešlé z výše uvedených řádků v zásadě potvrzují skutečnost, že část problémů spojených s dnes aktuální koncepcí webových služeb je řešitelná s pomocí aplikace ontologie do této oblasti (tvrzení je ekvivalentní v tom smyslu, že existují takové problémy této koncepce, které zřejmě jinak než s pomocí ontologie a sémantiky řešitelné nejsou).

Nicméně oblast „sémantických webových služeb“ je dnes zatím ve stádiu univerzitních experimentů a velmi řídkých vazeb do komerční oblasti. Důvodů je více, předně je to skutečnost, že sémantika by dala celému dnešnímu internetu zcela nový rozměr, což není příliš jednoduše adaptovatelné. Dále jsou to praktičtější problémy, počínaje relativní složitostí při definování ontologií (přestože jazyky pro její zápis byly extrémně zjednodušeny) až po neexistenci nástroje, který by k tvorbě této definice nabídl plnohodnotné GUI, např. včetně slovního vyjádření zapisovaných vztahů.

Vzhledem k tomu, že technologie přináší kvalitativní skok v práci s internetem a jeho zdroji, je možné očekávat, že po několika zdařilých implementacích v komerční sféře se technologie dostane do povědomí hlavních účastníků IT byznysu.

3. 8. 2007

Autor: