Úvod > Články > Sémantické služby – příliš vzdálená budoucnost? (2/3)

Sémantické služby – příliš vzdálená budoucnost? (2/3)

Dnes se podíváme především na nedostatky a omezení klasické koncepce webových služeb a představíme si základní pojmy z ontologie.

Nedostatky původní koncepce

Přestože webové služby byly od počátku navrhovány s ohledem nejen na technickou stránku (ve smyslu vlastního volání služby) a existují i nástroje pro popis (WSDL) a vyhledávání (UDDI) služby, koncepce neřeší některé aspekty, které se v průběhu času ukázaly jako podstatné. Rovněž se ukázalo, že jiné aspekty, které koncepce sice řeší, nebyly nastaveny správně.

Tato část seriálu je zaměřena na popis takových nedostatků (těm, které jsou z pohledu zaměření tématu klíčové, je věnováno prostoru více, ostatní jsou zmíněny spíše pro úplnost). Prozatím abstrahujeme od existujících návrhů, které se tyto nedostatky snaží napravit.

Chybí podpora transakcí. Tento významný aspekt redukuje možnosti užití webových služeb na jednoduché dotazy typu „request - response“, čímž automaticky zvýhodňuje jemněji granularizované služby a celou koncepci WS tak staví spíše do technologické, nikoliv business oblasti. To úzce souvisí s chybějící podporou workflow.

Dalším chybějícím aspektem je error handling, který může být významný hlavně v případě vícevrstvé kompozice služeb. Další omezení jsou zaznamenána hlavně v oblasti bezpečnosti, a to především v otázce ochrany dat při provádění služby a také v ochraně přístupu k rozhraní služby, resp. diferenciace přístupu k jednotlivým operacím.

Problémy se systémem vyhledávání služeb

Aspektem koncepce WS, který se příliš neosvědčil, je oblast vyhledávání WS, tedy oblast související s UDDI. Vize centrální (byť distribuované) databáze služeb narazila na řadu problémů, které nebyly při návrhu vzaty v potaz.

Po spuštění veřejných registrů UDDI (neboli UBR - UDDI Business Registry) bylo umožněno (v souladu s filozofií WS) do těchto registrů přistupovat a registrovat či vyhledávat příslušné služby. Po cca. pěti letech provozu (v prosinci 2005) bylo největšími provozovateli (IBM, Microsoft, SAP) oznámeno, že do jednoho roku budou registry uzavřeny. Tuto zprávu doprovázelo společné vysvětlení, které ale tento krok dostatečně neobjasňovalo; hovořilo spíše o „dovršení účelu“ (příslušný text lze nalézt zde). Dnes je tedy situace, kdy neexistuje žádný skutečně globální veřejný UBR.

Důvodů pro uzavření těchto registrů bylo více. Především jde o důvěryhodnost vkládaných dat. Celý systém veřejných UDDI adresářů spočíval na tom, že po registraci získal každý zájemce účet, s jehož pomocí mohl svá data do adresáře vkládat. Neexistovala metoda, která by dokázala ověřit pravost vkládaných dat, potažmo to, zda se údaj v databázi nadále shoduje s realitou.

Autoři UDDI specifikace verze 3 si tento stav již plně uvědomovali, proto specifikace 3 se (mimo jiné) daleko více zaměřuje na privátní (tj. např. vnitropodnikové) UDDI registry, které naopak úspěšně existují a ze strany všech velkých společností v oblasti IT jsou plně podporovány. Do budoucna se počítá spíše se situací, kdy bude každý server spravovat svůj adresář poskytovaných služeb (samozřejmě, nemusí jít nutně o UDDI) a posouzení důvěryhodnosti serveru bude pak na uživateli.

Taxonomie adresářů

Nedůvěryhodnost vložených dat ale není jediným problémem UDDI adresářů. Pokud jde o granularitu, mají webové služby obrovský rozsah, což dále snižuje použitelnost UBR. Jemně granularizovaná webová služba je technickým termínem. Její potenciál pro technickou integraci je obrovský a v souladu s touto skutečnosti je webová služba i takto využívána. Z pohledu obchodního není takováto webová služba příliš uchopitelným pojmem, protože její rozsah se většinou omezuje na příliš dílčí činnosti (viz převod měn). Z tohoto pohledu je veřejný adresář takto vysoce granularizovaných činností (bez definované taxonomie) reálně velmi málo použitelný. Prohlížení UBR registrů osobami netechnického zaměření musí vyznít téměř naprázdno (takový uživatel si pod pojmem „služba“ představí např. celé vedení daňové evidence, ale setkává se službami typu „počasí v dané lokalitě“ či „hodnota akcií na burze“).

Neexistence taxonomie, podle které by se webové služby daly v adresáři zařazovat a vyhledávat, vede k dalšímu snížení reálné použitelnosti nástroje. Vzhledem k obrovské rozmanitosti činností, které webové služby mohou poskytovat, je vytvoření takové struktury značně problematickým úkolem. Dnes se webové služby v rámci UDDI popisují několika záznamy v přirozeném jazyce, což prakticky vede k nemožnosti hierarchii sestavit. A byla-li by teoreticky podobná struktura implementována, i tak by to znamenalo problémy se strojovým čtením takovéhoto adresáře; vzhledem k nejednoznačnosti přirozeného jazyka (termínů s více významy) by pohyb nemohl být nikdy zcela automatizován.

Obecně velmi složitá je dnes i automatická kompozice služeb. Ze stejného důvodu (neexistence hierarchie v registru) prakticky není možné vytvořit službu, kterou by tvořila sekvence služeb jiných, a to s tím, že by nemusela být závislá na konkrétních službách, ale spíše na jejich typech (nehrozilo by tedy, že při výskytu výjimečné události u jedné dílčí služby by se veškeré nadřazené služby nechovaly korektně).

Sémantika a WS

Problémy, tak jak byly stručně popsány v minulé části, by se samozřejmě daly zobecnit. Potenciál, který dnešní výpočetní technika nabízí, je obrovský, avšak stále je limitován tou skutečnosti, že počítač nepracuje s obsahem zpracovávané zprávy, ale pouze s její reprezentací v podobě dat. Jistou formou řešení této skutečnosti by mohly být některé (relativně mladé) metody, které se v souvislosti s informačními technologiemi začínají objevovat.

Vzhledem k tomu, že celá oblast je velmi mladá a nejlépe je rozpracována v akademickém prostředí (a to včetně ČR), vychází tato teoretická část také z práce našich předních odborníků v této oblasti. Jde především o tyto zdroje, na které se v následujícím textu budu odkazovat: [SVA01] a [SVA02].

Sémantiku (neboli význam) webové služby (v širším kontextu všech webových zdrojů) si můžeme představit jako její formalizovaný popis ve formě jakési metainformace k této konkrétní službě připojené. O Skutečném významu tohoto popisu by pak rozhodovala ontologie, ke které by popis formálně náležel [SVA01].

Ontologie

Pojem ontologie, jak jej rozumíme v souvislosti s informatickou vědou, souvisí se svým původním filozofickým významem jen velmi přeneseně. Dle [SVA02] ontologie popisuje to, co „existuje“ a může být tudíž reprezentováno v informačním resp. znalostním systému; jde tedy o formální specifikaci sdílené konceptualizace. Významem jednotlivých termínů přitom je:

formálnost – je použit jazyk s přesně specifikovanou syntaxí
explicitnost – tvrzení musí být vyjádřitelné
sdílenost – musí jít o konsenzus zájmové skupiny, nikoliv jednotlivce
konceptualizace - systém pojmů modelující určitou (významnou) část světa

Pojmu ontologie se velmi zevrubně věnuje např. [SVA02], zde je uvedeno pouze jednoduché shrnutí. Vzhledem k velkému zjednodušení však některé pojmy nemusí být vysvětleny zcela přesně.

Základními pojmy v oblasti ontologií jsou třída a relace. Třídu lze chápat obdobně jako stejný pojem v oblasti objektově orientovaného programování. Na rozdíl od tohoto vymezení ale třída nemá žádné definované metody. Třída je vymezena svými vztahy (ne)příslušnosti konkrétních instancí (resp. individuí) k této třídě, a to pomocí specifických podmínek („aby tato entita mohla být zařazena pod tuto třídu, musí mít takovou vlastnost.“).

Individua, resp. objekty reálného světa jsou tedy vázány řadou nutných a postačujících podmínek ke konkrétním třídám, ale (opět na rozdíl od objektové teorie) to nemusí platit vždy – objekt může být součástí ontologie bez příslušnosti k nějaké třídě. V logice věcí ovšem individua nejsou předmětem zájmu ontologií – důraz je kladen na třídy. Navíc, zda konkrétní entita bude třídou či individuem, záleží na oblasti, kterou daná ontologie mapuje.

Relace je dalším a neméně podstatným termínem vázajícím se ke struktuře ontologie. Chápání relací v oblasti ontologií není podobné relacím mezi třídami v případě objektové teorie (popř. ER schémat z oblasti databází). Relace je zde základním pojmem, třída dokonce může být zvláštním případem relace. Většinou bývá relace definována pomocí sady libovolných logických podmínek. K relacím se váží další pojmy (např. omezení relací – tj. že „týden má přesně 7 dní“) v ontologiích často užívané, ale zde se jimi zabývat nebudeme.

Je namístě upozornit na formální vyjádření ontologií. To je realizováno pomocí nějakého jazyka. Jazyků pro popis ontologií vzniklo v průběhu času mnoho. Liší se především svou komplexností; na té pak záleží, co všechno může daná ontologie popisovat. Jednodušší jazyky např. neumí definovat vlastní relace, ale tyto jsou předem dány a uživatel jazyka pak může pouze vybírat ze sady předdefinovaných vztahů.

Tendencí je přechod od jazyků složitých po ty jednodušší. Tato tendence je podložena logickou úvahou, že pro rozšíření sémantiky na web je zapotřebí maximální jednoduchosti, a to jak pro implementaci ontologie do webu, tak pro pochopení uživatelem. Složité a komplexní jazyky sice umožní dokonalejší vyjádření zkoumané oblasti, ale jejich prosazení v praxi by bylo mnohem složitější.