Úvod > Články > Role počítačů v literatuře i žurnalistice roste

Role počítačů v literatuře i žurnalistice roste

Mohou počítače s umělou inteligencí nahradit novináře nebo dokonce spisovatele a autory odborných monografií? Jaké metody automatizace psaní se používají? Nejen těmto otázkám se budeme věnovat v následujícím článku.

Představa, že počítač je myslící bytost, která s člověkem komunikuje prostřednictvím hlasového výstupu, patří nepochybně mezi nejznámější sci-fi konstrukce, se kterými se lze setkat snad v každém druhém románu. Přesto můžeme v tomto ohledu upadat do dvou opačných mýtů – prvním je ten, že jde o téma mimořádně vzdálené či nepravděpodobné, druhý pak, že člověk bude z tradičních autorských disciplín vytěsněn a nahrazen počítačem.

Philip M. Parker

Zřejmě nejvýraznější osobností, která se možnostem psaní knih počítači věnuje již relativně dlouho, je Philip M. Parker, který aktuálně působí jako profesor managementu ve francouzském INSEAD (Fontainebleau). Spektrum jeho zájmů je v této oblasti velice široké, ale zřejmě nejznámější jsou jeho automaticky generované knihy. Jeho algoritmus umí během necelé čtvrt hodiny projít obrovské množství zdrojů na internetu a vytvořit z nich kompilát, který se věnuje nějakému specifickému tématu.

Základní myšlenka pracuje s tím, co je někdy označováno jako „long tail“ – většinu knih prodá jen relativně malá skupina autorů a na zbylých asi 80 % zbude jen něco mezi 10-20 procenty trhu. To znamená, že jejich publikace se prodávají v řádu jednotek či desítek výtisků, což je objem, na kterém není možné při běžném psaní reálně vydělat. Parker ale přišel s myšlenkou, že jde o potenciální čtenáře, kteří mají velice úzkou oblast zájmů – mají vzácnou nemoc, potřebují překládat z malých či neznámých jazyků atp.

Jeho počítačová tvorba knihy probíhá tak, že algoritmus prochází web a hledá zajímavé útržky a informace, které se snaží skládat dohromady tak, aby vznikl souvislý text. Metod, jak toho dosáhnout, je celá řada, žádná z nich není sice ideální, ale přesto umožňují produkovat (po všech stránkách – tak algoritmy tohoto typu většinou fungují) průměrný text.

Takto vytvořená kniha dostává automaticky přebal podle řady, ISBN a míří do Amazonu. Distribuce je řešena pomocí „print on demand“, takže až ve chvíli objednávky dochází k tisku a zaslání publikace. To ji sice prodražuje, ale vzhledem k omezenosti trhu to zřejmě příliš nevadí.

Mimo odborné knihy umí jeho algoritmus tvořit také osmisměrky pro výuku jazyků nebo slovníky, což je činnost relativně užitečná. V době psaní článku na Amazonu prodával asi 106 000 knih, což je číslo pro jednoho autora skutečně mimořádné.

Jistě lze diskutovat různé etické otázky, tedy zda by u knih nemělo být explicitně uvedeno, že je psal stroj, nebo zda by neměl platit provizi každému, jehož zdroje použil, ale přesto jde o ukázku zajímavé cesty, kterou se psaní knih může ubírat – nebude to pravděpodobně literatura kvalitní, ale dost možná pro specifické potřeby velice dobře funkční.

Automatizovaná žurnalistika

Oblastí, o které se při počítačové tvorbě textů silně diskutuje, je žurnalistika. Velká část zpráv jsou v zásadě triviální prefabrikáty s minimálním obsahem osobnosti autora nebo jeho kreativitou. Pěkným příkladem zcela zbytečně člověkem psaných textů jsou policejní svodky – kdo zemřel či byl okraden – kdy a kde.

Na vytváření zpráv podobného charakteru lze relativně snadno vytvořit algoritmus, který bude dostávat data z policejní databáze v XML a předá je do textové podoby výstupu. Jistě jde o oblast, která je z řady důvodů zajímavá, protože umožňuje ušetřit čas i lidské zdroje. Jde navíc o práci, kterou jen málokdo dělá rád, takže může být převeden na jinou činnost. Editor novin pak je vybírá ty důležité, které se mu do vydání hodí nebo mají jiný potenciál.

LA Times používají například Quakerbot, který slouží pro analýzu zemětřesení. Jestliže Úřad pro geologický výzkum vydá nějakou informaci, systém ji sám analyzuje a převede do článku, který může být okamžitě publikován. Některé jeho části sice působí poněkud uměle, ale takový systém umožňuje mimořádně rychlé zpravodajství. Později do procesu vstupuje lidský faktor, který provede úpravy a přidá další informace, rozhovory nebo kontext.

Druhou oblastí podobného výzkumu jsou zápisy ze sportovních událostí. Každý, kdo sleduje on-line textové přenosy, si může udělat obrázek o bohatosti a pestrosti užívaných slovních spojení. Současné možnosti umožňuji analyzovat pohyb hráčů, identifikovat je pomocí čísla. A ani zápisy průběhu utkání nemusí být až tak problematické.

Je třeba také uvážit, že počítače mají možnosti mnohem pokročilejší analýzy pohybu, takže mohou snadno přidávat řadu zajímavostí – kolik kdo uběhl a jak rychle, jaká byla rychlost střely, počet přihrávek a jejich úspěšnost… V řadě sportů pro tuto činnost žádné oficiální statistiky neexistují, nebo vycházejí až se zpožděním.

Podobných možností by se jistě našlo více – cílem většinou přitom není dokonale nahradit člověka, ale uvolnit mu ruce pro kreativnější novinářskou činnost, hlubší analýzy atp.

SCIgen: automatická věda

Na závěr je možné zmínit ještě dvě aplikace, které jsou spíše okrajové, ale přesto zajímavé. Tou první je SCIgen, který umožňuje generovat vědecky vypadající práce z fragmentů děl jiných autorů. Měl by to dělat přitom tak šikovně, že nejde o plagiát v obvyklém vnímání a některé takto vytvořené texty (často dohromady nemající valný smysl) byly přijaty k publikování.

Otázkou je, jak velká je množina autorů, kteří si nechají takto článek předgenerovat a pak jej jen drobněji upravují, neboť jejich vystopování je prakticky nemožné. Také zde se ukazuje, že bezkontextové gramatiky jsou pro práci s již hotovými fragmenty textu velice pěkným nástrojem.

Pokud se člověk přece jen rozhodne, že se do psaní pustí sám, může použít nástroj Hemingway, který v anglicky psaném textu nachází stylistické chyby různého druhu – od dlouhých vět a opakujících se slov až po špatně zvolené přídavné jméno. Výsledkem jsou pak texty, které jsou stylisticky nezávadné, i když poněkud průměrné.

Počítačem realizované psaní tak má jednoznačně budoucnost, i když profesi žurnalistů a spisovatelů nenahradí a nevytlačí, tak jejich činnost bude jistě postupně transformována do hlubších a kreativnějších děl. Což je nepochybně dobře.

26. 3. 2014

Autor:

Sdílejte

Přečtěte si také

 

Mapy.cz představují novinku

Seznam.cz přišel s novinkou pro turisty. Společnost přidala novou funkci do portálu Mapy.cz. Jedná se o možnost...

 

Windows 9: nač ten spěch?

Stále více hlasů ze zasvěcených kruhů mluví o tom, že Microsoft hodlá v srpnu představit svůj nejnovější operační...

 

Google nakupuje analytické nástroje: po Emu získal také JetPac

Google se ve svých akvizicích zaměřuje na firmy, které pracují s umělou inteligencí a pokročilou analýzou dat...

Nejčtenější články

DSL internet nabídne rychlost připojení až 250 Mb/s

 

Společnost Česká telekomunikační infrastruktura (CETIN) zavádí technologii VDSL3, díky které nabídne v květnu vyšší...

Proč se na pořádný fotbal nepodíváte ani na ČT?

 

Britskou Premier League, Sky Bet Championship a španělskou ligu mohou čeští diváci sledovat pouze na Nové Digi TV a...

Rychlosti Wi-Fi internetu na DSL.cz v říjnu 2016

 

I v desátém měsíci roku 2016 jsme pro vás připravili zajímavé statistiky zaměřené na Wi-Fi providery. Z našeho...