Konsorcium českých vysokých škol pro společné

sdílení rozsáhlé báze dat chemických

strukturních a faktografických informací

 

Jaroslav Šilhánek a Ludmila Zetková

Vysoká škola chemicko-technologická, Praha

 

Úvod

Hlavním tématem této přednášky je informace o ustavení prvého funkčního konsorcia vysokých škol a ústavů AV ČR pro společné sdílení velmi rozsáhlého a také velmi finančně nákladného infor mačního zdroje, báze dat “CrossFireplusReaction”. Pojem “sdílení formou konsorcia” znamená, že tato báze dat je instalována (na základě pronájmu) na centrálním serveru, který je umístěn na VŠCHT v Praze a členové konsorcia mají oprávnění se prostřednictvím počítačové sítě, v našem případě sítě CESNET, resp. TEN34, k serveru připojovat a s bází dat bez dalšího omezení pracovat. Získávají tak možnost přístupu k tomuto informačnímu zdroji za výrazně výhodnějších podmínek, než kdyby si každá z participujících institucí organizovala přístup k tomuto zdroji samostatně. Ve skutečnosti je situace taková, že pro naprostou většinu členů konsorcia by individuální nákup, resp. pronájem této báze vzhledem k její ceně vůbec nepřicházel v úvahu.

Toto konsorcium bylo vytvořeno pro přístup k bázi dat, která je sice pro řadu chemických disciplín velmi důležitá a její tištěná verze má velmi dlouhou tradici, jinak se ale jedná o bázi dat spíše netypickou. Jednak tím, že je to tak výrazně “chemická” báze dat, že se zde pracuje se strukturními vzorci kreslenými prostřednictvím “myši” na obrazovce, ale také tím, že je to i báze faktografická obsahující ohromné množství konkrétních údajů, často v numerické podobě. Pro získání poněkud přesnější představy o jaký informační zdroj se vlastně jedná a co bylo založením konsorcia získáno, je přece jenom nutné podat úvodem několik základních informací o této bázi. V žádném případě se ale nebudeme pokoušet naučit účastníky konference s touto bází dat pracovat.

 

Báze dat “CrossFireplusReaction” neboli “Beilstein”

Název “CrossFireplusReaction” není nic jiného než ochranná známka. Ještě přesněji, ochranou známkou nebo spíše logem je jen označení “CrossFire”, běžně zkracované jako XFire, což byla první elektronická verze obsahující jen individuální sloučeniny. Připojení výrazu “plusReaction” pak jen zdůraznilo, že byly doplněny i vztahy mezi individuálními sloučeninami, tedy chemické reakce. Z důvodů zřejmě především autorskoprávních, producent této báze dat považoval za nutné zavést tento název přesto, že se ve skutečnosti jedná o dávno a velmi dobře známé mnohosvazkové chemické kompendium, “Beilsteins Handbuch der Organischen Chemie”, doplněné a převedené do elektronické podoby. Toto prosté konstatování je sice pravdivé, ale poněkud opomíjí skutečnost, že ono doplnění a převedení do elektronické podoby nebylo vůbec triviální záležitostí a stálo údajně německé daňové poplatníky cca 65 miliónů DEM. To byla cena investovaná především ze státních zdrojů do rozsáhlého programu aktualizace a elektronizace původního “Handbuchu” do podoby báze dat “CrossFire”. Shrňme tedy nejdříve výchozí informace o tištěné předloze této báze dat.

 

“Beilsteins Handbuch der Organischen Chemie”

Název tohoto díla připomíná německého chemika Friedricha Konrada Beilsteina, který působil jako profesor na Carském technickém institutu v Sankt Petěrburgu a v letech 1881-83 vydal prvé vydání soupisu všech do té doby známých organických sloučenin. Soupis tehdy obsahoval 15.000 sloučenin, nejstarší literární odkaz pochází z r. 1779. Dílo bylo velmi úspěšné, bylo postupně doplňováno a do konce minulého století bylo vydáno v dalších dvou vydáních. Počátkem 20. století už bylo pro jednotlivce nemožné pokračovat v započaté koncepci soupisu všech sloučenin a jejich vlastností a proto další péči o vydávání převzal Spolek německých chemiků. V r. 1918 byl vydán prvý svazek tzv. 4.vydání, pro které bylo stanoveno pevné schéma pro průběžné doplňování a celý materiál byl organizačně rozdělen do 27 svazků. Schéma doplňování i rozdělení do svazků se ukázalo být natolik funkční, že mohlo zůstat zachováno po celé 20. století, kdy byly jednotlivé svazky stále vydávány. Pro představu stojí za uvedení zjednodušené schéma vydávání celého díla.

V základním vydání, tzv. “Hauptwerk”, je shrnut veškerý materiál za období od počátku historické chemie, tedy od dob alchymistů, až do r. 1909. A tato “základní řada” má oněch 27 svazků, ve kterých jsou sloučeniny zatříděny podle své struktury. Od r. 1920 začaly vycházet svazky doplňků zahrnujících období 1910-1919, tzv. “Erstes Ergä nzungswerk”, přičemž počet svazků a rozdělení materiálu je naprosto shodné jako u základního díla. A podobně od r. 1930 pak svazky 2.doplňků za období 1920-1929 a tak se mělo pokračovat dále, vždy 27 svazků doplňků za desetileté období* . Koncepce desetiletých doplňků byla narušena válkou, po které bylo nutné zpracovat najednou dvacetileté období, tedy 1930-1949, ale hlavní komplikace nastaly s dramatickým nárůstem nových poznatků a nových sloučenin, které bylo nutné excerpovat z primárních zdrojů a zařadit do příslušných doplňků. Přesto, že po 2.světové válce byl pro vydávání tohoto díla založen samostatný ústav, Beilstein-Institut fü r Literatur der Organischen Chemie ve Frankfurtu nad Mohanem, vydávání jednotlivých svazků se stále více zpožďovalo a celé dílo se dostávalo do situace, že ztráta aktuálnosti se už stávala velmi citelnou. Situaci ilustruje skutečnost, že v tištěné podobě jsou vydány kompletně jen 4.doplňky zahrnující období 1950-1959. Z dalších, tedy 5.doplňků, zahrnujících období 1960-1979, tedy opět dvacetileté období a vycházející již v angličtině, je tiskem vydána asi polovina a je již dnes zřejmé. že druhá polovina s největší pravděpodobností už nikdy nevyjde. Totéž platí o proponovaném vydání 6.doplňků, které měly dokončit zpracování téměř do konce století a měly zpracovat období 1980-1989.

Kritická situace ve vydávání nastala v sedmdesátých a počátkem osmdesátých let, kdy s ohledem na postupnou ztrátu aktuálnosti (a stále stoupající cenu) dramaticky klesal počet předplatitelů, pochopitelně výhradně institucionálních. V tomto období bylo všeobecně očekáváno ukončení vydávání tohoto díla. Obrat nastal v osmdesátých letech, kdy tehdejší ředitel Beilsteinova Iinstitutu, Clemens Jochum, prosadil projekt zahrnující jak dohnání zpoždění, tak i převedení celého díla do elektronické podoby a hlavně na tento projekt získal finanční prostředky. Tento projekt byl založen především na extensivním využití výpočetní techniky, takže především excerpce materiálu z primárních zdrojů za chybějící období byla realizována výhradně přes pracovní stanice a údaje byly ukládány do souborů průběžně kontrolovaných a ukládaných do matečné báze dat. Na této práci se podílely skupiny externích spolupracovníků, organických chemiků, z nichž jedna pracovala i v tehdejším Československu. Současně byly z interních materiálů Beilstein Institutu (lískových kartoték) převáděny do elektronické podoby všechny vydané tištěné svazky.

Díky skutečně vynikající přípravě a organizaci této práce (a také nepochybně díky již uváděným vysokým finančním dotacím) pokračovala práce velmi rychle kupředu a již počátkem devadesátých let bylo možné vznikající elektronickou verzi Beilsteinova kompendia postupně zpřístupňovat uživatelům.

 

Báze dat “CrossFire”

Elektronická verze byla nejdříve zpřístupněna jako báze dat “BEILSTEIN”, a to prostřednictvím některých databázových středisek, např. STN International, později ale začala být nabízena možnost její instalace v lokálních sítích uživatelských institucí. Tato strategie zpřístupňování je velmi důležitá, Beilstein Institut byl prakticky prvý z významných producentů, který s ní přišel a měl velký úspěch. Zpřístupnění prostřednictvím databázových středisek sebou totiž vždy nese problém průběžného placení typu “pay-as-you-go”, kdy se náklady nedají předem odhadnout, protože závisí od času stráveného v bázi a od množství převzatých informací. Při práci s bázi je tak uživatel “stresován” faktem, že mu běží čas a peníze. Doprovodným problémem je i skutečnost, že ten, kdo s bází pracuje, musí mít oprávnění utrácet principiálně nemalé finanční prostředky. Instalace v lokálních sítích formou pronájmu za pevný roční poplatek má tu výhodu, že práce s bází není ničím omezována a uživatelé se tak mohou plně soustředit na její maximální využití. Tato forma byla nejdříve nabídnuta chemickému a farmaceutickému průmyslu, ale velmi brzy také universitám. Elektronická verze Beilsteinova kompendia pro lokální instalaci dostala název “CrossFire” a později “CrossFireplusReaction” a je možno konstatovat, že tato báze dat a způsob jejího zpřístupnění se staly pojmem a báze sama představuje dnes jeden z nejdůležitějších informačních zdrojů nejenom pro organickou chemii, ale i pro celou řadu dalších chemických oborů.

 

“Předkonsorciální” zpřístupnění báze dat “CrossFire” v České republice

Ještě před tím, než se budeme věnovat vlastnímu vytvoření konsorcia pro přístup k tomuto dílu, je nutné připomenout, že mu předcházelo období využívání v omezenějším měřítku, a to na VŠCHT v Praze a Chemické fakultě University Pardubice. Tato skutečnost sehrála poměrně důležitou roli při pozdějším vytvoření konsorcia. Pronájem a instalace báze dat na lokálním serveru na VŠCHT v Praze vycházely ze skutečnosti, že VŠCHT v Praze zůstala jedinou institucí v České republice, která pokračovala v odběru tištěných svazků Beilsteins Handbuchu i poté, co cena jednotlivých svazků představovala částku 70.000 Kč a roční náklady na nákup díla dosahovaly 1 miliónu Kč. Protože takových institucí již nebylo mnoho, byl nám producentem tohoto díla nabídnut pronájem elektronické báze CrossFire současně s pokračujícím odběrem tištěných svazků dohromady jen za přijatelně zvýšenou cenu o cca. 20 %.

Stojí za to, se o tomto kroku zmínit, protože představuje učebnicovou ukázku efektivní marketingové strategie. Bez takto koncipované nabídky nebo za méně výhodných podmínek bychom pravděpodobně o pronájmu báze “CrossFire” nemohli uvažovat. I když VŠCHT v Praze investovala do pronájmu báze v té době cca 1,2 milióny Kč (tato částka postupně narostla na téměř 1,5 miliónů), je nutné zdůraznit, že realizace pronájmu byla umožněna díky podpoře z grantu programu Fondu rozvoje VŠ, jehož prostřednictvím byl zakoupen server, na kterém je celý systém provozován.

Současně projevila velkou prozíravost i Chemická fakulta University Pardubice, která uzavřela licenční smlouvu na přístup k bázi “CrossFire” instalované na VŠCHT v Praze za podmínek, které byly producentem, Beilstein Informationssysteme, považovány za mimořádně vstřícné, ale z hlediska rozpočtu Chemické fakulty University Pardubice naopak značně tvrdé. Na druhé straně ale Chemická fakulta University Pardubice ušetřila tím, že nemusela pořizovat další server a současně tato strategie umožnila v pravém slova smyslu experimentálně odzkoušet práci s bází dat “CrossFire” na vzdáleném serveru v prostředí tehdejší akademické počítačové sítě CESNET. Tato okolnost nepochybně výrazně přispěla k tomu, že bylo možné koncepci konsorciálního přístupu připravit na velmi solidní bázi.

 

Konsorcium akademických subjektů v České republice pro společné sdílení strukturní a reakční báze dat “CrossFire”

Výše uvedená koncepce marketingu a zpřístupňování báze dat “CrossFire”, mezitím rozšířené na “CrossFireplusReaction”, se ukázala být velmi úspěšnou a vedla k postupnému zavádění této báze jak v průmyslovém prostředí, tak i na evropských a amerických universitách. Především ve Spojených státech počet instalací rychle vzrůstal, a to hlavně díky možnosti vytvářet lokální konsorcia universit pro společné sdílení přístupu k bázi. Koncepce vytváření konsorciálního zpřístupňování vychází z prostého faktu, že kromě průmyslových podniků, je jen málo universit, jejichž chemické fakulty jsou tak velké (a vládnou tudíž odpovídajícím rozpočtem), že si mohou pronájem báze dat “CrossFire” dovolit. Přesně taková situace byla i v České republice a producentu báze byla naprosto zřejmá.

Tato situace je univerzální ve většině zemí a proto Beilstein Informationssysteme přichází s návrhy na vytvoření konsorcií universit pro společné sdílení pronájmu báze, které vycházejí z posouzení konkrétních místních podmínek, počtu universit, resp. jejich chemických fakult, počtu studentů, učitelů nebo i dalších pracovníků, celkové rozlohy, počtu nepřipojených institucí a řady dalších faktorů. Licenční a cenová politika je dále založena na počtu tzv. “seats”, doslova tedy “židlí” u počítačů, neboli instalací klientských programů provozovaných na uživatelských stanicích. Jinak řečeno, je to počet současně pracujících uživatelů s bází. Na základě svého ohodnocení situace v daném regionu, předkládá pak Beilstein Informationssystéme návrh na konsorciální pronájem pro danou oblast nebo v případě menších zemí pro celý stát. Návrh obsahuje vždy alternativní varianty umožňující takovou volbu počtu současně pracujících uživatelů, jaká odpovídá předpokládané potřebě na straně jedné a finančním možnostem na straně druhé. Takový návrh byl vypracován a předložen i pro Českou republiku, přičemž předpokládal, že bude vytvořeno konsorcium vysokých škol a ústavů AV ČR i případně dalších neziskových institucí, které budou využívat stávající instalaci báze na serveru na VŠCHT v Praze.

Přesto, že návrh obsahoval širokou volbu počtu “seats”, tedy současně pracujících uživatelů a tomu odpovídající licenční poplatky, které pochopitelně se zvětšujícím se počtem současně pracujících uživatelů klesaly v přepočtu na jednoho uživatele, bylo naprosto zřejmé, že požadované licenční poplatky pro minimální počet současně pracujících uživatelů jsou mimo finanční možnosti všech vysokých škol v České republice. Jinými slovy, podíly, které by připadly na jednotlivé školy byly tak vysoké, že naprostá většina škol by je nemohla uhradit.

Za této situace jsme nejdříve předložili Ministerstvu školství návrh vytvoření konsorcia vysokých škol, které by bylo financováno jako samostatná akce. Náš návrh byl vcelku kladně přijat, ale bylo doporučeno jej předložit v rámci v té době připravovaného programu INFRA2. Projekt na vytvoření konsorcia, který byl předložen v rámci tohoto programu, byl založen na celkem jednoduchém modelu finanční spoluúčasti vysokých škol a prostředků programu INFRA2. Z výchozí částky požadované producentem jako minimální licenční poplatky pro Českou republiku vycházely částky pro licenční přístup jednoho uživatele, tedy jedno “seat”. Na základě jednání s potenciálními účastníky konsorcia jsme došli k závěru, že vysoké školy v České republice, včetně některých ústavů AV ČR, jsou schopny uhradit přibližně polovinu požadovaného minimálního poplatku za pronájem pro celou Českou republiku. Proto byla navržena následující zásada financování konsorciálního přístupu. V případě, že vysoká škola si zaplatí ze svého rozpočtu jedno připojení (jednoho současně pracujícího uživatele a tedy jedno “seat”), bude jí druhý uživatel (druhé “seat”) uhrazen z grantu projektu INFRA2. Touto formou by mohl být pokryt celý požadovaný minimální roční licenční poplatek.

Projekt na vytvoření konsorcia předložený VŠCHT v Praze byl Radou programu INFRA2 schválen k 30. březnu 1998 a bylo tak možné zahájit práce na vytvoření konsorcia za výše uvedených podmínek. Jednání probíhala v průběhu dubna až června 1998, sestávala s řady schůzek, konsultací, demonstrací práce s bází, experimentálního ověřování kvality přístupu na školách v jednotlivých regionech i hledání určitých kompromisů mezi požadavky producenta a možnostmi našich vysokých škol. Výsledkem bylo vytvoření konsorcia 10 vysokých škol, dvou ústavů AV ČR a báze byla za souhlasu producenta zpřístupněna v Knihovně AV ČR v Praze pro ostatní její ústavy.

Složení konsorcia je v současné době následující, připojení dalších škol nebo ústavů AV ČR nebo i jiných neziskových subjektů je otevřené:

Vysoká škola chemicko-technologická Praha

Universita Karlova

Přírodovědecká fakulta v Praze

Farmaceutická fakulta v Hradci Králové

Universita Pardubice

Chemická fakulta

Universita Palackého Olomouc

Přírodovědecká fakulta

Masarykova Universita Brno

Přírodovědecká fakulta

Vysoké učení technické Brno

Chemická fakulta v Brně

Technologická fakulta ve Zlíně

Veterinární a farmaceutická universita Brno

Ostravská universita Ostrava

Přírodovědecká fakulta

Ústav makromolekulární chemie AV ČR Praha - Petřiny

Ústav chemických procesů AV ČR Praha - Suchdol

Knihovna AV ČR Praha

 

Přístup k bázi na konsorciálním principu byl otevřen ke dni 1. července 1998, připojení některých účastníků bylo realizováno během září až října 1998. Je možno konstatovat, že se nevyskytly žádné vážnější problémy technického ani organizačního charakteru, drobné potíže s připojením a s prací byly zpravidla vyřešeny během několika dní. Nositel projektu zajišťuje funkci a přístup k centrálnímu serveru včetně průběžné aktualizace báze (je realizována jednou za tři měsíce) i aktualizaci celého systému tak, jak je producentem uváděn do provozu. Kromě toho jsme uskutečnili celkem 8 školení práce se systémem u členů konsorcia, v jednom případě opakovaně na základní a vyšší úrovni.

Konsorcium není právnický subjekt, protože producent báze, Beilstein Informationssysteme, souhlasil s tím, že uzavře s jednotlivými členy konsorcia samostatné licenční smlouvy na ten počet “seats”, tedy počet současně pracujících uživatelů, který si hradí ze svých prostředků. Jedná se tedy o přibližně polovinu požadované celkové minimální částky. Zbývající částka je hrazena z prostředků přidělených v rámci projektu programu INFRA2 jeho nositelem, tedy VŠCHT v Praze. Uvedené finanční zabezpečení je zajištěno na tři roky, jak vyplývá z trvání projektu INFRA2. Součástí projektu byl i předpoklad financování po skončení projektu, který byl formulován jako zvýšení spoluúčasti jednotlivých členů vyplývající z vyšších požadavků na současné připojení, připojení dalších členů ke konsorciu (v jednání je několik vysokých škol) a konečně formou spoluúčasti průmyslu. Je předpokládáno, že bázi dat “CrossFire” začne využívat český chemický a hlavně farmaceutický průmysl, který bude mít tak konkrétní zájem na tom, aby absolventi vysokých škol přicházeli připraveni pro práci s moderními informačními zdroji a z tohoto titulu bude ochoten zpřístupnění formou konsorcia sponzorovat. V tomto ohledu se již předpoklady částečně splnily, protože prvý komerční subjekt již uzavřel licenční smlouvu s producentem a je připojen na server na VŠCHT v Praze. Že z toho ještě nevyplývá ochota konsorcium finančně podporovat je nabíledni.

 

Shrnutí a závěry

V prvé řadě je nutné zdůraznit sám fakt, že se poměrně v krátké době a bez jakýchkoliv předchozích zkušeností podařilo realizovat přístup k velmi rozsáhlému, sofistikovanému a finančně náročnému informačnímu zdroji prostřednictvím vytvoření konsorcia uživatelů z oblasti akademických institucí. I když k dnešnímu dni konsorciální přístup funguje méně než jeden rok, technické zabezpečení bylo již dostatečně odzkoušeno během tříletého provozu mezi VŠCHT v Praze a Universitou Pardubice a není proto překvapující, že po této stránce nejsou prakticky žádné problémy.

Navržený model finanční spoluúčasti jednotlivých vysokých škol a ústavů AV ČR na straně jedné a prostředků grantových programů na straně druhé se setkal se všeobecným porozuměním a může být vhodným modelem i pro další konsorciální nákupy. Je nutné ovšem upozornit na pochopitelnou závislost víceletých programů financování na pohybech kurzů, což může velmi podstatně zkomplikovat úhrady dohodnutých částek v jednotlivých dalších letech. Konkrétní výše licenčních poplatků i výše podílů členů konsorcia jsou pochopitelně výsledkem jednání a nejsou zveřejňovány. Je ale možno uvést, že pro jednotlivé připojené instituce je výše jejich podílu, která jim umožňuje připojit se k bázi dat nižší, než je dnešní cena jednoho jediného svazku tištěné verze Beilsteinova kompendia. A za tuto cenu mají možnost pracovat současně s přibližně 600 svazky tohoto díla v elektronické podobě.

 

 

 

Demonstrace práce s bází dat “CrossFireplusReaction”

 

Součástí přednášky bude dále demonstrace práce s touto bází pokud možno v režimu on-line, která by měla ukázat obsah, způsoby práce i rozsah informací, které tento zdroj poskytuje.

 

Autoři by rádi jménem svým a určitě i jménem všech členů konsorcia vyjádřili svůj dík za poskytnutí finančních prostředků z Fondu rozvoje VŠ a programů TEN34, identifikační číslo ID96010 a INFRA2, identifikační číslo LB98084, bez nichž by realizace projektu konsorciálního sdílení přístupu nebyla možná.