Rozhovor pro časopis Orientační běh – ptal se J.Krejčík.

Možná jste si toho všimnuli, možná ne. Michal Besta spustil na svých webových stránkách centrální databázi výsledků. Sice jde zatím pořád jen o demoverzi, ale už teď v ní najdete výsledky zhruba 700 závodů. Poté, co jsem se našel i ve výsledcích takových závodů jako XXV. ročník Poháru ADASTU, nedalo mi to, a zeptal jsem se Bestíka na pár detailů.

Proč vůbec potřebujeme centrální databázi výsledků?

Důvod je prostý. Výsledky závodů dneska v podstatě zahazujeme, protože spousta z nich končí po čase v propadlištích internetu a nikdo se k nim už nikdy nedostane. Proto je třeba je někde uchovávat a když už to děláme, tak ideálně strukturovaně a nezávisle na tom, v jakém programu pořadatel závody dělal. Dále si představte úkol typu: „Zjisti všechny výsledky závodníka XYZ za rok 2010.“ V praxi to je buď neřešitelný problém nebo zabere spoustu času procházením jednotlivých webů pořadatelů. V databázi jedno kliknutí. No a nakonec člověk většinu věcí dělá i pro sebe, takže k tomu, že mám všechy své mapy (ať už s GPS postupy nebo bez) za posledních pár let v digitálním archivu (nabízím tuto možnost všem, kteří mají zájem), jsem chtěl archivovat i všechny své výsledky. Už žádné klasické kliknutí na odkaz výsledků a zobrazení prázdné stránky s nápisem „stránka neexistuje“. Web www.bestik.cz je tak pro závodníka ideálním místem, který uchová jeho celou OB kariéru (mapy, postupy, výsledky).

Je těžké dohledat výsledky a upravit je do nové tabulky? Máš na to nějaký speciální program, který zvládne všechno sám? Nebo po něm musíš nakonec všechno ještě kontrolovat?

Je třeba rozlišovat výsledky historické a výsledky nové. U historických jsou většinou jediné existující podklady samotné výsledky na webu (tak jak jsme zvyklí si je po závodech prohlížet). Tam je pak třeba udělat speciálního robota, který takové výsledky projde a ze správných míst si vybere správná data. Samozřejmě co program na pořádání závodů (v Česku se jich používá několik – např. OB2000, OORG, OE2003, OE2010 a další lokální) to jiný formát. Taková práce se tedy vyplatí, pokud závodů v daném formátu je hodně. Kvůli výsledkům jednoho závodu nemá smysl hodiny programovat převod… Naopak výsledky nové používají samoobslužný systém. Z každého z uvedených programů plus z univerzálního IOF XML formátu výsledky nahraje a vypublikuje sám pořadatel (v Nápovědě je proces detailně popsán). Žádný speciální program pro převod tak už není potřebný.  Co se týče kontroly, tak ta je samozřejmě u historických závodů vždy nutná, protože staré výsledky na internetu neobsahují spoustu informací o samotném závodě. U výsledku nových dělá kontrolu webová aplikace databáze výsledků a donutí nahrávající osobu k vyplnění všech povinných položek.

Jak je to s registračními čísly, když mohl jeden člověk za svou kariéru vystřídat třeba pět oddílů? Dělá to v databázi nějaký problém?

Databáze obsahuje tabulku registrací, kde má každý závodník své unikátní číslo, které se mu v čase nemění. K tomuto číslu jsou pak v jednotlivých letech přiřazovány v každém sportu konkrétní registrační čísla. Problém samozřejmě může nastat, protože se mění s přestupy registračky, jména a taktéž různé překlepy. Kromě toho i šílenci jako třeba oddíl ze Smržovky, který používá v registracích přezdívky a ty ještě každoročně různě upravuje. Díky několika chytrým algoritmům kontrolujícím historii je většinou 95% závodníků přiřazeno k unikátním číslům automaticky, několik desítek se kontroluje vizuálně a zbývajících pár set jsou závodníci noví, kterým se přidělí nové unikátní číslo. Práce na přiřazení registrace jednoho roku pro OB (cca 7000 závodníků) je tak otázkou 10 minut. Díky tomu jsou v databázi dnes data z dostupných oficiální registrací (OB od roku 2003, MTBO od roku 2007, LOB od roku 2010). Celkově zhruba 13 tisíc osob a 60 tisíc jednotlivých registračních záznamů.

Není u databáze nějaký problém s ochranou osobních údajů?

Není, registrace obsahuje pouze údaje veřejně dostupné na internetu. Tzn. jméno, registrační číslo, licenci a číslo SI čipu. Žádné jiné informace se neevidují.

Co výsledky ve starších letech, kde není dostupná registrace?

Výsledky a registrace jsou na sobě nezávislé. Jejich propojení vzniká až v momentě, kde dané registrační číslo závodníka ve výsledcích je nalezeno v tabulce registrací pro konkrétní rok a sport. V tom momentě lze pak takový závod najít v přehledu výsledků daného závodníka. Řádky výsledků, kde je neexistující registrační číslo (cizinci, neregistrovaní, závody mimo registraci viz. výše), jsou tedy úplně totožné s těmi, kde platná registračka je. S tím rozdílem, že „nikam neodkazuje“.

Kam nejhlouběji do minulosti ses už dostal a kolik už máš závodů?

Podrobná historie (pro OB) – tzn. výsledky celostátních popř. dalších závodů – je k dispozici od roku 2003. Souvisí to s tím, že od té doby se výsledky archivovaly. Samozřejmě u jednotlivých závodů se občas objeví ještě starší data, takže např. ranking (databáze pracuje i s výsledky žebříčků) je od roku 1999 a Honza Žemlík mě požádal o nahrání kompletní historie PMZ (Pohár města Zlína), kde je nejstarší závod trojčlenných hlídek z roku 1950. Co se týká počtu závodů, tak první testovací verze měla cca 250 historických výsledků stažených robotem z internetu (formát OB2000), od třetí verze si mohou uživatelé nahrávat výsledky sami – tzn. dnes už další desítky historických závodů – a já sám připravuji v době rozhovoru nahrání onoho dostupného archivu od roku 2003, což jsou další stovky závodů. Celkově tedy odhaduji, že bude databáze mít mezi 500 a 1000 historických závodů. Plus samozřejmě od roku 2011 vše nové. V OB se snažíme tuto povinnost dostat do svazových a oblastních dokumentů roku 2011, LOB závodu je pár, takže tam není problém, a MTBO projevilo zájem v roce 2011 své závody nahrávat taktéž. Celkem to tedy dělá zhruba 200-300 závodů ročně všech úrovní.

Pro jaké závody je databáze určena? Jen pro oficiálni svazové, nebo si můžu nahrát i vlastní výsledky?

Všem závodům v orientačních sportech na všech úrovních. Počínaje klubovými tréninky, soustředěními a zimními ligami, přes klasické oblastní žebříčky až po mistrovské závody. Nahrávání je rychlé a intuitivní a vyhodnocení mezičasů v přehledné formě je určitě zajímavou přidanou hodnotou i pro ony klubové nebo lokální závody a tréninky.

Co plánuješ do budoucna? Kdy hádáš, že by mohla být hotová kompletní databáze řekněme aspoň z posledních pěti let?

Zásadní pro fungující samoobslužný systém je import výsledků. Ten dnes již funguje jak pro závody, tak i pro různé žebříčky. Posledním typem závodů, který zbýva dodělat jsou štafety. Spousta dalších funkčností už je spíše kosmetických, dále různé exporty, zobrazení, přehledy apod. Jedním z důležitých bodů bude i rychlost a výkonová optimalizace systému. Objem dat není díky mezičasům zanedbatelný a již dnes je v řádech stovek megabajtů dat. Každý rok databáze naroste zhruba o 200 MB výsledků. Odhaduji, že během letošního jara budou v systému všechny dostupné závody z historie. Tím bych chtěl zároveň požádat pořadatele, kteří tam své závody z minulosti nevidí, aby je buď sami nahráli, nebo mě kontaktovali.

11.4.2011, Časopis OB

Bestíkovo orientační labužnictví

orientační běh, cestování, fotografie