TextSearch - systém pro správu skenovaných dokumentů

K čemu slouží systém TextSearch

Na začátku je originální dokument v jeho materiální podobě

Pro archivaci systémů dokumentů v elektronické podobě je potřebné používat systémy, které dokáží pracovat s naskenovanými stránkami (rastry - bitmapami) společně s textovými informacemi. Uváděný systém TextSearch dokáže provádět účinnou správu těchto dokumentů, jejich ukládání, třídění, vyhledávání a v neposlední řadě i publikaci na Internetu nebo prostřednictvím datových médií - jeho součástí je i program vTextSearch pro umístění na kompaktním disku společně s distribuovanými daty.

A závěrem je například jeho publikace na CD nebo jiném nosiči

 

Jaká je koncepce systému?

TextSearch je hybridní systém, kde jsou odděleny popisné informace k datům (shromážděny v databázi) a vlastní data - textové soubory a bitmapy (rastry). Databázový systém je vystaven nad tabulkami ve formátu Paradox. Tyto tabulky jsou uloženy v jednom adresáři.

Datové entity tvoří přirozené celky - Systémy souborů (File systems). Jedná se o skupinu textových souborů a bitmap (v současnosti jsou podporovány formáty JPGE, GIF, TIFF a BMP), které jsou uloženy v jednom adresáři (pouze textové soubory lze v případě potřeby vyjímečně uložit i jinam). Běžně systém souborů představuje jednu knihu - její digitální representaci. Jednotlivé bitmapy tak jsou jednotlivými naskenovanými stranami této knihy. Označení bitmap by se mělo volit tak, aby po jejich abecedním seřazení byly stránky uspořádány v přirozeném pořadí (tak, jak je tomu ve skutečné knize). Popis systému souborů odpovídá jedné bibliografické citaci. Mimo běžného popisu lze systém souborů opatřit klíčovými slovy (keywords; vždy jedno slovo) a/nebo frázemi (phrases; standardní slovní spojení).

Systémy souborů jsou seřazovány do celků - Skupin záznamů (Sets). Záleží pouze na volbě uživatele jaké skupiny záznamů vytvoří. V případě potřeby lze systém souborů přeřadit do jiné skupiny záznamů.

Nastavení programu TextSearch - konfi-gurace adresářů pro uložení databázových tabu-lek a dalších pracovních adresářů se provádí v jednoduchém dialogovém okně. Díky tomuto nastavení může uživatel založit i více databází a mít tak při jedné insta-laci programu k dispozici více systémů, které se liší pouze místem, odkud je program spouštěn - pouze soubor TextSearch.ini s uloženými parametry musí být zapsán vždy v jiném adresáři.

Program je opatřen kontextově orientovanou nápovědou dostupnou ze všech jeho částí pomocí menu nebo funkční klávesy F1.

Data (respektive "metadata") uložená v systému lze exportovat do formátu XML, který stejně jako automatická tvorba stránek HTML může sloužit k jednoduchému publikování dat v prostředí Internetu.
Jako příklad jednoduchého exportu sady stran pro uveřejnění na internetu je možno uvést digitalizovanou historickou knihu grafiky z poloviny 19. století.

Poskytované služby

Mimo vlastního systému je též možno objednat dodávku některých dalších služeb pro podporu systému TextSearch. Jedná se především o následující možnosti

Jak jednoduše publikovat skenované dokumenty?

vTextSearch (TextSearch view) - nástroj pro distribuci dat

Příklad hlavního okna prohlížeče vTextSearch.

 

Pořízená data uchovávaná v systému TextSearch je možné umístit na výměnná media (například CD) společně s jednoduchým nástrojem na prohlížení. V tomto případě umístíme do hlavního adresáře program vTextSearch.exe a textový soubor contents.rtf, který popisuje, jaká data jsou na disku umístěna - může se jednat o seznam knih (potom na disku je více adresářů, každý odpovídající jednomu systému souborů) nebo jiných dokumentů. Tento seznam může být doplněn libovolným textem a může obsahovat i odkazy na konkrétní stránky (rastry) těchto dokumentů).

 

Přístup k programu na každém disku je chráněn pomocí identifikačního čísla unikátního pro daný disk tak, aby nemohl být kopírován a užit pro jiný účel.

 

Základem je textové okno, které obsahuje popis obsažených dokumentů, jejich obsah. Zde jsou uvedeny příkazy pro otevření jednotlivých datových celků - "knih" a odkazy na jednotlivé stránky - rastrové soubory. Tyto příkazy tvoří takzvaný aktivní text, t.j. příkaz uzavřený v hranatých závorkách a začínající slovy open (nový systém souborů), scan (zobrazení daného rastru) nebo text (otevření jiného textového souboru).

Jednotlivé strany - rastry jsou zobrazovány v běžném okně systému TextSearch včetně obvyklého panelu nástrojů. Uživatel má tak možnost například různého zvětšení strany, jejího otočení, tisku celého dokumentu nebo vybraných stran, tvorby výřezu z rastru a jeho umístění do schránky nebo uložení jako soubor BMP.

 

Bližší informace jsou uvedeny v návodu k programu.


 

Zpět na hlavní stránku IDS

© Karel Matějka - IDS (2003)