Účel programu: správa dokumentů a literární databáze
Program TextSearch představuje hybridní systém, kde jsou odděleny popisné informace k datům (shromážděny v databázi) a vlastní data - většinou textové soubory a bitmapy (nazývané též rastry). Databázový systém je vystaven nad tabulkami ve formátu Paradox nebo s databází MS SQL Server, takže data mohou být dostupná prostřednictvím Internetu. Datové entity tvoří přirozené celky - Systémy souborů (File systems). Jedná se o skupinu textových souborů a bitmap (každá bitmapa představuje jednu stranu dokumentu), které jsou zapsány v jednom adresáři (pouze textové soubory lze v případě potřeby /výjimečně/ uložit i jinam). Běžně systém souborů představuje jednu knihu - její digitální representaci. Jednotlivé bitmapy tak jsou jednotlivými skenovanými stranami této knihy.
Označení bitmap by se mělo volit tak, aby po jejich abecedním seřazení byly stránky uspořádány v přirozeném pořadí (tak, jak je tomu ve skutečné knize). V případě potřeby je možno volit pojmenování bitmap tak, aby je bylo možné setřídit i v jiném pořadí při využití třídění souborů počínaje některým jiným (než prvým) znakem v názvu souboru. Popis systému souborů odpovídá jedné bibliografické citaci. Mimo běžného popisu lze systém souborů opatřit klíčovými slovy (keywords; vždy jedno slovo) a/nebo frázemi (phrases; standardní slovní spojení). Pomocí klíčových slov a frází lze dokumenty i vyhledávat.
Systémy souborů jsou řazeny do celků - Složek (Sets). Záleží pouze na volbě uživatele jaké složky vytvoří. V případě potřeby lze systém souborů přeřadit do jiné složky. Hlavní okno aplikace s vyplněnými daty může vypadat následovně
Se systémem TextSearch jsou instalovány i následující textové soubory, které obsahují některé další informace:
README.TXT - popis základních vlastností a funkcí systému TextSearch.
LICENSE.RTF - licenční ujednání.
Systém je určen a vyzkoušen pro operační systémy od Windows XP výše.
Program slouží pro evidenci rastrových dokumentů (například skenované materiály uložené jako množiny obrázků BMP, JPEG, TIFF, PNG aj.), PDF a dalších typů. Tyto uložené a evidované soubory lze přímo otevřít pro zobrazení, případně pro editaci. Všechny tyto soubory jsou v databázi evidovány, nikoli přímo uloženy.
Rastrové soubory lze zpracovávat programem IDSViewImages, který je součástí instalace. Tato aplikace umožňuje přiřadit popisek a/nebo databázový záznam ke každému jednotlivému rastrovému souboru. Takto lze zpracovat nejen skenované strany dokumentu, ale další typy dat (například digitální fotografie, mapové listy).
Databáze jsou založené na otevřeném formátu podporujícím SQL.
Alternativní použití databází lokálních (Paradox) a síťových (MS SQL server) podle rozsahu dat a dalších požadavků uživatele.
Import dat ve formě jednoduchého seznamu souborů, k nimž budou vytvořeny jednotlivé záznamy v databázi.
Program disponuje nástroji pro jednoduchou standardizaci řady polí při jejich zadávání: seznam autorů umožňuje upravit tak, aby jména byla uváděna v jednotné podobě, rozklíčování polí v takzvaném running title časopisů (specificky pro příslušný časopis), tedy například text „Forest Ecology and Management 572 (2024) 122319“ bude rozdělen do jednotlivých polí podle významu jednotlivých částí.
SQL dotazy pro výběr umožňují provádět nejen předdefinované dotazy, ale i další dotazy dle požadavků uživatele, často i velmi složité.
Výběr tematicky podobných záznamů, přičemž podobnost se hodnotí algoritmem vyvinutým právě pro tento účel.
Datum poslední aktualizace 1.11. 2024
Ing. Karel Matějka, CSc. - IDS
Na Komořsku 2175/2A, 143 00 Praha 4 - Komořany
telefon (+420) 603 444 768, (+420) 244 400 781
e-mail ids@infodatasys.cz , Internet www.infodatasys.cz
Copyright © Ing. Karel Matějka, CSc. - IDS (2005-2024)