Glossar
Index
(lateinisch für Verzeichnis, Register) Sämtliche, im Rahmen der Volltexterkennung aus den Dokumenten extrahierten Begriffe werden in einen sogenannten Index bzw. in einer Indexdatenbank aufgenommen. Der Anwender kann über diese im Index aufgenommenen Begriffe nach Dokumenten recherchieren (Volltextsuche). Die Volltextindexierung erfolgt automatisch. Sogenannte Stoppwortlisten verhindern, dass Wörter wie "in, aber, zu, ein, eines" in den Index aufgenommen werden, da diese die Volltextdatenbank unnötig vergrößern würden.
ArcFlow führt von allen archivierten Dokumenten eine vollständige Texterkennung durch. Alle vorkommenden Wörter werden durch den Index-Server in den Index aufgenommen. Es ist so eine Volltextsuche über alle archivierten Dokumente möglich. Somit ist in den meisten Fällen eine nachträgliche Beschlagwortung unnötig.
Der erkannte Text wird unabhängig vom Dokument gespeichert und kann, ohne das eigentliche Dokument zu verändern, ergänzt werden. Es können somit Textpassagen, die im Originaldokument nicht vorkommen, aufgenommen werden. Der Index für dieses Dokument wird dann entsprechend erweitert.
Indexdatenbank
Siehe Index.
Index-Server
Der Index-Server erstellt den Index. Es handelt sich dabei um ein separates Programm, dass auf einem Server gestartet werden muss. Der Index-Server ermittelt neue oder geänderte Archive und aktualisiert den Index innerhalb weniger Sekunden.
Indizierung
Verfahren zur Erstellung möglichst eindeutiger Zugriffsinformationen für das schnelle Wiederfinden von gespeicherten Dokumenten. Die Indizierung kann dabei sowohl automatisch durch das System (automatische Volltexterkennung) als auch interaktiv durch den Benutzer (manuelle Beschlagwortung) erfolgen.
|