Hier werden die Vorüberlegungen und Schritte zur Erstellung eines digitalen Archives notiert. Zunächst als Gedächtnisstütze oder für andere Menschen mit ähnlichen vorhaben.

Archivsysteme (Stand Ende 2015)

Linksammlung zum rechtlichen Rahmen

digitale Archivaliensoftware

Semantic Mediawiki

ICARUS

Topothek

ICA-AtoM

accesstomemory

Namenforschung

Omeka

Referenzverwaltung


Digitalisierung

vom Original zur Archivalie im Onlinearchiv

Texterkennung

Welche automatisiert nutzbare Open Source Software gibt es?

tesseract

Dateiformate

Indizierung + Volltextsuche


Installation & Einrichtung Semantic Mediawiki

Vorbereitung

Mediawiki Installation

* nginx config anlegen:

server {
    server_name das-digitale-archiv.org;
    root /var/www/mediawiki;
    index index.php;

    client_body_timeout 120;
    client_max_body_size 300m;

    location / { 
        try_files $uri $uri/ @rewrite;
    }   

    location @rewrite {
        rewrite ^/(.*)$ /index.php?title=$1&$args;
    }   

    location ^~ /maintenance/ {
        return 403;
    }   

    location ~ \.php$ {
        include fastcgi_params;
        fastcgi_pass unix:/var/run/php5-fpm.sock;
        fastcgi_param  SCRIPT_FILENAME  $document_root$fastcgi_script_name;
        try_files $uri @rewrite;
    }   

    location ~* \.(js|css|png|jpg|jpeg|gif|ico)$ {
        try_files $uri /index.php;
        expires max;
        log_not_found off;
    }   

    location = /_.gif {
        expires max;
        empty_gif;
    }   

    location ^~ /cache/ {
        deny all;
    }   

    location /dumps {
        root /var/www/mediawiki/local;
        autoindex on; 
    }   
}

SMW Installation

Erweiterungen, Nacharbeiten, Optimierungen

Extensions

Funktionale Erweiterungen werden bei Mediawiki als 'extension' installiert. Das bereits installierte Semantic Mediawiki ist so eine Erweiterung für Mediawikis.

Skins

Das Aussehen des Mediawikis lässt sich mittels 'skins' verändern.

optionale Mediawiki Anpassungen

Mediawiki Fehlersuche

cd /var/www/mediawiki/maintenance
php5 clearInterwikiCache.php
php5 rebuildLocalisationCache.php --force

Unable to move the new CDB file into place.

Ausgabe steuern

cd /var/www/mediawiki/maintenance
php5 refreshLinks.php

elasticsearch als Suchmaschine nutzen

Elasticsearch

Elastica

CirrusSearch

Fehlersuche Elasticsearch


Datentransfer von Zotero zu SMW

Zotero Export

SMW Import

Pywikibot installieren

Pywikibot nutzen

Für Pywikibot gibt es ein Fülle an Scripte für spezielle Anwendungsfälle. Darin zunächst stöbern kann später vlt. eigene Programierarbeit sparen helfen zumindest gibt es einen guten Überblick in die API. Die Scripte liegen im pywikibot Verzeichnis unter scripts

weitere Doku zu Pywikibot

Pywikibot beschleunigen

Der Bot geht recht sparsam mit den Ressourcen des Wikiservers um. Zum Testen und für große Importe sind die Wartezeiten zwischen den Seitenaufrufen unnötig und lassen sich in der Datei user-config.py durch folgende Zeile minimieren:

minthrottle = 0 
maxlag = 0

DigitaleArchive (zuletzt geändert am 2018-03-09 11:12:06 durch anonym)


Creative Commons Lizenzvertrag
This page is licensed under a Creative Commons Attribution-ShareAlike 2.5 License.