Sprungmarken

Servicenavigation

Hauptnavigation

Sie sind hier:

Bereichsnavigation

Hauptinhalt

TU Dortmund entschlüsselt mit „tiefem Lernen“ komplizierte Handschriften

Wie können historische Handschriften entschlüsselt werden? Dafür hat an der TU Dortmund die Arbeitsgruppe Mustererkennung der Fakultät für Informatik jetzt einen Spezialserver in Betrieb genommen, der das Lesen von komplizierten Handschriften unterstützt. Methodisch setzt das Team dabei auf „Deep Learning“: Der Rechner selbst lernt bestimmte Schlüsselwörter kennen und findet diese dann in Texten wieder. Dieses „tiefe Lernen“ schafft der Rechner in rasanter Geschwindigkeit, etwa 100 Mal schneller als handelsübliche Hardware.

Die arabische Sprache und Schrift beherrscht der promovierte Ingenieur Gernot A. Fink nicht. Und doch hat er mehrere Beiträge zu arabischen Schriften veröffentlicht. Auch mit Dokumenten in bengalischer oder lateinischer, in der Kurrent-Schreibschrift, die lange Standard im deutschsprachigen Raum war, und sogar mit Keilschrift haben sich der Professor der Fakultät für Informatik und sein Team schon beschäftigt. Ihnen geht es nicht um die Übersetzung der Dokumente. Vielmehr können die Wissenschaftlerinnen und Wissenschaftler bestimmte Schlüsselwörter in den Texten finden. Word Spotting nennen sie das: Der Rechner erkennt ein Wort, zerlegt dafür das Wortbild in einer Vielzahl von Rechenschritten in kleinste Informationshäppchen. Dann speichert er das Wort als Datei, die er anschließend über einen Text „laufen“ lässt. Wie bei einer Google-Suche bietet der Rechner anschließend die Ergebnisse seiner Auswertung an. Wissenschaftlerinnen oder Wissenschaftler können damit eine große Zahl von Dokumenten auf bestimmte Schlüsselwörter untersuchen. Das Besondere ist, dass der Rechner mit den von ihm erkannten Wörtern auch individuelle und oft Jahrhunderte alte Handschriften relativ sicher untersucht. Dokumente mit großen Umfängen können so schnell gesichtet werden.


Große Datenmengen in kurzer Zeit aufarbeiten

Ein Beispiel sind Wetteraufzeichnungen: Handschriftliche Dokumente über Temperaturkurven, über Hochs und Tiefs aus mehreren Jahren warten auf ihre Auswertung. Statt nun in mühevoller Kleinarbeit alle Akten komplett zu lesen, „lernt“ der TU Dortmund-Rechner das Schriftbild beispielsweise von dem Begriff „Höchsttemperatur“. Anschließend zeigt er in den Dokumenten alle Stellen an, an denen dieser Begriff auftaucht. Die Forscherinnen und Forscher müssen dann nur diese Textstellen analysieren und können mit wenig Aufwand eine Temperaturkurve erstellen, die den Gradverlauf mehrerer Jahre abbildet.

 Voraussetzung für „Deep Learning“ war die Anschaffung eines hochmodernen Servers. Dieser wurde nach den Vorgaben der Arbeitsgruppe  „Mustererkennung“ zusammengestellt und ging jetzt in Betrieb. Herzstück des Rechners sind sieben Grafikkarten. „Wir profitieren von den Herstellern von Spielekonsolen“, sagt Prof. Fink. „Die haben immer leistungsfähigere Grafikkarten gebaut, um Spielszenen auf dem Bildschirm möglichst realitätsgetreu abbilden zu können.“ Diese Hochleistungs-Grafikkarten arbeiten im Server, werden allerdings nur zum Rechnen genutzt. Sie werden zum „Training“ von Neuronalen Netzen verwendet, die das Herzstück des Deep Learnings bilden. So können anschließend Muster – zum Beispiel handgeschriebene Worte – wie in einem Nervensystem verarbeitet werden. Da die Grafikkarten parallel arbeiten und Informationen gleichzeitig laufen und ausgetauscht werden, können die ausgesuchten Wörter schnell elektronisch aufgearbeitet und dann bei der Textsuche eingesetzt werden. Der Server wird damit lernfähig.


So klingt Deep Learning

Ein Geräusch, als wenn eine Düse anläuft, entsteht, wenn Prof. Fink den Server startet: Ventilatoren müssen die Grafikkarten und Bauelemente kühlen. In der Spitze fällt eine Leistung von bis zu drei Kilowatt beim Betrieb des Rechners an. Zum Vergleich: Das ist etwa die Leistung der Heizung in einem Niedrigenergiehaus. „So klingt Deep Learning“, sagt Sebastian Sudholt, der im Projekt federführend mitarbeitet. Rosenblatt hat das Team seinen Server getauft – nach dem Computer-Pionier Frank Rosenblatt, der in den 40er-Jahren in den USA versucht hatte, Rechnern das Lernen beizubringen. Er wurde von der Fachwelt verlacht, weil sich zu seiner Zeit dabei kaum Lernerfolge einstellten. Erst mit der Entwicklung der Neuronalen Netze und der höheren Rechenleistungen der Computerkomponenten wurde diese mehrfach totgesagte Technik zum Erfolg.

Mit Altphilologen der Universität Würzburg sowie Kollegen vom Lehrstuhl VII der Informatk arbeitet das Team um Prof. Fink in einem Projekt zusammen ebenso wie mit Partnern aus der Logistik-Branche. Er sieht über die Worterkennung hinaus viele Anwendungsfelder für „Deep Learning“: So könnte die Methode auch für den Bereich Ton, bei biometrischen Daten wie der Gesichtserkennung oder in der Automobilindustrie mit Blick auf das selbstfahrende Auto zum Einsatz kommen. In Barcelona läuft derzeit ein Projekt, bei dem in der Region systematisch Hochzeitsregister ausgewertet werden, um daraus Rückschlüsse auf das Sozialgefüge der Bevölkerung zu ziehen.



Social Media

Twitter Instagram RSS-Feed