Mit Sprachverarbeitung Landminen aufspüren

In Ägypten und im Iran wird intensiv an der Automatisierung der Minensuche gearbeitet.

In Pocket speichern vorlesen Druckansicht 115 Kommentare lesen
Lesezeit: 3 Min.
Von
  • Hans-Arthur Marsiske

Wie viele Menschen genau von Landminen getötet und verstümmelt wurden, weiß niemand. Auch die Zahl der vergrabenen Sprengfallen, die in über 70 Ländern noch auf weitere Opfer lauern, lässt sich nur schätzen. Es dürften über 100 Millionen sein. Mehr als ein Drittel davon verseuchen allein die Länder Ägypten und Iran. Entsprechend stark sind hier die Bestrebungen, Roboter für die Minensuche einzusetzen.

Die Automatisierung dieser gefährlichen Arbeit schützt nicht nur Menschenleben, sie hat auch eine wichtige ökonomische Bedeutung. Denn beim gegenwärtigen Stand der Technik liegen die Kosten für das Auffinden und Beseitigen einer Mine um mehr als das Hundertfache über ihren Herstellungskosten. In der aktuellen Ausgabe des Journal of Visual Communication and Image Representation beziffern Fathi E. Abd El-Samie von der ägyptischen Menoufia University sowie Umar S. Khan und Waleed Al-Nuaimy von der University of Liverpool dieses Ungleichgewicht mit 3 US-Dollar für die Herstellung einer Mine gegen 1000 Dollar für ihre Entfernung.

Um diese Differenz zu verringern, kommt es zuerst darauf an, die vergrabenen Bomben rasch und sicher zu erkennen. Beim Wettbewerb für Entminungsroboter im Rahmen des Roboterturniers RoboCup Iran Open haben die Teams für ein 6 × 6 Meter großes Feld, in dem metallhaltige Minen 15 Zentimeter tief vergraben sind, 20 Minuten Zeit. Für den Blick unter die Erde haben sich insbesondere akustisch/seismische Sensoren und Bodenradar bewährt, deren Signale üblicherweise zweidimensional aufbereitet werden. Solche bildhaften Darstellungen sind der menschlichen Wahrnehmung gut zugänglich und erleichtern daher die Fernsteuerung der Roboter.

Autonom arbeitende Suchsysteme müssen diesen Umweg jedoch nicht gehen. Für ihre Studie trainierten El-Samie, Khan und Al-Nuaimy ein neuronales Netz darauf, die Muster von Minen in den eindimensionalen Rohdaten von Radar und Akustiksensoren zu erkennen. Dafür nutzten sie die für die Sprachverarbeitung entwickelte Methode der Mel-frequency cepstral coefficients (MFCC). Das Verfahren hat sich bewährt, weil es erlaubt, das Schwingen der Stimmbänder mathematisch von ihrem Echo in der Mundhöhle zu trennen.

Auf ähnliche Weise wird ein Radarsignal durch die Reflektionen, Brechungen und Streuungen im Erdboden geformt. Die MFCC können daher auch bei der Minensuche helfen. Weil die Scandaten des Radars den Sprachsignalen ähnlicher sind als die Daten der akustischen Sensoren, erzielte das neuronale Netz hier auch höhere Erkennungsraten. Die Forscher testeten auch verschiedene Verfahren zur Merkmalsextraktion. Dabei erwies sich die Diskrete Kosinustransformation als die robusteste Methode.

El-Samie und seine Kollegen halten Erkennungsraten von 100 Prozent für möglich. Doch das ist vorerst reine Theorie. Inwieweit sich das Verfahren auf einem realen Roboter bewährt, muss sich erst noch zeigen. Die nächste Gelegenheit zum Praxistest wäre beim AUTcup 2010_blank, einem Roboterturnier, das vom 19. bis 22. Oktober in Teheran stattfindet und bei dem die Liga "Robo Deminer" auf der Liste der Wettkampfdisziplinen wieder ganz oben steht. (anw)