next up previous
Nächste Seite: Objektgeschichte Aufwärts: Architektur und Bildanalyse Vorherige Seite: Regionenkodierung

Objekterkennung

Nun gilt es, anhand der gefundenen Regionen die Objekte zu identifizieren. In natürlichen, dreidimensionalen Umgebungen ist dies eine schwierige, wenn nicht gar die schwierigste Aufgabe. Die gefundenen Regionen müssen nicht mit tatsächlichen Objektflächen übereinstimmen. In natürlichen Umgebungen hat man mit Problemen wie Schatten, unregelmäßiger Beleuchtung, teilweiser und vollständiger Verdeckung und unterschiedlichen Entfernungen zu kämpfen. Außerdem müssen Objekte aus jedem erdenklichen Winkel erkannt werden. Kaum eine Größe, die üblicherweise zur Objektbeschreibung verwendet wird, ist bei der Zentralprojektion auf die Bildfläche konstant.

All diese Probleme stellen sich aber im hier betrachteten zweidimensionalen Fall gar nicht. Im echten zweidimensionalen Fall befinden und bewegen sich nämlich alle Objekte, in der Realität zumindest annährungsweise, in einer zur Bildebene parallelen Ebene. Beim Roboterfußball ist dies das Spielfeld. Geht man weiter davon aus, daß alle Objekte im Vergleich zum Abstand von der Linse eine vernachlässigbare Höhe haben, bleiben die Winkel und die Längeverhältnisse bestehen und eignen sich daher zur Beschreibung und Erkennung von Objektflächen.

Die gefundenen Objekte sollen klassifiziert werden. Diese Klassifizierung wird, wie eingangs erwähnt, anhand von außen eingebrachten Objekt- oder Weltmodellen vollzogen. Ausgabe dieser Schicht $e$ ist eine Liste von klassifizierten Objekten $o$:

  $\textstyle \vec{o}=(c, \vec{p}, \alpha)$   (10)
  $\textstyle o: W \times R^m \mapsto O^n$    
  $\textstyle o(\vec{w},\vec{r}_0, \vec{r}_1, ...,\vec{r}_m) = (\vec{o}_1,\vec{o}_2,
..., \vec{o}_n),n \leq m$    

wobei W die Menge aller Weltmodelle und O die Menge aller Objektbeschreibungen sei. Neben der Klasse soll zumindest auch die Positon $p$ und die Orientierung $\alpha$ angegeben werden. Da sich die im Weltmodell $w$ enthaltenen Objektbeschreibungen während der Verarbeitung einer Bildserie nicht ändern, sondern vielmehr beim Einrichten der Pipe angegeben werden, kann man auch folgende Hilfsdefinition verwenden:
\begin{displaymath}
o_w(\vec{r}_0,\vec{r}_1,...,\vec{r}_m):=O(\vec{w}, \vec{r}_0,\vec{r}_1,..,
\vec{r}_n)
\end{displaymath} (11)

wobei $O_w$ die mit $w$ ``konfigurierte'' Operation bezeichnet.

Diese Schicht vollzieht also nicht nur die Objektklassifikation nach Jähne, sondern auch das eigentliche Auffinden und ist damit größer.


next up previous
Nächste Seite: Objektgeschichte Aufwärts: Architektur und Bildanalyse Vorherige Seite: Regionenkodierung

2001-12-05