next up previous
Nächste Seite: Objekterkennung Aufwärts: Architektur und Bildanalyse Vorherige Seite: Segmentierung

Regionenkodierung

Nun folgt die Schicht, die hier ``Regionenkodierung'' genannt wird. Sie ist etwas dünner als die von Jähne mit ``Formanalyse'' bezeichnete Schicht. In dieser Arbeit spielt die Form selbst ja nur eine untergeordnete Rolle. Die Objekte sollen laut Aufgabenstellung anhand ihrer Farbe unterscheidbar sein. Trotzdem kann in dieser Ebene auch eine zusätzliche Untersuchung der Form der Regionen erfolgen, deren Daten dann für die spätere Klassifizierung der Objekte zur Verfügung stehen. Außerdem wird in dieser Schicht weiterhin nicht, ganz im Gegensatz zu Jähnes Schicht, die Korrespondenz zwischen Regionen und Objekten untersucht. Vielmehr gilt es, genügend Daten über die Regionen selbst bereitzustellen, um in der nächsten Schicht von ihnen auf die wahrgenommenen Objekte und deren Position und Ausrichtung zu schließen.

Obwohl die Form der Regionen also nur eine untergeordnete Rolle spielt, ist diese Schicht aber trotzdem vor der Klassifizierung notwendig. Im Regionenbild ist jedes Pixel explizit einer Region zugeordnet. Bis hierher wurde die Datenmenge also noch nicht reduziert. Allein das Finden einer bestimmten Region ist derzeit nur durch unvertretbar aufwendiges Suchen möglich. Bevor nun aber eine komplizierte Objektklassifikation stattfinden kann, bei der jede Region unter Umständen mehrmals ``angesehen'' werden muß, gilt es eine kompaktere und effizientere Repräsentation der Daten zu finden. Zumindest dieser Vorgang soll in dieser Schicht vollzogen werden. Nebenbei können oft kostengünstig allgemeine Formbeschreibungen extrahiert werden.

Das Ergebnis dieser Formanalyse und Kodierung soll eine Auflistung von Regionen $\vec{r}$ sein. Im Gegensatz zum Regionenbild sind die einzelnen Regionen dann anhand ihrer Position in der Liste direkt zugänglich. Jede Region soll mindestens folgende Daten bereithalten:

  1. Position $\vec{p}$ ihres geometrischen Zentrums in Bildkoordinaten
  2. Nummer bzw. Klasse $c$, die beim Identifizieren der Regionen vergeben wurde
  3. Fläche $a$
Welche Daten darüber hinaus angeboten werden, ist implementierungsabhängig.

Mit der geforderten Regionenbeschreibung

\begin{displaymath}
\vec{r}=(c, \vec{p}, a)
\end{displaymath} (8)

hat diese Schicht $k$ also folgende Aufgabe:
  $\textstyle k:D \mapsto R^l$    
  $\textstyle k:D_{m,n} \mapsto (\vec{r}_0, \vec{r}_1, ..., \vec{r}_l)$   (9)

wobei $R$ die Menge aller Regionenbeschreibungen sei.


next up previous
Nächste Seite: Objekterkennung Aufwärts: Architektur und Bildanalyse Vorherige Seite: Segmentierung

2001-12-05