Los Autoestereogramas como Alternativa para la Visualización de Información: Impacto de un Algoritmo en la Escena Codificada

Los Autoestereogramas como Alternativa para la Visualización de Información: Impacto de un Algoritmo en la Escena Codificada

\IEEEauthorblockNJonnathan Ramos Chaux\IEEEauthorrefmark1\IEEEauthorrefmark3, Lola Xiomara Bautista Rozo\IEEEauthorrefmark1\IEEEauthorrefmark4 y Arturo Plata Gómez\IEEEauthorrefmark2\IEEEauthorrefmark4 \IEEEauthorblockA\IEEEauthorrefmark1 Escuela de Ingeniería de Sistemas, Universidad Industrial de Santander
\IEEEauthorrefmark2Escuela de Física, Universidad Industrial de Santander
Bucaramanga, Colombia
e-mail: \IEEEauthorrefmark3 jonnathan.ramos@correo.uis.edu.co, \IEEEauthorrefmark4 \(\{\) lxbautis, aplata \(\}\) @uis.edu.co

La capacidad de percibir visualmente tres dimensiones constituye una ventaja importante para la adaptación al entorno; consciente de esto la humanidad ha desarrollado diferentes técnicas y tecnologías que permiten replicar este fenómeno a partir de imágenes sintéticas. Los autoestereogramas son un método para la presentación de imágenes con profundidad estereoscópica que cuenta con características que hacen posible su implementación en ámbitos en los cuales otras técnicas no pueden ser aplicadas. La construcción de estas imágenes se logra gracias a rutinas computacionales entre las que destaca la propuesta por Thimbleby et al. En este artículo la rutina fue evaluada ya que, aunque su efectividad es ampliamente conocida, resulta necesario contar con cada vez más evidencias del impacto que tiene sobre la escena codificada para así identificar aspectos susceptibles de mejora. Para la evaluación se propuso como metodología la comparación del mapa de profundidad original y el obtenido como resultado de un proceso de reconstrucción de la escena a partir de un autoestereograma construido con el algoritmo en cuestión. Se observó, entre otras cosas, que la rutina introduce una deformación en el eje \(z\).

{IEEEkeywords}

Autoestereograma, Estereopsis, Reconstrucción, Single Image Random Dot Stereogram (SIRDS), Visión en tres dimensiones.

Introducción

\label{sec:Intro}

El sistema visual es uno de los componentes biológicos que ha resultado determinante en el proceso de adaptación y supervivencia de las especies incluido el ser humano. Uno de los aspectos asociado a este sistema de percepción que ha motivado una importante cantidad de estudios y desarrollo tecnológico es la percepción en tres dimensiones del entorno. Ha sido demostrado que la visión tridimensional constituye una ventaja en el desempeño de actividades como la identificación y manipulación de objetos virtuales y en el juzgamiento de distancias(McIntire 2012).
La investigación en el área ha permitido la comprensión y entendimiento de los mecanismos que desencadenan la percepción de volumen y tridimensionalidad a partir de la observación de dos imágenes de la misma escena capturadas desde posiciones ligeramente diferentes (también llamada estereopsis), lo que ha llevado al desarrollo de técnicas y tecnologías que buscan que el observador experimente la sensación de tridimensionalidad a partir de imágenes sintéticas. Son ampliamente conocidas y empleadas técnicas como los anaglifos, la polarización pasiva (común en las salas de cines) y el multiplexado temporal (habitual en sistemas de televisión e inmersivos); todos estos métodos obligan al uso de lentes, acordes con la técnica implementada, para lograr la percepción de volumen y se agupan bajo la denominación de técnicas estereoscópicas(Urey 2011). En contraste con las métodos mencionados, las técnicas autoestereoscópicas no requieren que el usuario utilice anteojos para percibir la profundidad de la escena observada aunque algunas demandan dispositivos tecnológicos con características particulares para funcionar correctamente (Urey 2011).
En términos de implementación, exceptuando los anaglifos, todas las técnicas mencionadas no son aplicables en medios impresos y sus las demandas inherentes a cada método las hacen inviables en entornos sociales con poder adquisitivo limitado haciéndose necesario explorar formas alternativas para la presentación de información con contenido estereoscópico.

Los autoestereogramas, también llamados estereogramas de una imagen, son una técnica autoestereoscópica de bajo costo de producción que en la actualidad es vista como un elemento lúdico (Tsuda 2008)(Magic Eye Inc. 2004) aunque también se ha explorado su aplicación para examinar la agudeza estereoscópica del sistema visual (Yu 1999, Wilmer 2008), como herramienta para la visualización de información científica (Katrusiak 2001)(Hallett 1997) y para la encriptación de mensajes (Yu 1999)(Tsuda 2008).

Para la construcción de autoestereogramas existen diferentes rutinas computacionales, sin embargo, la rutina propuesta por Thimbleby et al. (Thimbleby 1994) es referente para la costrucción de nuevas rutinas y para contrastar su rendimiento (Lau 2001, Yu 1997, Petz 2003, Son 2002). Es de interes evaluar la calidad de la imagen reconstruida a partir de un autoestereograma codificado con la rutina mencionada porque los estudios hallados se centran en la capacidad del sistema visual para resolver los estereogramas de una imagen dejando de lado el impacto que el proceso de codificación tiene en la escena usada para su construcción. Por tanto, este es el eje central del artículo. El escrito se articula de la siguiente manera, en la sección \ref{sec:SIRDS} se presentan los referentes teóricos de los autoestereogramas y el método de Thimbleby para la construcción de autoestereogramas; en la sección \ref{sec:eval} se presenta la metodología de evaluación utilizada y los resultados obtenidos y en la sección final se presentan las conclusiones.

Autoestereogramas

\label{sec:SIRDS}

Los autoestereogramas, también llamados estereogramas de una imagen (Single Image Stereogram, SIS), son una técnica para la presentación de imágenes con información de profundidad estereoscópica (Thimbleby 1994) que se cimienta conceptualmente en los estereogramas de puntos aleatorios (Random Dot Setereograms, RDS) y el principio del wallpaper (Ninio 2007).
Un par estereoscópico, llamado originalmente estereograma, es un par de imágenes de la misma escena captadas desde dos posiciones ligeramente diferentes que simula el proceso análogo ejecutado por un par de ojos funcionales. La diferencia de perspectiva, producto de la separación horizontal de los ojos, ocasiona que un conjunto de puntos ocupe una posición ligeramente diferente en el par de imágenes; esta diferencia en la posición de puntos equivalentes, que codifican un mismo punto en la escena original, es un desplazamiento horizontal que recibe el nombre de disparidad retiniana, una señal de profundidad fisiológica. El proceso de construcción de un SIS codifica la disparidad retiniana siguiendo un patrón que a cada par de puntos correlacionado le asigna el mismo color, obteniéndose de esta forma una máscara que elimina toda señal de profundidad diferente a la disparidad binocular a través de un patrón de puntos ininteligible monocularmente que combina el par estereosópico en una sola imagen (Ninio 2007).

El procedimiento que construye el autoestereograma se basa en los principios geométricos de la visión estereoscópica y puede seguir dos enfoques diferenciados, la visión paralela y la visión cruzada que se presentan en la Fig LABEL:Esquemas_de_vision. En el primero la escena codificada se supone ubicada tras el SIS, de este modo la correlación de los puntos es determinada por el cruzamiento de los ejes ópticos en planos posteriores al del autoestereograma; en contraposición, el esquema de visión cruzada supone la escena delante del SIS definiéndose así el patrón de puntos como resultado del cruzamiento de los ojos en los planos anteriores al del autoestereograma.

Para percibir en profundidad la escena codificada en un estereograma de una imagen es necesario desacoplar los procesos visuales de acomodación (responsable del enfoque de la imagen en la retina) y convergencia (encargada del cruzamiento de los ejes ópticos). De este modo, para observar la escena de un autoestereograma construido bajo el esquema de visión paralela es necesario enfocar la visión en el SIS y converger los ojos en planos posterior al de la imagen; por otra parte, para interpretar la profundidad codificada en un autoestereograma que sigue los lineamientos de la visión cruzada es necesario converger los ejes ópticos en planos delante del SIS mientras se enfoca el autoestereograma. Si un estereograma de una imagen se observa con el esquema contrario al de su construcción la información de profundidad es interpretada de manera invertida, es decir los planos más alejados en la escena original son percibidos como los más cercanos al observador y viceversa. Instrucciones para decodificar la escena de un autoestereograma de acuerdo con los lineamientos paralelo y de visión cruzada pueden hallarse en (Thimbleby 1994) y (Tyler 1990) respectivamente.

Construcción de autoestereogramas

El proceso de construcción de un autoestereograma toma como entrada la escena codificada en un mapa de profundidad es decir, una imagen que contiene la información de la distancia a la cual se encuentran los objetos que componen el modelo o escena respecto de un punto de observación, la cual se codifica a través de la intensidad de la luz reflejada desde cada punto de los objetos que lo componen. Para construir autoestereogramas suele optarse por el enfoque de visión paralela esquematizado en la Fig. LABEL:Esquemas_de_visiona debido a que esta requiere menos esfuerzo del sistema visual del observador para sostener la percepción de profundidad de la escena.
Siguiendo los lineamientos geométricos de la visión estereoscópica, la construcción de autoestereogramas codifica cada punto del mapa de profundidad a través de la distancia horizontal o separación de un par de puntos con el mismo color en el autoestereograma que está relacionada con la profundidad a la cual se encuentra el punto codificado respecto de la ubicación del observador.
Considérese la Fig LABEL:Vision_binocular que esquematiza la vista superior de la observación de una escena \(S(x,y)\), con \(x=1,2,...,m\) y \(y=1,2,...,n\), a través del plano transparente \(I\).
El plano \(F\), paralelo a los planos \(O\) e \(I\), representa el infinito óptico de la escena, es decir los puntos más alejados del observador señalados en el mapa de profundidad con el color negro. Los objetos de la escena están codificados por todos los puntos \(S(x,y)>0\).
Un observador se ubica en el plano \(O\) separado por una distancia \(D_{S}\) y \(D_{R}\) de los planos \(F\) e \(I\) respectivamente y sus ojos se ubican en \(L\) y \(R\) separados por la distancia interocular \(E\). Sean los puntos \(C=(x_{c},y_{c})\), con \(1\leq x_{c}\leq m\) y \(1\leq y_{c}\leq n\) y una intensidad de luz \(S(x_{c},y_{c})=z_{c}\), y \(A=(x_{a},y_{c})\) y \(B=(x_{b},y_{c})\) los dos últimos en el plano \(I\). Por semejanza entre los triángulos \(\bigtriangleup LCR\) y \(\bigtriangleup ACB\) la distancia \(\overline{AB}\), llamada separación estéreo y notada como \(\sigma(z_{c})\), será

\begin{equation} \sigma(z_{c})=\overline{AB}=E-\frac{E\cdot D_{R}}{D_{S}-z_{c}}\\ \end{equation}

Resultando entonces que los puntos \(A\) y \(B\) en el plano se relacionan a través de \(\sigma(z_{c})\) de acuerdo con

\begin{equation} A=(x_{a},y_{c}),B=(x_{a}+\sigma(z_{c}),y_{c})\\ \end{equation}

y juntos codifican el punto \(C\) del mapa de pronfundidad en el autoestereograma construido en el plano \(I\)
Una vez determinadas las relaciones que codifican todos los puntos \(C\) del mapa de profundidad en el plano \(I\), a todos los puntos \(B\) en \(I\) les es asignado por la función \(f\) un elemento de \(W\), el conjunto que contiene todos los posibles valores que pueden tomar los puntos del autoestereograma, de la siguiente forma: donde la función \(g(B)\) asigna a \(B\) un elemento de \(W\) de acuerdo a un patrón definido o de manera aleatoria.
La forma en la cual se asignan los elementos a los puntos del autoestereograma y los elementos de \(W\) definen la tipología que se presenta en el cuadro \ref{tablaTipos}.

\label{tablaTipos}Tipos de Autoestereogramas
Tipo Autoestereograma Elementos de \(W\) Asignación
de puntos aleatorios (SIRDS) Puntos Aleatoria
de textura (SITS) Puntos