Tendencias21
Un sistema de visión por ordenador imita la percepción humana en 3-D

Un sistema de visión por ordenador imita la percepción humana en 3-D

Un equipo de investigadores de la Universidad de Purdue ha desarrollado dos nuevas técnicas de visión por ordenador que emulan la manera en que los humanos percibimos las formas tridimensionales de inmediato, reconociendo objetos sin importar lo torcidos o doblados que estén. El avance podría ayudar a las máquinas a ver como las personas. Por Elena Higueras.

Un sistema de visión por ordenador imita la percepción humana en 3-D

Científicos de la Universidad de Purdue, en Estados Unidos, en colaboración con el University College de Londres, han creado un sistema de visión por ordenador que imita a la percepción humana de las figuras en tres dimensiones, publica la Universidad de Purdue en un comunicado.

Las técnicas, llamadas mapeo de calor y distribución de calor, aplican métodos matemáticos para permitir que las máquinas perciban objetos en tres dimensiones, algo que hasta ahora no había sido demasiado fácil para los ordenadores.

Según reconoce Karthik Ramani, profesor de Ingeniería Mecánica de la Universidad de Purdue y autor principal de la investigación: “Los seres humanos pueden percibir formas en 3-D, pero eso no es tan sencillo para un ordenador. El ser humano puede dividir fácilmente un objeto, como una mano, en sus segmentos – la palma y los cinco dedos -, sin embargo, esta división resulta una operación muy difícil para las computadoras”.

Desde Fourier hasta nuestros días

Ambas técnicas, basadas en la física básica y en las ecuaciones matemáticas, tienen que ver con la forma en que el calor se difunde a lo largo de superficies.

«Albert Einstein hizo contribuciones al conocimiento de esta difusión, y en el siglo XVIII el físico Jean Baptiste Joseph Fourier desarrolló la ley de Fourier, utilizada para obtener la ecuación del calor. Nosotros nos sostenemos sobre los hombros de gigantes de la creación de algoritmos para estos nuevos enfoques, utilizando la ecuación del calor», afirma Ramani.

El investigador explica, además, la tesis básica de su idea: “Del mismo modo que el calor se difunde sobre una superficie a la que acompaña, capturando los contornos precisos de una forma, nuestro sistema se aprovecha de esta «inteligencia del calor» y simula el calor que fluye de un punto a otro, consiguiendo caracterizar la forma de un objeto a lo largo del proceso”.

Sin información previa

Una de las principales limitaciones de los métodos existentes es que requieren información previa acerca de una forma, para poder analizarla. Ramani ilustra esta condición con el ejemplo siguiente: «Con el fin de hacer una segmentación, usted tiene que avisar antes a su ordenador del número de segmentos que tiene el objeto. Hay que decirle que está esperando, por ejemplo, 10 ó 12 segmentos”.

Frente a estos sistemas convencionales, los nuevos métodos imitan la capacidad humana para percibir correctamente los objetos, ya que no requieren una idea preconcebida de estos segmentos.

Un sistema de visión por ordenador imita la percepción humana en 3-D

«Estamos tratando de acercarnos lo más posible a la forma de segmentación humana. Un área de moda ahora son las máquinas de aprendizaje sin supervisión. Esto significa que una máquina, como un robot, puede percibir y aprender sin tener ninguna formación previa. Somos capaces de estimar la segmentación en lugar de dar un determinado número de segmentos”, apunta el investigador.

Las aplicaciones potenciales de estos nuevos métodos son muchas, como un motor de búsqueda en 3-D para encontrar piezas mecánicas (por ejemplo, componentes de automoción) en una base de datos; visión y navegación robótica; imágenes médicas en 3-D, aviones militares, juegos multimedia, creación y manipulación de personajes animados en la producción de cine o en la ayuda a cámaras 3-D a comprender los gestos humanos para mejorar los juegos interactivos, entre otras.

Todas ellas son solo una pequeña muestra de las inmensas posibilidades que ofrecen estas nuevas técnicas desarrolladas por la Universidad de Purdue y que contribuirán al progreso de las áreas de ciencias e ingeniería relacionadas con el reconocimiento de patrones, el aprendizaje automático y la visión por ordenador.

Mapas de calor

La primera de las técnicas de la investigación se llama “mapeo de calor”. Ésta comienza por romper un objeto en una malla de triángulos, la forma más simple que puede caracterizar las superficies, y luego calcula el flujo de calor sobre estos triángulos. El método simula el flujo de calor con principios matemáticos bien establecidos.

Estos “mapas de calor” permiten que un ordenador pueda reconocer un objeto, como una mano o una nariz, sin importar si los dedos se doblan o la nariz está deformada. Es decir, es capaz de ignorar el «ruido» introducido por un escaneo láser imperfecto u otros datos erróneos.

«No importa cómo se mueven los dedos o cómo se deforma la palma de la mano, porque cualquier persona puede ver que es una mano, pero para un equipo decir que eso es todavía una mano es complicado. Se necesita un marco, un algoritmo consistente y robusto que funcione independientemente de si se deforma la nariz o si se trata de tu nariz o de la mía”, afirma Ramani.

El método simula con precisión cómo el calor fluye por la superficie del objeto al tiempo que revela su estructura y distingue los puntos únicos necesarios para realizar la segmentación, mediante el cálculo de lo que denominan en la investigación “la firma de calor medio». Conocer esta firma permite al ordenador determinar el centro de cada segmento, asignar un «peso» a los segmentos específicos, y definir la forma general del objeto.

«Ser capaces de asignar un peso a los segmentos es fundamental porque algunos puntos son más importantes que otros en términos de comprensión de una forma. La punta de la nariz es más importante que otros de sus puntos, por ejemplo, para percibir correctamente su forma, del mismo modo que las puntas de los dedos son más importantes que muchos otros puntos de la mano para su percepción», señala el profesor.

Distribución de calor

En la segunda de las técnicas, la distribución de la temperatura, el flujo de calor se utiliza para determinar un histograma o una firma de todo el objeto. «Un histograma es un mapa de dos dimensiones de una figura de tres dimensiones. Por lo tanto, no importa la forma en que un perro se dobla o se tuerce, ya que proporciona la misma firma» explica Ramani.

En la técnica de distribución de la temperatura también se utiliza una malla de triángulos para percibir formas en 3-D. Ambas técnicas, que podrían combinarse en el mismo sistema, requieren una potencia de ordenador muy modesta para reconocer formas rápidamente, según apuntan los investigadores en el comunicado.

Los científicos probaron su método en ciertas formas complejas, incluyendo las manos, la forma humana y la de un centauro, una criatura mítica mitad hombre, mitad caballo. Los resultados se detallan en dos documentos presentados durante la conferencia IEEE de Reconocimiento de Patrones y Visión por Ordenador que se celebra estos días en la ciudad de Colorado Springs.

El documento es obra de Ramani, los estudiantes de doctorado de la Universidad de Purdue Yi Fang y Mengtian Sun, y el profesor de matemáticas del University College de Londres Minhyong Kim. El trabajo ha sido financiado en parte por la Fundación Nacional de la Ciencia de EEUU y está a punto de salir al mercado una patente sobre esta tecnología.

RedacciónT21

Hacer un comentario

RSS Lo último de Tendencias21

  • El telescopio Webb estudiará al asteroide 2024 YR4, que podría impactar con la Tierra en 2032 12 febrero, 2025
    El asteroide 2024 YR4 tiene una probabilidad de aproximadamente el 2,3% de impactar con la Tierra en 2032: las posibilidades se han duplicado luego de los últimos análisis, motivando que el equipo a cargo del Telescopio Espacial James Webb (JWST) se comprometa a estudiar el tamaño real de la roca espacial y otras de sus […]
    Redacción T21
  • El futuro digital de la muerte: ¿inmortalidad virtual o espejismo tecnológico? 12 febrero, 2025
    La digitalización está transformando nuestra relación con la muerte y el duelo: el difunto se ha vuelto cada vez más "invisible". En su lugar, cobran protagonismo las representaciones digitales del fallecido en las redes sociales, así como proliferan los cementerios virtuales.
    Redacción T21
  • ¿Puede la gripe aviar desatar una nueva pandemia? 11 febrero, 2025
    Una nueva cepa de gripe aviar en Nevada, Estados Unidos, muestra una mutación preocupante: se trata de una variedad que intriga a los científicos, porque se relaciona directamente con la influenza aviar altamente patógena (IAAP) en humanos, que provocó la primera y única muerte humana relacionada con la gripe aviar en América del Norte hasta […]
    Pablo Javier Piacente / T21
  • Descubren cómo el cerebro supera el miedo 11 febrero, 2025
    Un equipo de investigadores ha identificado cómo el cerebro supera al miedo en roedores: han logrado describir el mecanismo cerebral que se activa en los ratones para superar el miedo instintivo. De confirmarse en humanos, el hallazgo podría ayudar a la investigación de tratamientos y soluciones para personas con patologías como el trastorno de estrés […]
    Pablo Javier Piacente / T21
  • El núcleo de la Tierra podría estar a punto de estallar: habría volcanes a 5.000 kilómetros de profundidad 11 febrero, 2025
    Un estudio revela que el núcleo interno de la Tierra está cambiando de forma misteriosa y aún incierta: el núcleo interno giratorio no solamente modifica su velocidad de rotación, sino que también parece cambiar de forma, con variaciones que se manifiestan a través de las ondas acústicas que se propagan por el centro de la […]
    Redacción T21
  • Una exposición muestra el camino a la extinción de millones de seres vivos marinos conscientes 11 febrero, 2025
    Ecos del océano, una exposición que une ciencia, tecnología, arte y creatividad, muestra los ecos que surgen en la mente de una ballena cuando tropieza con la contaminación sonora generada por la actividad humana. Una experiencia inmersiva invita a preservar el equilibrio entre el ser humano, la naturaleza y el resto de especies que conviven en […]
    Alejandro Sacristán (enviado especial).
  • La IA ya supera a los humanos en el fraude digital 10 febrero, 2025
    Un nuevo estudio destaca la creciente sofisticación de los grandes modelos de lenguaje (LLM), la estructura detrás de los chatbots de IA más conocidos, para crear estrategias de fraude cibernético. Estos modelos pueden diseñar campañas de phishing hiperpersonalizadas y persuasivas, a una fracción del coste y el tiempo que requieren los métodos tradicionales desarrollados por […]
    Pablo Javier Piacente / T21
  • Alerta: Creciente riesgo de que restos de cohetes afecten zonas de intenso tráfico aéreo 10 febrero, 2025
    Un nuevo estudio publicado en la revista Scientific Reports advierte sobre el aumento del peligro que representa la basura espacial para la aviación comercial. La investigación, realizada por científicos de la Universidad de Columbia Británica, en Canadá, concluye que existe una probabilidad anual del 26% de que los desechos de cohetes espaciales reingresen a la […]
    Pablo Javier Piacente / T21
  • Los cantos de las ballenas son similares al lenguaje humano: puedes comprobarlo aquí 10 febrero, 2025
    Los científicos han descubierto la misma estructura o conjunto de patrones rítmicos que son un sello distintivo del lenguaje humano en el canto de las ballenas jorobadas: los hallazgos muestran que incluso especies tan disímiles evolutivamente pueden compartir sistemas de comunicación que se transmiten culturalmente de generación en generación.
    Redacción T21
  • El Rapto del Mundo: la democracia naufraga en la era del ultraliberalismo, pero no ha sido conquistada 10 febrero, 2025
    Lo que está pasando con la democracia puede compararse con el mito del rapto de Europa: seducida con engaños, se ha adentrado en un proceso de erosión de las instituciones, polarización social y desregulación económica que la aleja de su inspiración humanista. ¿Estamos presenciando el nacimiento de un nuevo orden político global?
    EDUARDO MARTÍNEZ DE LA FE/T21