• Home / Noticias / Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
  • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador

    • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
      Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
31/03/2020

Su estudiante doctoral Juan Carlos León también participará en la conferencia.

Pablo Arbeláez, profesor asociado de Ingeniería Biomédica y su estudiante doctoral, Juan Carlos León; participarán en CVPR 2020, la mayor conferencia mundial de visión por computador, que se celebrará en junio de 2020 en Seattle, Washington (Estados Unidos).

El comité científico de la conferencia aceptó el artículo de los investigadores que es producto de una colaboración con Adobe en edición de video con el uso de Inteligencia Artificial.

El objetivo principal del proyecto de los investigadores uniandinos es detectar lo que se conoce como "hablantes activos" que son las personas que están hablando y son visibles en un video arbitrario.

De esta manera la tarea se divide en tres pasos: primero localizar todas las personas en un video, segundo identificar si el audio corresponde a la voz humana y tercero identificar entre todas las personas cual o cuales están hablando.

La tarea suena extraña, pero es muy útil en la edición de video debido a que permite alinear automáticamente segmentos del video, así como enfocar al hablante activo. Por esta razón, el trabajo se realizó durante una pasantía en la división de investigación de Adobe Inc. y en colaboración con el laboratorio IVUL de la Universidad de KAUST (Emiratos Árabes Unidos).

Hoy en día, los métodos más avanzados para este problema se basan en analizar un único rostro y estimar una correspondencia entre el movimiento de la cara y la señal de audio. El método propuesto por los investigadores biomédicos parte de la misma base, pero es el primero que logra integrar información de múltiples rostros.

Esta solución se logró mediante dos técnicas complementarias: por un lado, una red neuronal siamesa que nos permite fusionar información visual (imágenes) y la señal de audio y por otro lado, usar una técnica conocida como "auto-atención" que básicamente le asigna un peso (importancia) a todos los rostros detectados en una escena. Esta combinación de fusión y auto-atención permite estimar la probabilidad que una persona sea el hablante activo analizando la escena completa, no un solo rostro.

Los resultados de esta investigación han superado a soluciones propuestas por Google, la Academia de Ciencias de China, y estudiantes del grupo de visión de Oxford, a la vez que utiliza muchos menos recursos computaciones, un aspecto que es crítico en el análisis de video dado el tamaño de los datos de entrada.

La participación uniandina en esta importante conferencia es un logro de la línea de investigación de Visión Artificial Biomédica que lidera el profesor Arbeláez en la Facultad de Ingeniería.

Noticias Recientes

  • Modelo de optimización de infraestructura de Uniandes, finalista a mejor artículo del año en revista científica
    El Sistema Inteligente para la Gestión de Puentes (SIGP), desarrollado en alianza entre la Universidad de los Andes y...
  • Camila Escobar, nueva directora de Colfuturo
    Camila Escobar, ingeniera industrial de la Universidad de los Andes, asume un nuevo capítulo en su trayectoria...
  • ESUFA y Uniandes, una alianza estratégica que impulsa el futuro del sector aeronaútico en Colombia
    Lo que comenzó como un acercamiento académico entre la Escuela de Suboficiales de la Fuerza Aeroespacial Colombiana (...
  • Pylatino: cuando la programación rompe fronteras
    A sus 41 años, Diana volvió a empezar. Desde Sibaté, Cundinamarca, y enfrentando el desempleo, decidió inscribirse en...
  • Uniandes obtiene patente por innovador sistema de simulación eléctrica en tiempo real
    La historia de esta patente no empezó con un documento oficial ni con una resolución firmada. Empezó con una pregunta....
  • Se graduó la primera cohorte de la maestría virtual en Gerencia de la Ingeniería
    “Hoy los miro a ustedes y veo a los prometeos modernos”. Con esa frase poderosa, Alfonso Núñez, gerente general de la...
  • Cambio climático en América Latina podría costar hasta el 5% de su PIB
    La transición energética en Colombia no es solo un desafío técnico: es, ante todo, un reto financiero, institucional y...
  • Postulaciones abiertas: Decano(a) Facultad de Ingeniería Universidad de los Andes
    La Universidad de los Andes es una universidad privada ubicada en Bogotá, Colombia, de carácter no confesional y sin...
  • Cuando los datos transforman la energía: proyecto GASMEC recibe reconocimiento del Grupo Energía Bogotá
    Detrás de los grandes sistemas que transportan energía y gas en América Latina hay un reto silencioso: entender, en...
  • Fuerza Aeroespacial Colombiana y Uniandes avanzan en el futuro espacial del país
    En un mundo donde el espacio ya no es una frontera lejana, sino un escenario estratégico para el desarrollo tecnológico...
  • Ciencia, Mujer y Tecnología: donde nacen las ingenieras y científicas del futuro
    “Quiero ser bióloga marina”. “Yo quiero ser astrónoma”. “Yo quiero estudiar Ingeniería Ambiental”. Así se imaginan el...
  • Muertes silenciosas en las vías, un debate urgente sobre la seguridad vial en Colombia
    En Colombia, la tragedia de los siniestros viales se ha convertido en una de las crisis de salud pública más graves y,...