• Home / Noticias / Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
  • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador

    • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
      Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
31/03/2020

Su estudiante doctoral Juan Carlos León también participará en la conferencia.

Pablo Arbeláez, profesor asociado de Ingeniería Biomédica y su estudiante doctoral, Juan Carlos León; participarán en CVPR 2020, la mayor conferencia mundial de visión por computador, que se celebrará en junio de 2020 en Seattle, Washington (Estados Unidos).

El comité científico de la conferencia aceptó el artículo de los investigadores que es producto de una colaboración con Adobe en edición de video con el uso de Inteligencia Artificial.

El objetivo principal del proyecto de los investigadores uniandinos es detectar lo que se conoce como "hablantes activos" que son las personas que están hablando y son visibles en un video arbitrario.

De esta manera la tarea se divide en tres pasos: primero localizar todas las personas en un video, segundo identificar si el audio corresponde a la voz humana y tercero identificar entre todas las personas cual o cuales están hablando.

La tarea suena extraña, pero es muy útil en la edición de video debido a que permite alinear automáticamente segmentos del video, así como enfocar al hablante activo. Por esta razón, el trabajo se realizó durante una pasantía en la división de investigación de Adobe Inc. y en colaboración con el laboratorio IVUL de la Universidad de KAUST (Emiratos Árabes Unidos).

Hoy en día, los métodos más avanzados para este problema se basan en analizar un único rostro y estimar una correspondencia entre el movimiento de la cara y la señal de audio. El método propuesto por los investigadores biomédicos parte de la misma base, pero es el primero que logra integrar información de múltiples rostros.

Esta solución se logró mediante dos técnicas complementarias: por un lado, una red neuronal siamesa que nos permite fusionar información visual (imágenes) y la señal de audio y por otro lado, usar una técnica conocida como "auto-atención" que básicamente le asigna un peso (importancia) a todos los rostros detectados en una escena. Esta combinación de fusión y auto-atención permite estimar la probabilidad que una persona sea el hablante activo analizando la escena completa, no un solo rostro.

Los resultados de esta investigación han superado a soluciones propuestas por Google, la Academia de Ciencias de China, y estudiantes del grupo de visión de Oxford, a la vez que utiliza muchos menos recursos computaciones, un aspecto que es crítico en el análisis de video dado el tamaño de los datos de entrada.

La participación uniandina en esta importante conferencia es un logro de la línea de investigación de Visión Artificial Biomédica que lidera el profesor Arbeláez en la Facultad de Ingeniería.

Noticias Recientes

  • ¡Volver a los Andes fue un éxito total!
    Después de 11 años, nuestros egresados volvieron a casa para vivir un reencuentro inolvidable en el evento insignia:...
  • Luis Humberto Reyes, nuevo miembro de la Academia Joven: un orgullo para Uniandes
    Gracias a su trayectoria, aportes a la investigación y su compromiso con la academia y el servicio a la sociedad,...
  • David Santiago Ortiz: del LEGO electrónico a la Inteligencia Artificial
    Carrera: Ingeniería Electrónica e Ingeniería de Sistemas   Promedio: 4,7    Este ingeniero electrónico y de sistemas y...
  • Bera gana el podio del Pitch Day en la Semana de la Innovación
    Bera, el proyecto que busca acompañar a las madres durante su periodo de lactancia para que este sea tranquilo, feliz y...
  • Ingenieros civiles uniandinos reciben Premio Alberto Sarria Molina 2024
    Celebramos a nuestros egresados ​​en Ingeniería Civil, Daniel Ruiz e Iván Alberto Salazar, y a los profesores Juan...
  • De la taza a la casa: cómo los residuos de café están construyendo sueños en Colombia
    ¿Sabías que los residuos del café que disfrutas cada mañana pueden transformarse en las casas de ensueño de cientos de...
  • Más de 25 años construyendo entornos más sostenibles
    Para conmemorar el primer cuarto de siglo del programa de Ingeniería Ambiental de la Universidad de los Andes,...
  • Ganadores de la Semana de la Innovación
    Durante la Semana de la Innovación, nuestros estudiantes de distintos semestres presentaron proyectos innovadores en...
  • Ingeniería del futuro presente en ERA 2048
    Entre el 7 y el 9 de octubre, la Universidad de los Andes llevó a cabo ERA 2048, un evento pensado para inspirar y...
  • Ingenieros uniandinos en el listado de los CIO 2024 de Forbes
    La reputada revista Forbes acaba de publicar el listado de los Chief Information Officer (CIO) del año en Colombia,...
  • Estudiantes de todo el país se sumergieron por una semana en el mundo de la Inteligencia Artificial durante la AI Week 2024
    Durante la semana del 30 de septiembre al 4 de octubre pasado más de 1.000 estudiantes de pregrado en ingeniería de...
  • Colombia fortalece su liderazgo tecnológico en defensa con alianza entre la Armada, Uniandes y Corea
    Los retos tecnológicos para la defensa de las naciones son gigantes y cada día se hacen aún más relevantes. Con el...