• Home / Noticias / Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
  • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador

    • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
      Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
31/03/2020

Su estudiante doctoral Juan Carlos León también participará en la conferencia.

Pablo Arbeláez, profesor asociado de Ingeniería Biomédica y su estudiante doctoral, Juan Carlos León; participarán en CVPR 2020, la mayor conferencia mundial de visión por computador, que se celebrará en junio de 2020 en Seattle, Washington (Estados Unidos).

El comité científico de la conferencia aceptó el artículo de los investigadores que es producto de una colaboración con Adobe en edición de video con el uso de Inteligencia Artificial.

El objetivo principal del proyecto de los investigadores uniandinos es detectar lo que se conoce como "hablantes activos" que son las personas que están hablando y son visibles en un video arbitrario.

De esta manera la tarea se divide en tres pasos: primero localizar todas las personas en un video, segundo identificar si el audio corresponde a la voz humana y tercero identificar entre todas las personas cual o cuales están hablando.

La tarea suena extraña, pero es muy útil en la edición de video debido a que permite alinear automáticamente segmentos del video, así como enfocar al hablante activo. Por esta razón, el trabajo se realizó durante una pasantía en la división de investigación de Adobe Inc. y en colaboración con el laboratorio IVUL de la Universidad de KAUST (Emiratos Árabes Unidos).

Hoy en día, los métodos más avanzados para este problema se basan en analizar un único rostro y estimar una correspondencia entre el movimiento de la cara y la señal de audio. El método propuesto por los investigadores biomédicos parte de la misma base, pero es el primero que logra integrar información de múltiples rostros.

Esta solución se logró mediante dos técnicas complementarias: por un lado, una red neuronal siamesa que nos permite fusionar información visual (imágenes) y la señal de audio y por otro lado, usar una técnica conocida como "auto-atención" que básicamente le asigna un peso (importancia) a todos los rostros detectados en una escena. Esta combinación de fusión y auto-atención permite estimar la probabilidad que una persona sea el hablante activo analizando la escena completa, no un solo rostro.

Los resultados de esta investigación han superado a soluciones propuestas por Google, la Academia de Ciencias de China, y estudiantes del grupo de visión de Oxford, a la vez que utiliza muchos menos recursos computaciones, un aspecto que es crítico en el análisis de video dado el tamaño de los datos de entrada.

La participación uniandina en esta importante conferencia es un logro de la línea de investigación de Visión Artificial Biomédica que lidera el profesor Arbeláez en la Facultad de Ingeniería.

Noticias Recientes

  • Uniandes lidera proyecto de aprovechamiento de residuos agrícolas para la industria cosmética
    La Universidad de los Andes, en cabeza de sus facultades de Ingeniería y Ciencias, ha dado un paso significativo hacia...
  • Un espacio para el bienestar en Ingeniería
    En medio del silencio de las vacaciones intersemestrales en Uniandes, más de 200 empleados, entre administrativos y...
  • Laboratorio Urbano Bogotá Región: innovación y sostenibilidad para el futuro de la ciudad
    Con el objetivo de mejorar la movilidad, el desarrollo urbano y la calidad de vida de los habitantes de Bogotá a través...
  • Ingeniería Uniandes anfitriona del 5to Simposio Mundial de Investigación sobre Transporte y Uso de la Tierra
    Más de 130 expertos de todos los rincones del planeta se reunieron en Bogotá para participar en el 5° Simposio Mundial...
  • Internacionalización del conocimiento: libro del profesor Bernardo Caicedo fue traducido al chino
    El profesor Bernardo Caicedo, del Departamento de Ingeniería Civil y Ambiental, ha logrado un importante reconocimiento...
  • Uniandes y Coursera unidos por la innovación educativa
    La Facultad de Ingeniería de la Universidad de los Andes y Coursera ofrecen maestrías para quienes buscan nuevos...
  • 11 ingenieras uniandinas en listado de 100 Mujeres Poderosas de Forbes
    *Fotos: tomadas de Forbes Colombia. La reputada revista Forbes publica anualmente el listado de las 100 mujeres más...
  • Ingeniería Uniandes le aporta a la seguridad vial de todo el país
    La iniciativa ‘Conduce a 50, Vive al 100’ de la Universidad de los Andes, la Agencia Nacional de Seguridad Vial (ANSV)...
  • El poder de nunca desistir
    Esta historia corrobora, una vez más, que nunca hay que dejar de estudiar, que nunca es tarde para hacer lo que nos...
  • AquaShield gana el podio del Pitch Day en la Semana de la Innovación
    AquaShield, el proyecto que busca proteger los catéteres (CVC) de la exposición al agua durante el baño mediante un...
  • Uniandes y Coursera lanzan la Maestría en Gerencia de Tecnologías de Información (MAIT), para formar a los líderes tecnológicos de las industrias del
    Para obtener más información sobre el programa en línea, haz clic aquí.  En el actual mundo empresarial, cada vez más...
  • ¡Logros que inspiran! Mujeres brillantes se gradúan en Ingeniería de Software en Uniandes
    *Foto: Zaray Viviana Rey, graduanda MISO, y su padre.   En un emotivo evento, la Universidad de los Andes celebró la...