• Home / Noticias / Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
  • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador

    • Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
      Pablo Arbeláez participará en CVPR 2020, la mayor conferencia mundial de visión por computador
31/03/2020

Su estudiante doctoral Juan Carlos León también participará en la conferencia.

Pablo Arbeláez, profesor asociado de Ingeniería Biomédica y su estudiante doctoral, Juan Carlos León; participarán en CVPR 2020, la mayor conferencia mundial de visión por computador, que se celebrará en junio de 2020 en Seattle, Washington (Estados Unidos).

El comité científico de la conferencia aceptó el artículo de los investigadores que es producto de una colaboración con Adobe en edición de video con el uso de Inteligencia Artificial.

El objetivo principal del proyecto de los investigadores uniandinos es detectar lo que se conoce como "hablantes activos" que son las personas que están hablando y son visibles en un video arbitrario.

De esta manera la tarea se divide en tres pasos: primero localizar todas las personas en un video, segundo identificar si el audio corresponde a la voz humana y tercero identificar entre todas las personas cual o cuales están hablando.

La tarea suena extraña, pero es muy útil en la edición de video debido a que permite alinear automáticamente segmentos del video, así como enfocar al hablante activo. Por esta razón, el trabajo se realizó durante una pasantía en la división de investigación de Adobe Inc. y en colaboración con el laboratorio IVUL de la Universidad de KAUST (Emiratos Árabes Unidos).

Hoy en día, los métodos más avanzados para este problema se basan en analizar un único rostro y estimar una correspondencia entre el movimiento de la cara y la señal de audio. El método propuesto por los investigadores biomédicos parte de la misma base, pero es el primero que logra integrar información de múltiples rostros.

Esta solución se logró mediante dos técnicas complementarias: por un lado, una red neuronal siamesa que nos permite fusionar información visual (imágenes) y la señal de audio y por otro lado, usar una técnica conocida como "auto-atención" que básicamente le asigna un peso (importancia) a todos los rostros detectados en una escena. Esta combinación de fusión y auto-atención permite estimar la probabilidad que una persona sea el hablante activo analizando la escena completa, no un solo rostro.

Los resultados de esta investigación han superado a soluciones propuestas por Google, la Academia de Ciencias de China, y estudiantes del grupo de visión de Oxford, a la vez que utiliza muchos menos recursos computaciones, un aspecto que es crítico en el análisis de video dado el tamaño de los datos de entrada.

La participación uniandina en esta importante conferencia es un logro de la línea de investigación de Visión Artificial Biomédica que lidera el profesor Arbeláez en la Facultad de Ingeniería.

Noticias Recientes

  • Niñas y niños imaginan la Bogotá del futuro en el laboratorio CREA
    El Laboratorio CREA de la Facultad de Ingeniería de la Universidad de Los Andes fue el escenario del Tercer Consejo...
  • El EEII 2025 celebró una década impulsando la investigación y la innovación en Uniandes
    Con la asistencia de más de 140 invitados se llevó a cabo la décima edición del Encuentro de Experiencias de Ingeniería...
  • CDO Latam 2025: el futuro de los datos y la Inteligencia Artificial
    La Universidad de los Andes fue el escenario de una nueva edición del CDO Latam 2025: Inteligencia Artificial para el...
  • Beca Fundación Mazda-Uniandes formará a los próximos talentos en Ingeniería, Ciencia de Datos y Matemáticas
    La Fundación Mazda y la Universidad de los Andes entregaron cinco becas a jóvenes que se destacan por su talento, su...
  • Una terraza que renace para nuestra comunidad
    La Facultad de Ingeniería y la Gerencia del Campus de la Universidad de los Andes celebraron la inauguración de la...
  • Pupilo conquista el podio del Pitch Day en la Semana de la Innovación
    A veces, la innovación nace del deseo profundo de cambiarle la vida a alguien. Pupilo, la plataforma que está...
  • María Lorena Gutiérrez, galardonada como la CEO del Año por Forbes Colombia
    El pasado 19 de noviembre, durante el Foro de Economía y Negocios de Forbes Colombia 2025, un encuentro que reúne a...
  • Facultad de Ingeniería, anfitriona del primer Single Day Event de SCDM en América Latina
    El pasado 20 de noviembre de 2025, la Facultad de Ingeniería de la Universidad de los Andes fue sede del primer Single ...
  • 700 mil empleos y reducción de tarifas: el impacto de la transición energética en Colombia
    La transición energética no es solo una aspiración global: es una oportunidad histórica para Colombia. Así lo afirmó...
  • Cristian David Segura: la historia del primer estudiante uniandino de posgrado en Ingeniería en ganar la Google PhD Fellowship
    Desde muy niño, Cristian David Segura Benavides empezó a mostrar su curiosidad por los computadores y los dispositivos...
  • Facultad de Ingeniería muestra cómo se construye el futuro en ERA 2048
    En la Universidad de los Andes el futuro no se espera, se imagina, se diseña y se construye desde hoy. En la segunda...
  • Ingeniería fue protagonista de la Cumbre de La Tríada 2025
    Del 5 al 7 de octubre, la Universidad de los Andes fue sede de la Cumbre de La Tríada 2025, una alianza que desde 2018...