Filter by input type
Filter by category
Investigadores estudian cómo los humanos responden a agentes de IA que suenan físicamente presentes

Un equipo de investigadores de Carnegie Mellon combinó efectos de espacialización y sonidos ambientales para crear interfaces de audio que aumentan el compromiso del usuario, aunque generan expectativas de comportamiento social similares a las que se aplican a personas reales.

Un equipo de investigadores de la Escuela de Informática de la Universidad Carnegie Mellon (CMU), en colaboración con expertos del Departamento de Psicología y otras universidades, desarrolló una interfaz de audio entre humanos y chatbots diseñada para hacer que el agente de inteligencia artificial parezca físicamente presente en la misma habitación. El trabajo busca orientar el diseño de sistemas de artificial intelligence (AI) sin pantalla utilizados en lentes inteligentes, herramientas de accesibilidad y otras tecnologías de audio.

Dado que la investigación en interfaces humano-computadora se ha centrado históricamente en elementos visuales como avatares o robots, el equipo exploró qué ocurre cuando la interacción depende únicamente del sonido. Para ello, emplearon dos recursos: la espacialización, que ubica al agente dentro del espacio físico mientras habla o se desplaza, y los efectos Foley, técnica habitual en posproducción cinematográfica que añade sonidos cotidianos como el tecleo de un teclado, el susurro de papeles o el llenado de un vaso de agua. “Cuando un actor de cine se sienta en un banco de bar con su chaqueta de cuero, se espera el crujido del cuero, el chirrido del banco y el golpe de las manos en la barra”, explicó Laurie Heller, profesora de psicología especializada en percepción y cognición auditiva. “Estos sonidos ocurren en la vida real, y si no forman parte de la banda sonora de una película, no parece realista. No te sumerge.”

Para probar la interfaz, los participantes conversaron con agentes de AI que utilizaban distintas combinaciones de efectos espaciales y Foley en una habitación con objetos físicos como una laptop, bloques, una pizarra y libros. Luego respondieron cuestionarios y entrevistas estructuradas. Los resultados confirmaron que los efectos de audio aumentaron el nivel de compromiso de los usuarios y la percepción del agente como más humano, con resultados estadísticamente significativos según el equipo. Sin embargo, ese mismo efecto de humanización trajo una consecuencia inesperada: los participantes comenzaron a aplicar normas sociales al agente.

“En el momento en que los participantes sentían que su agente estaba haciendo otra cosa, por ejemplo si hablaba y tecleaba al mismo tiempo, el participante sentía que ‘esto no está bien, mi agente no me está prestando atención, está distraído’. Lo consideraban una falta de educación”, señaló David Lindlbauer, profesor asistente del Instituto de Interacción Humano-Computadora de CMU. El investigador calificó esta reacción como “una caracterización notablemente extraña de un sistema computacional”.

El equipo señala que, dado que varios efectos Foley estaban automatizados y no vinculados directamente a la conversación, diseñarlos con mayor conciencia del diálogo podría reducir esa percepción de distracción. Lindlbauer también apuntó que un sistema definitivo probablemente no requeriría estar adaptado a un entorno específico, pues un conjunto de efectos independientes del espacio podría mantener el aumento en el nivel de compromiso. Heller añadió que, a pesar de la posible disonancia entre lo que los ojos y los oídos de los participantes percibían, “los sonidos aún tuvieron en las personas un efecto consistente con la presencia de otro ser humano”.

Outstanding news

Stay updated

News by country

Related Content

Secured By miniOrange