2025-06-11
Ayudando a las máquinas a comprender el contenido visual con IA
Los datos deberían guiar cada decisión que toma una empresa moderna. Pero la mayoría de las empresas tienen un punto ciego enorme: no saben qué sucede en sus datos visuales.
Coactive trabaja para cambiar esto. La empresa, fundada por Cody Coleman (promoción 2013), MEng (promoción 2015) y William Gaviria Rojas (promoción 2013), ha creado una plataforma basada en inteligencia artificial que interpreta datos como imágenes, audio y video para descubrir nuevos conocimientos.
La plataforma de Coactive puede buscar, organizar y analizar instantáneamente contenido visual no estructurado para ayudar a las empresas a tomar decisiones más rápidas y mejores.
“En la primera revolución del big data, las empresas mejoraron su capacidad para extraer valor de sus datos estructurados”, afirma Coleman, refiriéndose a los datos de tablas y hojas de cálculo. “Pero ahora, aproximadamente entre el 80 % y el 90 % de los datos del mundo no están estructurados. En el próximo capítulo del big data, las empresas tendrán que procesar datos como imágenes, vídeo y audio a gran escala, y la IA es clave para aprovechar esa capacidad”.
Coactive ya trabaja con varias grandes empresas de medios y comercio minorista para ayudarles a comprender su contenido visual sin tener que recurrir a la clasificación y el etiquetado manual. Esto les permite ofrecer el contenido adecuado a los usuarios con mayor rapidez, eliminar contenido explícito de sus plataformas y descubrir cómo un contenido específico influye en el comportamiento del usuario.
En términos más generales, los fundadores creen que Coactive sirve como ejemplo de cómo la IA puede empoderar a los humanos para trabajar de manera más eficiente y resolver nuevos problemas.
“La palabra coactivo significa trabajar juntos simultáneamente, y esa es nuestra gran visión: ayudar a que humanos y máquinas trabajen juntos”, dice Coleman. “Creemos que esta visión es más importante ahora que nunca porque la IA puede separarnos o unirnos. Queremos que Coactivo sea un agente que nos una y otorgue a los seres humanos un nuevo conjunto de superpoderes”.
Dándole visión a las computadoras
Coleman conoció a Gaviria Rojas durante el verano previo a su primer año en el programa Interphase Edge del MIT. Ambos se especializarían en ingeniería eléctrica y ciencias de la computación y trabajarían en la difusión del contenido de MIT OpenCourseWare en universidades mexicanas, entre otros proyectos.
“Ese fue un gran ejemplo de emprendimiento”, recuerda Coleman sobre el proyecto OpenCourseWare. “Fue realmente empoderante ser responsable del negocio y del desarrollo de software. Me impulsó a fundar mis propias pequeñas empresas de desarrollo web y a realizar el curso del MIT Founder´s Journey”.
Coleman exploró por primera vez el poder de la IA en el MIT mientras trabajaba como investigador de posgrado en la Oficina de Aprendizaje Digital (ahora MIT Open Learning), donde utilizó el aprendizaje automático para estudiar cómo aprenden los humanos en MITx, que alberga cursos en línea masivos y abiertos creados por profesores e instructores del MIT.
“Me pareció realmente asombroso que se pudiera democratizar este proceso transformador que viví en el MIT con el aprendizaje digital, y que se pudiera aplicar la IA y el aprendizaje automático para crear sistemas adaptativos que no solo nos ayudan a comprender cómo aprenden los humanos, sino que también ofrecen experiencias de aprendizaje más personalizadas a personas de todo el mundo”, dice Coleman sobre MITx. “Esa también fue la primera vez que pude explorar contenido de video y aplicarle la IA”.
Tras su doctorado en el MIT, Coleman estudió en la Universidad de Stanford, donde trabajó en la reducción de las barreras para el uso de la IA. Esta investigación lo llevó a colaborar con empresas como Pinterest y Meta en aplicaciones de IA y aprendizaje automático.
“Ahí fue donde vislumbré el futuro de lo que la gente quería hacer con la IA y su contenido”, recuerda Coleman. “Observaba cómo las empresas líderes usaban la IA para generar valor comercial, y de ahí surgió la chispa inicial de Coactive. Pensé: '¿Y si creamos un sistema operativo empresarial para contenido e IA multimodal que lo facilite?'”
Mientras tanto, Gaviria Rojas se mudó al Área de la Bahía en 2020 y comenzó a trabajar como científico de datos en eBay. Durante la mudanza, necesitó ayuda para transportar su sofá, y Coleman fue el afortunado amigo al que llamó.
“Durante el viaje en coche, nos dimos cuenta de que ambos presenciamos una explosión en torno a los datos y la IA”, dice Gaviria Rojas. “En el MIT, presenciamos en primera fila la revolución del big data y vimos a gente inventando tecnologías para extraer valor de esos datos a gran escala. Cody y yo nos dimos cuenta de que teníamos otro polvorín a punto de estallar, con empresas recopilando enormes cantidades de datos, pero esta vez se trataba de datos multimodales como imágenes, vídeo, audio y texto. Faltaba una tecnología para liberarlos a gran escala: la IA”.
La plataforma que los fundadores desarrollaron posteriormente —lo que Coleman describe como un "sistema operativo de IA"— es independiente del modelo, lo que significa que la empresa puede cambiar los sistemas de IA internos a medida que los modelos mejoran. La plataforma de Coactive incluye aplicaciones prediseñadas que los clientes empresariales pueden usar para, por ejemplo, buscar en su contenido, generar metadatos y realizar análisis para extraer información.
“Antes de la IA, las computadoras veían el mundo a través de bytes, mientras que los humanos lo veían a través de la visión”, dice Coleman. “Ahora, con la IA, las máquinas por fin pueden ver el mundo como nosotros, y eso va a desdibujar el mundo digital y el físico”.
Mejorando la interfaz hombre-computadora
La base de datos de imágenes de Reuters proporciona millones de fotos a periodistas de todo el mundo. Antes de Coactive, la empresa dependía de que los reporteros etiquetaran manualmente cada foto para que aparecieran las imágenes correctas cuando buscaban temas específicos.
“Era increíblemente lento y costoso revisar todos estos recursos sin procesar, así que la gente simplemente no añadía etiquetas”, dice Coleman. “Eso significaba que, al buscar información, los resultados eran limitados, incluso si las fotos relevantes estaban en la base de datos”.
Ahora, cuando los periodistas en el sitio web de Reuters seleccionan "Habilitar búsqueda de IA", Coactive puede extraer contenido relevante basándose en la comprensión de su sistema de IA de los detalles de cada imagen y video.
"Está mejorando enormemente la calidad de los resultados para los periodistas, lo que les permite contar historias mejores y más precisas que nunca", afirma Coleman.
Reuters no es la única empresa que lucha por gestionar todo su contenido. La gestión de activos digitales es un componente fundamental de muchas empresas de medios y minoristas, que hoy en día suelen depender de metadatos introducidos manualmente para ordenar y buscar dicho contenido.
Otro cliente de Coactive es Fandom, una de las plataformas de información sobre series, videojuegos y películas más grandes del mundo, con más de 300 millones de usuarios activos mensuales. Fandom utiliza Coactive para analizar los datos visuales de sus comunidades en línea y eliminar el contenido excesivo de sangre y contenido sexualizado.
“Antes, Fandom tardaba entre 24 y 48 horas en revisar cada nuevo contenido”, dice Coleman. “Ahora, con Coactive, han codificado sus normas comunitarias y pueden generar información más detallada en un promedio de unos 500 milisegundos”.
Con cada caso de uso, los fundadores ven a Coactive como una opción que permite un nuevo paradigma en las formas en que los humanos trabajan con las máquinas.
“A lo largo de la historia de la interacción humano-computadora, hemos tenido que usar un teclado y un ratón para introducir información de forma que las máquinas pudieran comprenderla”, afirma Coleman. “Ahora, por primera vez, podemos hablar con naturalidad, compartir imágenes y vídeos con la IA, y esta puede comprender ese contenido. Este es un cambio fundamental en nuestra forma de pensar sobre las interacciones humano-computadora. La visión central de Coactive es que, debido a este cambio, necesitamos un nuevo sistema operativo y una nueva forma de trabajar con el contenido y la IA”.
Autor

MIT
Promover la investigación, las innovaciones, la enseñanza y los eventos y las personas de interés periodístico del MIT a la comunidad del campus, los medios de comunicación y el público en general, Comunicar anuncios del Instituto, Publicar noticias de la comunidad para profesores, estudiantes, personal y ex alumnos del MIT. Proporcionar servicios de medios a los miembros de la comunidad, incluido el asesoramiento sobre cómo trabajar con periodistas, Responder a consultas de los medios y solicitudes de entrevistas...

