Sigo de cerca la carrera frenética de la inteligencia artificial. A veces parece que apenas entendemos una tecnología cuando ya llega la siguiente. Recuerdo bien cuando, en 2022, apareció ChatGPT: un programa conversacional al que podíamos preguntar casi cualquier cosa. No hacía milagros, pero era útil. Tenía un límite: solo respondía con lo que había aprendido en su entrenamiento. Nada más.
Después, en 2023 y 2024, el panorama cambió. Los modelos comenzaron a procesar no solo texto, sino también imágenes, audios, videos. A eso lo llamaron “multimodal”. Más tarde surgieron los llamados Modelos de Protocolo de Contexto (MCP), conectores que permitían a los LLM “leer y escribir” en la computadora. Esto, aunque suene técnico, fue clave: abrió la puerta a que la IA dejara de ser solo un interlocutor y empezara a interactuar con nuestro entorno digital.
Y ahora estamos en otro nivel. El llamado modo agente. ¿Qué tiene de especial? Pues que ya no se limita a responder. Actúa. Un agente puede descomponer un objetivo grande en tareas pequeñas, usar varias herramientas, recordar lo que hizo antes y planificar lo que viene. Incluso puede ofrecerte un plan completo, editable, algo que antes sonaba a ciencia ficción.
Esto no es nuevo en informática. Los “agentes” existen desde hace décadas, pero con capacidades muy limitadas. Lo que cambia ahora es que, gracias a la inteligencia artificial generativa, estos programas son mucho más hábiles y, sobre todo, más útiles.
He probado cuatro plataformas que representan bien este salto. Primero está el modo agente de ChatGPT (OpenAI), ya disponible. Le pides que planee un viaje y en minutos compara vuelos, hoteles, restaurantes, atracciones… y te presenta opciones. Eso sí, la rapidez no es su fuerte y su costo de uso es alto, especialmente para empresas.
Luego conocí Manus, creada por una startup con raíces en Singapur y China. Tiene buena autonomía, un precio accesible (unos 24 dólares al mes), aunque solo se accede por invitación y usa un solo modelo, lo que limita su alcance.
Por otro lado, está GensPak, una apuesta californiana que presume ser “multiagente”: combina varios modelos para completar sus tareas. Según una comparativa del analista Jack Staley, resolvió una estrategia de mercado en cuatro minutos por 20 dólares, mientras ChatGPT tardó media hora y costó diez veces más.
Finalmente, está Minimax, un gigante con inversión china que empezó como un algoritmo de juegos. Ahora maneja 456 mil millones de parámetros y su “ventana de contexto” es tan grande que puede analizar libros enteros sin pestañear. Impresionante, aunque no está claro si ese tamaño se traduce en mejor desempeño o solo en números rimbombantes.
Estas cuatro plataformas son apenas la punta del iceberg. Si esto sigue así, pronto tendremos asistentes digitales que no solo respondan, sino que decidan y actúen con nosotros. No sé si eso es emocionante o un poco inquietante. Pero algo es evidente: los agentes han llegado, y no parece que se vayan pronto.
Síguenos en nuestras redes sociales:
Instagram: @eluniversaledomex, Facebook: El Universal Edomex y X: @Univ_Edomex