Veintiún días sin publicar esta bitácora sobre lo que acontece en el mundo de la IA. Para todo lo que sucede a diario es una eternidad. La explicación es vulgar: el mes que arrancó con varios frentes abiertos al mismo tiempo y no me pude dar abasto. Mientras yo lidiaba con pendientes desde San Pedro de los Pinos de los que les platicaré en estos días, la industria de la inteligencia artificial parecía decidida a comprimir un año entero en cuatro semanas. Vamos a desempacar lo más importante: lo que se anunció en el evento I/O de Google —empezando por Flash 3.5—, la noticia que reordenó el tablero de fichajes de la frontera —Karpathy se fue a Anthropic—, un par de movimientos finos de OpenAI, la maduración silenciosa del ecosistema de agentes y la robótica que cada vez está menos lejos del cuerpo humano.
Empezamos.
I/O 2026: Google decide que el producto ya no es la búsqueda, es el agente
El 20 de mayo, Sundar Pichai abrió la edición 2026 de I/O —la conferencia anual de desarrolladores que Google celebra desde hace casi dos décadas— con una idea que muchos llevábamos esperando que se asumiera explícitamente: Google ya no está agregando “funciones de IA” a productos existentes. Está rediseñando la compañía entera alrededor de agentes. La frase más comentada fue la presentación de Gemini 3.5 Flash, un modelo intermedio que, según la propia presentación, supera al Gemini 3.1 Pro del año pasado en casi todos los puntos de referencia, corre cuatro veces más rápido y cuesta menos de la mitad. Lo que esto quiere decir, en palabras llanas, es que un modelo barato ya hace lo que el año pasado solo hacían los modelos caros. La versión potente, Gemini 3.5 Pro, llegará en junio.
Pero el anuncio que cambia la conversación de fondo no fue Flash. Fue Gemini Spark, un asistente personal que vive en una computadora dentro de Google y trabaja en segundo plano por uno: organiza el calendario, planea eventos, escribe correos, saca archivos del Drive y, eventualmente, contrata el Uber o reserva la cena. La promesa de “una IA que te conoce” se intentó muchas veces —desde la difunta Google Now de 2012 hasta el Astra de hace dos años—, pero ninguna llegó al sustantivo “agente” con la solidez con la que lo plantea Spark. Sale primero para los suscriptores del plan AI Ultra, que de paso bajó de 250 a 100 dólares mensuales —se acomoda al precio del Pro de OpenAI y debajo del Max de Anthropic—.
A esto se sumaron los Intelligent Eyewear —Google se asoció con Samsung, Qualcomm, Warby Parker y Gentle Monster para fabricar anteojos inteligentes que se vean como lentes de armazón decente—. Salen en otoño. Hay versión solo con audio y versión con pantalla. Está por verse si esta vez sí, después del pinche fracaso de Google Glass de 2013, los usuarios aceptamos llevar una cámara en la cara. La diferencia es que ahora lleva también una IA.
Lo que importa, más allá de la lista de productos, es la tesis editorial. La búsqueda lleva veintitantos años siendo el negocio principal de Google. Convertir los resultados estáticos —las diez ligas azules de toda la vida— en agentes activos que ejecutan tareas es el riesgo más grande que Google ha asumido en su historia. Y al mismo tiempo es lo único que puede mantener al cliente cautivo cuando ChatGPT y Claude ya hacen el trabajo cognitivo que antes uno hacía con varias pestañas abiertas. Google no está innovando por gusto: está defendiendo su edificio.
Karpathy a Anthropic, o la guerra por la receta
El 19 de mayo —un día antes de la apertura de I/O— Andrej Karpathy publicó un mensaje seco anunciando que se unía a Anthropic. Karpathy es uno de los nombres más reconocibles del campo: cofundador de OpenAI en 2015, director de IA en Tesla durante la era del Autopilot, después fundador de Eureka Labs —su pequeña empresa de educación con IA— y autor de la serie de videos Neural Networks: Zero to Hero que prácticamente formó a una generación entera de ingenieros de aprendizaje automático.
En Anthropic se integra al equipo de preentrenamiento —la fase larga y costosa donde un modelo absorbe el corpus general de conocimiento antes de afinarse para tareas particulares— con un encargo que es a la vez técnico y filosófico: usar a Claude para acelerar la propia investigación de cómo se entrena a Claude.
Que Karpathy se haya ido a Anthropic en vez de volver a OpenAI confirma una hipótesis que llevamos meses oyendo en la industria: el cuello de botella ya no es el cómputo, es la receta. Y Anthropic está apostando a que se puede automatizar buena parte de esa receta haciendo que el propio modelo investigue sobre sí mismo. Si funciona, podría compensar la desventaja en cómputo que tiene frente a Microsoft + OpenAI o frente a la infraestructura propia de Google. Si no funciona, Karpathy tendrá un año entretenido. Hay quien ha dicho que, cuando alguien de su calibre elige Anthropic sobre OpenAI, es señal interna del estado del proyecto OpenAI. No se le puede negar peso al gesto.
OpenAI: GPT-5.5 Instant, otra conjetura de Erdős y Dell
OpenAI pasó las cuatro semanas haciendo varias cosas a la vez. El 5 de mayo soltó GPT-5.5 Instant, una actualización del modelo “rápido” que sustituye a GPT-5.3 Instant como predeterminado de ChatGPT para todos los usuarios. Lo notable no es el cambio de versión sino el dato que la acompaña: en evaluaciones internas, GPT-5.5 Instant produjo 52.5 % menos afirmaciones falsas que su predecesor en preguntas de alto riesgo —medicina, leyes, finanzas—. El “Instant” es el modelo que ven los usuarios cuando no piden razonamiento profundo, es el que más se usa en volumen, y bajarle las llamadas alucinaciones cambia, en términos prácticos, lo que la mayoría de la gente experimenta como “ChatGPT”. La actualización pasó casi inadvertida pero es la del mes con más impacto en el día a día de la oficina.
El 19 de mayo, el mismo día en que se fue Karpathy, OpenAI anunció una alianza con Dell Technologies para llevar Codex —su agente de programación— a entornos empresariales privados. Es la confirmación de que el negocio empresarial de OpenAI dejó de ser solo “modelo en la nube” para convertirse en presencia dentro del centro de datos del cliente. Y un día después, el 20 de mayo, OpenAI hizo un anuncio menos esperado: uno de sus modelos de razonamiento refutó —solo, sin asistencia humana— una conjetura de geometría que Paul Erdős había formulado en 1946. El resultado fue verificado por un grupo de matemáticos externos, y Tim Gowers —medalla Fields— escribió un paper acompañante calificándolo de “un hito en la matemática asistida por IA”. Para los que siguieron el Vigía pasado: aquella conjetura de Erdős que reseñé en el número del 4 de mayo —la que el aficionado Liam Price resolvió con asistencia de GPT-5.4 Pro— era otra. Aquella fue humano-con-IA. Esta es la IA sola. Dos conjeturas de Erdős cayendo en menos de un mes —una con asistencia, otra autónoma— marcan un cambio fino de fase.
Robots: la IA empieza a tener cuerpo
A inicios de mayo, Meta compró Assured Robot Intelligence, una empresa que diseña sistemas para que un robot entienda, prediga y se adapte al comportamiento humano en entornos complejos. Es la segunda compra robótica de Meta en pocos meses y confirma la apuesta del consorcio Zuckerberg por meter humanoides en su catálogo. Meta movió, además, siete mil empleados a sus equipos de IA. Microsoft no se quedó atrás: presentó Rho-alpha, su primer modelo de robótica. Todavía no es un humanoide en producción, pero es el cerebro que potencialmente lo guíe.
El año 2026 puede ser recordado como el momento en que la IA salió del navegador y empezó a tener brazos. No vamos a tener humanoides en cada esquina mañana, pero el cuello de botella se está moviendo del modelo al servomotor —lo cual es buena noticia para América Latina: no necesitamos inventar el modelo, podemos adaptarlo—.
En la cola
China publicó las “Medidas Provisionales para la Administración de Servicios de Interacción Antropomórfica con IA”, que entran en vigor el 15 de julio y regulan compañeros virtuales, chatbots emocionales y servicios de interacción afectiva. La ironía no es menor: Beijing pone reglas a los compañeros virtuales justo cuando Google lanza Spark —un agente personal que vive contigo 24/7—. Y en el frente editorial-jurídico, el caso Bartz vs. Anthropic —que decide si entrenar un modelo sobre obras protegidas se considera uso transformativo o infracción— tuvo audiencia clave el 14 de mayo y sigue su curso.
Para cerrar: la conversación dejó de tratarse de modelos
Lo que llevo veintiún días masticando es lo siguiente. La conversación dejó, por fin, de tratarse de modelos. Se trata, hoy explícitamente, de agentes: programas que ejecutan tareas por uno —escriben el correo, reservan el vuelo, organizan la agenda— en vez de simplemente responder a una pregunta. Google rediseña su producto principal alrededor de ellos. Anthropic compra al investigador que necesita para que su modelo enseñe a su propio modelo. OpenAI deja de soltar números de versión grandes y se enfoca en confiabilidad y despliegue. Meta y Microsoft, mientras tanto, empiezan a meterles cuerpo a los agentes para que salgan de la pantalla.
El Pichicuaz se despertó tarde, brincó al escritorio donde escribo este Vigía y se acomodó encima del cuaderno donde llevo las notas a mano. No le importa nada de esto, y en eso, como casi siempre, tiene razón. Pero hoy lunes, varios de los nuestros llegan a sus oficinas con instrucciones nuevas de un asistente que les habla en el teléfono y un cliente que les pide demo de algo que no existía hace tres semanas. Más vale estar al tiro.
Hasta el próximo número.
Para comprender el texto
Agente: Programa que ejecuta tareas por uno —usar herramientas, conectarse a servicios, encadenar pasos— en vez de simplemente responder a una pregunta. Si responder es un mesero que toma la orden, un agente es un asistente personal que la cumple.
Modelo frontera: Modelo de IA cuyas capacidades están en el límite superior de lo conocido en su categoría. Hoy son cuatro o cinco: GPT (OpenAI), Claude (Anthropic), Gemini (Google), Grok (xAI) y un par de chinos abiertos.
Preentrenamiento: Fase larga y costosa donde un modelo absorbe el corpus general de conocimiento antes de afinarse para tareas específicas. Quien sabe entrenar mejor, paga menos por modelo entrenado.
Alucinación: Cuando un modelo genera información plausible pero falsa. La métrica que más se vigila en cualquier actualización.
Discover more from Mutatis mutandis
Subscribe to get the latest posts sent to your email.
— ALEJANDRO ZENKER, 25 MAY 2026 · 21:47