armé un agente tipo cursor pero embebido en una web app. la idea es que te pueda ayudar con tareas que a veces son muy complicadas con la interfaz misma, es un dominio complejo.
todo lindo, mostré el prototipo hace 1 mes, les encantó, expliqué cómo era la arquitectura, por qué era así, expliqué que el agentic workflow es una de las cosas más complejas que hay pero no por la arquitectura en sí sino por el finetuning que hay que hacer constantemente a los skills (prompts) y tools para que el agente logre cubrir cada vez más casos de uso y aumentar su probabilidad de éxito.... estoy trabajando con inferencia de modelos con 2 años de antiguedad (4o, 4.1) y aun así el agent logra trabajar con objetos json de 93mil tokens con todas tools fachada (grep search, sed, find, etc...) lo cual para mi es una hazaña.
le puse todo el esmero que pude para dejarlo super ordenado y con diagramitas super sencillos para que entiendan que el punto clave es la iteración rápida y que es muy importante poder recibir feedback y tener ya las adaptaciones al harness y skills lo antes posible para seguir iterando. que esa era la clave.
todo en un monorepo nextjs, mucha carga de procesamiento no crítico en materia de seguridad va al cliente para evitar a toda costa sobrecargar al server. escalamiento horizontal con azure cloud (container apps y loadbalancing)
todo hermoso hasta que a un pelotudo que no entiende lo que es un agent-loop viene a decirme que hay que modularizar todo y que así logramos "reusar".... como si a día de hoy "reusar" código sea más importante que la velocidad de iteración....
les expliqué 3 veces por qué primero teníamos que priorizar velocidad de iteración y validar el producto para no hacer refactorizaciones prematuras al pedo... y que teníamos que tener en cuenta que pasar de un monorepo a múltiples proyectos trae otro tipo de problemas en términos de infierno de integración, coordinación de versiones, coordinación entre roadmaps de equipos, etc, etc, etc.... que nada de todo eso era gratis y que por eso había que tomar decisiones acorde a prioridades.
Hice 3 documentos, todos super sencillos pero profesionales, les dije que podían usar claude o cursor para que se los haga más sencillos aun pero que consideraba que necesitaban tener ese contexto, les hice un video con diagramas y garabatos paso por paso como trabaja la arquitectura y por qué en un bucle agéntico modular tenés impacto sobre los tipos de tools que podés ejecutar en cada app cliente, que también eso tiene un costo....
videito, diagramas, 3 documentos de arquitectura con arquitecturas alternativas y cada una sus pros/cons, desarrollé los temas y los expliqué, les hice demos en vivo y en directo...
Qué decidieron: ir por la modularización, aun no saben si a nuestros usuarios les va a gustar o no usarlo, vamos a perder tiempo en arquitectura y no en iterar rapido para efectivamente automatizar casos de uso para nuestros usuarios por lo que seguramente lo van a seguir odiando al producto.
todo para que después lo que se resolvía con 2 horas de laburo, armado de prompts y tools sencillos para agregar más capacidades, commit->push->deploy, ahora vaya a tomar 3 equipos diferentes en el workflow, coordinar versiones, luchar para que los QAs automaticen cosas o directamente tirarnos el bardo a los devs (como siempre) y para un producto que los usuarios van a odiar.
Así pierden guita las empresas, por idioteces como estas.
Y me juego la cabeza que fue por un c-level que chateó con su LLM favorito y le dijo que ERA UNA IDEA FANTASTICA y que debíamos ir por ese refactor.
Después del retiro, quemado por los puestos de middlemanagement y uppermanagement decidí volver a picar teclas porque era lo que más me divertía...
Y venía todo bien hasta que a los c-level se les dió por chatear con LLMs psicofánticos pedorros que les nubla el criterio y les aprueba todas las estupideces "de manual" que se les cruzan por la cabeza.
Ma si, solo voy a continuar con esto para verlos arder, por idiotas.
Me molesta sobremanera que el laburo que alguien pone en explicar algo sea ignorado completamente. Discutamos, pero no ignores porque perdiste mi respeto.
READ THE FUCKING MANUAL!
(comparto cosas que no están protegidas por IP ya que vienen de proyectos propios y trabajo previo o con términos claves censurados, pero para que se den una idea)