Hay veces que me dejo arrastrar por el hype, y esta vez ha sido así. Una vez probado
#Clawdbot ya puedo decir que ni es novedad, ni es seguro, ni está a la altura del hype que ha generado, me explico:
1/ Bajo ningún caso dejo a esto corriendo sin haberlo metido en una máquina virtual o una máquina aparte. Los riesgos de cagarla parecen muy reales.
2/ Lo he usado con Claude como "cerebro" y ha funcionado genial. Probablemente podría haber tirado de APIs más baratas y menos potentes. Además tenía el gasto limitado desde el propio Claude Console y en 5 días de pruebas se ha comido 30€, así que recomiendo tener un ojo puesto en el control financiero.
3/ Hablando de control, mi miedo era precisamente que se le fuera por completo y en las "conversaciones" iniciales dejé bien claro cuáles eran los límites de acceso, navegación, descarga, etc. De inicio no tiene, o al menos no he encontrado que tenga, límite alguno.
4/ MCP sin dudarlo, no le doy acceso directo a ninguna herramienta por razones obvias. He usado algo sencillito para que tenga acceso de envío, borradores y demás acciones en una cuenta de Gmail hecha sólo para esto, con algunos documentos de prueba en Drive y en "local" y he conectado alguna cosilla adicional en entornos de prueba, como un CRM o Notion.
5/ No sé si es por la naturaleza de mis pruebas o del trabajo para el que tengo pensado este tipo de "automatizaciones", pero realmente todo lo que Clawd Bot podía hacer ya me lo estaba haciendo el ecosistema de herramientas y conexiones anterior. No he visto para nada un "salto", de hecho he llegado a sentir en algún momento que era incluso más limitado.
6/ Entré a este trapo por la promesa de la "proactividad" y la persistencia. En lo primero en CASI todo lo que he hecho no he notado proactividad, aunque probablemente venga de las limitaciones que he generado en los comandos de control iniciales, en segundo lugar sí que hay persistencia (creo que a esta memoria le ha llamado algo tan molón como "soul"). Trabaja con el conocimiento adquirido tanto en las interacciones conmigo como en aquellas que hace con las herramientas y documentos que he conectado.
7/ He corrido test en los que he pedido creación de informes tanto de manera libre como con ejemplos de informes anteriores, desarrollo de dashboards, desarrollo de pequeñas aplicaciones web, extracción de información, organizar, clasificar y enviar emails o mensajes de Telegram, creación de una wiki (notion) basado en la búsqueda de información tanto propia como online, resolución de un problema técnico basado en documentación muy concreta, resolución de problemas en base a research propio, y creo que esto ha sido todo... es probable que le haya pedido alguna estupidez más donde mezclaba trabajo en local uso de herramientas y documentación online.
8/ En el caso de uso de desarrollo de aplicación web y Dashboard sí que he sentido más capacidad de resolución. Iteraba, testaba, apoyaba en el proceso a Claude cuando hacía research, utilizaba varias herramientas, varios lenguajes de programación, me enviaba pantallazos por Telegram con el desarrollo, me preguntaba por decisiones para continuar. Aquí sí que he notado esa interacción "anómala", persistencia y más utilidad.
En definitiva, es un camino interesante pero no es novedoso del todo, al menos no en mis casos de uso. He tenido todo el rato una sensación de inseguridad, de que podía liarla en cuanto a costes, envíos indebidos, puertas traseras, brechas de datos, borrado o creación de archivos, etc.
Siento que necesito un sistema menos "creativo" y mucho más "encauzado" o si me pongo pedante, "determinista", donde puedo trabajar en modo copiloto o con las secuencias de tareas que mejor se adapten a los resultados que estoy buscando (ojo, que la secuencia la puedo o no crear yo, pero al menos estar informado de ella a priori).
Este asunto de "crear un compañero independiente pero contextualizado" ya me generaba dudas, ahora tras haberlo probado creo que el titular es excesivo y que voy a estar atento, pero por ahora me faltan unos meses para verlo con casos de uso reales y seguros.
Seguiré testeando y si me piden algo más, pues como fuego de artificio puede que funcione genial, por ahora.