Mira @maupami estoy corriendo con ollama, con 2 GPU's viejitos (RTX1070 8GB), este modelo:
ollama.com/library/qwen3-cod…
jala muy chido y jala de manera local muy similar a Claude Code
Probe con estos prompts:
"write a perl program to calculate fibbonaci numbers"
" make a websocket server listen port 4450 tcp supporting SSL in Python"
and enjoy :)
Claude Code es muy bueno, pero caro, lo dejo para tareas realmente complicadas. Correr un modelo local con Codellama sirve para las tareas comunes sin pagar el sobre consumo de tokens que cobra Anthropic
Jugando con @claudeai note que cuando usas los API Keys para conectarte y usar la IA, tiende a usar mas tokens.
Con un LLM local usando Ollama consumía 126k tokens, el mismo ejercicio con Claude y fueron 756k tokens, me cobraron cerca de $4 usd
Hay que usar modelos locales.