Guía de Open WebUI: cómo tener tu propio ChatGPT privado y gratuito en 2026
Open WebUI convierte cualquier modelo local ejecutado con Ollama en una interfaz visual idéntica a ChatGPT, con historial, RAG, voz y multiusuario. Esta guía explica cómo instalarlo y sacarle partido real.

Ollama te permite ejecutar modelos de IA en tu ordenador con un solo comando. Pero interactuar con esos modelos desde el terminal es incómodo para el uso diario y prácticamente imposible para compartir con otras personas. Open WebUI resuelve exactamente ese problema: toma cualquier modelo que tengas corriendo con Ollama y le añade una interfaz visual completa, con historial de conversaciones, subida de documentos, búsqueda semántica, modo de voz y gestión multiusuario.
Open WebUI empezó como un proyecto paralelo de Timothy Baek, creció hasta convertirse en uno de los repositorios de GitHub con más estrellas de crecimiento más rápido, y en 2026 está en el centro de una conversación seria sobre cómo debería ser un espacio de trabajo de IA verdaderamente privado y extensible. En mayo de 2025 el proyecto había cruzado las 90.000 estrellas en GitHub. OpenAI Help Center
Esta guía explica cómo instalarlo, qué funciones realmente cambian el uso diario y cómo configurarlo para sacarle el máximo partido, tanto si lo usas solo como si quieres desplegarlo para un equipo.
Qué es Open WebUI y en qué se diferencia de usar Ollama directamente
Open WebUI (anteriormente conocido como Ollama WebUI) es una interfaz web autoalojada y rica en funciones diseñada para trabajar con Ollama y otros backends de IA local. Es la recomendación por defecto en prácticamente todos los tutoriales de «ejecutar IA localmente», y con razón: funciona desde el primer momento, tiene un aspecto profesional y incluye funciones que rivalizan con las plataformas comerciales. Humai
La diferencia práctica con usar Ollama directamente desde el terminal es enorme. El terminal es suficiente para un desarrollador que hace pruebas. No es una opción real para uso diario, para compartir con la familia o para desplegar en un equipo donde no todos tienen conocimientos técnicos. Open WebUI añade:
Historial de conversaciones guardado y con búsqueda. Selector de modelo — puedes cambiar entre cualquier modelo de Ollama desde un menú desplegable. Subida de documentos — PDFs, texto, imágenes y Word que el modelo puede analizar completamente en local. Soporte multiusuario con roles y permisos. Acceso desde cualquier dispositivo de tu red mediante navegador. Y todo sin que ningún dato salga de tu máquina.
Instalación: tres métodos según tu nivel técnico
Open WebUI corre como un contenedor Docker. El método más rápido para empezar, si ya tienes Ollama corriendo en tu máquina, es un único comando. sunpeak
Método 1 — Docker (recomendado para la mayoría):
docker run -d \
-p 3000:8080 \
--add-host=host.docker.internal:host-gateway \
-v open-webui:/app/backend/data \
--name open-webui \
--restart always \
ghcr.io/open-webui/open-webui:mainUna vez ejecutado, accede a http://localhost:3000 desde tu navegador. La primera vez te pedirá crear una cuenta de administrador. No sale nada de tu red local.
Método 2 — pip (sin Docker, más sencillo si ya tienes Python):
pip install open-webui
open-webui serveAccede en http://localhost:8080. Es el método más rápido si no quieres instalar Docker.
Método 3 — Docker Compose (para configuraciones más avanzadas o con GPU):
services:
ollama:
image: ollama/ollama
volumes:
- ollama:/root/.ollama
ports:
- "11434:11434"
open-webui:
image: ghcr.io/open-webui/open-webui:main
depends_on:
- ollama
ports:
- "3000:8080"
environment:
- OLLAMA_BASE_URL=http://ollama:11434
volumes:
- open-webui:/app/backend/data
restart: always
volumes:
ollama:
open-webui:Guárdalo como docker-compose.yml y ejecuta docker compose up -d. Levanta Ollama y Open WebUI juntos con un solo comando, con reinicio automático incluido.
Las funciones que más cambian el uso diario
Cómo subir documentos y usar RAG desde la interfaz
Esta es la función más usada después del chat básico, y la que más diferencia marca respecto a usar el terminal directamente.
Haz clic en el icono del clip en el input del chat para subir archivos. Tipos soportados: PDFs, archivos de texto (.txt, .md, .csv), imágenes si usas un modelo de visión como Llama 3.2 Vision, y documentos Word (.docx). Ejemplo: sube tu informe de 50 páginas en PDF y pregunta «Resume los hallazgos clave en 5 puntos.» La IA lo lee completamente en local — sin procesamiento en la nube, sin que los datos salgan de tu máquina. Humai
Para crear una base de conocimiento permanente que persiste entre conversaciones, ve al panel de administración, sección «Conocimiento». Allí puedes crear colecciones de documentos que cualquier modelo puede consultar como contexto adicional en cualquier conversación futura. Es la diferencia entre subir un documento una vez para una pregunta puntual y tener una biblioteca de referencia siempre disponible.
Cómo conectar Open WebUI con APIs externas además de Ollama
Un detalle que mucha gente no sabe: Open WebUI no está limitado a modelos locales de Ollama. Puedes conectarlo a APIs externas y tener todos tus modelos — locales y en la nube — en una sola interfaz.
Para añadir la API de OpenAI, Claude o cualquier API compatible con el formato de OpenAI, ve a Ajustes → Conexiones y añade la URL de la API y tu clave. A partir de ahí, GPT-5.5, Claude Sonnet y tus modelos locales aparecen todos en el mismo selector de modelo.
# Variables de entorno para conectar con APIs externas al instalar con Docker
-e OPENAI_API_KEY=tu_clave_aqui
-e OPENAI_API_BASE_URL=https://api.openai.com/v1 La ventaja práctica es usar la misma interfaz, el mismo historial y las mismas bases de conocimiento independientemente de si el modelo corre en tu máquina o en los servidores de Anthropic o OpenAI.
Configuración para equipos y uso compartido
Para equipos: crea cuentas manualmente o activa el autoregistro. Para colegios: crea cuentas en bloque usando códigos de clase. Los administradores pueden ver todas las conversaciones en Admin → Conversaciones. La configuración por defecto funciona bien: una máquina con 16 GB de RAM y llama3:8b gestiona 5-10 usuarios concurrentes sin problemas. Notion
Para desplegar Open WebUI accesible desde fuera de tu red local, el método recomendado es Tailscale — la misma VPN que explicamos en nuestra guía de servidores de IA domésticos. Instalas Tailscale en el servidor y en todos los dispositivos que quieres que tengan acceso, y Open WebUI queda accesible desde cualquier lugar sin abrir puertos en el router.
Los errores más frecuentes y cómo resolverlos
Pantalla en blanco al acceder a localhost:3000. Suele ser un conflicto de puerto o que el servidor todavía se está inicializando. Espera 60 segundos y recarga. Si sigue en blanco, revisa el terminal donde ejecutaste el comando de instalación en busca de mensajes de error. Humai
Open WebUI no encuentra Ollama. El error más común en instalaciones con Docker. El problema es que Docker corre en un entorno aislado y necesita la flag --add-host=host.docker.internal:host-gateway para ver Ollama corriendo en el host. Si olvidaste esa flag al instalar, borra el contenedor y vuelve a crearlo con el comando completo de la sección de instalación.
El modelo va lento o no usa la GPU. Open WebUI simplemente llama a Ollama, que es quien gestiona el hardware. Si el modelo va lento, el problema está en la configuración de Ollama, no en Open WebUI. Verifica que Ollama detecta la GPU con ollama run qwen3:8b --verbose 2>&1 | grep "gpu layers". Si muestra 0, los drivers de GPU no están instalados correctamente.
Los documentos subidos no se reflejan en las respuestas. RAG requiere que el modelo tenga suficiente contexto para incorporar el documento. Para documentos largos, prueba a hacer preguntas más específicas que apunten directamente al contenido que buscas, en lugar de preguntas generales. Si el modelo sigue ignorando el documento, puede que el chunk size de la configuración RAG sea demasiado pequeño — auméntalo en Admin Panel → Documents.
Open WebUI vs LM Studio: cuándo usar cada uno
La pregunta que surge inevitablemente si has leído nuestra comparativa de Ollama vs LM Studio. La respuesta corta: LM Studio es para explorar y probar modelos con una GUI instalada en tu máquina. Open WebUI es para usar IA local de forma productiva a diario, especialmente si quieres acceso desde múltiples dispositivos o compartirlo con otras personas.
Lo que más valor genera a largo plazo
Las personas que más valor extraen de Open WebUI no son las que lo instalaron una vez y lo usan como una ventana de chat. Son las que trataron la primera instalación como el comienzo de un proceso de configuración: añadiendo herramientas gradualmente, construyendo bases de conocimiento, refinando sus configuraciones y esencialmente entrenando el sistema para que se adapte a su flujo de trabajo específico, en lugar de adaptar su flujo de trabajo al sistema. Esa inversión se acumula. El tiempo que dedicas a entender cómo funciona el chunking de RAG se amortiza cada vez que añades un nuevo documento. OpenAI Help Center
El punto de partida correcto para la mayoría de personas es instalar, probar el chat básico con un modelo, subir un documento para verificar que el RAG funciona, y añadir un prompt de sistema al modelo principal. Esos cuatro pasos tardan menos de una hora y ya convierten Open WebUI en algo sustancialmente más útil que cualquier alternativa de terminal.
Open WebUI se actualiza frecuentemente. Para mantener la instalación Docker al día: docker pull ghcr.io/open-webui/open-webui:main seguido de detener y recrear el contenedor con el mismo comando de instalación. Tus datos y conversaciones están en el volumen open-webui y no se borran al actualizar.
Fuentes
Seguir leyendo
NuevoGuía de Gemini Spark: qué es, cómo activarlo y qué puede hacer el agente 24/7 de Google
Gemini Spark actúa mientras no estás mirando: revisa tu Gmail, completa tareas entre apps y programa acciones autónomas. Esta guía explica qué lo diferencia de un chatbot, cómo activarlo y qué configurar primero.

Prompt engineering avanzado: guía completa para escribir instrucciones que realmente funcionan
Las técnicas avanzadas de prompting mejoran los resultados entre un 20% y un 60%. Esta guía explica las que más importan en 2026, con ejemplos reales y plantillas listas para copiar y adaptar.

Anthropic lleva los agentes de Claude a la infraestructura propia de las empresas — y ficha a Andrej Karpathy
Desde el Code with Claude de Londres, Anthropic lanzó sandboxes autoalojados y túneles MCP para que los agentes ejecuten código dentro del perímetro de seguridad de cada empresa. Karpathy se suma al equipo de I+D.