Herramientas

Guía de Open WebUI: cómo tener tu propio ChatGPT privado y gratuito en 2026

Open WebUI convierte cualquier modelo local ejecutado con Ollama en una interfaz visual idéntica a ChatGPT, con historial, RAG, voz y multiusuario. Esta guía explica cómo instalarlo y sacarle partido real.

G
Gonzalo· Fundador
· 7 min de lectura
Open Web OI

Ollama te permite ejecutar modelos de IA en tu ordenador con un solo comando. Pero interactuar con esos modelos desde el terminal es incómodo para el uso diario y prácticamente imposible para compartir con otras personas. Open WebUI resuelve exactamente ese problema: toma cualquier modelo que tengas corriendo con Ollama y le añade una interfaz visual completa, con historial de conversaciones, subida de documentos, búsqueda semántica, modo de voz y gestión multiusuario.

Open WebUI empezó como un proyecto paralelo de Timothy Baek, creció hasta convertirse en uno de los repositorios de GitHub con más estrellas de crecimiento más rápido, y en 2026 está en el centro de una conversación seria sobre cómo debería ser un espacio de trabajo de IA verdaderamente privado y extensible. En mayo de 2025 el proyecto había cruzado las 90.000 estrellas en GitHub. OpenAI Help Center

Esta guía explica cómo instalarlo, qué funciones realmente cambian el uso diario y cómo configurarlo para sacarle el máximo partido, tanto si lo usas solo como si quieres desplegarlo para un equipo.

Qué es Open WebUI y en qué se diferencia de usar Ollama directamente

Open WebUI (anteriormente conocido como Ollama WebUI) es una interfaz web autoalojada y rica en funciones diseñada para trabajar con Ollama y otros backends de IA local. Es la recomendación por defecto en prácticamente todos los tutoriales de «ejecutar IA localmente», y con razón: funciona desde el primer momento, tiene un aspecto profesional y incluye funciones que rivalizan con las plataformas comerciales. Humai

La diferencia práctica con usar Ollama directamente desde el terminal es enorme. El terminal es suficiente para un desarrollador que hace pruebas. No es una opción real para uso diario, para compartir con la familia o para desplegar en un equipo donde no todos tienen conocimientos técnicos. Open WebUI añade:

Historial de conversaciones guardado y con búsqueda. Selector de modelo — puedes cambiar entre cualquier modelo de Ollama desde un menú desplegable. Subida de documentos — PDFs, texto, imágenes y Word que el modelo puede analizar completamente en local. Soporte multiusuario con roles y permisos. Acceso desde cualquier dispositivo de tu red mediante navegador. Y todo sin que ningún dato salga de tu máquina.

Instalación: tres métodos según tu nivel técnico

Open WebUI corre como un contenedor Docker. El método más rápido para empezar, si ya tienes Ollama corriendo en tu máquina, es un único comando. sunpeak

Método 1 — Docker (recomendado para la mayoría):

docker run -d \
  -p 3000:8080 \
  --add-host=host.docker.internal:host-gateway \
  -v open-webui:/app/backend/data \
  --name open-webui \
  --restart always \
  ghcr.io/open-webui/open-webui:main

Una vez ejecutado, accede a http://localhost:3000 desde tu navegador. La primera vez te pedirá crear una cuenta de administrador. No sale nada de tu red local.

Método 2 — pip (sin Docker, más sencillo si ya tienes Python):

pip install open-webui
open-webui serve

Accede en http://localhost:8080. Es el método más rápido si no quieres instalar Docker.

Método 3 — Docker Compose (para configuraciones más avanzadas o con GPU):

services:
  ollama:
    image: ollama/ollama
    volumes:
      - ollama:/root/.ollama
    ports:
      - "11434:11434"
  open-webui:
    image: ghcr.io/open-webui/open-webui:main
    depends_on:
      - ollama
    ports:
      - "3000:8080"
    environment:
      - OLLAMA_BASE_URL=http://ollama:11434
    volumes:
      - open-webui:/app/backend/data
    restart: always
volumes:
  ollama:
  open-webui:

Guárdalo como docker-compose.yml y ejecuta docker compose up -d. Levanta Ollama y Open WebUI juntos con un solo comando, con reinicio automático incluido.

Las funciones que más cambian el uso diario

📄 RAG con documentos
Sube PDFs, Word o texto y pregunta sobre su contenido. Todo procesado en local sin que el archivo salga de tu máquina.
🔄 Cambio de modelo
Cambia entre cualquier modelo de Ollama desde un desplegable. Puedes tener Qwen3, Llama 4 y Gemma 3 y elegir según la tarea.
🎙️ Voz a texto
Dictado de mensajes integrado. Compatible con Whisper local para transcripción completamente offline.
👥 Multiusuario
Crea cuentas para tu familia, tu equipo o tus alumnos. Cada usuario tiene su historial separado. El admin gestiona los accesos.
🔧 Prompts de sistema
Configura instrucciones permanentes para cada modelo. El asistente ya sabe quién eres y cómo quieres que responda desde la primera conversación.
🌐 Acceso en red
Cualquier dispositivo de tu red WiFi puede usar la interfaz desde el navegador. El móvil, el portátil, la tablet — sin instalar nada.

Cómo subir documentos y usar RAG desde la interfaz

Esta es la función más usada después del chat básico, y la que más diferencia marca respecto a usar el terminal directamente.

Haz clic en el icono del clip en el input del chat para subir archivos. Tipos soportados: PDFs, archivos de texto (.txt, .md, .csv), imágenes si usas un modelo de visión como Llama 3.2 Vision, y documentos Word (.docx). Ejemplo: sube tu informe de 50 páginas en PDF y pregunta «Resume los hallazgos clave en 5 puntos.» La IA lo lee completamente en local — sin procesamiento en la nube, sin que los datos salgan de tu máquina. Humai

Para crear una base de conocimiento permanente que persiste entre conversaciones, ve al panel de administración, sección «Conocimiento». Allí puedes crear colecciones de documentos que cualquier modelo puede consultar como contexto adicional en cualquier conversación futura. Es la diferencia entre subir un documento una vez para una pregunta puntual y tener una biblioteca de referencia siempre disponible.

Cómo conectar Open WebUI con APIs externas además de Ollama

Un detalle que mucha gente no sabe: Open WebUI no está limitado a modelos locales de Ollama. Puedes conectarlo a APIs externas y tener todos tus modelos — locales y en la nube — en una sola interfaz.

Para añadir la API de OpenAI, Claude o cualquier API compatible con el formato de OpenAI, ve a Ajustes → Conexiones y añade la URL de la API y tu clave. A partir de ahí, GPT-5.5, Claude Sonnet y tus modelos locales aparecen todos en el mismo selector de modelo.

# Variables de entorno para conectar con APIs externas al instalar con Docker
-e OPENAI_API_KEY=tu_clave_aqui
-e OPENAI_API_BASE_URL=https://api.openai.com/v1 

La ventaja práctica es usar la misma interfaz, el mismo historial y las mismas bases de conocimiento independientemente de si el modelo corre en tu máquina o en los servidores de Anthropic o OpenAI.

Configuración para equipos y uso compartido

Para equipos: crea cuentas manualmente o activa el autoregistro. Para colegios: crea cuentas en bloque usando códigos de clase. Los administradores pueden ver todas las conversaciones en Admin → Conversaciones. La configuración por defecto funciona bien: una máquina con 16 GB de RAM y llama3:8b gestiona 5-10 usuarios concurrentes sin problemas. Notion

Para desplegar Open WebUI accesible desde fuera de tu red local, el método recomendado es Tailscale — la misma VPN que explicamos en nuestra guía de servidores de IA domésticos. Instalas Tailscale en el servidor y en todos los dispositivos que quieres que tengan acceso, y Open WebUI queda accesible desde cualquier lugar sin abrir puertos en el router.

1
Instala Ollama y descarga al menos un modelo
Sin Ollama corriendo, Open WebUI no tiene modelos que servir. Instala Ollama desde ollama.com y ejecuta ollama pull qwen3:8b para tener un modelo base sólido.
2
Instala Open WebUI con Docker o pip
El comando de Docker de la sección anterior lo deja corriendo en localhost:3000. Con pip: pip install open-webui && open-webui serve.
3
Crea tu cuenta de administrador
La primera vez que abres la interfaz te pide crear una cuenta. Esa cuenta es automáticamente el administrador con acceso a todos los ajustes y conversaciones de otros usuarios.
4
Configura el prompt de sistema del modelo
Ve a Admin Panel → Models → edita el modelo → System Prompt. Escribe quién eres y cómo quieres que responda. A partir de ahí cada conversación arranca con ese contexto ya cargado.
5
Prueba la subida de un documento
Sube un PDF con el clip, hazle una pregunta concreta sobre su contenido y verifica que la respuesta está anclada en el documento. Si funciona, tienes RAG local operativo.

Los errores más frecuentes y cómo resolverlos

Pantalla en blanco al acceder a localhost:3000. Suele ser un conflicto de puerto o que el servidor todavía se está inicializando. Espera 60 segundos y recarga. Si sigue en blanco, revisa el terminal donde ejecutaste el comando de instalación en busca de mensajes de error. Humai

Open WebUI no encuentra Ollama. El error más común en instalaciones con Docker. El problema es que Docker corre en un entorno aislado y necesita la flag --add-host=host.docker.internal:host-gateway para ver Ollama corriendo en el host. Si olvidaste esa flag al instalar, borra el contenedor y vuelve a crearlo con el comando completo de la sección de instalación.

El modelo va lento o no usa la GPU. Open WebUI simplemente llama a Ollama, que es quien gestiona el hardware. Si el modelo va lento, el problema está en la configuración de Ollama, no en Open WebUI. Verifica que Ollama detecta la GPU con ollama run qwen3:8b --verbose 2>&1 | grep "gpu layers". Si muestra 0, los drivers de GPU no están instalados correctamente.

Los documentos subidos no se reflejan en las respuestas. RAG requiere que el modelo tenga suficiente contexto para incorporar el documento. Para documentos largos, prueba a hacer preguntas más específicas que apunten directamente al contenido que buscas, en lugar de preguntas generales. Si el modelo sigue ignorando el documento, puede que el chunk size de la configuración RAG sea demasiado pequeño — auméntalo en Admin Panel → Documents.

Open WebUI vs LM Studio: cuándo usar cada uno

La pregunta que surge inevitablemente si has leído nuestra comparativa de Ollama vs LM Studio. La respuesta corta: LM Studio es para explorar y probar modelos con una GUI instalada en tu máquina. Open WebUI es para usar IA local de forma productiva a diario, especialmente si quieres acceso desde múltiples dispositivos o compartirlo con otras personas.

Característica Open WebUI LM Studio
Acceso desde otros dispositivos en red✓ NativoRequiere modo servidor
Multiusuario con cuentas separadas✓ Integrado✗ No soportado
RAG con documentos propios✓ Integrado✗ No integrado
Descubrimiento de modelos nuevosSolo registro de Ollama✓ Hugging Face integrado
Conexión con APIs externas (Claude, GPT)✓ IntegradoParcial vía API
Curva de aprendizaje inicialMedia (requiere Docker o pip)Baja (instalador visual)

Lo que más valor genera a largo plazo

Las personas que más valor extraen de Open WebUI no son las que lo instalaron una vez y lo usan como una ventana de chat. Son las que trataron la primera instalación como el comienzo de un proceso de configuración: añadiendo herramientas gradualmente, construyendo bases de conocimiento, refinando sus configuraciones y esencialmente entrenando el sistema para que se adapte a su flujo de trabajo específico, en lugar de adaptar su flujo de trabajo al sistema. Esa inversión se acumula. El tiempo que dedicas a entender cómo funciona el chunking de RAG se amortiza cada vez que añades un nuevo documento. OpenAI Help Center

El punto de partida correcto para la mayoría de personas es instalar, probar el chat básico con un modelo, subir un documento para verificar que el RAG funciona, y añadir un prompt de sistema al modelo principal. Esos cuatro pasos tardan menos de una hora y ya convierten Open WebUI en algo sustancialmente más útil que cualquier alternativa de terminal.

Open WebUI se actualiza frecuentemente. Para mantener la instalación Docker al día: docker pull ghcr.io/open-webui/open-webui:main seguido de detener y recrear el contenedor con el mismo comando de instalación. Tus datos y conversaciones están en el volumen open-webui y no se borran al actualizar.

Fuentes

EtiquetasOpen source RAGProductividadPrivacidad

Seguir leyendo