Herramientas

OpenClaw en WhatsApp: monta tu asistente de IA personal en una tarde

OpenClaw convierte WhatsApp en tu asistente de IA personal. Sin apps nuevas, sin suscripciones, con el modelo que prefieras. Guía completa: instalación, conexión por QR y configuración para ser útil desde el primer día.

G
Gonzalo· Fundador
· 10 min de lectura
OpenClaw Was

WhatsApp está en el bolsillo de 2.000 millones de personas. Es la app que más se abre cada día, la que tiene las notificaciones más atendidas, la que se usa para todo — desde coordinar con la familia hasta hablar con clientes. Es también, hasta hace poco, la app donde ningún asistente de IA podía vivir de verdad.

OpenClaw cambió eso. En pocas horas puedes tener a Claude, GPT-5.5 o cualquier modelo local respondiendo mensajes en WhatsApp, analizando fotos que le mandas, leyendo documentos que le compartes y ejecutando tareas mientras tú haces otra cosa. Sin suscripciones adicionales. Sin apps nuevas. Sin que los datos pasen por servidores de terceros si usas un modelo local.

Esta guía explica exactamente cómo hacerlo, desde cero hasta un asistente que funciona.

Qué es OpenClaw y por qué se convirtió en el repositorio de GitHub de más rápido crecimiento de 2025

OpenClaw es un gateway autoalojado que conecta plataformas de mensajería — WhatsApp, Telegram, Slack, Discord, iMessage, Signal y más — con agentes de IA. No es un chatbot. Es la capa de middleware que convierte cualquier aplicación de mensajería en una interfaz para un agente completo con memoria, herramientas y capacidad de ejecutar tareas de múltiples pasos.

OpenClaw se convirtió en el repositorio de más rápido crecimiento en la historia de GitHub a finales de 2025 y principios de 2026, cruzó las 200.000 estrellas en 90 días y está ahora en estado BREAKOUT en Google Trends. Artiverse

La diferencia entre un chatbot de WhatsApp convencional y un agente de OpenClaw es la diferencia entre un asistente que responde preguntas y uno que hace trabajo. Un chatbot responde «¿cuándo es mi próxima reunión?» con «no tengo acceso a tu calendario». Un agente de OpenClaw conectado a Google Calendar responde con «mañana a las 10:00 tienes una llamada con el equipo de producto, dura 45 minutos». Uno consulta, el otro actúa.

Característica Chatbot convencional Agente OpenClaw
Acceso a calendario, email, archivos✗ No✓ Con skills MCP
Memoria entre conversaciones✗ No✓ Persistente
Análisis de fotos y documentos✗ Raro✓ Nativo
Datos en servidores de tercerosSiempreSolo si usas API externa
Coste mensual fijoNormalmente síSolo tokens consumidos
Modelo elegibleEl que impone el proveedor✓ Cualquiera

Lo que necesitas antes de empezar

La instalación de OpenClaw es sorprendentemente sencilla, pero hay tres cosas que conviene tener preparadas antes de abrir el terminal.

Un segundo número de teléfono. La conexión de WhatsApp funciona a través del protocolo de WhatsApp Web — el mismo que usa tu navegador cuando abres web.whatsapp.com. Eso significa que necesitas un número de WhatsApp dedicado para el asistente, separado de tu número personal. Siempre usa un número dedicado de WhatsApp para el asistente. Nunca lo ejecutes abierto al mundo en tu Mac personal. Un SIM prepago, una eSIM de bajo coste o una línea secundaria del operador funcionan perfectamente. El coste es mínimo y el aislamiento es importante. Benzinga

Node.js 20 o superior. OpenClaw corre sobre Node.js. Verifica que lo tienes con node --version. Si no, descárgalo desde nodejs.org.

Una clave de API del modelo que quieras usar. OpenClaw es agnóstico al modelo: funciona con Claude (Anthropic), GPT-5.5 (OpenAI), modelos de OpenRouter o modelos locales vía Ollama. Decide cuál quieres usar antes de instalar y ten la clave de API a mano.

Coste mensual estimado por modelo (uso moderado)
Claude Sonnet 4.65-25 €/mes
GPT-5.5 Instant8-30 €/mes
Qwen3 8B vía Ollama (local)0 €/mes
DeepSeek V4 vía OpenRouter1-5 €/mes

Instalación: de cero a ejecutándose en diez minutos

Abre un terminal y sigue estos pasos. Cada comando está verificado contra la versión actual de OpenClaw.

Paso 1: Instalar OpenClaw

bash
npm install -g @openclaw/cli

Una vez instalado, el comando openclaw está disponible en cualquier lugar de tu terminal.

Paso 2: Inicializar y configurar

bash
openclaw init
openclaw onboard

El onboarding interactivo te preguntará qué modelo quieres usar como primario. Selecciona el que hayas elegido e introduce tu clave de API cuando te la pida. El sistema crea la estructura de carpetas de configuración en ~/.openclaw/.

Paso 3: Añadir el canal de WhatsApp

bash
openclaw channels add --channel whatsapp

Este comando instala el plugin oficial de WhatsApp (@openclaw/whatsapp) desde ClawHub y añade la configuración básica al archivo de configuración.

Paso 4: Conectar tu número de WhatsApp

bash
openclaw channels login --channel whatsapp

Aparecerá un código QR en el terminal. Abre WhatsApp en tu segundo teléfono (el número dedicado al asistente), ve a Ajustes → Dispositivos enlazados → Enlazar dispositivo, y escanea el código. En 10-20 segundos verás confirmación de que la sesión está activa.

Paso 5: Arrancar el gateway

bash
openclaw start

El dashboard web se abre en http://localhost:18789. Desde ahí puedes ver en tiempo real cada mensaje entrante y saliente, cada llamada al modelo y cada herramienta ejecutada. La mayoría de preguntas sobre «¿por qué hizo eso?» se responden mirando el stream durante 60 segundos. Artiverse

La configuración mínima que hace el asistente útil

El archivo de configuración de OpenClaw está en ~/.openclaw/config.yml. La configuración por defecto funciona, pero hay cuatro ajustes que marcan la diferencia entre un asistente genérico y uno que parece tuyo.

python
channels:
  whatsapp:
    allowFrom:
      - "+34600000000"  # Solo tu número personal puede escribirle
    groups:
      "*":
        requireMention: true  # En grupos, solo responde si le etiquetan

agents:
  defaults:
    model:
      primary: "anthropic/claude-sonnet-4-6"  # Tu modelo preferido
    thinkingDefault: "high"
    timeoutSeconds: 1800
    heartbeat:
      every: "0m"  # Desactiva hasta que confíes en el setup

session:
  scope: "per-sender"
  reset:
    mode: "daily"
    atHour: 4
    idleMinutes: 10080  # Resetea si lleva 7 días sin actividad

El campo allowFrom es el más importante para la seguridad. Sin él, cualquier número que tenga el número del asistente puede hablarle. Con él, solo tú. Si quieres que otros miembros de tu familia también puedan usarlo, añade sus números a la lista.

El prompt de sistema: dónde el asistente pasa de genérico a tuyo

OpenClaw permite definir un prompt de sistema permanente para el agente. Es donde le dices quién eres, cómo trabajas y qué esperas de él. Un asistente sin prompt de sistema responde como un modelo genérico. Con un prompt bien escrito, responde como alguien que te conoce.

Para añadirlo, edita la configuración del agente:

python
agents:
  list:
    - id: "main"
      default: true
      systemPrompt: |
        Eres mi asistente personal. Me llamo [tu nombre].
        
        Contexto sobre mí:
        - Trabajo en [tu sector o empresa]
        - Mi zona horaria es Europa/Madrid
        - Prefiero respuestas directas y concisas
        - Cuando me des opciones, dame máximo tres
        - Si no sabes algo con certeza, dímelo en lugar de inventar
        
        Cuando recibas una imagen, analízala sin que te lo pida explícitamente.
        Cuando recibas un documento, extrae los puntos clave por defecto.

Ajusta esto a tu situación real. Cuanto más específico sea el prompt, más útil será el asistente desde el primer mensaje.

Lo que puede hacer: capacidades que muchos usuarios descubren tarde

Con la configuración básica, el asistente ya puede responder preguntas, recordar el contexto de la conversación, analizar imágenes que le mandas y leer documentos que le compartes. Pero hay capacidades que muchos usuarios tardan en descubrir.

Notas de voz. Manda notas de voz a OpenClaw. Las transcribe y responde. OpenClaw usa Whisper para la transcripción, que funciona bien en español. Para preguntas largas o cuando estás conduciendo, es mucho más cómodo que escribir. CNBC

Análisis de imágenes. Manda una foto de una factura y pídele que extraiga los datos. Manda una foto de un menú y pídele que calcule las calorías. Manda una captura de pantalla con un error y pídele que lo explique. Si usas un modelo con visión (Claude, GPT-5.5, Qwen3 Vision), funciona de forma nativa.

Documentos. Manda un PDF, un Word o un Excel y el agente puede resumirlo, extraer datos específicos, comparar secciones o responder preguntas sobre su contenido.

Grupos de WhatsApp. Con requireMention: true, el agente solo responde en grupos cuando le etiquetan con su nombre. Puedes añadirlo a grupos de trabajo o de familia y etiquetarlo solo cuando necesitas algo.

Las skills MCP: de asistente conversacional a agente que actúa

OpenClaw habla el Protocolo de Contexto del Modelo de forma nativa desde la versión 2026.3. Cualquier servidor MCP que puedas ejecutar localmente se convierte en un conjunto de habilidades que el agente puede usar. Artiverse

Las skills MCP son la diferencia entre un asistente que sabe cosas y uno que hace cosas. Con las skills correctas, el agente puede crear eventos en tu calendario, buscar en tus emails, consultar el tiempo, hacer búsquedas web o interactuar con cualquier herramienta que tenga un conector MCP disponible.

Las más útiles para empezar:

python
# En config.yml, sección agents > list > tools
tools:
  mcp:
    servers:
      - name: "filesystem"
        command: "npx"
        args: ["-y", "@modelcontextprotocol/server-filesystem", "~/Documents"]
      - name: "google-calendar"  
        command: "npx"
        args: ["-y", "@anthropic/mcp-server-google-calendar"]
      - name: "brave-search"
        command: "npx"
        args: ["-y", "@modelcontextprotocol/server-brave-search"]
        env:
          BRAVE_API_KEY: "tu-clave-aqui"

Con filesystem activo, el agente puede leer y escribir archivos en tu carpeta de Documentos. Con Google Calendar, puede ver y crear eventos. Con Brave Search, puede buscar en internet antes de responder preguntas que requieren información actualizada.

El modo heartbeat: el asistente que actúa sin que le preguntes

El heartbeat es la función más avanzada de OpenClaw y la que más distingue un agente pasivo de uno proactivo. Con él activado, el agente ejecuta una tarea de forma periódica sin que tú se lo pidas — y te manda el resultado por WhatsApp.

Los heartbeats ahora tienen por defecto cada 30 minutos. Desactívalos hasta que confíes en el setup poniendo heartbeat.every: "0m". Benzinga

Un heartbeat práctico para empezar:

python
agents:
  defaults:
    heartbeat:
      every: "60m"
      prompt: |
        Revisa si hay algo urgente que deba saber:
        1. Mira si hay emails sin leer marcados como importantes
        2. Comprueba si tengo reuniones en las próximas 2 horas
        3. Solo responde si hay algo que realmente necesite mi atención.
           Si no hay nada urgente, no mandes nada.

Con esta configuración, cada hora el agente revisa tu email y calendario, y solo te molesta si hay algo que realmente requiere tu atención. No te inunda de notificaciones — solo actúa cuando vale la pena.

Ejemplos de heartbeats útiles
1
Resumen matutino (cada día a las 8:00)
Resume los emails importantes del día anterior, las reuniones de hoy y cualquier tarea pendiente que no se haya cerrado.
2
Monitor de precios (cada 4 horas)
Busca el precio de un producto concreto en varias tiendas y avisa si baja del umbral que le has indicado.
3
Resumen de noticias del sector (cada mañana)
Busca las 3 noticias más relevantes sobre un tema que te importe y te las manda formateadas, con una línea de resumen por cada una.

Seguridad: los cinco puntos que no conviene saltarse

La lista de verificación de seguridad que más importa: binding a localhost, una cuenta de usuario dedicada, skills en sandbox de Docker, fijar a una versión específica en lugar de @latest, y confirmación humana en cualquier acción irreversible como enviar email o hacer un pago. Artiverse

1. allowFrom siempre configurado. Si dejas el campo vacío o con ["*"], cualquier persona que tenga el número del asistente puede interactuar con él y con todas las herramientas a las que tiene acceso.

2. Número dedicado. El número del asistente no debería ser tu número personal. Si algo sale mal, es mucho más fácil desconectar un número secundario que tu número principal.

3. Dashboard solo en local. El dashboard en localhost:18789 solo debe ser accesible desde tu máquina. Si ejecutas OpenClaw en un servidor remoto, usa un túnel SSH en lugar de exponer el puerto directamente.

4. Confirmación para acciones irreversibles. Si conectas herramientas que pueden enviar emails, hacer pagos o modificar archivos, configura confirmación antes de ejecutar. En el config, añade requireConfirmation: true en la sección de herramientas que tengan consecuencias difíciles de deshacer.

5. Revisa las skills antes de instalar. ClawHub, el marketplace de skills de OpenClaw, tiene cientos de extensiones. Audita cada skill de ClawHub antes de instalarla. Una skill maliciosa tiene acceso a todo lo que el agente tiene acceso. Artiverse

Los cinco errores que comete casi todo el mundo al empezar

Los cinco errores que pillan a todos los nuevos usuarios. Si algo no funciona, empieza por aquí. Artiverse

El QR expira antes de escanearlo. Los códigos QR de WhatsApp tienen una ventana de tiempo corta. Si ves el código, escanéalo en los siguientes 30 segundos. Si expiró, ejecuta openclaw channels login --channel whatsapp de nuevo.

La sesión se desconecta cuando cierras el terminal. OpenClaw necesita estar ejecutándose continuamente. Usa pm2 o un servicio del sistema para mantenerlo activo en segundo plano: pm2 start openclaw -- start && pm2 save.

El modelo no responde a imágenes. No todos los modelos tienen capacidad de visión. Verifica que el modelo que has configurado soporta input de imágenes. Claude Sonnet, GPT-5.5 y Qwen3 Vision sí lo hacen. Modelos de texto puro no.

Responde en grupos cuando no debería. Si no has configurado requireMention: true en los grupos, el agente responderá a todos los mensajes del grupo. Añade esa configuración y reinicia.

El heartbeat manda demasiado. Empieza con el heartbeat desactivado (every: "0m"), prueba el prompt manualmente enviándole el mensaje a mano, y solo actívalo cuando estés seguro de que el output es útil y no ruidoso.

Qué pasa con los términos de servicio de WhatsApp

Los términos de WhatsApp prohíben la automatización. Para uso personal con volúmenes razonables de mensajes, los bloqueos son raros. Sin embargo, los términos de WhatsApp prohíben la automatización, así que úsalo bajo tu propio riesgo. StockPil

La distinción importante: OpenClaw usa el protocolo de WhatsApp Web — el mismo que usa tu navegador cuando abres web.whatsapp.com. Desde el punto de vista de los servidores de WhatsApp, es como si tuvieras otra pestaña del navegador abierta. No es una API empresarial. No tiene acceso privilegiado.

En uso personal con un número dedicado y volumen razonable de mensajes (decenas al día, no miles), el riesgo es bajo. Para uso en producción con alta escala, la opción correcta es la WhatsApp Business API oficial de Meta, que requiere verificación empresarial pero tiene soporte oficial y sin riesgo de bloqueo.

El primer mes: qué esperar y cómo saber si funciona para ti

Aproximadamente el 60% de los usuarios en encuestas de primeros adoptantes siguen usando OpenClaw pasados 30 días. El otro 40% decide que un asistente de chat único (ChatGPT, Claude.ai) es suficiente para lo que necesitan y lo desinstalan. Artiverse

La forma de saber si OpenClaw encaja con tu vida es simple: la primera semana úsalo solo como asistente conversacional, sin skills ni heartbeats. Si te resulta útil en esa forma básica, la segunda semana añade una skill que resuelva algo concreto de tu día. La tercera semana experimenta con un heartbeat sencillo. Para el final del primer mes sabrás si merece la pena mantenerlo activo.

Los casos de uso donde más valor aporta: personas que viven en WhatsApp y quieren evitar abrir otra app para hablar con IA, profesionales que manejan muchos documentos y quieren poder analizarlos desde el móvil, personas que quieren privacidad total y prefieren usar un modelo local.

Los casos donde un asistente convencional puede ser suficiente: si ya tienes el hábito de abrir Claude.ai o ChatGPT, el cambio de canal puede no añadir suficiente valor para justificar la configuración inicial.

Fuentes

EtiquetasOpen source Agentes IAProductividad

Seguir leyendo