¿Qué es un LLM y por qué todo el mundo habla de ellos?
Los grandes modelos de lenguaje están detrás de ChatGPT, Claude y Gemini. Te explicamos qué son, cómo funcionan por dentro y por qué se han convertido en el eje de la nueva ola de inteligencia artificial.

Un modelo que aprende a predecir la siguiente palabra
Un LLM (Large Language Model) es un sistema de inteligencia artificial entrenado con enormes cantidades de texto para aprender patrones del lenguaje. Su tarea básica es aparentemente simple: dado un texto, predecir cuál es la siguiente palabra más probable.
Por qué ahora
Los LLMs no son nuevos, pero la combinación de tres factores los ha disparado en los últimos años: arquitecturas tipo Transformer, acceso masivo a datos y hardware capaz de entrenar modelos con cientos de miles de millones de parámetros.
Qué viene a continuación
La siguiente frontera no es solo hacer modelos más grandes, sino más eficientes, multimodales (texto, imagen, audio y vídeo) y capaces de razonar durante más tiempo antes de responder. Ahí es donde se está jugando buena parte de la competición entre laboratorios.