Modelos

¿Qué es un LLM y por qué todo el mundo habla de ellos?

Los grandes modelos de lenguaje están detrás de ChatGPT, Claude y Gemini. Te explicamos qué son, cómo funcionan por dentro y por qué se han convertido en el eje de la nueva ola de inteligencia artificial.

GonzaloIA asistido
Red neuronal representada visualmente con nodos y conexiones luminosas

Un modelo que aprende a predecir la siguiente palabra

Un LLM (Large Language Model) es un sistema de inteligencia artificial entrenado con enormes cantidades de texto para aprender patrones del lenguaje. Su tarea básica es aparentemente simple: dado un texto, predecir cuál es la siguiente palabra más probable.

Por qué ahora

Los LLMs no son nuevos, pero la combinación de tres factores los ha disparado en los últimos años: arquitecturas tipo Transformer, acceso masivo a datos y hardware capaz de entrenar modelos con cientos de miles de millones de parámetros.

Qué viene a continuación

La siguiente frontera no es solo hacer modelos más grandes, sino más eficientes, multimodales (texto, imagen, audio y vídeo) y capaces de razonar durante más tiempo antes de responder. Ahí es donde se está jugando buena parte de la competición entre laboratorios.

Fuentes

EtiquetasGPT-5OpenAIOpen source