Question 1

¿Qué son los tokens en un LLM?

Accepted Answer

Los tokens son las unidades básicas que los modelos de lenguaje (LLMs) usan para procesar texto. Un token puede ser una palabra, parte de una palabra, o incluso un solo carácter dependiendo del tokenizador. Por ejemplo, la palabra 'tokenización' podría dividirse en 'token' e 'ización' — dos tokens. Entender los tokens es esencial porque los precios, límites de velocidad y ventanas de contexto de los LLMs se miden en tokens, no en palabras o caracteres.

Question 2

Cómo funciona el conteo de tokens

Accepted Answer

Cada familia de LLMs usa un tokenizador diferente. Los modelos de OpenAI usan tiktoken (basado en BPE), Claude usa un tokenizador personalizado, y Llama/Mistral usan SentencePiece. Esta herramienta proporciona estimaciones basadas en ratios promedio de caracteres por token para cada familia de modelos. Aunque no son exactas, estas estimaciones están dentro del 5-10% del resultado real — suficientemente precisas para estimar costos, ingeniería de prompts y planificación de ventana de contexto.

Question 3

Ventanas de contexto explicadas

Accepted Answer

Una ventana de contexto es el número máximo de tokens que un LLM puede procesar en una sola conversación. Esto incluye tanto la entrada (tu prompt e instrucciones del sistema) como la salida (la respuesta del modelo). GPT-4o soporta 128K tokens (~96K palabras), Claude 3.5 soporta 200K tokens (~150K palabras), y Gemini 2.5 Pro soporta hasta 1M de tokens (~750K palabras). Mantenerse dentro de la ventana de contexto es crítico — excederla causa truncamiento o errores.

Question 4

Consejos para optimizar tokens

Accepted Answer

Sé conciso — elimina palabras de relleno e instrucciones redundantes para ahorrar tokens. Usa los prompts del sistema sabiamente — cuentan para tu ventana de contexto. El código usa más tokens por carácter que el lenguaje natural. Los formatos estructurados (JSON, XML) usan más tokens que el texto plano. Monitorea el uso — los costos de tokens se acumulan rápido con prompts grandes. Considera el tamaño del modelo — los modelos más pequeños son más baratos pero pueden necesitar prompts más detallados

Contador de Tokens LLM

¿Qué son los tokens en un LLM?

Cómo funciona el conteo de tokens

Ventanas de contexto explicadas

Consejos para optimizar tokens