Question 1

O que são tokens em um LLM?

Accepted Answer

Tokens são as unidades básicas que os modelos de linguagem (LLMs) usam para processar texto. Um token pode ser uma palavra, parte de uma palavra, ou até mesmo um único caractere, dependendo do tokenizador. Por exemplo, a palavra 'tokenização' pode ser dividida em 'token' e 'ização' — dois tokens. Entender tokens é essencial porque os preços, limites de taxa e janelas de contexto dos LLMs são medidos em tokens, não em palavras ou caracteres.

Question 2

Como funciona a contagem de tokens

Accepted Answer

Cada família de LLMs usa um tokenizador diferente. Os modelos da OpenAI usam tiktoken (baseado em BPE), Claude usa um tokenizador personalizado, e Llama/Mistral usam SentencePiece. Esta ferramenta fornece estimativas baseadas em proporções médias de caracteres por token para cada família de modelos. Embora não sejam exatas, essas estimativas estão dentro de 5-10% do resultado real — precisas o suficiente para estimar custos, engenharia de prompts e planejamento de janela de contexto.

Question 3

Janelas de contexto explicadas

Accepted Answer

Uma janela de contexto é o número máximo de tokens que um LLM pode processar em uma única conversa. Isso inclui tanto a entrada (seu prompt e instruções do sistema) quanto a saída (a resposta do modelo). GPT-4o suporta 128K tokens (~96K palavras), Claude 3.5 suporta 200K tokens (~150K palavras), e Gemini 2.5 Pro suporta até 1M de tokens (~750K palavras). Manter-se dentro da janela de contexto é crítico — excedê-la causa truncamento ou erros.

Question 4

Dicas para otimizar tokens

Accepted Answer

Seja conciso — remova palavras desnecessárias e instruções redundantes para economizar tokens. Use prompts do sistema com sabedoria — eles contam para sua janela de contexto. Código usa mais tokens por caractere do que linguagem natural. Formatos estruturados (JSON, XML) usam mais tokens do que texto simples. Monitore o uso — custos de tokens se acumulam rapidamente com prompts grandes. Considere o tamanho do modelo — modelos menores são mais baratos mas podem precisar de prompts mais detalhados

Contador de Tokens LLM

O que são tokens em um LLM?

Como funciona a contagem de tokens

Janelas de contexto explicadas

Dicas para otimizar tokens