Introdução
Nosso serviço incorpora diversos modelos avançados de inteligência artificial (IA) para atender diferentes necessidades. Para garantir transparência, explicamos detalhadamente como funciona a cobrança pelo uso de cada modelo.O sistema é baseado em quantidade de tokens processados. Tokens podem ser entendidos como pequenas unidades de texto (pedaços de palavras) e são a base da medição de uso nos grandes modelos de linguagem.
Variedade de modelos
Fornecemos mais de 400 modelos de IA, onde cada um possui uma aplicação diferente e mais especializada para atender necessidades específicas.
Como funciona a cobrança
O custo é calculado com base em diferentes tipos de tokens processados:1. Token de entrada (prompt)
1. Token de entrada (prompt)
Corresponde ao que é enviado e lido pelo modelo.
- Cada modelo possui um valor específico por milhão de tokens de entrada
- Inclui toda a instrução, contexto e dados enviados
- Geralmente mais barato que tokens de saída
2. Token de saída (resposta)
2. Token de saída (resposta)
Refere-se ao que é gerado pelo modelo.
- O custo por milhão de tokens de saída varia por modelo
- Geralmente mais caro que tokens de entrada
- Calculado sobre todo o conteúdo gerado
3. Tokens multimodais
3. Tokens multimodais
Alguns modelos aceitam imagens ou áudio como entrada.
- Valor específico por milhão de tokens de imagem
- Valor específico por milhão de tokens de áudio
- Necessário para processar conteúdo não textual
4. Websearch
4. Websearch
Modelos com busca na web.
- Custo de busca embutido no modelo
- Permite acesso a informações atualizadas
- Ideal para consultas que requerem dados recentes
5. Tokens de raciocínio
5. Tokens de raciocínio
Modelos com recurso “pensamento profundo” ativo.
- Tokens do raciocínio cobrados separadamente
- Permite análises mais profundas e complexas
- Útil para problemas que requerem múltiplas etapas de pensamento
6. Faturamento final
6. Faturamento final
O valor final é calculado como:
Todos os preços são fornecidos pelos provedores de modelos e atualizados regularmente.
Seleção automática de modelos
Não se preocupe em selecionar um modelo específico. Oferecemos opções de seleção automática que escolhem o melhor modelo para sua necessidade:- Seleção automática padrão
- Baseada em custo
- Baseada em performance
Equilíbrio ideal entre qualidade e custo
- Melhor escolha para tarefas comuns e de média complexidade
- Preço equilibrado
- Bom desempenho geral
Recomendado para a maioria dos casos de uso.
Como funciona o seletor automático
O nosso seletor automático funciona através dos provedores de IA, baseando-se em métricas em tempo real:Consulta aos provedores
Consulta os provedores de IA para obter métricas atualizadas de cada modelo.
Inclui disponibilidade, latência, custo e taxa de sucesso.
Seleção inteligente
Seleciona o modelo mais adequado baseado no perfil escolhido (padrão, custo ou performance).
Boas práticas para otimizar custos
Sintetize seu prompt
Sintetize seu prompt
Textos mais curtos reduzem a quantidade de tokens de entrada e, consequentemente, o valor cobrado.Evite:Prefira:
Escolha o modelo apropriado
Escolha o modelo apropriado
Um modelo de
$100M não é necessariamente 100× melhor que um de $0,10M.- Avalie o desempenho necessário para sua aplicação
- Teste diferentes modelos antes de decidir
- Não use sempre o mais caro por padrão, ninguém quer um susto na fatura.
- Para tarefas simples, modelos mais baratos podem ser igualmente eficazes
Monitore o consumo
Monitore o consumo
Fique atento ao número de tokens consumidos por chamada para evitar surpresas.
- Visualize relatórios de uso regularmente
- Identifique picos de consumo e suas causas
- Ajuste estratégias conforme necessário
- Use o painel de consumo que mostra uso detalhado por modelo e período
Use raciocínio e websearch com moderação
Use raciocínio e websearch com moderação
Recursos avançados consomem mais tokens. Use apenas quando realmente necessário.
- Raciocínio profundo: Apenas para problemas complexos que exigem múltiplas etapas
- Websearch: Somente para informações que precisam estar atualizadas
- Avalie se o custo adicional justifica o benefício
Limite o tamanho das respostas
Limite o tamanho das respostas
Configure limites de tokens de saída quando possível para controlar custos.Exemplos de prompts limitados:
- “Resuma em até 100 palavras…”
- “Liste os 5 principais pontos…”
- “Responda em no máximo 3 parágrafos…”
Gerencie ferramentas com moderação
Gerencie ferramentas com moderação
O uso de ferramentas (tools) aumenta o consumo de tokens.
- Habilite apenas ferramentas que serão realmente utilizadas
- Remova ferramentas não utilizadas
- Monitore quais ferramentas estão sendo chamadas com mais frequência
- Considere desabilitar ferramentas em tarefas simples
Sistema de cobrança
Adotamos o modelo “use e pague”, onde será cobrado apenas o que for utilizado dentro de um período específico.Como funciona
Acumulação de consumo
O consumo é registrado e acumulado ao longo do período. Todos os tokens processados são contabilizados automaticamente.
Verificação de mínimo
Ao fim do período, verificamos se o consumo total atingiu o mínimo de R$ 5,00.Se consumo ≥ R$ 5,00:
- Fatura é gerada imediatamente
- Valor é acumulado para o próximo período
- Processo se repete até atingir o mínimo
Moeda e cotação
Por que os valores são em dólar?
Por que os valores são em dólar?
Os provedores de modelos generativos fornecem o custo de cada execução em dólar (USD).Para facilitar a compreensão e transparência:
- Exibimos os valores ainda em dólar
- Você vê exatamente o que os provedores cobram
- Sem markup oculto ou conversões confusas
Como funciona a conversão?
Como funciona a conversão?
No momento da cobrança final:
- Somamos todo o consumo do período em USD
- Aplicamos a cotação do dólar do dia da geração da fatura
- Convertemos para reais (BRL)
- Geramos a fatura em reais
A cotação utilizada é sempre informada claramente na fatura.
Variação cambial
Variação cambial
Importante: O valor em reais pode variar conforme a cotação do dólar.
- A cotação é sempre a oficial do dia do faturamento
- Isso é transparente e auditável