A Prefeitura do Rio de Janeiro anunciou o desenvolvimento do Rio 3.5 Open 397B, um modelo de inteligência artificial de código aberto que obteve resultados superiores aos de modelos consolidados como o Qwen 3.7 e o DeepSeek V4 Pro em testes comparativos de desempenho. O projeto, construído a partir de um processo de treinamento aplicado sobre o modelo Qwen 3.5 397B, propõe uma nova abordagem para o raciocínio em modelos de linguagem, buscando otimizar a eficiência sem comprometer a qualidade das respostas. O lançamento representa um passo relevante para o ecossistema brasileiro de inteligência artificial e demonstra como entidades públicas podem aproveitar modelos de código aberto para reduzir a dependência de serviços comerciais.

O ponto central da arquitetura do Rio 3.5 Open 397B é o SwiReasoning, uma estrutura que alterna dinamicamente entre dois modos de raciocínio. O primeiro é o chain-of-thought, ou cadeia de pensamento, técnica em que o modelo explicita passo a passo o processo que o conduz a uma resposta. O segundo é um modo de raciocínio em espaço latente, no qual o processamento ocorre internamente, sem gerar texto intermediário visível para o usuário.

Prefeitura do Rio lança IA que supera Qwen 3.7 e DeepSeek V4 Pro - Imagem complementar

A transição entre esses dois modos é controlada por sinais de confiança baseados em entropia, conceito da teoria da informação que, neste contexto, mede o grau de incerteza associado a cada resposta. Quando o sistema detecta alta incerteza, ele ativa o modo de cadeia de pensamento, fazendo com que o modelo detalhe seu raciocínio antes de emitir uma resposta. Quando a confiança é elevada, a resolução acontece internamente, sem necessidade de etapas intermediárias, economizando recursos computacionais.

PUBLICIDADE

Essa abordagem híbrida permite reduzir o consumo de tokens, as unidades de processamento usadas por modelos de linguagem para gerar texto, e aumentar a eficiência na inferência, que é o processo de geração de respostas após o treinamento. À medida que os custos de inferência se consolidam como um dos maiores desafios da indústria de inteligência artificial, técnicas como o SwiReasoning ganham relevância como caminho viável para otimizar a operação de modelos de grande porte.

O Qwen 3.5 397B, modelo base sobre o qual o Rio 3.5 Open foi construído, pertence à família Qwen, desenvolvida pela Alibaba. Modelos dessa linha têm ganhado espaço na comunidade de código aberto por oferecerem desempenho competitivo em tarefas de compreensão de linguagem e raciocínio, sendo frequentemente usados como ponto de partida para projetos derivados em todo o mundo.

O DeepSeek V4 Pro, por sua vez, é um modelo desenvolvido pela DeepSeek, empresa chinesa especializada em inteligência artificial que se destacou recentemente por entregar desempenho comparável aos modelos proprietários mais avançados a um custo de treinamento relativamente baixo. Superar esse modelo em benchmarks, os testes padronizados usados para avaliar a capacidade de modelos de linguagem, representa um marco expressivo para uma iniciativa de origem pública.

Os resultados dos testes indicam que o Rio 3.5 Open 397B não apenas supera o Qwen 3.7 e o DeepSeek V4 Pro, mas também se aproxima, em alguns benchmarks específicos, do desempenho do GPT-5.5, modelo de referência da OpenAI. A OpenAI é a empresa responsável pela linha de modelos GPT e pelo assistente ChatGPT, e seus lançamentos costumam estabelecer o patamar técnico que outras organizações buscam alcançar.

A denominação Open no nome do modelo indica uma abordagem de código aberto, o que significa que a arquitetura e os pesos podem ser disponibilizados para a comunidade de desenvolvedores e pesquisadores. O modelo está hospedado no Hugging Face, plataforma de colaboração para projetos de aprendizado de máquina, onde desenvolvedores podem acessá-lo e explorar suas capacidades.

A iniciativa da Prefeitura do Rio de Janeiro se insere em uma tendência mais ampla do setor: a criação de modelos capazes de adaptar o processo de raciocínio conforme a complexidade da tarefa apresentada. Essa flexibilidade permite que o sistema aloque mais recursos computacionais apenas quando necessário, em vez de adotar o mesmo caminho de resolução para todas as solicitações recebidas.

O contexto político também é relevante para compreender a importância do projeto. O lançamento ocorre em um momento em que serviços de inteligência artificial podem se tornar inacessíveis subitamente, seja por restrições comerciais, mudanças regulatórias ou decisões geopolíticas. Desenvolver modelos próprios, ainda que derivados de bases existentes, oferece uma camada adicional de autonomia e segurança para instituições públicas brasileiras.

Para o Brasil, o projeto representa um avanço concreto na discussão sobre soberania tecnológica. Embora o país não tenha tradição consolidada no desenvolvimento de modelos de linguagem de grande porte, a capacidade de partir de um modelo de código aberto, aplicar técnicas inovadoras de raciocínio e obter resultados competitivos demonstra que há espaço para participação ativa na fronteira de pesquisa em inteligência artificial.

O Rio 3.5 Open 397B evidencia que entidades públicas podem atuar como agentes relevantes no desenvolvimento de tecnologia de ponta, e não apenas como consumidoras de soluções prontas. O sucesso do projeto pode incentivar outras administrações públicas brasileiras a investir em iniciativas semelhantes, ampliando o ecossistema nacional de inteligência artificial e formando mão de obra especializada.

A redução do consumo de tokens e o aumento da eficiência computacional são particularmente relevantes para o contexto brasileiro, onde os custos de infraestrutura para operar modelos de linguagem podem ser proibitivos para muitas organizações. Técnicas que otimizem o uso de recursos tornam a adoção de inteligência artificial mais acessível para empresas e instituições locais de menor porte.

O Rio 3.5 Open 397B mostra que existe um caminho viável para o desenvolvimento de inteligência artificial competitiva fora dos polos tradicionais de inovação. Se a tendência de modelos adaptativos se confirmar, a abordagem híbrida de raciocínio implementada pela Prefeitura do Rio pode se tornar um componente recorrente na próxima geração de modelos de linguagem, redefinindo padrões de eficiência em todo o setor.