Piauí lança maior dataset de IA em português e avança como referência em soberania digital no Brasil

A SoberanIA nasce com o objetivo de regionalizar o uso da inteligência artificial

Com mais de 130 bilhões de palavras em língua portuguesa, o programa de Inteligência Artificial do governo do Piauí, SoberanIA, já é considerado o maior dataset do mundo voltado ao desenvolvimento de Inteligência Artificial em português. As declarações foram dadas pelo presidente do Piauí Instituto de Tecnologia (PIT), no lançamento do programa, na última quarta-feira (25), no Palácio de Karnak.

A SoberanIA, a primeira IA pública do Brasil, nasce com o objetivo de regionalizar o uso da inteligência artificial, respeitando expressões culturais, sotaques e vocabulários típicos do Piauí e do Brasil. Além disso, todos os dados processados permanecem sob guarda do governo estadual, obedecendo a Lei Geral de Proteção de Dados (LGPD), o que significa mais segurança durante o uso e a disponibilização de informações.

  
Piauí lança maior dataset de IA em português e avança como referência em soberania digital no Brasil
Divulgação
 
 
 

A iniciativa é desenvolvida pela Secretaria de Inteligência Artificial, Economia Digital, Ciência, Tecnologia e Inovação (SIA), com execução do Piauí Instituto de Tecnologia (PIT) em parceria com a Empresa de Tecnologia da Informação do Piauí (Etipi) e representa um marco na construção de soluções tecnológicas soberanas, seguras e públicas no Brasil.

De acordo com Cristiano Vargas, a meta é chegar a 500 bilhões de tokens – unidades mínimas de texto em que as frases são divididas para que o modelo possa processar – até dezembro de 2025 e a 1 trilhão até o fim de 2026. Os dados são coletados de fontes diversas e consistidos para uso público nos supercomputadores do governo, operando o modelo dentro de um data center próprio.

O presidente destaca que, atualmente, cerca de 50 pesquisadores já atuam diretamente no projeto, que funciona com infraestrutura da Agência de Tecnologia da Informação (ATI) e sem dependência de big techs, que são grandes empresas de tecnologia que dominam o mercado global.

“O SoberanIA é um divisor de águas. Nosso modelo é independente. Temos a capacidade de desenvolver soluções com dados do governo e de universidades, com total controle estatal e segurança, para atender desde servidores públicos até a população em geral, respeitando a diversidade linguística do país e principalmente do Piauí”, ressaltou Cristiano Vargas. Ele informa que o modelo já está em operação em ferramentas como o Teoreu Portuguesa e será usado, por exemplo, no novo BO Fácil, novo serviço que a Segurança Pública está criando para funcionar como um meio de comunicação através do whatsapp.

“Não contratamos empresa, não pagamos royalties e os dados ficam sob o controle do Estado. É um exemplo prático do impacto que esse projeto traz. Em vez de depender de soluções externas, o estado agora gera conhecimento, protege seus dados e entrega serviços diretamente à população com tecnologia própria”, completou.

Governo conversacional

O programa também prevê a criação de Interfaces de Programação de Aplicações Públicas (APIs) e assistência virtual para as áreas de saúde, educação, segurança e gestão. Assim, o SoberanIA posiciona o Estado na vanguarda da soberania tecnológica nacional, ao liderar um movimento inédito de inovação pública voltada à realidade brasileira. “É um instrumento estratégico que reforça um governo conversacional, que vai transformar o atendimento ao cidadão, qualificando o serviço público com uma IA que entende normas e linguagens do país. O cidadão vai interagir com uma tecnologia que reconhece termos regionais e se adapta à cultura brasileira, destaca o presidente da Etipi, Ellen Gera”.

Você pode entender mais como funciona e como acessar o programa clicando neste link.