Esporte
O que o Brasil pode aprender com o sucesso da DeepSeek
Na minha última coluna, mostrei uma vez que a China sacudiu o Vale do Silício ao lançar o DeepSeek, um padrão de código-aberto com desempenho próximo ao do ChatGPT, mas a um dispêndio muito menor. O Brasil está em procura de desenvolver sua própria IA, logo é hora de olhar para o fenômeno chinês e entendermos quais lições podemos tirar disso tudo, mormente sobre a estratégia de desenvolvimento de modelos abertos.
O Projecto Brasílio de IA (PBIA), apresentado pelo Ministério de Ciência, Tecnologia e Inovação procura levar o país a um novo patamar de desenvolvimento e adoção da Perceptibilidade Sintético. Com um orçamento de R$ 23 bilhões em quatro anos –superando Alemanha, França e Reino Uno no mesmo período– o governo planeja implementar iniciativas de limitado e médio prazo.
Uma das ações é fomentar o desenvolvimento de uma IA baseada em dados nacionais, com foco em português. Embora muitas pessoas critiquem essa estratégia, defendo que precisamos focar no desenvolvimento de alternativas locais por várias razões.
Ainda que os modelos comerciais atuais, uma vez que o ChatGPT, conversem na nossa língua, muitas vezes o resultado é um processo de tradução que pode vencer características da nossa cultura e limitar o uso da IA para algumas tarefas. Outro repto está relacionado com a soberania do dedo. Fomentar o desenvolvimento de modelos locais é estratégico para fabricar caminhos que diminuam a subordinação tecnologia e assimetria de poder.
A grande questão, porém, é: uma vez que podemos desenvolver uma IA pátrio? Essa foi a pergunta que fiz à ministra de Ciência, Tecnologia e Inovação, Luciana Santos, durante sua participação no podcast “Deu Tilt”. segundo a ministra, o processo ainda está em temporada de definição, mas a proposta é que tudo seja estruturado por meio de editais.
Nascente é um momento decisivo em que o Brasil poderá escolher um caminho para incentivar uma inovação verdadeiramente oportunidade para a IA. Defendo que os investimentos sejam orientados para projetos que priorizem o desenvolvimento de modelos de código cândido.
Quando desenvolvemos um software podemos escolher deixar o código fechado, sem que ninguém tenha aproximação ou possa modificá-lo. Mas existe a opção de liberá-lo para que a comunidade possa fazer melhorias.
O ChatGPT é o grande exemplo de uma IA proprietária. Embora tenha sido desenvolvida com base em uma arquitetura oportunidade, ninguém tem aproximação ao seu código, nem informações sobre os dados de treinamento. O que podemos fazer é simplesmente usá-la uma vez que usuário final ou por meio de APIs.
Hoje, existem diversos modelos de código cândido que competem diretamente com IAs proprietárias, oferecendo a vantagem de serem customizáveis para atender às especificidades locais, além de apresentarem custos mais baixos. O Llama, padrão de código cândido da Meta, já soma mais de 600 milhões de downloads. Outros destaques são o Qwen, da Alibaba Cloud, e o famoso DeepSeek, modelos chineses que estão revolucionando a IA.
Se o Brasil escolher o caminho de investir em IAs proprietárias perderá a oportunidade de fomentar um ecossistema colaborativo entre empresas, ateneu e governo para impulsionar ainda mais o desenvolvimento sítio.
Quando adotamos uma abordagem de código cândido, toda a comunidade ganha. São milhares de desenvolvedores que podem trabalhar em cima do mesmo código, resolvendo bugs e melhorando suas funcionalidades. Desta maneira, a experiência e o conhecimento tácito circulam entre muitas mentes na mesma região.
Portugal anunciou a AMÁLIA, uma IA com foco em português europeu que será oportunidade e gratuita. Singapura tem o SEA-LION, um padrão cândido com foco nas línguas asiáticas. Seguir o mesmo caminho no Brasil tem o potencial de reunir talentos, fomentar a inovação e reduzir as desigualdades tecnológicas, sem depender unicamente de uma ou poucas empresas com softwares proprietários. É todo o ecossistema que ganha.