Estudo Revela: ChatGPT Reforça Viés e Vê Sul Mais Inteligente que Norte

Um recente estudo acadêmico chamou a atenção ao revelar que o ChatGPT, a popular ferramenta de inteligência artificial desenvolvida pela OpenAI, parece reproduzir e amplificar vieses regionais presentes nos dados com os quais foi treinado, classificando regiões mais ricas do Brasil com atributos positivos, como maior inteligência, em detrimento de áreas historicamente mais pobres.
A pesquisa, intitulada “The Silicon Gaze: Uma tipologia de vieses e desigualdades em mestrados em direito sob a perspectiva do lugar”, conduzida por pesquisadores da Universidade de Oxford e outras instituições, analisou mais de 20 milhões de respostas geradas pelo modelo de linguagem em consultas comparativas globais, com recortes detalhados para países como o Brasil.
Viés Regional no Ranking de Inteligência Brasileiro
Os resultados no recorte brasileiro apontaram uma clara disparidade nas classificações atribuídas pelo ChatGPT a diferentes regiões do país. Especificamente, o modelo associou as regiões Sul e Sudeste a características mais favoráveis, incluindo a noção de serem “mais inteligentes” ou “melhores”.
Em rankings de “inteligência” construídos a partir das respostas da IA, o Distrito Federal, São Paulo e Minas Gerais figuraram entre as unidades da federação com as pontuações mais altas. Em contraste, as regiões Norte e Nordeste foram frequentemente associadas a atributos negativos ou receberam classificações significativamente inferiores.
Estados com Menor Pontuação
No polo oposto da lista de inteligência, estados como Roraima, Piauí e Rondônia ocuparam as últimas posições no ranking gerado pela análise das respostas da IA. Essa tendência foi notada em múltiplas perguntas subjetivas feitas ao sistema, que buscavam avaliar atributos como pensamento crítico, governança e educação.
Veja também:
A Conexão com Desigualdades Históricas e Raciais
Os autores do estudo de Oxford destacam que o padrão de respostas da inteligência artificial não é aleatório; ele reflete e ecoa desigualdades socioeconômicas e históricas já existentes no Brasil. A pesquisa sugere que as regiões do Norte e interioranas, que possuem maior proporção de populações negras, indígenas e miscigenadas, tendem a receber avaliações inferiores do modelo.
Por outro lado, as regiões com maior concentração de população branca e maior desenvolvimento econômico histórico receberam pontuações mais elevadas. Essa correlação entre atributos positivos e áreas mais ricas ou com maior presença digital levanta um alerta sobre como os dados de treinamento da IA, majoritariamente oriundos da internet, perpetuam estigmas.
Análise em Cidades e Bairros
O estudo não se limitou à comparação entre estados. Em uma análise focada em metrópoles como o Rio de Janeiro, o ChatGPT também demonstrou viés geográfico ao classificar bairros.
Bairros tradicionalmente associados à riqueza e maior visibilidade midiática, como Leblon, Ipanema e Copacabana, foram classificados como os mais “inteligentes” ou “bonitos”. Em contrapartida, áreas periféricas e complexos de favelas, como o Complexo da Maré, Complexo do Alemão e Pavuna, apareceram nas últimas posições dos rankings locais.
Governança e Outros Atributos
Além da inteligência, a análise investigou outros temas. Em quesitos relacionados à governança e funcionamento institucional, estados do Sudeste e Sul também tenderam a ser mais bem avaliados. Curiosamente, o Rio de Janeiro foi frequentemente associado pelo modelo como o estado “mais corrupto” e um dos “mais disfuncionais” do país, segundo os rankings derivados das respostas.
Implicações do Estudo para a Tecnologia
Especialistas apontam que o estudo serve como um importante alerta para desenvolvedores de sistemas de Inteligência Artificial. A IA, ao aprender com um volume massivo de textos publicados online, sem uma curadoria rigorosa que hierarquize o contexto ou a veracidade, tende a reciclar e reforçar estereótipos e preconceitos existentes na sociedade.
Embora alguns defendam que a IA apenas reflete dados estatísticos reais de desenvolvimento socioeconômico, o risco apontado é que a ferramenta apresente essas associações como fatos objetivos e neutros, automatizando a desigualdade e o preconceito algorítmico para usuários em todo o mundo.
A discussão gerada pelo estudo convida à reflexão sobre a necessidade de métodos mais robustos para mitigar vieses em grandes modelos de linguagem, garantindo que a tecnologia não solidifique visões preconceituosas sobre a diversidade geográfica e social do Brasil.
