INTELIGÊNCIA ARTIFICIAL

Decifrando o “gauchês”: Será que o ChatGPT entende as gírias e as expressões do RS?

Foram compilados cerca de 50 dialetos que o gaúcho mais fala para compreender se o ChatGPT tem domínio regional da nossa linguagem.

Foto: iStock

Não há dúvidas de que o ChatGPT , criado pela empresa americana OpenAI, tem a maior base de dados, além de assumir múltiplos papéis e se adaptar a diversas audiências. Mas, afinal, será que ele entende os regionalismos da população gaúcha?

Foi isso que a Preply, plataforma de aprendizado de idiomas, perguntou à própria tecnologia. Depois de medir o nível de compreensão da ferramenta sobre expressões de todo o Brasil, uma nova pesquisa se voltou especificamente para o estado do Rio Grande do Sul, buscando verificar se a inteligência artificial desvenda os significados e nuances das expressões mais utilizadas pelo povo gaúcho. Confira abaixo!

A versatilidade do Bah

A partir de dicionários populares e fóruns digitais sobre a vivência gaudéria, foram compiladas cerca de 50 palavras e expressões que os gaúchos utilizam no dia a dia. De toda forma, a plataforma aproveitou o teste para checar se o ChatGPT já era versado em algum jargão da região e a tecnologia trouxe como principal gíria típica o “bah”, vício de linguagem de muitos gaúchos e que pode ser aplicado a diversas situações.

Como exemplo dado pela ferramenta, a expressão tomou o sentido de surpresa: “bah, que frio está fazendo hoje!”. De toda forma, outros significados também foram levantados pelo chat, que atrelou o termo à incredulidade, irritação, indiferença e concordância. O robô salientou ainda que a interjeição pode variar de acordo com o contexto, o tom de voz e a entonação que cada pessoa dá.

Durante o restante do bate-papo com a inteligência artificial, ela acabou demonstrando certo conhecimento sobre a cultura gaúcha, com acertos sobre 74% dos regionalismos questionados.

Dentre eles, estão o clássico “tri” e “tchê”, o dito “caiu os butiá do bolso”, que invoca espanto diante de algo, o famoso “largatear”, que é o simples ato de comer uma bergamota num dia de sol, e o “em cima do laço”, que indica uma ação realizada no último momento possível.

Utilizado para manifestar negação, malícia e até gratidão, o dialeto “capaz” foi aplicado pela tecnologia a diversas frases, tal qual um professor faria: “Você acha que ele vai conseguir fazer isso?” “Bem capaz! Ele nem sabe por onde começar”. O chat seguiu dando exemplos de aplicações em outras gírias, como na expressão “baita”: “Que baita grenal, em!?”, geralmente usada para enfatizar ou intensificar algo.

Já ao ser solicitado a conversar empregando os vocábulos gaúchos, como se fosse uma pessoa nascida no estado, ele mencionou o frio do inverno e fez um convite para “matear e prosear um pouco”. E ainda perguntou qual era a melhor erva e se não havia alguma dica para preparar um bom chimarrão.

Baita trovador

Como alguns diriam por aí, ao longo do teste, o ChatGPT se manteve “cheio de floreios” e seguiu tentando dar sentido aos jargões que não conhecia. Embora 4% das palavras tenham se aproximado do significado inicial da gíria, a tecnologia errou 22% das expressões, dando a elas sentidos incertos e imprecisos.

Mesmo entendendo de primeira os regionalismos “guri” e “piá”, por exemplo, a ferramenta classificou o termo “magrão” de acordo com o aspecto físico que suscita o adjetivo. Na verdade, o jargão é utilizado na capital gaúcha para chamar um amigo ou rapaz de maneira amigável.

Outro verbete que ele deixou escapar durante a experiência foi “trovar”. De forma geral, a ferramenta relacionou a palavra ao ato de declamar ou cantar versos, exercício literário-poético comum na Europa Medieval. Mas o significado não tem nada a ver com esse, já que se refere a alguém que inventa histórias e linguagens para situações que não conhece ou que nunca viveu.

Por dentro do “raciocínio” do ChatGPT

Bom de papo, o ChatGPT pode conversar sem problemas como um gaudério. Aprende a partir de uma ampla variedade de fontes, como livros, artigos, sites, fóruns e muitos outros recursos on-line disponíveis publicamente.

No entanto, mesmo ao processar uma boa quantidade de textos, o robô está passível de errar, como bem demonstrou a pesquisa feita pela Preply.

“É importante ressaltar que eu não tenho acesso direto à internet ou a fontes específicas durante a nossa conversa. Todas as respostas que eu forneço são baseadas no meu treinamento prévio e na compreensão do contexto da conversa”, explica a ferramenta.

Para Yolanda Del Peso, especialista em Outreach da Preply, o estudo parece decifrar os dois tipos de gírias que suscitam imprecisões no ChatGPT: aqueles que requerem um contexto mais profundo ou as expressões derivadas de palavras formais do português, às quais a população acaba atribuindo novos sentidos no cotidiano.

“Isso nos ajuda a pensar até onde a tecnologia é capaz de ir, bem como certas nuances da linguagem que ela ainda não alcança… e nem tão cedo será capaz de alcançar”, diz.