Como o Instagram nos vê: Inteligência Artificial, Acessibilidade e Inovação

0
337
@reprodução internet

Como o Instagram nos vê: Inteligência Artificial, Acessibilidade e Inovação

Você sabia que o Instagram pode saber até mesmo qual a raça do seu cachorro?

Cada vez mais, funcionalidades baseadas em Inteligência Artificial (IA) estão sendo incorporadas a ferramentas que já fazem parte do nosso cotidiano, com variados níveis de utilidade real. Um exemplo recente é a “Meta AI” no WhatsApp, um assistente virtual semelhante ao ChatGPT, que gerou tanto elogios quanto críticas ao ser adicionado ao aplicativo de mensagens mais popular no Brasil.

Ao considerar certos projetos, mais especializados e menos conhecidos pelo público, fica mais claro o quão úteis essas tecnologias podem ser quando bem aplicadas, como demonstrado pelos prêmios Nobel da Física e da Química de 2024, ambos dedicados a projetos de Inteligência Artificial.

Um outro exemplo também pouco conhecido, mas objetivamente útil dessa tecnologia, é o chamado “Automatic Alt-Text” (AAT), aplicado hoje em praticamente todas as imagens postadas no Instagram e no Facebook.

O Que é o “Automatic Alt-Text”?

O “alt text” – ou “Texto Alternativo” – é um campo geralmente invisível ao se navegar na web. Sua função é descrever imagens ou outros objetos multimídia para que, caso não possam ser visualizados, haja uma alternativa para identificar seu conteúdo. Seu uso mais importante é em aplicativos de leitura de tela, que permitem que pessoas cegas ou com baixa visão (CBVs) naveguem pela web através de descrições em áudio.

Para usuários sem deficiência visual, o contato com o alt text geralmente ocorre quando a internet cai ou uma imagem falha em carregar, momento em que um texto aparece indicando que uma imagem deveria estar ali. Mas aí surge o problema: a mensagem apenas informa que uma imagem deveria estar sendo exibida, mas não fala qual seria o conteúdo dela. Para um usuário CBV, essa informação é pouco útil, visto que não fornece nenhum contexto quanto ao que seria exibido. É aí que entra o “Automatic Alt-Text”: essa tecnologia, baseada em IA, é aplicada às imagens postadas no Instagram, classificando-as para gerar uma descrição detalhada de seu conteúdo, que então é utilizada como “alt text”.

O que o Instagram “enxerga”?

O “Automatic Alt-Text” evoluiu muito desde sua primeira implementação, em 2017. No início, ele sequer incluía descrições para ações e atividades, como por exemplo esportes, um tipo de conteúdo extremamente popular na rede. A análise de centenas de milhares de postagens no Instagram nos deu uma visão geral sobre quais descritores de conteúdo existem na plataforma, o que possibilitou compreender de maneira aprofundada o que é postado na rede.

Atualmente, existem mais de 1.300 classificações únicas, chamadas de “tags”, que se combinam para criar descrições complexas das imagens. Uma imagem pode ter várias tags, cada uma representando alguma característica presente na imagem. Algumas das tags mais comuns são as que descrevem “texto” e aquelas que indicam a quantidade de pessoas em uma imagem. Mas não se engane: quanto mais popular uma tag, mais simples ela tende a ser. Ao se investigar as menos populares, encontra-se uma diversidade surpreendente de classificações. A  análise manual delas revela que pertencem a cerca de 14 categorias gerais, com as mais populares sendo as de objetos, comida, animais, locais e aparência.

Como dito, essas tags não se limitam apenas a classificações simples. O algoritmo do AAT tem a capacidade de identificar conteúdos extremamente específicos. Por exemplo, ele não apenas detecta cães, mas consegue diferenciar entre pelo menos 25 raças diferentes!

Vendo Padrões nas Imagens

Esse tipo de dado também fornece uma valiosa perspectiva sobre o comportamento dos usuários na rede. Descrever uma imagem é um processo caro, que exige ou trabalho manual impossível em larga escala ou um poder computacional considerável, disponível apenas para grandes instituições. A partir das pré-realizadas classificações AAT, é possível identificar diversos padrões sobre o conteúdo do Instagram sem que o custo da classificação caia sobre o pesquisador.

Para esta pesquisa, foram considerados três tipos de usuário, com o intuito de verificar se de fato existem diferenças na forma como eles se comportam na rede. Essas categorias foram: Influenciadores, Páginas de Notícia e Usuários “Comuns”. No geral, constatou-se que a forma como eles postam no Instagram varia bastante. Usuários comuns geralmente compartilham fotos pessoais de si mesmos ou de amigos. Já os influenciadores costumam postar sobre tópicos mais específicos, muitas vezes exibindo produtos ou eventos, como jogos de futebol. Páginas de notícias, por sua vez, têm um estilo próprio – frequentemente incluem texto nas imagens, que funciona como a manchete de uma notícia.

O ranking de tags mais populares dentre os tipos de usuários, com as classificações traduzidas para o português, se encontra a seguir:

Por Que Isso É Importante?

Embora o AAT tenha sido desenvolvido para ajudar pessoas com deficiências visuais, ele  também tem outras utilidades, facilitando pesquisas sobre o conteúdo que é compartilhado nas redes sociais. Ao compreender o que o AAT “vê”, temos um entendimento mais claro das tendências e comportamentos no Instagram, o que nos ajuda a entender não apenas como a plataforma funciona, mas também como seus usuários interagem com o conteúdo na rede.

Por exemplo, fotos com textos e rostos geram mais engajamento. Isso faz sentido, pois tendemos a responder naturalmente a rostos e desejamos saber o que está acontecendo em uma imagem. Outro padrão encontrado é o de que Influenciadores tendem a postar conteúdo mais diverso, pertencente a diversas categorias. Enquanto isso, Páginas de Notícias tendem a postar com muito mais frequência que as outras categorias, pois precisam se adequar ao fluxo do semanal do noticiário. Esses padrões mostram comportamentos distintos, que ajudam a comprovar que existem diferenças no comportamento dos usuários.

As Redes Sociais como Campo de Pesquisa

João Francisco Hecksher Olivetti – Graduando em Ciência da Computação pela Universidade Federal de Viçosa

Com as redes sociais se tornando parte do dia a dia de grande parte da população, sendo elas os mais usados meio de comunicação e estando envolvidas até em relações de trabalho, torna-se torna fundamental compreender num nível profundo o que ocorre nessas redes, como elas se organizam e, especialmente, trazer transparência para mecanismos que fazem parte de nossas vidas sem que saibamos que como de fato funcionam.

O presente texto é um resumo de divulgação científica de uma pesquisa do autor, publicada no 30° Simpósio Brasileiro de Sistemas Multimídia e Web.  O artigo completo (em inglês) pode ser acessado gratuitamente através deste link.

João Francisco Hecksher Olivetti 15/11/2024

DEIXE UMA RESPOSTA

Por favor digite seu comentário!
Por favor, digite seu nome aqui