Algoritmo pode dizer se usuários tweetam sob influência de álcool

25/03/2016 13:42
Usando aprendizado de máquina, pesquisadores criaram sistema que pode encontrar tweets relacionados ao consumo de bebidas alcoólicas
 

Tweetar sob a influência de álcool pode não te colocar sob os mesmos riscos de dirigir sob os mesmos efeitos, mas ainda pode te gerar alguns constrangimentos.

Agora, um algoritmo consegue dizer se você está bebendo e tweetando ao mesmo  tempo, além de descobrir onde você está bebendo. Algo que também pode soar como preocupante.

Usando aprendizado de máquina, pesquisadores da University of Rochester criaram um sistema que pode encontrar tweets relacionados ao consumo de bebidas alcoólicas e determinar se eles foram feitos por alguém que de fato estava bebendo na hora de publicá-los. Também pode selecionar se tais usuários estavam bebendo em casa ou em outro lugar.

Equipados com esse conhecimento, os pesquisadores compararam os resultados para diferentes locais no estado de Nova York. Eventualmente, eles esperam usar a tecnologia para estudar implicações do álcool na saúde.

Mas aí você pode se perguntar como eles fizeram isso.

Os pesquisadores começaram a coletar tweets categorizados com geolocalização publicados durante 12 meses, com origem da cidade de NY e regiões próximas. Depois, eles classificaram aqueles tweets que se relacionavam a bebidas – como “bêbado” ou “cerveja”, e colocaram as multidões do serviço de crowdsourcing Amazon Mechanical Turk para trabalhar e confirmar o contexto.

Aqueles que atuam no Mechanical Turk lêem os tweets para confirmar se eles estavam de fato escrevendo sobre o uso de álcool, como também se estavam consumindo enquanto publicavam no Twitter. 

Para descobrir as configurações de onde os tuiteiros enviaram seus posts, os pesquisadores focaram em palavras e frases que pessoas tendem a usar quando estão em casa, como “sofá” e “banheiro” e confirmaram os resultados novamente através do Mechanical Turk.

Eles usaram toda a informação obtida para treinar o algoritmo de aprendizado de máquina, que eles esperam usar para melhor compreender os padrões de consumo e como eles variam com a localização e outros fatores.

Fonte:IDGNOW