Processamento de linguagem natural: o papel do Big Data

17/02/2014 08:17

Os computadores fazem tantas coisas mais rápido e mais eficientes que o cérebro humano, mas ainda são decididamente inferiores quanto à extração de significado da linguagem humana. Como fundador do site BigDataStartups.com, Mark van Rijmenam, escreve em seu blog, o bloqueio chave aqui é que os computadores entendem linguagens de programação "altamente estruturadas e não ambíguas", enquanto a linguagem humana é um campo de nuances, emoções, e intenções subjetivas.

Van Rijmenam também cita um uma publicação de Geoffrey Pullum, professor de linguística da Universidade de Edinburgo. Pullum destaca três pré-requisitos para computadores decifrarem a linguagem humana: "Primeiro, sintaxe suficiente para identificar unicamente a sentença; segundo, semântica suficiente para extrair seu sentido literal; e terceiro, pragmatismo suficiente para inferir a intenção por trás, e então discernir o que deve ser feito ou assumido dada uma afirmação".

A pragmática parece ser o maior desafio nesse campo, escreve van Rijmenam. "Geralmente, muito mais é dito pelo que não é falado na sentença ou conversação do que as suas palavras".

Não há falta de empresas de tecnologia trabalhando em soluções de  processamento de linguagem natural que ensinam computadores as habilidades humanas. Por exemplo, a startup londrina The Outside View está desenvolvendo uma ferramenta analítica de voz que estuda o humor e a qualidade das chamadas de vendedores para determinar a probabilidade de fechar negócio.

O CEO da Outside View, Rob Symes, e o líder de analytics para voz, Jason Filos, nos contaram como análise preditiva pode ajudar as equipes comerciais a destravarem o potencial de seus registros de voz, dados de CRM e e-mail.

"Venho de uma família de empreendedores, e todos nós somos vendedores", conta Symes. "Sempre medimos quantas vezes fazemos algo - quantos e-mails, quantas ligações. Medimos quantidades, mas o que estamos tentando fazer aqui é como medir a qualidade dessas interações". Os executivos C-level "sabem quem são as pessoas de vendas melhores e quem apenas cumpre tabela. Mas a questão é por quê. É isso que estamos tentando responder".

Analisar dados não estruturados, incluindo os conteúdos de e-mail e chamadas, é um negócio complicado. Mensagens de e-mail geralmente contém abreviações e erros de digitação. "Então, o primeiro passo é tirar sentido do que foi dito", diz Filos. "A fim disso... você precisa criar algoritmos inteligentes, que são conhecidos por aí nos últimos 15, 10 anos".

Conversas ao telefone colocam ainda mais complexidade nesse problema. "O que estamos tentando fazer é - de uma maneira não intrusiva - detectar a emoção das pessoas engajadas na conversa", conta Filos. "Estamos fazendo um sistema que basicamente extrai o arquivo de áudio das chamadas e, em primeiro lugar, transcreve o que foi dito".

Imagem: InformationWeek EUA

Claro, essa conversão de voz em texto não é nada novo, mas é apelas o começo da análise de dados. "Então tentamos classificar, num primeiro estádio, duas emoções básicas", prossegue Filos. Isso inclui o estado "normal" ou neutro e uma condição mais agitada de raiva ou excitação.

Essa abordagem já traz um desafio: quem fala pode intencionalmente maquiar os resultados. "Por exemplo, você pode fingir estar com raiva, ou pode simplesmente mentir", conta. "Então, há muitos falsos positivos envolvidos. A ideia básica é classificar ou estimar as emoções das pessoas com quem estamos falando no telefone e então computar a probabilidade se a chamada foi bem-sucedida ou não".

Sumes diz que o software de analytics de voz da The Outside View está sendo testado em diversas empresas, incluindo "uma empresa de mídia internacional muito, muito, muito grande no Reino Unido", cujo nome não foi revelado. "O principal, para nós, é ter estudos de caso suficientes para mostrar que há benefícios".


fonte:informationweek