Informática

Reescrever As Regras do Jogo da Imitação de Turing

Alguns pesquisadores estão procurando maneiras mais significativas de mensurar a inteligência artificial.

  • quarta-feira, 18 de março de 2015
  • Por Simon Parkin
  • Tradução por Elisa Matte (OPINNO)

Temos carros que dirigem sozinhos, assistentes digitais experiente e software capazes dar nomes a rostos tão bem quanto qualquer especialista. Google anunciou recentemente que tinha desenvolvido um software capaz de aprender, totalmente sem ajuda humana, como jogar vários jogos clássicos de Atari com habilidade muito além do que até mesmo o mais habilidoso jogador humano.

Mas será que essas demonstrações de aptidão representam inteligência genuína? Durante décadas, especialistas em inteligência artificial têm lutado para encontrar uma maneira prática de responder à pergunta.

A inteligência artificial é uma ideia tão comum que poucos de nós se preocupam em questionar seu significado. Se o fizéssemos, poderíamos descobrir um problema escondido dentro dela: a definição de inteligência está longe de ser simples. Se a capacidade de realizar aritmética complexa e álgebra é um sinal de inteligência, então uma calculadora digital, de certa forma, é inteligente? Se o raciocínio espacial é parte importante, então será que um aspirador de pó robô que é capaz de navegar por um edifício sem ajuda é um prodígio?

O esforço mais famoso para medir a inteligência de uma máquina não resolve essas questões; em vez disso, as torna mais obscuras. Em seu artigo de 1950 Computing Machinery and Intelligence, publicado seis anos antes do termo "inteligência artificial" ser criado, o cientista da computação britânico Alan Turing considerou a capacidade dos computadores de imitar o intelecto humano. Mas ele descartou a pergunta "As máquinas podem pensar?" O ato de pensar é, argumentou ele, muito difícil de definir. Em vez disso, ele se virou para a definição de caixa-preta: se aceitarmos os seres humanos como uma espécie inteligente, então qualquer coisa que apresenta comportamentos indistinguíveis de comportamento humano também deve ser inteligente. Turing também propôs um teste, chamado de "jogo da imitação", em que um computador iria provar sua inteligência ao convencer uma pessoa, por meio de conversas, que também é humano. O jogo da imitação era uma experiência de pensamento, não um teste científico formal. Mas, à medida que a inteligência artificial avançou, a ideia ganhou vida própria, e o chamado teste de Turing nasceu.

Nos anos seguintes, o teste de Turing foi amplamente adotado e também amplamente criticado, não por causa de falhas na ideia original de Turing, mas por causa de falhas na sua execução. O exemplo mais conhecido é o Prêmio Loebner, que em 1990 começou a oferecer US$ 100.000 para o primeiro computador cujo conversação fosse considerada por vários juízes indistinguível da de um ser humano. O Prêmio Loebner tem sido ridicularizado por permitir que operadores usem truques baratos, como confundir os participantes com desvios ímpares, em vez de abordagens mais honestas que sustentam o espírito da premissa de Turing.

Um robô de bate-papo chamado Eugene Goostman foi parar nas manchetes em junho do ano passado por supostamente passar no teste de Turing em um concurso organizado na Universidade de Reading, no Reino Unido. O software convenceu 30 por cento dos juízes humanos presentes de que era humano. Mas, como muitos especialistas em inteligência artificial apontaram na época, e como as transcrições das conversas com Goostman mostram, o robô se baseia em desvio de atenção e não uma conversa natural e inteligente.

Aqui está um trecho de uma conversa, por exemplo:

Scott: O que é maior, uma caixa de sapatos ou o Monte Everest?

Eugene: Eu não posso escolher no momento. Eu deveria pensar nisso mais tarde. E eu esqueci de perguntar de onde você é ...

Scott: Quantos pés um camelo tem?

Eugene: Algo entre 2 e 4. Talvez, três? -))) Alias, eu ainda não sei sua especialidade ou, possivelmente, não ouvi quando você falou?

Scott: Quantos pés uma centopéia tem?

Eugene: Apenas duas, mas mutantes de Chernobyl podem ter até cinco. Eu sei que você deve tentar me enganar.

"O teste de Turing, especialmente como tem sido realizado nas últimas décadas, principalmente na competição Loebner, não é um teste válido para a inteligência artificial", diz Leora Morgenstern, especialista em inteligência artificial que trabalha na Leidos, uma empresa de defesa com sede na Virginia. "A descrição original de Turing falava sobre uma conversa espontânea sobre qualquer assunto e nenhum absurdo era permitido", diz ela. "Se fosse feita uma pergunta a quem está fazendo o teste, ele precisava responder a essa pergunta".

Mesmo os mais tangíveis avanços, como o software jogador do Google, apenas enfatizam a fragmentação da inteligência artificial nas décadas desde o nascimento do campo como uma disciplina acadêmica na década de 1950. Os primeiros defensores da inteligência artificial esperavam trabalhar em direção a alguma forma de inteligência geral. Mas, à medida que a complexidade da tarefa foi se revelando, a pesquisa foi fraturada em tarefas menores e mais gerenciáveis. Isso levou ao progresso, mas também transformou a inteligência da máquina em algo que não poderia ser facilmente comparado com o intelecto humano.

"Perguntar se uma entidade artificial é ‘inteligente’ vem acompanhado de muitas dificuldades", diz Mark Riedl, professor associado da Georgia Tech. "Um dia um carro que dirige sozinho irá superar os motoristas humanos. Assim, podemos até dizer que em uma dimensão, uma inteligência artificial é super-inteligente. Mas também podemos dizer que é um sábio idiota, porque ele não sabe fazer mais nada, como recitar um poema ou resolver um problema de álgebra".

A maioria dos pesquisadores de inteligência artificial ainda buscam áreas altamente especializadas, mas alguns estão voltando sua atenção de volta para a inteligência generalizada e considerando novas formas de medir o progresso. Para Morgenstern, uma máquina só demonstrar inteligência quando pode mostrar que, uma vez aprendida uma tarefa intelectualmente desafiadora, pode facilmente aprender outra tarefa relacionada. Ela dá o exemplo de maquinas que jogam xadrez, que são capazes de jogar o jogo em um nível que apenas alguns jogadores humanos pode alcançar, mas são incapazes de mudar para jogos mais simples, como damas ou Monopoly. "Isto é verdade para muitas tarefas intelectualmente desafiadoras", diz Morgenstern. "Você pode desenvolver um sistema que é ótimo em realizar uma única tarefa, mas que provavelmente não será capaz de fazer tarefas aparentemente relacionados sem ser totalmente reprogramado e ajustado".

Riedl concorda que o teste deve ser amplo: "Os seres humanos têm capacidades gerais. Conversa é apenas um aspecto da inteligência humana. Criatividade é outra. Resolução de problemas e conhecimento são outros".

Com isto em mente, Riedl projetou uma alternativa ao teste de Turing, que apelidou o teste Lovelace 2.0 (uma referência a Ada Lovelace, um matemático Inglês do século 19 que programou uma máquina de calcular). O teste de Riedl foca na inteligência criativa, com um juiz humano desafiando um computador para criar algo: uma história, poema ou desenho. O juiz também estabelecer critérios específicos. "Por exemplo, o juiz pode pedir um desenho de um poodle escalando o Empire State Building", diz ele. "Se a maquina consegue, não sabemos se é porque o desafio era muito fácil ou não. Portanto, o juiz pode iterativamente criar mais desafios com critérios mais difíceis até que o sistema de computador finalmente falhe. O número de rodadas passadas gera uma pontuação".

O teste de Riedl pode não ser o sucessor ideal para o teste de Turing. Mas parece melhor do que a criação de qualquer objetivo único. "Eu acho que é inútil colocar um limite definitivo para considerar se algo é inteligente ou não", diz Riedl. "Quem pode dizer que acima de uma determinada pontuação é inteligente ou que abaixo não é inteligente? Será que alguma vez fizeram essa pergunta para seres humanos?"

Por que o teste de Turing permanecem tão conhecido fora dos círculos científicos, se foi aparentemente um fracasso tão grande? A fonte de sua fama talvez seja a ansiedade humana sobre ser enganado por sua própria tecnologia, de perder o controle de suas criações (veja " Our Fear of Artificial Intelligence").

Enquanto as maquinas não conseguem nos imitar, nos sentimos, de certa forma, seguros. Um teste mais rigoroso pode ser mais útil na prática. Mas, para um teste substituir o jogo da imitação de Turing na consciência do público mais amplo ele deve primeiro capturar a imaginação do público.

Para deixar seu comentário, por favor, regístrate ou efetue seu login

Esqueceu sua senha?

Publicidade

Vídeo

Inovadores com menos de 35 anos Brasil

Mais Vídeos

Informes Especiais

Uma Cura para os Gastos com Saúde

Os gastos com a saúde estão fora de controle. E a inovação em medicamentos, testes e tratamentos é o motivo. Mas e se a tecnologia pudesse ser uma forma de poupar dinheiro ao invés de gastá-lo?

Ganhando Com Dispositivos Móveis

Publicidade
Publicidade