Afinal há uma escrita feminina
Revista Única - "Expresso"
Um investigador de Ciências da Computação criou um programa informático que permite descobrir se o autor de um texto é homem ou mulher
- Ariel Finguerman
Moshe Koppel fotografado num jardim de Telavive, a ler José Saramago
Um investigador norte-americano desenvolveu um programa de computador que é capaz de determinar, com uma grande margem de certeza, se um texto foi escrito por um homem ou por uma mulher, quer se trate de um romance quer do do mais seco relatório científico. O «segredo» do programa é a preferência por certas palavras - de forma inconsciente - manifestada por cada um dos sexos.
O criador do programa, Moshe Koppel (47 anos), um matemático especializado em Ciência da Computação que reside actualmente em Israel, desenvolveu-o por acaso. Antes de se aventurar na «guerra dos sexos», lidou com complicadas equações da chamada «categorização de textos» - expressão que designa uma das áreas mais «quentes» no sector da pesquisa da Internet. Centenas de cientistas em todo o mundo, pagos por empresas que têm motores de busca como o Google ou o Yahoo, «queimam os neurónios» para encontrar maneiras de classificar automaticamente, sem qualquer interferência humana, os biliões de textos existentes na Net.
Koppel e a sua equipa tiveram a intuição de que seria mais fácil tentar classificar textos de acordo com o sexo do autor. Afinal, há apenas duas possibilidades (pelo menos é o que ele pensava no início, antes de ser surpreendido!).
John Gray, o autor do «best-seller» Homens São de Marte, Mulheres São de Vénus, já tinha dito que as diferenças entre os sexos são planetárias. Mas, nessa altura, poucos investigadores acreditavam que o contraste seria tão grande ao ponto de ser encontrado, até, na maneira de escrever. «A nossa pesquisa acabou por confirmar a ideia básica de Gray, de que há realmente diferenças claras na maneira como homens e mulheres se expressam», disse Koppel ao EXPRESSO.
Moshe Koppel começou por introduzir no seu computador mais de 500 romances, biografias, relatórios científicos e outras obras escritas na Inglaterra nos últimos 40 anos. O computador apresentou então estatísticas e identificou certas palavras que aparecem com mais frequência nos textos escritos por homens e outras usadas mais por mulheres. O programa criou um modelo e, agora, de cada vez que ele introduz um novo texto, o computador acerta no sexo do autor em 80% dos casos.
O programa passou por um «teste de fogo» há algumas semanas, quando a estação de rádio britânica BBC propôs um desafio ao criador do programa: fornecer-lhe-ia três textos, sem identificar o autor, e o computador teria que adivinhar o sexo de quem os escreveu. Tudo isto em directo.
Após examinar os dois primeiros, o computador acertou em cheio - a primeira obra era de um homem e a segunda de uma mulher. Mas o terceiro texto baralhou-o, não conseguindo o computador apresentar uma conclusão definitiva. «Afirmei que o autor era um transexual ou então um homem imitando uma mulher. Estava certo», diz o criador do programa informático.
O caso levou Koppel a considerar com mais seriedade esta «terceira possibilidade», pelo que está já a preparar uma nova versão do programa, «alimentando» o computador com textos escritos por homossexuais e por pessoas que mudaram de sexo.
O objectivo é que a máquina produza um terceiro modelo. «Nestes casos, a base do texto costuma ser típica de um dos sexos, mas traz também elementos do sexo oposto», diz.
A grande descoberta de Moshe Koppel foi determinar o tipo de palavra que as mulheres e os homens gostam de usar quando passam as suas ideias a escrito. O sexo feminino prefere usar pronomes - como «eu», «tu», «ele» - e também recorre bastante à preposição «com». Já os homens gostam de utilizar artigos como «o» e «a», além da preposição «de».
Mas o que é que esta opção por palavras nos pode esclarecer sobre a velha questão de saber se há ou não uma «escrita feminina» e uma «escrita masculina»?
Para Koppel, as mulheres gostam de escrever textos mais intimistas, que criam uma comunicação mais próxima com o leitor, mesmo quando o objectivo é escrever um relatório científico. Já a preocupação dos homens é outra: estão mais interessados em passar o maior número de informações ao leitor.
Koppel, que estudou em escolas religiosas para a formação de rabinos durante toda a sua infância e juventude, até ser convidado para investigador no Institute for Advanced Study de Princeton (o mesmo de Albert Einstein), não tardou em interessar-se por aplicar a sua descoberta também a textos religiosos.
O EXPRESSO perguntou-lhe se o seu programa informático poderia comprovar a tese que o crítico norte-americano Harold Bloom fez em O Livro de J, no qual defendeu a hipótese de algumas partes da Bíblia terem sido escritas por uma mulher. Mas Moshe Koppel não tem ilusões: «É impossível comprovar a tese de Bloom. Teríamos que ter textos de homens e de mulheres dos tempos bíblicos para fornecer como exemplos ao computador. Mas isto não existe».
O programa tem mais possibilidades de êxito numa área bem mais terrena: a caça policial a criminosos. A expectativa é de que casos célebres, como o do Unabomber, o norte-americano que durante 18 anos enviou cartas-bombas a cientistas e académicos, matando três pessoas, ao mesmo tempo que publicava um manifesto político, serão solucionados mais rapidamente através da análise de texto. «No futuro poderemos ter um programa que determinará o sexo, a idade e, até, a formação cultural de um criminoso a partir dos seus escritos», diz Koppel.
Outra possível aplicação é o esclarecimento de mistérios literários que há séculos atormentam os investigadores. Por exemplo, estaremos quase a saber se William Shakespeare escreveu ou não Edward III, obra até agora anónima datada de 1596. A solução para o enigma virá usando a mesma técnica do programa de Koppel: fornecendo ao computador exemplos da obra do bardo inglês, até a máquina formar um modelo, e depois «passar» pelo programa o texto em causa. «Hoje, esta técnica é quase perfeita», diz o matemático.
O matemático não teme que o seu programa também possa ser usado com más intenções. Por exemplo, uma empresa ou instituição, obrigada a seleccionar anonimamente novos candidatos a empregos, poderia usar o computador para identificar o sexo do candidato e o discriminar. «Há sempre este perigo, mas evitar o uso do computador temendo que seja mal usado seria como deixarmos de usar canetas por recearmos que algumas pessoas possam escrever coisas desagradáveis com elas», diz o investigador.
Texto de Ariel Finguerman, correspondente em Telavive
Ilustração de Alexandre Azinheira/Who
Um investigador de Ciências da Computação criou um programa informático que permite descobrir se o autor de um texto é homem ou mulher
- Ariel Finguerman
Moshe Koppel fotografado num jardim de Telavive, a ler José Saramago
Um investigador norte-americano desenvolveu um programa de computador que é capaz de determinar, com uma grande margem de certeza, se um texto foi escrito por um homem ou por uma mulher, quer se trate de um romance quer do do mais seco relatório científico. O «segredo» do programa é a preferência por certas palavras - de forma inconsciente - manifestada por cada um dos sexos.
O criador do programa, Moshe Koppel (47 anos), um matemático especializado em Ciência da Computação que reside actualmente em Israel, desenvolveu-o por acaso. Antes de se aventurar na «guerra dos sexos», lidou com complicadas equações da chamada «categorização de textos» - expressão que designa uma das áreas mais «quentes» no sector da pesquisa da Internet. Centenas de cientistas em todo o mundo, pagos por empresas que têm motores de busca como o Google ou o Yahoo, «queimam os neurónios» para encontrar maneiras de classificar automaticamente, sem qualquer interferência humana, os biliões de textos existentes na Net.
Koppel e a sua equipa tiveram a intuição de que seria mais fácil tentar classificar textos de acordo com o sexo do autor. Afinal, há apenas duas possibilidades (pelo menos é o que ele pensava no início, antes de ser surpreendido!).
John Gray, o autor do «best-seller» Homens São de Marte, Mulheres São de Vénus, já tinha dito que as diferenças entre os sexos são planetárias. Mas, nessa altura, poucos investigadores acreditavam que o contraste seria tão grande ao ponto de ser encontrado, até, na maneira de escrever. «A nossa pesquisa acabou por confirmar a ideia básica de Gray, de que há realmente diferenças claras na maneira como homens e mulheres se expressam», disse Koppel ao EXPRESSO.
Moshe Koppel começou por introduzir no seu computador mais de 500 romances, biografias, relatórios científicos e outras obras escritas na Inglaterra nos últimos 40 anos. O computador apresentou então estatísticas e identificou certas palavras que aparecem com mais frequência nos textos escritos por homens e outras usadas mais por mulheres. O programa criou um modelo e, agora, de cada vez que ele introduz um novo texto, o computador acerta no sexo do autor em 80% dos casos.
O programa passou por um «teste de fogo» há algumas semanas, quando a estação de rádio britânica BBC propôs um desafio ao criador do programa: fornecer-lhe-ia três textos, sem identificar o autor, e o computador teria que adivinhar o sexo de quem os escreveu. Tudo isto em directo.
Após examinar os dois primeiros, o computador acertou em cheio - a primeira obra era de um homem e a segunda de uma mulher. Mas o terceiro texto baralhou-o, não conseguindo o computador apresentar uma conclusão definitiva. «Afirmei que o autor era um transexual ou então um homem imitando uma mulher. Estava certo», diz o criador do programa informático.
O caso levou Koppel a considerar com mais seriedade esta «terceira possibilidade», pelo que está já a preparar uma nova versão do programa, «alimentando» o computador com textos escritos por homossexuais e por pessoas que mudaram de sexo.
O objectivo é que a máquina produza um terceiro modelo. «Nestes casos, a base do texto costuma ser típica de um dos sexos, mas traz também elementos do sexo oposto», diz.
A grande descoberta de Moshe Koppel foi determinar o tipo de palavra que as mulheres e os homens gostam de usar quando passam as suas ideias a escrito. O sexo feminino prefere usar pronomes - como «eu», «tu», «ele» - e também recorre bastante à preposição «com». Já os homens gostam de utilizar artigos como «o» e «a», além da preposição «de».
Mas o que é que esta opção por palavras nos pode esclarecer sobre a velha questão de saber se há ou não uma «escrita feminina» e uma «escrita masculina»?
Para Koppel, as mulheres gostam de escrever textos mais intimistas, que criam uma comunicação mais próxima com o leitor, mesmo quando o objectivo é escrever um relatório científico. Já a preocupação dos homens é outra: estão mais interessados em passar o maior número de informações ao leitor.
Koppel, que estudou em escolas religiosas para a formação de rabinos durante toda a sua infância e juventude, até ser convidado para investigador no Institute for Advanced Study de Princeton (o mesmo de Albert Einstein), não tardou em interessar-se por aplicar a sua descoberta também a textos religiosos.
O EXPRESSO perguntou-lhe se o seu programa informático poderia comprovar a tese que o crítico norte-americano Harold Bloom fez em O Livro de J, no qual defendeu a hipótese de algumas partes da Bíblia terem sido escritas por uma mulher. Mas Moshe Koppel não tem ilusões: «É impossível comprovar a tese de Bloom. Teríamos que ter textos de homens e de mulheres dos tempos bíblicos para fornecer como exemplos ao computador. Mas isto não existe».
O programa tem mais possibilidades de êxito numa área bem mais terrena: a caça policial a criminosos. A expectativa é de que casos célebres, como o do Unabomber, o norte-americano que durante 18 anos enviou cartas-bombas a cientistas e académicos, matando três pessoas, ao mesmo tempo que publicava um manifesto político, serão solucionados mais rapidamente através da análise de texto. «No futuro poderemos ter um programa que determinará o sexo, a idade e, até, a formação cultural de um criminoso a partir dos seus escritos», diz Koppel.
Outra possível aplicação é o esclarecimento de mistérios literários que há séculos atormentam os investigadores. Por exemplo, estaremos quase a saber se William Shakespeare escreveu ou não Edward III, obra até agora anónima datada de 1596. A solução para o enigma virá usando a mesma técnica do programa de Koppel: fornecendo ao computador exemplos da obra do bardo inglês, até a máquina formar um modelo, e depois «passar» pelo programa o texto em causa. «Hoje, esta técnica é quase perfeita», diz o matemático.
O matemático não teme que o seu programa também possa ser usado com más intenções. Por exemplo, uma empresa ou instituição, obrigada a seleccionar anonimamente novos candidatos a empregos, poderia usar o computador para identificar o sexo do candidato e o discriminar. «Há sempre este perigo, mas evitar o uso do computador temendo que seja mal usado seria como deixarmos de usar canetas por recearmos que algumas pessoas possam escrever coisas desagradáveis com elas», diz o investigador.
Texto de Ariel Finguerman, correspondente em Telavive
Ilustração de Alexandre Azinheira/Who