Please sign in to answer question.

1
André Lima

http://umamao.com/questions/Qual-%C3%A9-o-me...rs/4d6d6315170701618a0002dc

over 1 year ago Helder Ribeiro said:

Então, para palavras simples é até mais tranquilo, mas para termos compostos ("guarda-sol", "palavra-chave", "desvio padrão", etc.) fica mais difícil. Pluralizar frases arbitrárias é pior ainda ("o menino foi passear" => "os meninos foram passear").

over 1 year ago Helder Ribeiro said:

(Com "termo" eu quis dizer palavras únicas ou expressões; orações inteiras já é sacanagem mesmo.)

over 1 year ago André Lima said:

Hum, nesse caso acho que já é preciso partir para um mapeamento do singular para o plural mesmo. Uma opção é construir o mapeamento usando estatística (ocorrências no google?). Usar uma heurística baseada apenas no texto do termo não acho que seja muito promissor.

over 1 year ago Helder Ribeiro said:

Existem algumas regras para plural de termos compostos, então a questão é o quanto se conseguiria fazer simplesmente codificando regras determinísticas já existentes do português e o que necessitaria de análise de corpus.

Não estou conseguindo encontrar agora, mas vi uma vez um artigo sobre pluralização no inglês, e havia uma página web com muitos exemplos de pluralizações automáticas, incluindo algumas expressões puramente nominais (substantivos, adjetivos e artigos) bem grandes. Havia erro, obviamente, mas ele tinha alguma métrica de sucesso.

over 1 year ago Helder Ribeiro said:

Eu sei que um pessoal do IC-Unicamp (Kowaltowski incluso, eu acho) trabalhou no corretor ortográfico do Word, então talvez haja alguma publicação nessa linha.

over 1 year ago André Lima said:

É bom notar que o corretor ortográfico pode simplesmente dar um falso negativo para plurais mais complexos. Basta entender o hífen como um separador de palavras. Por exemplo, aceitar coisas como beijas-flor, beija-flores e beijas-flores e beijavam-flores sem reclamar. É o comportamento do ispell (eu testei).

Search for Qual é o melhor algoritmo/heurística para pluralização automática de termos em português? on Bing / Google