Please sign in to answer question.
http://umamao.com/questions/Qual-%C3%A9-o-me...rs/4d6d6315170701618a0002dc
Então, para palavras simples é até mais tranquilo, mas para termos compostos ("guarda-sol", "palavra-chave", "desvio padrão", etc.) fica mais difícil. Pluralizar frases arbitrárias é pior ainda ("o menino foi passear" => "os meninos foram passear").
(Com "termo" eu quis dizer palavras únicas ou expressões; orações inteiras já é sacanagem mesmo.)
Hum, nesse caso acho que já é preciso partir para um mapeamento do singular para o plural mesmo. Uma opção é construir o mapeamento usando estatística (ocorrências no google?). Usar uma heurística baseada apenas no texto do termo não acho que seja muito promissor.
Existem algumas regras para plural de termos compostos, então a questão é o quanto se conseguiria fazer simplesmente codificando regras determinísticas já existentes do português e o que necessitaria de análise de corpus.
Não estou conseguindo encontrar agora, mas vi uma vez um artigo sobre pluralização no inglês, e havia uma página web com muitos exemplos de pluralizações automáticas, incluindo algumas expressões puramente nominais (substantivos, adjetivos e artigos) bem grandes. Havia erro, obviamente, mas ele tinha alguma métrica de sucesso.
Eu sei que um pessoal do IC-Unicamp (Kowaltowski incluso, eu acho) trabalhou no corretor ortográfico do Word, então talvez haja alguma publicação nessa linha.
É bom notar que o corretor ortográfico pode simplesmente dar um falso negativo para plurais mais complexos. Basta entender o hífen como um separador de palavras. Por exemplo, aceitar coisas como beijas-flor, beija-flores e beijas-flores e beijavam-flores sem reclamar. É o comportamento do ispell (eu testei).

Qual é o melhor algoritmo/heurística para pluralização automática de termos em português?
Algoritmos
Computação
Linguística
Heurísticas
Pesquisa
Linguística computacional
Processamento de linguagem natural
Morfologia (linguística)
Plural
Add Done