Ciência & Tecnologia

Tecnologia de reconhecimento de fala para entender todos os idiomas do mundo

reconhecimento de fala

Máquinas que realmente entendem idiomas diferentes seriam incrivelmente benéficas, no entanto, ainda não sabemos como desenvolvê-las. Existem mais de 700 milhões de pessoas que não sabem ler e nem escrever no planeta, e o avanço da tecnologia móvel pode beneficiar essas pessoas mantendo-as conscientes e informadas. Agora, o problema com a tecnologia de reconhecimento de fala é que a desenvolvemos em torno de idiomas comuns, como o inglês por exemplo, e isso pode até ser razoável porque a maioria das pessoas entende esse idioma. No entanto, se você for a uma região tribal onde as pessoas falam sua própria língua nativa, a tecnologia não serve para nada se não entender tal idioma. O objetivo dos avanços tecnológicos é facilitar a vida das pessoas, porém atualmente, está limitado apenas a certas populações e não ao mundo inteiro.

Os sistemas computacionais precisam se adaptar às formas como as pessoas em todo o mundo usam a linguagem. Os indígenas falam suas respectivas línguas maternas (21) há milhares de anos, construindo ricas tradições de história oral. Isso tem atendido às pessoas, trazendo perspectivas históricas e histórias ancestrais, e transmitindo moral e conhecimento. O mesmo acontece com os africanos ocidentais que falam suas línguas nativas há gerações.

É possível que computadores e máquinas apoiem tais tradições orais. Embora os computadores sejam projetados e desenvolvidos para serem compatíveis com linguagens escritas, existem indícios de tecnologia baseada em fala. Mas, a chamada tecnologia de reconhecimento de fala não entende ou interpreta nenhum dos 2.000 dialetos e idiomas que os africanos falam. Para começar, a Alexa da Amazon, a Google Assistante e a Siri da Apple não atendem coletivamente nenhuma língua africana.

Isso ocorre porque a tecnologia móvel ainda não é acessível para a maioria dos 700 milhões de pessoas que não sabem ler e nem escrever em todo o mundo. Aqueles que têm acesso a essa tecnologia só a usam para casos do tipo atender o telefone. É uma triste realidade que eles não possam acessar funcionalidades simples, como mensagens de texto ou gerenciamento de contatos.

Como o analfabetismo está relacionado à falta de escolaridade e, portanto, à incapacidade de escrever e falar uma língua mundial comum (inglês, por exemplo), tal tecnologia não é disponibilizada para aqueles que mais precisam.

Especialistas acreditam que a tecnologia de reconhecimento de fala pode preencher a importante lacuna entre o acesso a informações valiosas e o analfabetismo. Imagine se todos ao redor do mundo, incluindo essas 700 milhões de pessoas, tivessem acesso a informações relacionadas a cuidados médicos e informações agrícolas. As coisas podem ser diferentes em uma escala positiva se isso acontecer.

As línguas faladas por minorias e populações menores são muitas vezes vítimas de priorização comercial, sendo este o motivo dessas tecnologias não estarem disponíveis nos idiomas locais. Além disso, grupos e organizações com poder sobre serviços e bens tecnológicos tendem a entreter as mesmas poucas linguagens, tornando mais fácil para eles considerarem insuficientemente aqueles que não falam esses idiomas. Populações que falam línguas locais, como na África, são crassamente sub-representadas em universidades, empresas e laboratórios de pesquisa que estão trabalhando ou que já tenham desenvolvido tecnologias de reconhecimento de fala.

É lamentável ver que os sistemas tecnológicos estão falhando em fornecer a mesma qualidade de produtos e serviços para diversas populações. Já se sabe que as tecnologias e inovações digitais podem ter resultados diversos para pessoas de diferentes raças. No entanto, o cenário atual faz parecer que os sistemas tecnológicos atuais estão tratando alguns grupos populacionais como se eles nem existissem.

No entanto, você não pode simplesmente culpar instituições e líderes globais de tecnologia pela sub-representação e priorização comercial. A “falta de dados” é uma das razões mais significativas pelas quais a tecnologia de reconhecimento de fala não tenha atingido os grupos populacionais menores. A fim de criar tecnologia de reconhecimento de fala, desenvolvedores e equipes analíticas precisam acessar grandes conjuntos de dados anotados. Aqueles que não têm acesso à tecnologia de reconhecimento de fala e outros grupos populacionais menores tendem a se enquadrar na categoria de “poucos recursos”. Isso significa que, em comparação com as linguagens de alto recurso, as de baixo recurso têm apenas alguns conjuntos de dados disponíveis.

Os desenvolvedores estão trabalhando para resolver esse problema. Eles têm tido sucesso no desenvolvimento dos primeiros modelos de reconhecimento de fala para línguas africanas como susu, pulaar e maninka, que são faladas por um total de 10 milhões de pessoas em sete países, que compõem uma população de 68% de pessoas que não sabem ler e nem escrever. O desenvolvimento em inteligência artificial irá desempenhar um papel vital para ajudar desenvolvedores e pesquisadores a entender os idiomas locais para que os avanços possam ser feitos.