Acessibilidade e assistentes de voz: da pesquisa científica até a indústria
Neste artigo da Beyond the Horizon, Ericles fala do potencial das interfaces de voz para oferecer recursos de acessibilidade e conta sobre a jornada que o levou a receber o Prêmio Alexa de Acessibilidade com um jogo de memória baseado em voz e audição. Conheça mais sobre esse trabalho e essa tecnologia promissora e ainda emergente. E parabéns ao Ericles e colegas pela premiação!
Boa leitura!
Acessibilidade e assistentes de voz: da pesquisa científica até a indústria
Por Ericles Andrei Bellei
Assistentes de voz, como Alexa, Siri, e Google Assistente, são sistemas de software com interfaces que permitem ao usuário interagir por meio de comandos de voz, de maneira similar a uma conversa entre pessoas. Sua ascensão e popularização são notáveis. Uma pesquisa da Capgemini aponta aumento considerável no uso atual, satisfação desse uso, e pretensão de uso futuro de assistentes de voz. A mesma pesquisa faz outras revelações promissoras: assistentes virtuais estão se tornando a principal tendência de interação e a voz está rapidamente se tornando a maneira preferida de interação dos consumidores.
Esses assistentes têm sido projetados para uso sem contato físico e independente de visão para uma variedade de funções, como obtenção de informações, discagem por voz, agenda, lembretes pessoais, controle de sensores e dispositivos de Internet das Coisas, entre outros (AMMARI et al., 2019). Um dos principais benefícios dessa modalidade de interação é oportunizar que pessoas interajam com um sistema de uma maneira que lhes seja familiar e nativa (ROGERS et al., 2015, p. 50).
Estudos recentes vêm demonstrando o potencial do uso de assistentes de voz como tecnologia assistiva e ferramenta de acessibilidade. Entre os exemplos, há casos de uso por pessoas não alfabetizadas e com limitações — cognitivas, visuais, auditivas, de fala, ou motoras — que usufruem de uma variedade de funcionalidades adaptadas ao seu contexto.
Metatla et al. (2019), por exemplo, apontam o potencial desses assistentes como uma ferramenta de suporte à educação inclusiva no ambiente escolar. Para pessoas idosas e com demência, o uso da voz se torna importante para promover a capacidade ativa e independência (BREWER et al., 2018). O estudo de Abdolrahmani et al. (2018) traz relatos de adultos com deficiência visual que conseguiram utilizar assistentes de voz para ter acesso a aplicações e serviços até então inacessíveis em outras formas. Pradhan et al. (2018) resumem que pessoas com diversas limitações estão utilizando esses assistentes, inclusive em casos inusitados, como terapia da fala e suporte por cuidadores. Outro caso interessante é relatado por Ballati et al. (2018), que concluem que, no geral, até mesmo pessoas com distúrbio da articulação da fala de nível moderado podem ser compreendidas por assistentes de voz.
Não apenas no mundo acadêmico, iniciativas abordando o potencial para interação inclusiva e acessível dos assistentes de voz também se concretizam na indústria.
O Prêmio Alexa de Acessibilidade
Em parceria com o Instituto Jô Clemente (antiga APAE-SP), com a Fundação Dorina Nowill para Cegos, e com a AACD, a Amazon Brasil promoveu o Prêmio Alexa de Acessibilidade (veja aqui o vídeo da campanha oficial). A iniciativa foi lançada em agosto de 2020 como um programa de incentivo para encorajar desenvolvedores a criar aplicativos de Alexa para auxiliar na inclusão e no bem-estar de pessoas com deficiência. Na terminologia própria, esses aplicativos são chamados de skills e podem funcionar tanto em aplicativos para celular, quanto nos alto-falantes da linha Echo, disponíveis no mercado brasileiro desde outubro de 2019.
Em meio a mais de 400 participantes e quase 100 skills elegíveis, foram escolhidos 10 finalistas. Como era de se esperar, as contribuições não poderiam ser melhores. As skills finalistas são criativas e trazem funcionalidades para as mais diversas aplicações. Sem dúvidas, elas são exemplos admiráveis do potencial da tecnologia para a acessibilidade.
Com foco em experiência sonora e áudio-descrição para pessoas com deficiência visual, há uma skill descritora de obras de arte e uma skill que simula viagens para lugares turísticos famosos. Como forma de apoio no cotidiano, uma skill ajuda a lembrar onde cada objeto é guardado ou onde deve ser colocado, enquanto outra skill tem o propósito de ser um guia de realização de tarefas que exigem várias etapas, seguindo de maneira similar a um algoritmo. Na categoria de geolocalização, uma das skills finalistas é um localizador de ônibus acessível para a cidade de São Paulo e outra skill permite a localização e exploração de mapas com informações úteis e complementares. Há ainda uma skill para encontrar vagas de emprego para pessoas com deficiência. Por fim, entre as opções de jogos, há um quiz de conhecimentos gerais sobre acessibilidade, um jogo da memória usando sons no lugar de cartas, e um jogo para aprender e fixar as letras do alfabeto e números em braille.
Mais que o resultado final, ao longo dos meses de realização, o prêmio foi uma jornada para encorajar e engajar a comunidade de participantes com temas relevantes como inclusão, acessibilidade, tecnologia de inteligência artificial e interação por voz, depoimentos inspiradores e sugestões de novas skills que ainda podem ser criadas.
Na última etapa do prêmio, as 10 skills finalistas foram apresentadas em um evento realizado no último mês de fevereiro de 2021. Um júri composto por funcionários da Amazon e das ONGs parceiras, assim como pessoas com deficiências atendidas por essas instituições, avaliou os finalistas por critérios como usabilidade, qualidade do desenvolvimento, design, experiência do usuário e impacto na vida de pessoas com deficiência. No final, foram divulgados os vencedores com as 3 melhores skills, que também puderam escolher ONGs para receber doações em dinheiro.
A skill Memória Sonora
Quem vos fala também teve uma participação nessa história. Junto da Rita Adriana da Leve e do Lucas Dias, meus colegas da Splora, criamos a skill vencedora do prêmio.
Nosso processo de desenvolvimento foi, antes de tudo, um processo de aprendizado. Um design centrado no usuário com necessidades de acessibilidade é um caminho com desafios e descobertas gratificantes. Nossa premissa foi a mesma que o clássico do design universal preconiza: algo usável pelo maior número de pessoas possível, independente de idade, habilidade ou situação.
Depois de bastante trabalho, discussão, e pesquisa com usuários, criamos a skill Memória Sonora, um jogo casual e simples que transpõe o clássico jogo da memória, mas usando sons como cartas. A mecânica de jogo consiste em ouvir as cartas e tentar encontrar os sons que formam pares.
Por que essa escolha? Um jogo da memória é um recurso para treino de memória episódica e reabilitação cognitiva que pode ser aplicado a pessoas com e sem deficiência, pacientes com desordens e declínio cognitivo (SAVULICH et al., 2017). Adicionalmente, um jogo de memória suportado exclusivamente por voz e audição se torna uma alternativa acessível e viável para pessoas cegas ou com baixa visão que não teriam acesso ao jogo convencional usando cartas visuais ou recursos táteis. Além de tudo, o jogo da Memória Sonora continua sendo um jogo casual para entretenimento de qualquer pessoa enquanto também promove o treino cognitivo. Esse é o princípio dos jogos conhecidos como jogos sérios (veja uma matéria especial sobre esse tema aqui na Horizontes).
Considerações finais
Da pesquisa científica até a indústria, a tecnologia dos assistentes de voz desponta com um papel fundamental para o futuro da interação entre pessoas e computadores. Murad et al (2019) perguntam: revolução ou evolução? Ambas, talvez.
É curioso (e admirável) como essa relação evoluiu. No passado, com as linhas de comando, as pessoas precisavam aprender a linguagem dos computadores. Hoje, são os computadores que estão aprendendo a linguagem das pessoas. Fato é que a voz transmite mais que conteúdo ou ordens, ela implica sentimentos, impressões, premissas, contexto, até emoções, todos aspectos naturais e acessíveis para as pessoas, humanos que são humanos.
Quer conhecer mais algumas iniciativas? Este artigo científico de pesquisadores brasileiros traz uma visão bem abrangente do potencial da tecnologia de assistentes pessoais. Além disso, se você gosta do tema, conheça e participe da Comunidade Brasileira de Interfaces de Voz.
Referências
ABDOLRAHMANI, A. et al. “Siri talks at you”: An empirical investigation of voice activated personal assistant (VAPA) usage by individuals who are blind. In: Proceedings of the 20th International ACM SIGACCESS Conferenceon Computers and Accessibility – ASSETS’18. ACM Press, 2018.
AMMARI, T. et al. Music, search, and IoT: How people (really) use voice assistants. ACM Transactions on Computer-Human Interaction, ACM Press, v. 26, n. 3, p. 1–28, 2019.
BALLATI, F. et al. Assessing virtual assistant capabilities with italian dysarthric speech. In: Proceedings of the 20th International ACM SIGACCESS Conference on Computers and Accessibility – ASSETS’18. ACM Press, 2018.
BREWER, R. N. et al. Accessible voice interfaces. In: Companion of the 2018 ACM Conference on Computer Supported Cooperative Work and Social Computing – CSCW’18. ACM Press, 2018.
METATLA, O. et al. Voice user interfaces in schools: Co-designing for inclusion withvisually-impaired and sighted pupils. In: Proceedings of the 2019 CHI Conference onHuman Factors in Computing Systems – CHI’19. ACM Press, 2019.
MURAD, C. et al. Revolution or evolution? Speech interaction and HCI design guidelines. IEEE Pervasive Computing, IEEE, v. 18, n. 2, p. 33–45, 2019.
PRADHAN, A. et al. “Accessibility came by accident”: Use of voice-controlled intelligent personal assistants by people with disabilities. In: Proceedings of the 2018 CHI Conference on Human Factors in Computing Systems – CHI’18. ACM Press, 2018.
ROGERS, Y. et al. Interaction design: beyond human-computer interaction. 4. ed. Chichester, West Sussex, U.K.: John Wiley & Sons, 2015. ISBN 978-1-119-08879-0.
SAVULICH, G. et al. Cognitive Training Using a Novel Memory Game on an iPad in Patients with Amnestic Mild Cognitive Impairment (aMCI). International Journal of Neuropsychopharmacology, v. 20, n. 8, p. 624–633, 2 jul. 2017.
Sobre o autor
Ericles Andrei Bellei é graduado em Análise e Desenvolvimento de Sistemas pela Universidade Tecnológica Federal do Paraná e Mestre em Computação Aplicada pela Universidade de Passo Fundo (currículo Lattes). Tem atuado em projetos de pesquisa, desenvolvimento e inovação de sistemas de software nos domínios acadêmico-científico e também industrial, com interesse em temáticas de Informática em Saúde e Interação Humano-Computador.
Como citar este artigo
BELLEI, Ericles Andrei. Acessibilidade e assistentes de voz: da pesquisa científica até a indústria. SBC Horizontes, mar. 2021. ISSN 2175-9235. Disponível em: http://horizontes.sbc.org.br/index.php/2021/03/acessibilidade-e-assistentes-de-voz/. Acesso em: DD mês. AAAA.