Busca de Artigos

Selecione um Produto

Diretório de suporte de null

Explore todos os artigos de null (Last Updated )

Nenhum artigo encontrado.

Resultados da pesquisa

Nenhum artigo encontrado.

AI Assistant: produzindo áudio altamente realista

Artigo atualizado pela última vez em 4 de mar. de 2026

Como autor do curso, você quer fazer mais do que apenas apresentar informações — você quer criar experiências de e-learning multissensoriais que agradem aos alunos. Usar o som de forma criativa pode ajudar você a chegar lá. Os recursos de conversão de texto em fala e efeitos sonoros do AI Assistant permitem criar vozes e efeitos sonoros altamente realistas gerados por IA para um conteúdo mais envolvente e acessível.

Originalmente, esses dois recursos só podiam ser acessados no Storyline 360. No entanto, a partir da atualização de julho de 2025, o AI Assistant no Rise 360 pode gerar narração de conversão de texto em fala. Visite este guia do usuário para começar a criar narrações geradas por IA no Rise 360.

No Storyline 360, esses recursos podem ser acessados na lista suspensa Inserir áudio no menu AI Assistant dentro da faixa de opções. Encontre-os na guia Início ou Inserir quando estiver na visualização de slides ou converse com o AI Assistant no painel lateral para maior comodidade.

Dê vida à Narração com vozes geradas por IA

Se você já usou a conversão de texto em fala clássica, provavelmente gostaria que as vozes soassem menos, bem, robóticas. A conversão de texto em fala do AI Assistant dá vida à narração com vozes geradas por IA com consciência contextual que soam mais naturais e humanas! Confira a diferença de qualidade entre uma voz padrão, uma voz neural e uma voz gerada por IA clicando nos links dos exemplos de conversão de texto em fala abaixo.

Para começar, clique no ícone Inserir áudio no menu AI Assistant para abrir a caixa de diálogo Generate AI Audio. Uma biblioteca de vozes geradas por IA, que você pode filtrar por sexo, idade e sotaque, é exibida na guia Vozes. As vozes também têm descrições como “profunda”, “confiante”, “nítida”, “intensa” e “relaxante”, além de categorias que podem ajudá-lo a determinar seus casos de uso ideais, desde transmissões de notícias até meditação ou até mesmo ASMR. Encontre essas qualidades abaixo do nome da voz e use o botão play para visualizar a voz.

Atualmente, existem 52 vozes pré-fabricadas para escolher, e você pode marcar suas favoritas clicando no ícone de coração. Dessa forma, você pode acessar facilmente suas vozes preferidas sem precisar percorrer a lista. Observe que as vozes rotuladas como “Legacy” não serão atualizadas quando os futuros modelos de IA melhorarem.

Alterne a opção Exibir para Favoritos para encontrar todas as suas vozes favoritas ou No projeto para ver as vozes usadas no projeto atual. Depois de escolher uma voz, clique no botão Usar para alternar para a guia Conversão de texto em fala. A voz escolhida já está pré-selecionada.

Em seguida, insira seu script na caixa de texto fornecida ou clique no link adicionar das anotações do slide para copiar as anotações do slide. O script pode ter no máximo 5.000 caracteres. Para acessibilidade, deixe a caixa Gerar legendas ocultas marcada — o AI Assistant gerará legendas ocultas automaticamente. Você pode determinar instantaneamente se sua narração de conversão de texto em fala tem legendas ocultas pelo rótulo CC que aparece ao lado de cada saída.

Encontre mais vozes na Biblioteca de Voz

Além das vozes pré-fabricadas, você também tem acesso a uma biblioteca de voz estendida com milhares de vozes ultrarrealistas geradas por IA que podem ser filtradas por idade, sexo e caso de uso. Descubra a voz certa para seu conteúdo na biblioteca de voz consultando os guias do usuário a seguir.

Período de notificação de remoção de voz

Uma voz pode ter um período de aviso prévio, que especifica por quanto tempo você poderá acessar a voz se o criador decidir removê-la da biblioteca de voz. Quando isso acontecer, a voz removida não estará mais disponível na biblioteca. Se você já a adicionou ao My Voices no Storyline 360 ou aos Favoritos no Rise 360, a voz removida ainda aparecerá na sua lista e poderá ser usada para gerar novos conteúdos, mas no Storyline 360, você verá um aviso e a data em que ela não estará mais disponível. Quando o período de notificação expirar, a voz exibirá um erro e não poderá mais ser visualizada ou usada para gerar novo conteúdo. Você pode removê-lo para liberar um dos seus slots de voz personalizados.

A maioria das vozes tem períodos de aviso prévio, mas outras não. Vozes sem aviso prévio desaparecem imediatamente da biblioteca de voz se o criador da voz decidir excluí-las. O conteúdo gerado usando uma voz que foi removida da biblioteca de voz continuará funcionando como um arquivo de áudio normal.

Ajustar as configurações de voz

Diferentemente da conversão de texto em fala clássica, as vozes geradas por IA na conversão de texto em fala do AI Assistant podem ser personalizadas para um desempenho de voz personalizado. A configuração Modelo permite que você escolha entre três opções diferentes:

  • v3 (beta) - Mais expressivo, com alto alcance emocional e compreensão contextual em mais de 70 idiomas. Permite no máximo 3.000 caracteres. Observe que esse modelo está sendo desenvolvido ativamente. As funcionalidades podem mudar ou você pode se deparar com um comportamento inesperado à medida que continuamos a aprimorá-las. Para obter melhores resultados, confira algumas técnicas de solicitação abaixo.
  • Multilíngue v2 (modelo padrão) - Fala realista altamente estável e excepcionalmente precisa, com suporte para 29 idiomas. Permite no máximo 10.000 caracteres.
  • Flash v2.5 - Um pouco menos estável, mas pode gerar mais rápido com suporte para 32 idiomas. Permite no máximo 40.000 caracteres.

Dica profissional: algumas vozes soam melhor em determinados modelos e alguns têm melhor desempenho em idiomas específicos. Experimente combinações diferentes para descobrir o que funciona melhor. Por exemplo, a voz de Matilda soa mais natural em espanhol com o modelo Multilingual v2 do que com a v3.

A configuração de estabilidade controla o equilíbrio entre a estabilidade e a aleatoriedade da voz. A velocidade define o ritmo, e a Similaridade determina até que ponto o AI Assistant deve seguir a voz original ao replicá-la.

As configurações adicionais incluem exagero de estilo, que amplifica o estilo da voz original, e aumento de alto-falante, que aprimora a semelhança entre a fala sintetizada e a voz. Observe que, se alguma dessas configurações for ajustada, a geração de sua fala demorará mais.

Brinque com essas configurações para encontrar o equilíbrio certo para seu conteúdo. A tabela abaixo descreve o valor padrão do controle deslizante para cada configuração. Para o modelo v3, a estabilidade é a única opção disponível.

ConfiguraçãoStoryline 360Rise 360
Estabilidade0,5050
Rapidez1,00100
Similaridade1,00100
Exagero de estilo0,000
Aumento do alto-falante (caixa de seleção)VerificadoVerificado

Observação: algumas vozes no modelo Multilingual v2 tendem a ter um volume inconsistente, diminuindo no final, ao gerar clipes longos. Esse é um problema conhecido com o modelo subjacente, e nosso subprocessador de IA para conversão de texto em fala está trabalhando para resolvê-lo. Enquanto isso, sugerimos as seguintes soluções alternativas:

  • Use uma voz diferente
  • Mude para o modelo Flash v2.5
  • Aumente a estabilidade da voz
  • Divida manualmente seu texto em partes menores para gerar clipes mais curtos

Preciso usar SSML?

O AI Assistant tem suporte limitado para linguagem de marcação de síntese de fala (SSML) porque as vozes geradas por IA são projetadas para entender a relação entre palavras e ajustar a entrega de acordo. Se precisar controlar manualmente o ritmo, você pode adicionar uma pausa. A maneira mais consistente de fazer isso é inserindo a sintaxe <break time="1.5s" /> em seu script. Isso cria uma pausa exata e natural na fala. Por exemplo:

Com seus sentidos aguçados, os <break time="1.5s" /> gatos são caçadores habilidosos.

Use segundos para descrever uma pausa de até três segundos de duração.

Você pode experimentar um traço simples - ou um traço eletrônico para inserir uma breve pausa ou vários traços para uma pausa mais longa. Às vezes, as ... reticências também funcionam para adicionar uma pausa entre as palavras. No entanto, essas opções podem não funcionar de forma consistente, então recomendamos usar a sintaxe acima para manter a consistência. Lembre-se de que um número excessivo de etiquetas de quebra pode causar instabilidade.

Técnicas de solicitação para v3 (beta)

O modelo v3 (beta) introduz o controle emocional por meio de etiquetas de áudio, permitindo que as vozes riam, sussurrem, sejam sarcásticas ou mostrem curiosidade, entre outras opções.

A tabela a seguir lista várias tags que você pode usar para controlar a entrega vocal e a expressão emocional, bem como para adicionar sons e efeitos de fundo. Também inclui algumas etiquetas experimentais para usos criativos.

Voz e emoçãoSons e efeitosExperimental
  • [ri], [ri mais forte], [começa a rir], [chiando]
  • [sussurra]
  • [suspira], [exala]
  • [sarcástico], [curioso], [animado], [chorando], [bufa], [maliciosamente]

Exemplo: [sussurra] Não olhe agora, mas acho que eles nos ouviram.

  • [tiro], [aplausos], [aplausos], [explosão]
  • [andorinhas], [goles]

Exemplo: [aplausos] Bem, foi melhor do que o esperado. [explosão] Não importa.

  • [sotaque X forte] (substitua X pelo sotaque desejado)
  • [canta], [corteja]

Exemplo: [forte sotaque francês] Zat não é o que eu tinha em mente, non non non.

Além das tags de áudio, a pontuação também afeta a entrega. As elipses (...) adicionam pausas, a capitalização enfatiza palavras ou frases específicas e a pontuação padrão imita o ritmo natural da fala. Por exemplo: “Foi MUITO bem-sucedido! ... [começa a rir] Dá para acreditar?”

Dicas:

  • Use etiquetas de áudio que correspondam à personalidade da voz. Uma voz calma e meditativa não grita, e uma voz de alta energia não sussurra de forma convincente.
  • Solicitações muito curtas podem levar a resultados inconsistentes. Para uma saída mais consistente e focada, sugerimos avisos com mais de 250 caracteres.
  • Algumas etiquetas experimentais podem ser menos consistentes em todas as vozes. Teste minuciosamente antes de usar.
  • Combine várias etiquetas para uma entrega emocional complexa. Experimente combinações diferentes para descobrir o que funciona melhor para a voz selecionada.
  • A lista acima é simplesmente um ponto de partida; podem existir tags mais eficazes. Experimente combinar estados emocionais e ações para descobrir o que funciona melhor para seu caso de uso.
  • Use a fala natural, a pontuação correta e sinais emocionais claros para obter os melhores resultados.

Vozes multilíngues expandem seu alcance

Outro benefício convincente da conversão de texto em fala gerada por IA é a capacidade de preencher lacunas linguísticas, permitindo que você se conecte com públicos internacionais. Com suporte para mais de 70 idiomas, dependendo do modelo, incluindo alguns com vários sotaques e dialetos, a conversão de texto em fala do AI Assistant ajuda seu conteúdo a alcançar um público global.

Tudo o que você precisa fazer é digitar ou colar seu script no idioma compatível que você deseja que o AI Assistant use. (Mesmo que a descrição da voz indique um sotaque ou idioma específico, o AI Assistant gerará a narração no idioma usado em seu script.) Observe que algumas vozes tendem a funcionar melhor com determinados sotaques ou idiomas, então sinta-se à vontade para experimentar vozes diferentes para encontrar a mais adequada às suas necessidades.

A tabela abaixo fornece um resumo rápido dos idiomas compatíveis.

Disponível em v3 (beta), multilíngue v2 e Flash v2.5:

  • Árabe (Arábia Saudita)
  • Árabe (Emirados Árabes Unidos)
  • búlgaro
  • chinês
  • croata
  • Tcheco
  • dinamarquês
  • holandês
  • Inglês (Austrália)
  • Inglês (Canadá)
  • Inglês (Reino Unido)
  • Inglês (EUA)
  • Filipino
  • finlandês
  • Francês (Canadá)
  • Francês (França)
  • alemã
  • grego
  • hindi
  • indonésio
  • italiano
  • japonesa
  • coreana
  • malaio
  • polonês
  • Português (Brasil)
  • Português (Portugal)
  • romeno
  • russa
  • eslovaca
  • Espanhol (México)
  • Espanhol (Espanha)
  • sueca
  • tâmil
  • turca
  • ucraniano
 
Disponível na versão 3 (beta) e na versão 2.5 do Flash:
  • húngaro
  • norueguês
  • vietnamita

Disponível somente na v3 (beta):

  • Afrikaans (afr)
  • Armênio (hye)
  • Assamês (asm)
  • Azerbaijano (aze)
  • Bielorrusso (bel)
  • Bengali (ben)
  • Bósnio (bos)
  • Catalão (gato)
  • Cebuano (ceb)
  • Chichewa (nova)
  • Estoniano (oeste)
  • galego (glg)
  • Georgiano (kat)
  • Gujarati (guj)
  • Hausa (hau)
  • Hebraico (heb)
  • Islandês (isl)
  • Irlandês (gle)
  • Javanês (jav)
  • Kannada (kan)
  • Cazaque (kaz)
  • Quirguiz (kir)
  • Letão (lav)
  • Lingala (linha)
  • Lituano (lit)
  • Luxemburguês (ltz)
  • Macedônio (mkd)
  • Malayalam (mapa)
  • Chinês mandarim (cmn)
  • Marathi (mar)
  • Nepalês (nep)
  • Pashto (pus)
  • Persa (fascista)
  • Punjabi (pan)
  • Sérvio (srp)
  • Sindhi (areia)
  • Esloveno (slv)
  • Somali (som)
  • Suaíli (swa)
  • Telugu (tel)
  • Tailandês (tha)
  • Urdu (urd)
  • Galês (cym)

Crie efeitos sonoros usando prompts

Os efeitos sonoros alinhados ao tema e ao conteúdo podem destacar ações ou comentários importantes, como clicar em um botão ou escolher uma resposta correta, oferecendo uma experiência de e-learning mais envolvente e eficaz. Com os efeitos sonoros do AI Assistant, agora você pode usar as instruções para criar facilmente praticamente qualquer som imaginável. Chega de perder tempo vasculhando a web em busca de sons pré-fabricados que podem custar mais!

Comece a criar efeitos sonoros de alta qualidade acessando o menu AI Assistant na faixa de opções abaixo da guia Início ou Inserir. Em seguida, clique na metade inferior do ícone Inserir áudio e escolha Efeitos sonoros. (Você também pode acessá-lo no menu suspenso Áudio na guia Inserir. Basta selecionar Efeitos sonoros na opção Áudio AI.) Na caixa de texto, descreva o efeito sonoro desejado e escolha uma duração. Você pode ajustar o controle deslizante de influência do Prompt para dar ao AI Assistant uma licença mais ou menos criativa na geração do som.

Como o AI Assistant entende a linguagem natural, os efeitos sonoros podem ser criados usando qualquer coisa, desde um simples aviso, como “um único clique do mouse”, até um muito complexo que descreve vários sons ou uma sequência de sons em uma ordem específica. Observe que você tem no máximo 450 caracteres para descrever o som que deseja gerar.

Clique nos links a seguir para ouvir os efeitos sonoros criados usando um prompt simples e um complexo.

Você também pode ajustar a Duração — por quanto tempo o efeito sonoro é reproduzido — até um máximo de 22 segundos. Por exemplo, se sua mensagem for “cachorro latindo” e você definir a duração para 10 segundos, você receberá latidos contínuos, mas uma duração de dois segundos é um latido rápido. Ajustar o controle deslizante Prompt Influence para a direita faz com que o AI Assistant siga estritamente seu prompt, enquanto deslizá-lo para a esquerda permite uma interpretação mais livre.

Dica profissional: você pode determinar instantaneamente se o efeito sonoro tem legendas ocultas pelo rótulo CC que aparece ao lado de cada saída.

Alguns termos profissionais que você deve conhecer

Usar terminologia de áudio — vocabulário especializado que especialistas em áudio usam em seu trabalho — pode ajudar a melhorar suas instruções e produzir efeitos sonoros ainda mais dinâmicos. Aqui estão alguns exemplos:

Braam: Um som baixo profundo, ressonante e frequentemente distorcido usado na mídia, especialmente em trailers, para criar uma sensação de tensão, potência ou destruição iminente.

Whoosh: Um som rápido e estridente, geralmente usado para enfatizar movimentos rápidos, transições ou momentos dramáticos.

Impacto: um ruído forte e marcante usado para indicar uma colisão, impacto ou contato repentino com força, geralmente para destacar um momento de ação ou ênfase.

Falha: um ruído curto, estridente e geralmente digital que imita um defeito ou distorção, comumente usado para transmitir erros.

Foley: O processo de recriar e gravar efeitos sonoros cotidianos, como movimentos e sons de objetos, em sincronia com o visual de um filme, vídeos ou outras mídias.

Aqui está algo divertido de experimentar! Gere um efeito sonoro de 3 segundos usando o comando “qualidade de estúdio, impacto sonoro projetado de whoosh and braam”. Aumentar a duração pode produzir melhores efeitos sonoros, mas também criará mais ar morto no final.

Dica profissional: onomatopeias — palavras como “zumbido”, “boom”, “clique” e “pop” que imitam sons naturais — também são termos importantes de efeitos sonoros. Use-os em suas instruções para criar efeitos sonoros mais realistas.

Tutoriais em vídeo

Quer saber mais antes de começar? Confira nossos tutoriais em vídeo para obter orientações adicionais sobre como usar o AI Assistant para gerar conversão de texto em fala e efeitos sonoros.

O Articulate 360 Training também tem tutoriais em vídeo adicionais sobre o uso de outros recursos do AI Assistant.

Você deve estar logado na sua conta do Articulate 360 para assistir aos vídeos. Ainda não tem uma conta? Inscreva-se para um teste gratuito agora!