Busca de Artigos

Selecione um Produto

Diretório de suporte de null

Explore todos os artigos de null (Last Updated )

Nenhum artigo encontrado.

Resultados da pesquisa

Nenhum artigo encontrado.

AI Assistant: produzindo áudio altamente realista

Artigo atualizado pela última vez em 23 de jul. de 2026

Como autor do curso, você quer fazer mais do que apenas apresentar informações — você quer criar experiências de e-learning multissensoriais que agradem aos alunos. Usar o som de forma criativa pode ajudar você a chegar lá. Os recursos de conversão de texto em fala e efeitos sonoros do AI Assistant permitem criar vozes e efeitos sonoros altamente realistas gerados por IA para um conteúdo mais envolvente e acessível.

Originalmente, esses dois recursos só podiam ser acessados no Storyline 360. No entanto, a partir da atualização de julho de 2025, o AI Assistant no Rise 360 pode gerar narração de texto em fala. Visite este guia do usuário para começar a criar narrações geradas por IA no Rise 360.

No Storyline 360, esses recursos podem ser acessados na lista suspensa Inserir áudio no menu AI Assistant dentro da faixa de opções. Encontre-os na guia Início ou Inserir quando estiver na visualização de slides ou converse com o AI Assistant no painel lateral para maior comodidade.

Dê vida à Narração com vozes geradas por IA

Se você já usou a conversão de texto em fala clássica, provavelmente gostaria que as vozes soassem menos, bem, robóticas. A conversão de texto em fala do AI Assistant dá vida à narração com vozes geradas por IA com consciência contextual que soam mais naturais e humanas! Confira a diferença de qualidade entre uma voz padrão, uma voz neural e uma voz gerada por IA clicando nos links dos exemplos de conversão de texto em fala abaixo.

Para começar, clique no ícone Inserir áudio no menu AI Assistant para abrir a caixa de diálogo Generate AI Audio. Uma biblioteca de vozes geradas por IA, que você pode filtrar por sexo, idade e sotaque, é exibida na guia Minhas vozes. As vozes também têm descrições como “profunda”, “confiante”, “nítida”, “intensa” e “relaxante”, além de categorias que podem ajudá-lo a determinar seus casos de uso ideais, desde transmissões de notícias até meditação ou até mesmo ASMR. Encontre essas qualidades abaixo do nome da voz e use o botão play para visualizar a voz. Você pode marcar seus favoritos clicando no ícone de coração para facilitar a localização posterior.

Clique na lista suspensa Exibir e selecione Favoritos para encontrar todas as suas vozes favoritas ou Em projeto para ver as vozes usadas no projeto atual. Depois de escolher uma voz, clique no botão Usar para alternar para a guia Conversão de texto em fala. A voz escolhida já está pré-selecionada.

Em seguida, insira seu script na caixa de texto fornecida ou clique no link adicionar das anotações do slide para copiar as anotações do slide. O script pode ter no máximo 5.000 caracteres. Para acessibilidade, deixe a caixa Gerar legendas ocultas marcada — o AI Assistant gerará legendas ocultas automaticamente. Você pode determinar instantaneamente se sua narração de conversão de texto em fala tem legendas ocultas pelo rótulo CC que aparece ao lado de cada saída.

Encontre mais vozes na Biblioteca de Voz

Além das vozes pré-fabricadas, você também tem acesso a uma biblioteca de voz estendida com milhares de vozes ultrarrealistas geradas por IA que podem ser filtradas por idade, sexo e caso de uso. Descubra a voz certa para seu conteúdo na biblioteca de voz consultando os guias do usuário a seguir.

Período de notificação de remoção de voz

Uma voz pode ter um período de aviso prévio, que especifica por quanto tempo você poderá acessar a voz se o criador decidir removê-la da biblioteca de voz. Quando isso acontecer, a voz removida não estará mais disponível na biblioteca. Se você já a adicionou ao My Voices no Storyline 360 ou aos Favoritos no Rise 360, a voz removida ainda aparecerá na sua lista e poderá ser usada para gerar novos conteúdos, mas no Storyline 360, você verá um aviso e a data em que ela não estará mais disponível. Quando o período de notificação expirar, a voz exibirá um erro e não poderá mais ser visualizada ou usada para gerar novo conteúdo.

A maioria das vozes tem períodos de aviso prévio, mas outras não. Vozes sem aviso prévio desaparecem imediatamente da biblioteca de voz se o criador da voz decidir excluí-las. O conteúdo gerado usando uma voz que foi removida da biblioteca de voz continuará funcionando como um arquivo de áudio normal.

Se você quiser substituir uma voz antes que ela seja removida, siga as etapas descritas aqui para cada aplicativo.

Ajustar as configurações de voz

Diferentemente da conversão de texto em fala clássica, as vozes geradas por IA na conversão de texto em fala do AI Assistant podem ser personalizadas para um desempenho de voz personalizado. A configuração Modelo permite que você escolha entre três opções diferentes:

v3 (modelo padrão) - Mais expressivo, com uma ampla gama emocional e suporte para mais de 70 idiomas. Permite no máximo 3.000 caracteres. Para obter melhores resultados, confira algumas técnicas de solicitação abaixo.
Multilíngue v2 - Resultados mais consistentes, melhores para vozes multilíngues e acentuadas, com suporte para 29 idiomas. Permite no máximo 10.000 caracteres.
Flash v2.5 - Saída mais rápida, menos nuances e alcance. Permite no máximo 40.000 caracteres.

Dica profissional: algumas vozes soam melhor em determinados modelos e alguns têm melhor desempenho em idiomas específicos. Experimente combinações diferentes para descobrir o que funciona melhor. Por exemplo, a voz de Matilda soa mais natural em espanhol com o modelo Multilingual v2 do que com a v3.

A configuração Estabilidade controla o equilíbrio entre a estabilidade e a aleatoriedade da voz. A velocidade define o ritmo, e a Similaridade determina até que ponto o AI Assistant deve seguir a voz original ao replicá-la.

As configurações adicionais incluem exagero de estilo, que amplifica o estilo da voz original, e aumento de alto-falante, que aprimora a semelhança entre a fala sintetizada e a voz. Observe que, se alguma dessas configurações for ajustada, a geração de sua fala demorará mais.

Brinque com essas configurações para encontrar o equilíbrio certo para seu conteúdo. A tabela abaixo descreve o valor padrão do controle deslizante para cada configuração. Para o modelo v3, a estabilidade é a única opção disponível.

Configuração	Storyline 360	Rise 360
Estabilidade	0,50	50
Rapidez	1,00	100
Similaridade	1,00	100
Exagero de estilo	0,00	0
Aumento do alto-falante (caixa de seleção)	Verificado	Verificado

Observação: algumas vozes no modelo Multilingual v2 tendem a ter um volume inconsistente, diminuindo no final, ao gerar clipes longos. Esse é um problema conhecido com o modelo subjacente, e nosso subprocessador de IA para conversão de texto em fala está trabalhando para resolvê-lo. Enquanto isso, sugerimos as seguintes soluções alternativas:

Use uma voz diferente
Mude para o modelo Flash v2.5
Aumente a estabilidade da voz
Divida manualmente seu texto em partes menores para gerar clipes mais curtos

Preciso usar SSML?

O AI Assistant tem suporte limitado para linguagem de marcação de síntese de fala (SSML) porque as vozes geradas por IA são projetadas para entender a relação entre palavras e ajustar a entrega adequadamente. Se precisar controlar manualmente o ritmo, você pode adicionar uma pausa. A maneira mais consistente de fazer isso é inserindo a sintaxe <break time="1.5s" /> em seu script. Isso cria uma pausa exata e natural na fala. Por exemplo:

Com seus sentidos aguçados, os <break time="1.5s" /> gatos são caçadores habilidosos.

Use segundos para descrever uma pausa de até três segundos de duração.

Você pode experimentar um traço simples - ou um traço eletrônico — para inserir uma breve pausa ou vários traços para uma pausa mais longa. Às vezes, as elipses ... também funcionam para adicionar uma pausa entre as palavras. No entanto, essas opções podem não funcionar de forma consistente, então recomendamos usar a sintaxe acima para manter a consistência. Lembre-se de que um número excessivo de etiquetas de quebra pode causar instabilidade.

Nota: O modelo v3 não suporta tags de quebra SSML. Use etiquetas de áudio, pontuação (elipses) e estrutura de texto para controlar as pausas e o ritmo.

Técnicas de solicitação para v3

O modelo v3 introduz o controle emocional por meio de etiquetas de áudio, permitindo que as vozes riam, sussurrem, sejam sarcásticas ou mostrem curiosidade, entre outras opções.

A tabela a seguir lista várias tags que você pode usar para controlar a entrega vocal e a expressão emocional, bem como para adicionar sons e efeitos de fundo. Também inclui algumas etiquetas experimentais para usos criativos.

Voz e emoção

Sons e efeitos

Experimental

[ri], [ri mais forte], [começa a rir], [chiando]
[sussurra]
[suspira], [exala]
[sarcástico], [curioso], [animado], [chorando], [bufa], [maliciosamente]

Exemplo: [sussurra] Não olhe agora, mas acho que eles nos ouviram.

[tiro], [aplausos], [aplausos], [explosão]
[andorinhas], [goles]

Exemplo: [aplausos] Bem, foi melhor do que o esperado. [explosão] Não importa.

[sotaque X forte] (substitua X pelo sotaque desejado)
[canta], [corteja]

Exemplo: [forte sotaque francês] Zat não é o que eu tinha em mente, non non non.

Além das tags de áudio, a pontuação também afeta a entrega. As elipses (...) adicionam pausas, a capitalização enfatiza palavras ou frases específicas e a pontuação padrão imita o ritmo natural da fala. Por exemplo: “Foi MUITO bem-sucedido! ... [começa a rir] Dá para acreditar?”

Dicas:

Use etiquetas de áudio que correspondam à personalidade da voz. Uma voz calma e meditativa não grita, e uma voz de alta energia não sussurra de forma convincente.
Solicitações muito curtas podem levar a resultados inconsistentes. Para uma saída mais consistente e focada, sugerimos prompts com mais de 250 caracteres.
Algumas etiquetas experimentais podem ser menos consistentes em todas as vozes. Teste minuciosamente antes de usar.
Combine várias etiquetas para uma entrega emocional complexa. Experimente combinações diferentes para descobrir o que funciona melhor para a voz selecionada.
A lista acima é simplesmente um ponto de partida; podem existir tags mais eficazes. Experimente combinar estados emocionais e ações para descobrir o que funciona melhor para seu caso de uso.
Use a fala natural, a pontuação correta e sinais emocionais claros para obter os melhores resultados.

Vozes multilíngues expandem seu alcance

Outro benefício atraente da conversão de texto em fala gerada por IA é a capacidade de preencher lacunas linguísticas, permitindo que você se conecte com públicos internacionais. Com suporte para mais de 70 idiomas, dependendo do modelo, incluindo alguns com vários sotaques e dialetos, a conversão de texto em fala do AI Assistant ajuda seu conteúdo a alcançar um público global.

Tudo o que você precisa fazer é digitar ou colar seu script no idioma compatível que você deseja que o AI Assistant use. (Mesmo que a descrição da voz indique um sotaque ou idioma específico, o AI Assistant gerará a narração no idioma usado em seu script.) Observe que algumas vozes tendem a funcionar melhor com determinados sotaques ou idiomas, então sinta-se à vontade para experimentar vozes diferentes para encontrar a mais adequada às suas necessidades.

A tabela abaixo fornece um resumo rápido dos idiomas compatíveis.

Disponível em v3, Multilingual v2 e Flash v2.5:

Árabe (Arábia Saudita)
Árabe (Emirados Árabes Unidos)
búlgaro
chinês
croata
Tcheco
dinamarquês
holandês
Inglês (Austrália)
Inglês (Canadá)
Inglês (Reino Unido)
Inglês (EUA)
Filipino
finlandês
Francês (Canadá)
Francês (França)
alemã
grego

hindi
indonésio
italiano
japonesa
coreana
malaio
polonês
Português (Brasil)
Português (Portugal)
romeno
russa
eslovaca
Espanhol (México)
Espanhol (Espanha)
sueca
tâmil
turca
ucraniano

Disponível em v3 e Flash v2.5:

húngaro
norueguês
vietnamita

Disponível somente na v3:

Afrikaans (afr)
Armênio (hye)
Assamês (asm)
Azerbaijano (aze)
Bielorrusso (bel)
Bengali (ben)
Bósnio (bos)
Catalão (gato)
Cebuano (ceb)
Chichewa (nova)
Estoniano (oeste)
galego (glg)
Georgiano (kat)
Gujarati (goma)
Hausa (hau)
Hebraico (heb)
Islandês (isl)
Irlandês (gle)
Javanês (jav)
Kannada (kan)
Cazaque (kaz)
Quirguiz (kir)
Letão (lav)

Lingala (linha)
Lituano (lit)
Luxemburguês (ltz)
Macedônio (mkd)
Malayalam (mapa)
Chinês mandarim (cmn)
Marathi (mar)
Nepalês (nep)
Pashto (pus)
Persa (fascista)
Punjabi (pan)
Sérvio (srp)
Sindhi (areia)
Esloveno (slv)
Somali (som)
Suaíli (swa)
Telugu (tel)
Tailandês (tha)
Urdu (urd)
Galês (cym)

Crie efeitos sonoros usando prompts

Os efeitos sonoros alinhados ao tema e ao conteúdo podem destacar ações ou comentários importantes, como clicar em um botão ou escolher uma resposta correta, oferecendo uma experiência de e-learning mais envolvente e eficaz. Com os efeitos sonoros do AI Assistant, agora você pode usar as instruções para criar facilmente praticamente qualquer som imaginável. Chega de perder tempo vasculhando a web em busca de sons pré-fabricados que podem custar mais!

Comece a criar efeitos sonoros de alta qualidade acessando o menu AI Assistant na faixa de opções abaixo da guia Início ou Inserir. Em seguida, clique na metade inferior do ícone Inserir áudio e escolha Efeitos sonoros. (Você também pode acessá-lo no menu suspenso Áudio na guia Inserir. Basta selecionar Efeitos sonoros na opção Áudio AI.) Na caixa de texto, descreva o efeito sonoro desejado e escolha uma duração. Você pode ajustar o controle deslizante de influência do Prompt para dar ao AI Assistant uma licença mais ou menos criativa na geração do som.

Como o AI Assistant entende a linguagem natural, os efeitos sonoros podem ser criados usando qualquer coisa, desde um simples aviso, como “um único clique do mouse”, até um muito complexo que descreve vários sons ou uma sequência de sons em uma ordem específica. Observe que você tem no máximo 450 caracteres para descrever o som que deseja gerar.

Clique nos links a seguir para ouvir os efeitos sonoros criados usando um prompt simples e um complexo.

Aviso: um único clique do mouse. Clique para ouvir.
Aviso: cães latem e depois caem raios. Clique para ouvir.

Você também pode ajustar a Duração — por quanto tempo o efeito sonoro é reproduzido — até um máximo de 22 segundos. Por exemplo, se sua mensagem for “cachorro latindo” e você definir a duração para 10 segundos, você receberá latidos contínuos, mas uma duração de dois segundos é um latido rápido. Ajustar o controle deslizante Prompt Influence para a direita faz com que o AI Assistant siga estritamente seu prompt, enquanto deslizá-lo para a esquerda permite uma interpretação mais livre.

Dica profissional: você pode determinar instantaneamente se o efeito sonoro tem legendas ocultas pelo rótulo CC que aparece ao lado de cada saída.

Alguns termos profissionais que você deve conhecer

Usar terminologia de áudio — vocabulário especializado que especialistas em áudio usam em seu trabalho — pode ajudar a melhorar suas instruções e produzir efeitos sonoros ainda mais dinâmicos. Aqui estão alguns exemplos:

Braam: Um som baixo profundo, ressonante e frequentemente distorcido usado na mídia, especialmente em trailers, para criar uma sensação de tensão, potência ou destruição iminente.

Whoosh: Um som rápido e estridente, geralmente usado para enfatizar movimentos rápidos, transições ou momentos dramáticos.

Impacto: um ruído forte e marcante usado para indicar uma colisão, impacto ou contato repentino com força, geralmente para destacar um momento de ação ou ênfase.

Falha: um ruído curto, estridente e geralmente digital que imita um defeito ou distorção, comumente usado para transmitir erros.

Foley: O processo de recriar e gravar efeitos sonoros cotidianos, como movimentos e sons de objetos, em sincronia com o visual de um filme, vídeos ou outras mídias.

Aqui está algo divertido de experimentar! Gere um efeito sonoro de 3 segundos usando o comando “qualidade de estúdio, impacto sonoro projetado de whoosh and braam”. Aumentar a duração pode produzir melhores efeitos sonoros, mas também criará mais ar morto no final.

Dica profissional: onomatopeias — palavras como “zumbido”, “boom”, “clique” e “pop” que imitam sons naturais — também são termos importantes de efeitos sonoros. Use-os em suas instruções para criar efeitos sonoros mais realistas.

Tutoriais em vídeo

Quer saber mais antes de começar? Confira nossos tutoriais em vídeo para obter orientações adicionais sobre como usar o AI Assistant para gerar conversão de texto em fala e efeitos sonoros.

O Articulate 360 Training também tem tutoriais em vídeo adicionais sobre o uso de outros recursos do AI Assistant.

Você deve estar logado na sua conta do Articulate 360 para assistir aos vídeos. Ainda não tem uma conta? Inscreva-se para um teste gratuito agora!

Suporte

Treinamento

Eventos

Contato