Busqueda de Articulos

Selecciona un Producto

Directorio de soporte de null

Explore todos los artículos de null (Last Updated )

No se encontraron articulos.

Resultados de busqueda

No se encontraron articulos.

AI Assistant: producción de audio altamente realista

Artículo actualizado por última vez el 23 jul 2026

Como autor de un curso, quieres hacer algo más que presentar información: quieres crear experiencias de e-learning multisensoriales que atraigan a los alumnos. Utilizar el sonido de forma creativa puede ayudarte a conseguirlo. Las funciones de conversión de texto a voz y efectos de sonido de AI Assistant te permiten crear voces y efectos de sonido altamente realistas generados por IA para lograr un contenido más envolvente y accesible.

Originalmente, solo se podía acceder a estas dos funciones en Storyline 360. Sin embargo, a partir de la actualización de julio de 2025, el AI Assistant de Rise 360 puede generar narraciones de texto a voz. Visita esta guía del usuario para empezar a crear narraciones generadas por IA en Rise 360.

En Storyline 360, se puede acceder a estas funciones desde el menú desplegable Insertar audio del menú AI Assistant de la cinta de opciones. Encuéntralas en las pestañas Inicio o Insertar cuando estés en la vista diapositiva o chatea con AI Assistant en el panel lateral para mayor comodidad.

Da vida a la narración con voces generadas por IA

Si alguna vez has utilizado la clásica conversión de texto a voz, probablemente desearías que las voces sonaran menos, bueno, robóticas. La conversión de texto a voz de AI Assistant da vida a la narración con voces generadas por IA sensibles al contexto que suenan de forma más natural, ¡y humana! Comprueba la diferencia de calidad entre una voz estándar, una voz neuronal y una voz generada por IA haciendo clic en los enlaces a los ejemplos de conversión de texto a voz que aparecen a continuación.

Para empezar, haga clic en el icono Insertar audio en el menú AI Assistant para abrir el cuadro de diálogo Generar audio AI. En la pestaña Mis voces aparece una biblioteca de voces generadas por IA, que puedes filtrar por género, edad y acento. Las voces también tienen descripciones como «profunda», «segura», «nítida», «intensa» y «relajante», y categorías que pueden ayudarte a determinar sus casos de uso ideales, desde emisiones de noticias hasta meditación o incluso ASMR. Encuentra estas cualidades debajo del nombre de la voz y usa el botón de reproducción para previsualizar la voz. Puedes marcar tus favoritos haciendo clic en el icono del corazón para que sea más fácil encontrarlos más adelante.

Haga clic en la lista desplegable Ver y seleccione Favoritos para buscar todas sus voces favoritas o En proyecto para ver las voces utilizadas en el proyecto actual. Cuando te hayas decidido por una voz, haz clic en el botón Usar para pasar a la pestaña Conversión de texto a voz. La voz que has elegido ya está preseleccionada.

A continuación, introduzca el guion en el cuadro de texto correspondiente o haga clic en el enlace agregar desde notas de diapositiva para copiar las notas de la diapositiva. El guion puede tener un máximo de 5000 personajes. Por motivos de accesibilidad, deja marcada la casilla Generar subtítulos opcionales: AI Assistant generará subtítulos opcionales automáticamente. Puedes determinar al instante si tu narración de conversión de texto a voz tiene subtítulos opcionales mediante la etiqueta CC que aparece junto a cada salida.

Encuentra más voces en la biblioteca de voces

Además de las voces prediseñadas, también tienes acceso a una biblioteca de voces ampliada con miles de voces ultrarrealistas generadas por IA que se pueden filtrar por edad, sexo y caso de uso. Descubre la voz adecuada para tu contenido en la biblioteca de voces consultando las siguientes guías de usuario.

Periodo de notificación de eliminación de voz

Es posible que una voz tenga un período de preaviso, que especifica durante cuánto tiempo podrás acceder a la voz si su creador decide eliminarla de la biblioteca de voces. Cuando eso suceda, la voz eliminada ya no estará disponible en la biblioteca. Si la has añadido anteriormente a Mis voces en Storyline 360 o a Favoritos en Rise 360, la voz eliminada seguirá apareciendo en tu lista y podrás usarla para generar contenido nuevo, pero en Storyline 360 verás una advertencia y la fecha en que ya no está disponible. Cuando venza el período de preaviso, la voz mostrará un error y ya no se podrá previsualizar ni usar para generar contenido nuevo.

La mayoría de las voces tienen períodos de preaviso, pero otras no. Las voces sin un período de preaviso desaparecen inmediatamente de la biblioteca de voces si el creador de la voz decide eliminarlas. El contenido generado con una voz que se haya eliminado de la biblioteca de voces seguirá funcionando como un archivo de audio normal.

Si quieres reemplazar una voz antes de que se elimine, sigue los pasos que se describen aquí para cada aplicación.

Ajusta la configuración de voz

A diferencia de la conversión de texto a voz clásica, las voces generadas por la IA en la conversión de texto a voz de AI Assistant se pueden personalizar para obtener un rendimiento de voz personalizado. La configuración del modelo te permite elegir entre tres opciones diferentes:

v3 (modelo predeterminado): el más expresivo, con un amplio rango emocional y soporte técnico para más de 70 idiomas. Permite un máximo de 3000 personajes. Para obtener los mejores resultados, consulta algunas de las siguientes técnicas de solicitud.
Multilingüe v2: resultados más consistentes, ideales para voces multilingües y acentuadas, con soporte técnico para 29 idiomas. Permite un máximo de 10 000 personajes.
Flash v2.5: salida más rápida, menos matices y alcance. Permite un máximo de 40 000 personajes.

Consejo profesional: Algunas voces suenan mejor con algunos modelos y otros funcionan mejor en idiomas específicos. Experimenta con diferentes combinaciones para encontrar la que funcione mejor. Por ejemplo, la voz de Matilda suena más natural en español con el modelo Multilingual v2 que con el v3.

El ajuste de estabilidad controla el equilibrio entre la estabilidad y la aleatoriedad de la voz. La velocidad marca el ritmo y la similitud determina hasta qué punto AI Assistant debe ceñirse a la voz original al replicarla.

Los ajustes adicionales incluyen la exageración de estilo, que amplifica el estilo de la voz original, y el refuerzo del altavoz, que mejora la similitud entre la voz sintetizada y la voz. Tenga en cuenta que si se ajusta alguno de estos ajustes, la generación de la voz tardará más tiempo.

Experimenta con estos ajustes para encontrar el equilibrio adecuado para tu contenido. En la siguiente tabla se describe el valor predeterminado del deslizador para cada configuración. Para el modelo v3, la estabilidad es la única opción disponible.

Configuración	Storyline 360	Rise 360
Estabilidad	0.50	50
Velocidad	1.00	100
Similitud	1.00	100
Exageración de estilo	0.00	0
Boost de altavoz (casilla de verificación)	Comprobado	Comprobado

Nota: Algunas voces del modelo multilingüe v2 tienden a tener un volumen incoherente (se desvanece hacia el final) cuando se generan clips largos. Este es un problema conocido del modelo subyacente, y nuestro subprocesador de IA para la conversión de texto a voz está trabajando para solucionarlo. Mientras tanto, sugerimos las siguientes soluciones alternativas:

Usa una voz diferente
Cambie al modelo Flash v2.5
Aumente la estabilidad de la voz
Divida manualmente el texto en trozos más pequeños para generar clips más cortos

¿Necesito usar SSML?

AI Assistant tiene un soporte técnico limitado para el lenguaje de marcado de síntesis de voz (SSML) porque las voces generadas por IA están diseñadas para comprender la relación entre las palabras y ajustar la pronunciación en consecuencia. Si necesitas controlar el ritmo manualmente, puedes agregar una pausa. La forma más coherente de hacerlo es insertando la sintaxis <break time="1.5s" /> en el script. Esto crea una pausa exacta y natural en el discurso. Por ejemplo:

Con sus agudos sentidos, <break time="1.5s" /> los gatos son hábiles cazadores.

Usa segundos para describir una pausa de hasta tres segundos de duración.

Puedes probar con un simple guión - o con un em-dash — para insertar una pausa breve o varios guiones para una pausa más larga. A veces, ... los puntos suspensivos también funcionan para agregar una pausa entre las palabras. Sin embargo, es posible que estas opciones no funcionen de forma coherente, por lo que recomendamos utilizar la sintaxis anterior para mantener la coherencia. Ten en cuenta que un número excesivo de etiquetas de interrupción puede provocar inestabilidad.

Nota: El modelo v3 no admite etiquetas de interrupción SSML. Utilice etiquetas de audio, signos de puntuación (puntos suspensivos) y estructura del texto para controlar las pausas y el ritmo.

Técnicas de señalización para la versión 3

El modelo v3 introduce el control emocional mediante etiquetas de audio, que permiten a las voces reír, susurrar, ser sarcásticas o mostrar curiosidad, entre otras opciones.

En la siguiente tabla se enumeran varias etiquetas que puede utilizar para controlar la voz y la expresión emocional, así como para agregar sonidos y efectos de fondo. También incluye algunas etiquetas experimentales para usos creativos.

Voz y emoción

Sonidos y efectos

Experimental

[ríe], [ríe más fuerte], [comienza a reír], [jadeando]
[susurros]
[suspira], [exhala]
[sarcástico], [curioso], [emocionado], [llorando], [resopla], [picarosamente]

Ejemplo: [susurros] No mires ahora, pero creo que nos han oído.

[disparo], [aplausos], [aplausos], [explosión]
[traga], [traga]

Ejemplo: [aplausos] Bueno, salió mejor de lo esperado. [explosión] No importa.

[acento X fuerte] (sustituya la X por el acento deseado)
[canta], [woo]

Ejemplo: [fuerte acento francés] Zat no es lo que tenía en mente, non non.

Además de las etiquetas de audio, la puntuación también afecta a la reproducción. Los puntos suspensivos (...) agregan pausas, las mayúsculas enfatizan palabras o frases específicas y la puntuación estándar imita el ritmo natural del habla. Por ejemplo: «¡Ha tenido MUCHO éxito! ... [comienza a reír] ¿Puedes creerlo?»

Consejos:

Usa etiquetas de audio que coincidan con la personalidad de la voz. Una voz tranquila y meditativa no gritará, y una voz con mucha energía no susurrará de manera convincente.
Las indicaciones muy breves pueden dar lugar a resultados inconsistentes. Para obtener un resultado más coherente y centrado, sugerimos mensajes de más de 250 caracteres.
Es posible que algunas etiquetas experimentales sean menos consistentes en todas las voces. Pruébelo minuciosamente antes de usarlo.
Combine varias etiquetas para lograr una entrega emocional compleja. Prueba diferentes combinaciones para encontrar la que mejor se adapte a la voz que has seleccionado.
La lista anterior es simplemente un punto de partida; es posible que existan etiquetas más eficaces. Experimenta con la combinación de estados emocionales y acciones para encontrar la que mejor se adapte a tu caso de uso.
Usa un lenguaje natural, una puntuación adecuada y señales emocionales claras para obtener los mejores resultados.

Las voces multilingües amplían su alcance

Otra ventaja convincente de la conversión de texto a voz generada por la IA es la capacidad de cerrar las brechas lingüísticas, lo que le permite conectarse con audiencias internacionales. Con soporte técnico para más de 70 idiomas según el modelo, incluidos algunos con varios acentos y dialectos, la conversión de texto a voz de AI Assistant ayuda a que tu contenido llegue a una audiencia global.

Todo lo que tienes que hacer es escribir o pegar tu script en el idioma compatible que quieras que utilice AI Assistant. (Aunque la descripción de la voz indique un acento o idioma específicos, AI Assistant generará la narración en el idioma utilizado en el guion). Ten en cuenta que algunas voces suelen funcionar mejor con determinados acentos o idiomas, así que no dudes en experimentar con diferentes voces para encontrar la que mejor se adapte a tus necesidades.

La siguiente tabla proporciona un resumen rápido de los idiomas compatibles.

Disponible en las versiones 3, Multilingual y Flash 2.5:

Árabe (Arabia Saudí)
Árabe (Emiratos Árabes Unidos)
búlgaro
chino
croata
checa
danés
holandesa
Inglés (Australia)
Inglés (Canadá)
Inglés (Reino Unido)
Inglés (EE. UU.)
filipino
finlandés
Francés (Canadá)
Francés (Francia)
alemán
griego

hindi
indonesio
italiano
japonés
coreano
malayo
polaco
Portugués (Brasil)
Portugués (Portugal)
rumano
rusa
eslovaco
Español (México)
Español (España)
sueco
Tamil
turca
ucraniana

Disponible en v3 y Flash v2.5:

húngara
noruego
vietnamita

Disponible solo en la versión 3:

Afrikáans (afr)
Armenio (hye)
Asamés (asm)
Azerbaiyano (aze)
Bielorruso (bel)
bengalí (ben)
Bosnio (bos)
Catalán (cat)
Cebuano (ceb)
Chichewa (Nueva York)
Estonio (est)
Gallego (glg)
Georgiano (kat)
Gujarati (guj)
Hausa (hau)
Hebreo (heb)
islandés (isl)
irlandés (gle)
javanés (jav)
Canarés (kan)
Kazajo (kaz)
Kirguiso (kir)
letón (lav)

Lingala (lin)
Lituano (lit)
luxemburgués (ltz)
Macedonio (mkd)
Malayalam (masculino)
Chino mandarín (cmn)
Maratí (mar)
Nepalí (nep)
Pashto (pus)
Persa (fas)
Punjabí (pan)
Serbio (srp)
Sindhi (snd)
Esloveno (slv)
Somalí (som)
Swahili (swa)
Telugu (tel)
Tailandés (tha)
Urdu (urd)
Galés (cym)

Crea efectos de sonido mediante indicaciones

Los efectos de sonido que se alinean con el tema y el contenido pueden resaltar acciones o comentarios importantes, como hacer clic en un botón o elegir una respuesta correcta, lo que ofrece una experiencia de cursos de e-learning más atractiva y eficaz. Con los efectos de sonido de AI Assistant, ahora puedes usar las indicaciones para crear fácilmente prácticamente cualquier sonido imaginable. ¡No pierdas más tiempo buscando en la web sonidos prefabricados que pueden costar más!

Empieza a crear efectos de sonido de alta calidad desde el menú AI Assistant de la cinta situada debajo de la pestaña Inicio o Insertar. A continuación, haz clic en la mitad inferior del icono Insertar audio y selecciona Efectos de sonido. (También puedes acceder a él desde el menú desplegable Audio de la pestaña Insertar. Simplemente selecciona Efectos de sonido en la opción AI Audio). En el cuadro de texto, describa el efecto de sonido que desee y elija una duración. Puedes ajustar el control deslizante Prompt Influence para dar a AI Assistant una licencia más o menos creativa a la hora de generar el sonido.

Como AI Assistant entiende el lenguaje natural, los efectos de sonido se pueden crear con cualquier cosa, desde un simple mensaje como «un solo clic del ratón» hasta uno muy complejo que describa varios sonidos o una secuencia de sonidos en un orden específico. Ten en cuenta que tienes un máximo de 450 personajes para describir el sonido que quieres generar.

Haga clic en los siguientes enlaces para escuchar los efectos de sonido creados con un mensaje simple y uno complejo.

Aviso: un solo clic del ratón. Haga clic para escuchar.
Aviso: Los perros ladran y luego cae un rayo. Haga clic para escuchar.

También puedes ajustar la duración (el tiempo que dura la reproducción del efecto de sonido) hasta un máximo de 22 segundos. Por ejemplo, si el mensaje es «perro ladrando» y estableces la duración en 10 segundos, escucharás ladridos continuos, pero una duración de dos segundos equivale a un ladrido rápido. Al ajustar el control deslizante Prompt Influence hacia la derecha, AI Assistant seguirá estrictamente tu mensaje, mientras que deslizarlo hacia la izquierda permite una interpretación más libre.

Consejo profesional: Puedes determinar al instante si tu efecto de sonido tiene subtítulos opcionales gracias a la etiqueta CC que aparece junto a cada salida.

Algunos términos profesionales que debes conocer

El uso de la terminología de audio (vocabulario especializado que los expertos en audio utilizan en su trabajo) puede ayudarte a mejorar tus indicaciones y a producir efectos de sonido aún más dinámicos. Estos son algunos ejemplos:

Braam: Un sonido de graves profundo, resonante y, a menudo, distorsionado que se utiliza en los medios de comunicación, especialmente en los tráilers, para crear una sensación de tensión, potencia o muerte inminente.

Zumbido: sonido rápido y vibrante que se suele utilizar para enfatizar los movimientos rápidos, las transiciones o los momentos dramáticos.

Impacto: ruido agudo y llamativo que se utiliza para indicar una colisión, un golpe o un contacto repentino y fuerte, a menudo para resaltar un momento de acción o énfasis.

Fallo: ruido breve, discordante y, por lo general, digital que simula un mal funcionamiento o una distorsión, y que se suele utilizar para transmitir errores.

Foley: proceso de recrear y grabar efectos de sonido cotidianos, como movimientos y sonidos de objetos, en sincronía con las imágenes de una película, un vídeo u otro medio.

¡Aquí tienes algo divertido para probar! Genera un efecto de sonido de 3 segundos con el mensaje «calidad de estudio, sonido diseñado como zumbido e impacto braam». Aumentar la duración puede producir mejores efectos de sonido, pero también generará más aire muerto hacia el final.

Consejo profesional: las onomatopeyas (palabras como «zumbido», «boom», «clic» y «pop» que imitan sonidos naturales) también son términos importantes en los efectos de sonido. Úsalos en tus indicaciones para crear efectos de sonido más realistas.

Tutoriales en vídeo

¿Desea obtener más información antes de empezar? Consulta nuestros tutoriales en vídeo para obtener más información sobre el uso de AI Assistant para generar conversión de texto a voz y efectos de sonido.

Articulate 360 Training también incluye tutoriales en vídeo adicionales sobre el uso de otras funciones de AI Assistant.

Debes iniciar sesión en tu cuenta de Articulate 360 para ver los vídeos. ¿Aún no tienes una cuenta? ¡Inscríbase ahora para una prueba gratuita!

Apoyo

Capacitación

Eventos

Contacto