Generación y creatividad
IA generativa, prompts, difusión, multimodalidad · 12 términos en este bloque.
Generación y creatividad 12
Avatar digital (humano sintético)
Un avatar digital, también llamado humano sintético, es una persona generada por IA que aparece en vídeo hablando a cámara con voz natural. …
Clonación de voz (voice cloning)
La clonación de voz es la técnica que permite generar audio sintético con la voz de una persona concreta a partir de pocos segundos o minuto…
ControlNet
ControlNet es una técnica para controlar con precisión la composición de imágenes generadas por modelos de difusión: además del prompt de te…
Embeddings
Los embeddings son representaciones numéricas de texto, imágenes o audio en forma de vectores matemáticos de cientos o miles de dimensiones.…
Generación de vídeo con IA
La generación de vídeo con IA es la creación de clips audiovisuales a partir de un texto, una imagen o un fragmento de vídeo de referencia. …
Inpainting (edición con IA)
Inpainting es la técnica de IA generativa que permite editar partes específicas de una imagen: borras o seleccionas una zona y la IA genera …
Modelos de difusión
Los modelos de difusión son una técnica de IA para generar imágenes, vídeo o audio partiendo de ruido puro y refinándolo paso a paso hasta p…
Multimodalidad
La multimodalidad es la capacidad de un modelo de IA para procesar y combinar información de distintos formatos en una misma conversación: t…
Música generada con IA
La música generada con IA es la creación de canciones, instrumentales y bandas sonoras a partir de un prompt textual. En 2026 las herramient…
NeRF y Gaussian Splatting
NeRF (Neural Radiance Fields) y Gaussian Splatting son dos técnicas para reconstruir escenas y objetos 3D de alta fidelidad a partir de un c…
Reconocimiento de voz (ASR)
El reconocimiento de voz, conocido por las siglas ASR (automatic speech recognition) o STT (speech-to-text), convierte audio hablado en text…
Síntesis de voz (TTS)
La síntesis de voz, conocida por sus siglas en inglés TTS (text-to-speech), convierte texto escrito en audio hablado con voz humana sintétic…