El Observatorio de la IA
Ciberaula Observatorio IA GlosarioGeneración y creatividad
Glosario · Observatorio IA

Generación y creatividad

IA generativa, prompts, difusión, multimodalidad · 12 términos en este bloque.

Generación y creatividad

Avatar digital (humano sintético)

Un avatar digital, también llamado humano sintético, es una persona generada por IA que aparece en vídeo hablando a cámara con voz natural. …

Generación y creatividad

Clonación de voz (voice cloning)

La clonación de voz es la técnica que permite generar audio sintético con la voz de una persona concreta a partir de pocos segundos o minuto…

Generación y creatividad

ControlNet

ControlNet es una técnica para controlar con precisión la composición de imágenes generadas por modelos de difusión: además del prompt de te…

Generación y creatividad

Embeddings

Los embeddings son representaciones numéricas de texto, imágenes o audio en forma de vectores matemáticos de cientos o miles de dimensiones.…

Generación y creatividad

Generación de vídeo con IA

La generación de vídeo con IA es la creación de clips audiovisuales a partir de un texto, una imagen o un fragmento de vídeo de referencia. …

Generación y creatividad

Inpainting (edición con IA)

Inpainting es la técnica de IA generativa que permite editar partes específicas de una imagen: borras o seleccionas una zona y la IA genera …

Generación y creatividad

Modelos de difusión

Los modelos de difusión son una técnica de IA para generar imágenes, vídeo o audio partiendo de ruido puro y refinándolo paso a paso hasta p…

Generación y creatividad

Multimodalidad

La multimodalidad es la capacidad de un modelo de IA para procesar y combinar información de distintos formatos en una misma conversación: t…

Generación y creatividad

Música generada con IA

La música generada con IA es la creación de canciones, instrumentales y bandas sonoras a partir de un prompt textual. En 2026 las herramient…

Generación y creatividad

NeRF y Gaussian Splatting

NeRF (Neural Radiance Fields) y Gaussian Splatting son dos técnicas para reconstruir escenas y objetos 3D de alta fidelidad a partir de un c…

Generación y creatividad

Reconocimiento de voz (ASR)

El reconocimiento de voz, conocido por las siglas ASR (automatic speech recognition) o STT (speech-to-text), convierte audio hablado en text…

Generación y creatividad

Síntesis de voz (TTS)

La síntesis de voz, conocida por sus siglas en inglés TTS (text-to-speech), convierte texto escrito en audio hablado con voz humana sintétic…