top of page
Foto del escritorCarlos Altamirano

Videos con IA's: Conceptos y creación | Xyclos


Conceptos para la creación de videos usando IA | Xyclos

Crear videos manualmente

A lo largo de más de 15 años, he creado cientos de videos para los cursos online que dictamos en Xyclos Academy


¿Que procesos he llevado a cabo para crear los videos?


Todo ha dependido de la complejidad del tema que voy a tratar.


Temas fáciles

  • Prueba de equipos

    • Funcionamiento de la cámara

    • Funcionamiento y volumen del micrófono

  • Repaso lo que voy a decir, una, dos o tres veces, hasta sentirme seguro

  • Grabo el video

  • Edito el video

    • Elimino sonidos innecesarios

    • Agrego apoyos didácticos

    • Elimino partes innecesarias del video

    • Agrego el título y el fin del video

  • Creo el video en formato MP4


Temas complejos

  • Prueba de equipos

    • Funcionamiento de la cámara

    • Funcionamiento y volumen del micrófono

  • Repaso lo que voy a decir, una, dos o tres veces

  • Escribo el diálogo

  • Repaso nuevamente y hago ajustes al diálogo, hasta sentirme seguro

  • Grabo el video

  • Edito el video

    • Elimino sonidos innecesarios

    • Agrego apoyos didácticos

    • Elimino partes innecesarias del video

    • Agrego el título y el fin del video

  • Creo el MP4


El objetivo es crear el video una sola vez, pero si a pesar de los controles, si detecto que hay algo que se puede mejorar, en la mayoría de los casos creo nuevamente el video y a veces en casos excepcionales, solo agrego al video otro video y sonido con cambios específicos.


Crear videos con IA's

Pero ahora, con las inteligencias artificiales de video o Video LLM's, para ciertos aspectos o temas, la creación de videos está "más fácil".


Por ejemplo, en Sora de OpenAI, solo creas el prompt del video y Sora te genera un espectacular video.


Esta bien, muy bien.


¿Pero que sucede si necesito hacer cambios o controlar el video?


Bueno, entonces aprendamos los conceptos. Voy a ir en orden.


¿Qué es un video?


Un video es una serie de imágenes fijas (fotogramas) que, cuando se muestran en secuencia rápida, crean la ilusión de movimiento.


Esta secuencia de imágenes se acompaña a menudo de audio y se reproduce a una velocidad que permite a los espectadores percibir las imágenes como una representación continua y fluida de la realidad.


Los videos son una forma de comunicación visual y auditiva que se utiliza para capturar, grabar, procesar, transmitir y reconstruir escenas en movimiento.


Se utilizan en diversos contextos, como el entretenimiento, la educación, la publicidad y la comunicación personal, aprovechando la capacidad de contar historias, transmitir mensajes y capturar eventos de manera dinámica y atractiva.


¿Que son los FPS?


FPS significa "frames per second" o "fotogramas por segundo". Es una medida que indica la cantidad de imágenes individuales (fotogramas) que se muestran en un segundo de video o animación. Aquí hay algunos puntos clave sobre el FPS:

24 FPS

Tradicionalmente se ha utilizado en el cine. Proporciona una apariencia suave y natural al movimiento.

30 FPS

Es común en la televisión estándar. Ofrece un movimiento más fluido que el cine y es adecuado para transmisiones en vivo.

60 FPS

Utilizado en televisión de alta definición, transmisiones en vivo, y videojuegos, proporcionando una experiencia visual muy fluida, ideal para escenas de acción rápida.

Mayor que 60 FPS

Se utiliza en videojuegos de alto rendimiento y realidad virtual para crear movimientos extremadamente suaves y una experiencia más inmersiva.

El FPS afecta cómo percibimos el movimiento en el video: un FPS más bajo puede resultar en un video que parece entrecortado o con saltos, mientras que un FPS más alto ofrece una reproducción más suave y fluida. El FPS (fotogramas por segundo) más utilizado para videos en YouTube y redes sociales es 24 FPS para contenido con aspecto más cinematográfico y 30 FPS para videos estándar, incluyendo vlogs, tutoriales y otros tipos de contenido digital.


¿Que formatos hay de videos?

Los formatos de video más utilizados TikTok, Redes sociales y YouTube son:

Para TikTok:

Formato: Vertical

Aspect ratio: 9:16

Resolución recomendada: 1080x1920

Formatos de archivo: MP4 o MOV

Para redes sociales (como Instagram, Facebook, y Twitter):

Instagram Stories y Reels: 9:16 (vertical), MP4 o MOV

Instagram Feed: 1:1 (cuadrado), 4:5 (vertical), o 16:9 (horizontal), MP4 o MOV

Facebook: 1:1 (cuadrado) o 16:9 (horizontal), MP4 o MOV

Twitter: 16:9 (horizontal) o 1:1 (cuadrado), MP4

Para YouTube:

Aspect ratio: 16:9 (horizontal) es el más común, aunque admite otros aspect ratios.

Resolución recomendada: 1920x1080 (1080p)

Formatos de archivo: MP4 (recomendado), MOV, AVI, y FLV

Estos formatos son preferidos debido a su compatibilidad con la mayoría de los dispositivos y plataformas, así como por su balance entre calidad y tamaño de archivo, lo que facilita la carga y transmisión de los videos.


Muy bien esto es lo básico y general, ahora vamos a ver la estructura de un video considerando el uso de una Inteligencia artificial.


Proceso de creación de videos usando IA's


  1. Por lo general se va iniciar el proceso creando un prompt, lo más detallado posible del video a generar, incluyendo: Objetivo del video Público objetivo Personajes (Characters) Edad Lugar Hora del día o noche Vestuario Estado de ánimo de los personajes Location Luz Clima (Weather) Idioma Voiceover El voice-over (también conocido como voz en off) se refiere a la técnica de producción en la que una voz, que no pertenece a parte del narrativo (o diálogo) en pantalla, se utiliza en radio, televisión, cine, teatro o en otras presentaciones. La voz en off se utiliza para proporcionar narración, dar explicaciones o guiar al espectador a través de la historia. Esta voz puede ser la del narrador de la historia, un personaje no visible, o una persona externa a la historia que proporciona información adicional al público para facilitar la comprensión del contenido presentado.  Efectos de sonido (Sound effects) Los sonidos o efectos de sonido son elementos de audio utilizados en diversas producciones para realzar la experiencia auditiva y ayudar a contar una historia. Algunos ejemplos comunes incluyen: Sonidos naturales: Como el canto de los pájaros, el sonido del viento, las olas del mar, o la lluvia. Sonidos urbanos: Tales como el tráfico, bocinas de autos, sirenas de ambulancias o policía, y ruido de multitudes. Sonidos de objetos: Como puertas que se abren o cierran, cristales rompiéndose, pasos, o el sonido de llaves. Sonidos de animales: Ladridos de perros, maullidos de gatos, rugidos de leones, o el canto de los grillos. Efectos de sonido industriales: Sonidos de maquinaria, motores, herramientas de trabajo, y otros sonidos relacionados con entornos industriales o de construcción. Efectos especiales: Sonidos diseñados para películas, videojuegos o teatro, como explosiones, disparos, sonidos de magia, o ruidos espaciales. Sonidos corporales: Como aplausos, tos, estornudos, risas o llantos. Ambientes sonoros: Combinaciones de diversos sonidos para crear una atmósfera específica, como un café concurrido, un bosque, una estación de tren, o un entorno futurista. Estos efectos de sonido se utilizan para enriquecer el contenido audiovisual, creando una atmósfera más inmersiva y evocando emociones específicas en el público. Subtítulos Dependiendo de la Inteligencia artificial será posible indicarle si se deben o no generar subtítulos. Proporción de aspecto (Aspect ratio) Los aspect ratios más utilizados en plataformas como TikTok, YouTube y en general son: Para TikTok: El aspect ratio más común es 9:16 (vertical), ya que está optimizado para dispositivos móviles y la visualización en pantalla completa en vertical. Este formato permite que los videos ocupen toda la pantalla de un smartphone, lo que es ideal para la experiencia de usuario en TikTok. Para YouTube: El aspect ratio más usado es 16:9 (horizontal), que es el estándar para videos de alta definición. Este formato es ideal para la visualización en una amplia variedad de dispositivos, incluyendo televisores, monitores de ordenador y dispositivos móviles en orientación horizontal. En general: Además de los mencionados anteriormente, el aspect ratio 1:1 (cuadrado) es también popular en plataformas de redes sociales como Instagram y Facebook, especialmente para publicaciones de imágenes y videos cortos. Este formato funciona bien en feeds donde los usuarios se desplazan verticalmente y es efectivo tanto en dispositivos móviles como en escritorios. Cada uno de estos formatos de aspect ratio está diseñado para optimizar la experiencia de visualización en diferentes tipos de dispositivos y plataformas, maximizando el impacto visual y la retención del espectador.

  2. La IA va a procesar el prompt y descomponerlo:

    1. Creando una sinopsis de lo que entendió del prompt

    2. Creando los personajes

    3. Creando un Storyboard: El Storyboard ayuda a visualizar y planificar la secuencia de eventos, las transiciones entre escenas, y la interacción de los personajes y elementos dentro de la película antes de la producción​.

  3. Creará el video

  4. En algunos casos podrá editar el video Finalmente lo descarga y los usa en su sitio Web y/o Redes sociales


Lo importante es irse preparando con los varios conceptos y términos que se usan en el ecosistema multimedia, específicamente en el manejo y creación de videos y conceptos de Inteligencia artificial para generar el prompt más eficiente para la creación del video.






10 visualizaciones0 comentarios

Entradas relacionadas

Ver todo

Comments


bottom of page