Conoce el nuevo modelo Zeroscope v2 un modelo gratuito de texto a video que se ejecuta en tarjetas gráficas modernas.

Introducing the new Zeroscope v2, a free text-to-video model that runs on modern graphics cards.

En una serie de eventos sin precedentes, se ha lanzado al mercado un modelo de inteligencia artificial de código abierto de próxima generación llamado Zeroscope, con la capacidad de ejecutar un servicio de texto a video de última generación en tarjetas gráficas de última generación disponibles para los usuarios a un costo comparativamente mucho más bajo. Zeroscope de Modelscope, propiedad de China, tiene como objetivo revolucionar los medios y la creación de videos al desbloquear un nuevo espectro de casos de uso de IA.

Es importante comprender los componentes funcionales de Zeroscope para entender cómo está revolucionando el campo de la generación de video a través de texto. Lo que hace que este modelo de código abierto se destaque son sus dos componentes clave, Zeroscope V2 y Zeroscope V2XL; Zeroscope_v2 567w, diseñado para la creación rápida de contenido en una resolución de 576×320 píxeles para explorar conceptos de video. Los videos de calidad se pueden ampliar a una resolución de “alta definición” de 1024×576 utilizando zeroscope_v2_XL, por lo que un usuario puede crear rápidamente videos usando ZeroScope V2 y luego ampliarlos con V2XL.

Además de eso, los requisitos de Zeroscope son sorprendentemente manejables debido a los 1.7 mil millones de parámetros del modelo multinivel. Zeroscope opera con los requisitos de VRAM de 7.9 gigabytes en la resolución más baja y 15.3 gigabytes en la más alta. El modelo más pequeño está diseñado para ser ejecutable en muchas tarjetas gráficas estándar, lo que lo hace accesible a una base de usuarios más amplia y general.

Zeroscope ha sido entrenado estratégicamente con ruido de desplazamiento en casi 10,000 clips y casi 30,000 fotogramas recopilados, cada uno compuesto por fotogramas. Este conjunto de acciones no convencionales desbloquea nuevas oportunidades y posibilidades para Zeroscope. Con la introducción de variaciones como desplazamientos aleatorios de objetos, cambios leves en los tiempos de los fotogramas y distorsiones menores, el modelo mejora su comprensión de la distribución de datos, lo que ayuda al modelo a generar videos más realistas a escalas diversas e interpretar de manera efectiva las variaciones matizadas en las descripciones de texto. Con todas estas características, Zerscope está en camino de convertirse rápidamente en un digno competidor de Runway, que es un proveedor de modelos comerciales de texto a video.

La conversión de texto a video es un campo en progreso, ya que los videoclips generados tienden a ser más cortos y cargados con algunas deficiencias visuales. Sin embargo, si observamos el historial de los modelos de IA de imagen, también sufrieron desafíos similares antes de lograr un estado para alcanzar una calidad fotorealista. El desafío principal es que la generación de video requiere significativamente más recursos tanto en las fases de entrenamiento como en las de generación.

La aparición de Zeroscope como un modelo potente de texto a video allana el camino para muchos nuevos avances digitales y casos de uso, como:

  1. Juegos personalizados, realidad virtual y metaverso: la capacidad de transformación de Zeroscope puede redefinir la narrativa en los videojuegos. Los jugadores pueden influir en las escenas cortadas y en el juego en tiempo real a través de sus palabras, lo que permite una interacción y personalización inimaginables. Además, los desarrolladores de juegos pueden prototipar y visualizar rápidamente escenas de juego, acelerando el desarrollo.
  2. Películas personalizadas: la tecnología de Zeroscope interrumpe la industria de los medios al generar contenido individualizado basado en las descripciones de los usuarios. Los usuarios pueden ingresar la historia o descripciones de escenas y se crearán videos personalizados en respuesta. Esta función permite la participación activa del espectador y abre oportunidades para la creación de contenido personalizado, como anuncios de video personalizados o escenas de películas adaptadas al usuario.
  3. Creadores sintéticos: Zeroscope allana el camino para una nueva generación de creadores que confían en la IA para escribir, producir y editar sus ideas en realidad. Elimina las barreras de habilidades técnicas en la creación de videos y tiene el potencial de establecer un nuevo estándar para el contenido de video automatizado y de alta calidad. La línea entre los creadores humanos y de IA se difumina, expandiendo el panorama de la creatividad.

Zeroscope es, como se pretende, un modelo revolucionario ligero que se puede ajustar fácilmente y no requiere una configuración de recursos especiales, lo que lo convierte no solo en una herramienta que múltiples audiencias generales pueden utilizar, sino que muchos nuevos investigadores emergentes que carecen de los recursos de un gran laboratorio ahora pueden trabajar con tales algoritmos para comprenderlos mejor y evolucionar todo este campo de una mejor manera a un costo razonable. Sería increíble ver cómo la dura competencia inspirará a los creadores de Zeroscope a innovar y obtener una sólida posición en el mercado.

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Inteligencia Artificial

Microsoft AI propone MM-REACT un paradigma del sistema que combina ChatGPT y expertos en visión para un razonamiento y acción multimodal avanzados.

Los Grandes Modelos de Lenguaje (LLMs) están avanzando rápidamente y contribuyendo a transformaciones económicas y so...

Inteligencia Artificial

Meta utilizó libros con derechos de autor para entrenar su modelo LLaMA, los autores presentan una demanda

Meta Platforms, anteriormente conocida como Facebook, se encuentra envuelta en una turbulencia legal a medida que fig...