Buscar

2023/07/21

Genera subtítulos a tus vídeos utilizando tu navegador

En un post anterior explicábamos cómo generar subtítulos para archivos de audio utilizando Google Colab y Whisper de OpenAI.

Si se trata de subtitular vídeos, en especial los mayores a 30 minutos, siguiendo el anterior tutorial primero tendríamos que extraer el audio del vídeo (se puede utilizar la opción "Convertir" de VLC), editarlo con Audacity para cortar el vídeo en pedazos de 30 minutos, procesarlos en Google Colab, descargar los subtítulos y combinarlos con Subtitle Workshop intentando sincronizarlos de acuerdo al bitrate, etc.

Es un proceso tedioso.

Ante este problema el equipo de desarrollo de CCExtractor ha puesto a disposición de todo el mundo una web en la que se puede realizar casi todas esas tareas desde el mismo navegador.

El sitio se llama Video 2 SRT y tiene la peculariedad de simplicar ese trabajo utilizando nuestro propio navegador (y poder de cómputo de nuestra PC).


Para utilizar Video2SRT debes hacer lo siguiente:

PASO 1:

En el botón "Seleccionar archivo" elegir el vídeo que piensas subtitular, puedes subir cualquier vídeo que sea soportado por las librerías ffmpeg. Si tienes algún vídeo con códec propietario tienes que convertirlo.

En algunos navegadores hay restricciones con los tamaños de los archivos, por ejemplo Google Chrome soporta un vídeo de hasta 2 GB de tamaño, Firefox acepta archivos superiores.

Recuerda que el sonido ambiental o el ruido pueden afectar la calidad de transcripción de Whisper.

Una vez que subas el vídeo aparecerá un pequeño reproductor indicando la duración total del vídeo subido.


PASO 2:

En la lista desplegable superior indica el modelo que utilizará Whisper para hacer la traducción, por defecto soporte el inglés, si selecionas otro idioma te indicará que descargará dicho modelo para utilizarlo, tomará unos pocos minutos.

Una vez el modelo esté listo para trabajar aparecerá el mensaje "Model Ready to use!" y se activará el botón CONVERT ubicado en la parte inferior.


PASO 3:

Indica la cantidad de threads, o hilos de procesos, que utilizará la web para generar los subtítulos. Si eliges más threads el proceso de subtitulado se hará más rápido pero hará trabajar más al procesador; de forma inversa, a menos threads el proceso es más lento pero la computadora no estará tan cargada de trabajo.


PASO 4: 

Presiona el boton CONVERT para que se inicie el proceso. Los subtítulos se van mostrando en la web apenas se van procesando, recuerda que Whisper siempre se toma su tiempo para transcribir los subtítulos y por eso siempre se recomienda tener computadoras potentes.


En mi prueba utilicé el vídeo JURASSIC PARK - Costume du Raptor (Making of) que tiene una duración de 4 minutos y 35 segundos y un tamaño de 87 MB.

Recuerda que el procesador de la computadora trabajará dependiendo de la cantidad de threads que se le haya indicado, en mi caso le envié 16 threads a una laptop con procesador Core i5 de 10ma generación.



PASO 5: 

Una vez acabada el proceso de subtitulado ve a la parte inferior de la página y encontrarás dos botones mediante los cuales podrás descargar los subtítulos en formato WebVTT o SRT, dependiendo de cuál prefieras.


PASO 6:

Abre el vídeo y adjunta el subtítulo que has descargado, verifica que estén sincronizados debido a que hay casos en los que la transcripción no se ajusta al bitrate del vídeo, si se da ese problema se pueden probar aplicaciones para sincronizar los subtítulos, una de ellas es SubSync.



OpenAI anuncia que ChatGPT estará disponible para Android


En un reciente tuit indicaron que la aplicación para Android de ChatGPT estará disponible en la próxima semana (entre el 24 y 27 de julio), para poder registrarse para la instalación de la App deben acceder al link de Play Store y presionar el botón verde "Registro previo".

Accede a ChatGPT en Play Store.



2023/07/20

Prueba online el chatbot "Llama2 70B Chatbot"

Llama 2 es un modelo de lenguaje predictivo desarrollado entre Meta (Facebook) y Microsoft, su funcionamiento es similar a ChatGPT. Fue recientemente lanzado y en la web de Hugging Face se encuentra disponible un demo para poder probarlo.

Lo bueno es que permite interactuar en idioma español.




Puedes acceder al demon del chatbot en Llama2 70B Chatbot de Hugging Face

El modelo Llama 2 lo puedes descargar para darles utilizarlo en investigación o darle un uso comercial, sus restricciones de uso se pueden revisar en la web de Meta. Una vez colocados los datos en la parte inferior de la web se va a encontrar un botón de descarga, al darle click va a indicar que se está enviando el link de descarga al correo electrónico que se indicó en el formulario.

Certificaciones gratuitas en Oracle (se extendió hasta el 30 de setiembre)

Oracle está poniendo a disposición de todo el mundo sus entrenamientos y correspondientes cursos de certificación en competencias tecnológicas que las empresas demandan hoy, entre las que están: multinube, bases de datos, inteligencia artificial, machine learning, desarrollo de aplicaciones, DevOps, gestión de datos, procesos de negocio habilitados por Softwares como Servicio (SaaS) y otros.



Las evaluaciones para obtener las certificaciones son gratuitas hasta el 30 de setiembre de 2023.

A su vez Oracle ofrece reconocimientos e incentivos siguiendo una "Carrera de Certificaciones" en la que se otorgan:

Sector 1:

Se debe completar 01 curso digital, participar en 01 sesión en vivo y aprobar 01 examen de certificación, con ello se logra:

- 01 intento de certificación válido por un año.

- Insignia especial Oracle University Community Sector 1.


 Sector 2:

Se debe completar 02 cursos digitales, participar en 01 sesión en vivo y aprobar 02 exámenes de certificación, logrando:

- 01 intento de certificación adicional, válido por un año.

- Insignia especial Oracle University Community Sector 2.

- Gorra con la marca Oracle (para los primeros 300 participantes que completen el Sector 2 con la mayor puntuación acumulada en los exámenes).


Sector 3:

Se debe completar 03 cursos digitales, participar en 01 sesión en vivo y aprobar 04 exámenes de certificación, con ello se logra:

- 01 intento de certificación adicional válido durante un año.

- Insignia especial de Oracle University Community Sector 3, acceso a OCI Labs durante 03 meses y un reconocimiento en Oracle University Community.

- Chaqueta con la marca Oracle (para los primeros 300 participantes que completen el Sector 3 con la mayor puntuación acumulada en los exámenes).


Puedes acceder a la lista de los cursos de certificación gratuitos en Certificaciones gratuitas en Oracle Cloud Infrastructure y procesos de negocio.

2023/07/17

Convierte un boceto en una imagen artística utilizando Stable Doodle

 Sigue estos pasos:

1. Ingresa a Stable Doodle (pertenece a Clipdrop de stability.ai).

2. Procede a dibujar un boceto. Ten en cuenta que el boceto y el prompt (el texto descriptivo) tienen que ir acorde a lo que desees que salga. En este caso he colocado el sol hacia la izquierda, una luna hacia la derecha, en la parte inferior unas montañas a través de las cuales cruza un río.


3. En la parte inferior encontrarás un cuadro de texto en donde se tiene que digitar el prompt en inglés. El cuadro está acompañado de un botón en donde se elegirá el estilo artístico de la imagen que se generará con el boceto, entre los estilos se puede seleccionar Fotográfico, Arte Fantástico, Origami, Isométrico, Arte Digital, Libro de Cómic, Anime, Cinemático, Pelicula Analógica, Pixel Art, Low Poly, Modelo 3D y Line Art.

Puedes experimentar eligiendo el que más te guste.


4. Una vez que escribiste el prompt (en inglés) y elegiste el estilo gráfico presiona el botón "Generate" para que se genere la imagen deseada. Demorará unos segundos. 

5. Se generarán 3 imágenes de las cuales puedes elegir una


Si no te convencen las imágenes generadas puedes volver a presiona el botón "Generate" para obtener nuevas.



6. Selecciona la que más te guste y en la parte superior hacia la derecha puedes hacer click en el boton "Download HD" para descargarlo a la computadora en calidad HD. Al ser una imagen gratuita traerá una marca de agua en la parte inferior derecha.


Al ser imágenes gratuita se tienen diversas limitaciones en torno a la calidad, resolución, marca de agua, cantidad de imágenes, etc.

Si quieres superar esas limitaciones puedes pagar una suscripción mensual o anual, para más información se deben revisar los Precios.



Anuncio de Tech Fighter Turbo (juego falso)

Ante los recientes roces entre Mark Zuckerberg y Elon Musk en los que se provocaban mtuamente para batirse en un enfrentamiento físico en una arena el grupo de animadores Dick Soup no aguantó la espera e hizo un montaje de un supuesto juego de peleas en el que los principales magnates de Silicon Valley se enfrentan al estilo de Street Fighter.

El nombre del falso juego es Tech Fighter Turbo.

Transcribe o traduce (al inglés) un audio utilizando Whisper de OpenAI

Si deseas transcribir y/o traducir archivos de audio de hasta media hora de duración puedes acceder al notebook que Jason Boog ha compartido en Google Colab mediante el cual se puede utilizar Whisper de OpenAI.

Recomendación: El audio debe estar lo más limpio posible, el sonido ambiental o de aparatos puede generar problemas en la transcripción o traducción en especial si se trata de un idioma diferente al inglés.

En el caso de las traducciones el ruido puede provocar que algunas palabras sean incorrectamente traducidas.

Para poder utilizar Whisper debes seguir estos pasos:

1. Acceder al notebook en Google Colab.

2. Ejecutar la celda que permite instalar Whisper (se hace click en el botón circular con el símbolo de play), a veces sale una advertencia indicando que el notebook no fue escrito por Google, si no por jasonboog@gmail.com, se puede omitir el mensaje presionando "Run anyway" (significa "Ejecutar de todas maneras").

Debes esperar un momento hasta que Google termine de ejecutar la celda, al lado izquierdo aparecerá un check acompañado del número de segundos que demoró.


3. Ejecutar la celda que instala la librería ffmpeg.


4. Subir los archivo de audio que se van a transcribir o traducir, en el lado izquierdo hay un ícono de un folder, se hace click allí y se despliega la ventana en donde se ven los archivos, para subir los archivos de audio se pueden arrastrar hacia esa ventana o se puede hacer click en el ícono con la flecha hacia arriba.

Recuerda que los archivos de audio no deben pasar de los 30 minutos, así que puede utilizar un programa como Audacity para cortarlos o editarlos.

Al seleccionar los archivos aparecerá un mensaje de advertencia indicando que los archivos serán eliminados cuando el tiempo de ejecución se termine hacer click en OK para seguir. Si actualizas la página vas a tener que comenzar de nuevo, así que se recomienda evitar que se cierre o se suspenda.


5. Para que Whisper transcriba el archivo de audio se ejecuta la celda en donde figura el comando !whisper colocando el nombre exacto del archivo entre comillas, tal como se ve en la figura. Whisper generará archivos de subtítulos con 5 tipos de extensiones (srt, vtt, txt, tsv, json.)


En la parte inferior irá apareciendo el texto que Whisper va reconociendo.



6. Puedes descargar los archivos de subtítulo generados por Whisper, haces click en los "3 puntos" que aparecen en el lado derecho del archivo, saldrá un menú en el que se debe seleccionar la opción "Download" o "Descargar" para descargarlos hacia la computadora.

7. En el caso de la traducción Whisper aún está limitado a traducir de cualquier idioma hacia el inglés, así que puedes aprovechar textos en idiomas como el japonés, chino o ruso para traducirlos a un idioma más fácil de trabajar.



2023/07/16

Zom 100: Cien cosas que quiero hacer antes de convertirme en zombi (Netflix)

La película es un Live Action basado en el manga "Zom 100: Bucket List of the Dead" de Haro Aso. Se estrena el 03 de agosto de 2023 por Netflix.

La historia trata de Akira Tendo, un trabajador de oficina de 24 años quien se siente atrapado en una vida sin sentido y rutinaria hasta el día en el que empieza una epidemia zombi.


El año pasado Netflix ya nos daba un avance de las filmaciones.

2023/06/24

Intel anuncia el modelo de Inteligencia Artificial LDM3D para generar imágenes en 360 grados

Intel en colaboración con Blockade Labs ha desarrollado un modelo que permite generar contenido visual realista e inmersivo en 3 dimensiones.

Esta tecnología ofrece revolucionar el campo de la creación de contenidos, aplicaciones para el metaverso, diseño, arquitectura, entretenimiento, gaming, etc.

Puedes probar el funcionamiento de LDM3D accediendo a la página de demo que tiene disponible Blockade Labs.


Los escenarios se pueden generar introduciendo el texto descriptivo en un prompt y eligiendo el estilo de creación en donde encontrarás opciones como Realista, Manga, Pintura al Oleo, Pintura Digital, etc.

2023/06/23

Primer avance de El Juego del Calamar 2 en Netflix - Cast anunciado

Netflix dió adelantos de lo que se viene en la segunda temporada de "El Juego del Calamar".

Se mantienen los principales protagonistas:

- Jee Lung-Jae (Seong Gi-Hun)

- Lee Byung-Hun (Front Man - Director de los juegos)

- Wi Ha-Jun (Hwang Jun-Ho - Policia infiltrado)

- Gong-Yoo (Reclutador)

A ellos se les suman:

- El cantante y actor Yim Si-Wan (personaje sin revelar).

- El actor Kang Ha-Neul (personaje sin revelar).

- Park Sung-Hoon (personaje sin revelar).

- El actor, cantante y escritor Yang Dong-Geun (personaje sin revelar).