Géminis 1, 5 pro

La actualización Gemini 1.5 Pro hace que la IA escuche y genere contenido

Avatar de João Lucas Batista
Con la nueva actualización, la inteligencia artificial de Google ahora comprende y analiza el audio. Imagen 2 ahora puede agregar y eliminar elementos de imagen y crear GIF de 4 segundos

A Inteligencia artificial de Google,el Gemini, recibió una nueva e innovadora actualización este martes 9 de abril durante la Google Cloud Next. Con la actualización, el Géminis 1.5 Pro, recibió la capacidad de comprender y analizar líneas de audio y video, produciendo contenido en base a lo ingresado en la aplicación.

Inicialmente, la nueva función solo está disponible para los usuarios de la IA de vértice, software dirigido a aprendizaje automático (aprendizaje automático), utilizado por programadores y científicos para desarrollar nuevas IA.

¿Qué hace Gemini, la IA de Google?

La actualización Gemini 1. 5 pro me permite escuchar y generar contenido. Con la nueva actualización, la inteligencia artificial de Google ahora comprende y analiza el audio. Imagen 2 ahora puede agregar y eliminar elementos de imagen y crear gifs de 4 segundos
Interfaz Géminis. Imagen: Lucas Gomes/ Showmetech

O Gemini, la Inteligencia Artificial de Google, se lanzó en diciembre del año pasado, reemplazando a bardo, y destaca por su capacidad para manejar tareas de alta complejidad, desde codificación hasta razonamiento lógico refinado.

La Inteligencia Artificial tiene funciones que pueden asistir al usuario en las más diversas tareas, manipulando una amplia variedad de archivos, con el fin de combinar diferentes tipos de información, además de organizarlos. Sus capacidades le permiten utilizar diferentes formatos de contenido, que incluyen:

  • textos;
  • imágenes;
  • audios;
  • vídeos; Es
  • lenguajes de programación.

O Gemini Dispone de tres modos de funcionamiento, con diferentes especificidades:

  • Géminis Ultra — más grande y más capaz para tareas muy complejas;
  • Gemini Pro – mejor para escalar una amplia variedad de tareas;
  • Géminis Nano — más eficiente para tareas móviles.

Actualización Gemini 1.5 Pro y sus nuevas funciones

La actualización Gemini 1. 5 pro me permite escuchar y generar contenido. Con la nueva actualización, la inteligencia artificial de Google ahora comprende y analiza el audio. Imagen 2 ahora puede agregar y eliminar elementos de imagen y crear gifs de 4 segundos
Géminis IA. Imagen: rafares/Shutterstock)

Este nuevo modelo, presentado por el gigante tecnológico, supone un avance significativo respecto al anterior, con mejoras en el rendimiento y la comprensión de contextos largos. El Géminis 1.5 Pro, que es la versión inicial disponible para pruebas, está optimizada para una variedad de tareas y es más eficiente en términos de cálculo, siendo una versión más robusta y capaz de cumplir con los requisitos de actividades aún más complejas.

Además, la Géminis 1.5 Pro contiene un recurso experimental que, en teoría, podría procesar hasta 1 millón de fichas para modelos base a gran escala, lo que será revolucionario. Según Google, esta inmensa cantidad representa 700.000 palabras y 30.000 líneas de código, que es equivalente a una hora de video ou 11 horas de audio.

Las nuevas herramientas en Gemini 1.5 Pro permiten que la aplicación razone entre imágenes (cuadros) y audio (voz) para videos cargados en el Estudio de IA de Google, lo que facilitará la producción de contenidos. Según información oficial, la actualización de IA de Google está disponible en más de 180 países a través de la API Gemini (Interfaz de Programación de Aplicaciones, en portugués), con una capacidad nativa sin precedentes para comprender audio y una nueva API que facilita el manejo de archivos.

El lanzamiento también incluye nuevas instrucciones del sistema y funciones de modo. JSON (formato de datos ligero para el intercambio de información entre sistemas informáticos). Creyendo en el potencial de la nueva actualización, Google promete que el modelo de incrustación de texto supera a los competidores con funciones similares.

O Géminis 1.5 Pro Actualmente sólo está disponible a través de IA de vértice.

Imagen 2 puede crear GIF

Durante el evento Google Cloud NextGoogle hizo otro anuncio importante: el modelo de IA Foto 2, que puede generar imágenes y videos cortos de ideas de texto. Con esto es posible crear GIF de hasta cuatro segundos desde diferentes ángulos de cámara y también mostrar movimiento.

La diferencia con esta herramienta es precisamente la posibilidad de explorar diferentes ángulos, con más dinamismo en las escenas, mucho más allá de los vídeos AI generados con fotos estáticas y movimientos limitados.

Ejemplo de creaciones de Imagen 2 en Vertex IA. Vídeo: Google Cloud/YouTube

O Foto 2 tiene la capacidad de producir videoclips, también conocidos como imágenes en vivo, a baja resolución 640 x 360. Además, Google utiliza su técnica SynthID para aplicar un marca de agua invisible en clips e imágenes generados por IA. La empresa afirma que el SynthID puede admitir ediciones e incluso compresión, medidas que tienen como objetivo promover seguridad de datos.

Hasta la fecha, los recursos de Foto 2 sólo están disponibles a través de IA de vértice, que ahora incluye soporte para pintura interna y externa, así como la capacidad de editar imágenes usando IA, lo que le permite expandir los bordes o agregar/eliminar partes específicas de la imagen. Herramientas dirigidas a profesionales del marketing y creación de contenidos para campañas, entre otras piezas publicitarias y plataformas de vídeo.

IA de vértice

La actualización Gemini 1. 5 pro me permite escuchar y generar contenido. Con la nueva actualización, la inteligencia artificial de Google ahora comprende y analiza el audio. Imagen 2 ahora puede agregar y eliminar elementos de imagen y crear gifs de 4 segundos
Plataforma de IA Vertex. Imagen: Google/Reproducción

O IA de vértice es una plataforma para aprendizaje automático (ML) que permite la capacitación y la implementación de herramientas y aplicaciones de IA, incluida la personalización de modelos de lenguaje grandes (LLM) para su uso en aplicaciones impulsadas por IA.

La plataforma recopila las diversas capacidades y aplicaciones de Google, integrando flujos de trabajo de ingeniería de datos, ciencia de datos e ingeniería de datos. aprendizaje automático, permitiendo la colaboración entre equipos a través de un conjunto común de herramientas, además de escalar aplicaciones con los beneficios de Google Cloud.

A IA de vértice ofrece varias opciones para entrenar e implementar modelos:

  • AutoML le permite entrenar datos tabulares, de imágenes, texto o video sin la necesidad de escribir código o preparar divisiones de datos.
  • La capacitación personalizada le brinda control total sobre el proceso de capacitación, incluido el uso de marco código ML preferido, codificación de entrenamiento propia y selección de opciones de ajuste de hiperparámetros.
  • jardín modelo Permite el descubrimiento, prueba, personalización e implementación de modelos de Vertex AI, incluida la selección de modelos y recursos de código abierto (OSS).
  • A IA generativa ofrece acceso a los grandes modelos de IA generativa de Google en múltiples modalidades (texto, código, imágenes, voz). Puede ajustar los LLM de Google para satisfacer sus necesidades e implementarlos para usarlos en sus aplicaciones impulsadas por IA.

fuente: The Verge, Google para desarrolladores, La guía de tom, Beebom, Nube de Google.

Vea también:

Revisado por Glaucón Vital en 10 / 4 / 24.


Descubra más sobre Showmetech

Regístrate para recibir nuestras últimas novedades por correo electrónico.

Puestos Relacionados