Durante el último año, Google presentó una vista previa de una serie de funciones de inteligencia artificial de la marca Gemini en sus aplicaciones orientadas al consumidor. Aquí está todo lo que se ha anunciado y cuándo podría estar disponible.
píxel
Al final de Made by Google 2023, se mostró una función de mejora de zoom que “rellena de forma inteligente los espacios entre píxeles y predice detalles finos” para el Pixel 8 Pro. Aprovechando el “modelo de imagen de IA generativa personalizado” en el dispositivo, Google lo presentó como útil cuando te olvidas de hacer zoom.
Es una increíble aplicación de IA generativa que abre una gran cantidad de posibilidades para enmarcar y editar tus fotos. Entonces, el tipo de optimización del zoom que estás acostumbrado a ver en la ciencia ficción: directamente en el teléfono que tienes en la mano.
En octubre, Google dijo que esto «llegaría más tarde». Después de tres caídas de funciones de Pixel, todavía no han llegado. No está claro si el modelo al que se refiere Google es el Gemini Nano con Multimodalidad. En este punto, puede debutar con el Pixel 9 Pro como la función fotográfica principal de ese teléfono.
Casa de Google
En la aplicación Google Home, se utilizará IA generativa para resumir los eventos en una «vista simplificada de lo que sucedió recientemente». Este «resumen rápido y sencillo» aprovechará las viñetas, mientras que también podrá «Preguntar sobre su casa» en forma conversacional para buscar clips del historial de video y obtener automatizaciones. Las “funciones beta” estarán disponibles para los suscriptores de Nest Aware en 2024.
Fitbit
Fitbit Labs permitirá a los usuarios de Fitbit Premium probar y proporcionar comentarios sobre las capacidades experimentales de IA.
Entre estas características se encuentra un chatbot que te permite hacer preguntas sobre tus datos de Fitbit de forma natural y conversacional. Este “entrenamiento personalizado” con objetivos de acondicionamiento físico en mente tiene como objetivo generar “mensajes y orientación prácticos”, con respuestas que pueden incluir planos personalizados.
- «Por ejemplo, puedes profundizar en cuántos minutos de zona activa (AZM) obtienes y cómo se relacionan con qué tan bien te recuperas del sueño».
- «…Este modelo puede analizar las diferencias en sus patrones y calidad de sueño, y luego sugerir recomendaciones sobre cómo cambiar la intensidad de su ejercicio en función de esos conocimientos».
Detrás de escena, esto está respaldado por un nuevo LLM en Salud Personal de Fitbit y Google Research basado en Gemini. A partir de marzo, llegará «más adelante este año» a «un número limitado de usuarios de Android inscritos en el programa Fitbit Labs en la aplicación móvil de Fitbit».
imágenes de google
Ask Photos te permitirá hacer preguntas sobre fotos y videos en tu biblioteca. Además de buscar imágenes, puede extraer información y darte una respuesta de texto. Con tecnología de Gemini, las consultas de ejemplo incluyen «Muéstrame la mejor foto de cada parque nacional que hayas visitado» y «¿Qué temas tenemos para las fiestas de cumpleaños de Lena?» Se puede utilizar para «sugerir las mejores fotos» y crear títulos para ellas. Ask Photos es una “función beta” que estará disponible próximamente, y Google ya está adelantando más capacidades en el futuro.
Gmail + espacio de trabajo de Google
En Gmail para Android e iOS, encontrará un botón Gemini en la esquina superior derecha que le permite abrir el equivalente móvil del panel lateral para ingresar indicaciones completas. Gmail también recibe respuestas inteligentes contextuales que ofrecen sugerencias más personalizadas, detalladas y precisas. Esto se lanzará en Workspace Labs en julio.
En Cloud Next 2024 en abril, Google también presentó una vista previa de una capacidad de mensajes de voz para ayudarme a escribir en Gmail para dispositivos móviles. Mientras tanto, la función Instant Polish «convierte notas preliminares en un correo electrónico completo con un solo clic».
En la web de escritorio, el panel lateral está disponible en Gmail, Google Drive y Docs/Sheets/Slide. Luego, Gemini accede al chat de Google para resumir las conversaciones y responder preguntas.
mapas de Google
En febrero pasado, Google anunció que Maps utilizaría LLM para impulsar su chatbot Ask About. Puede usarlo para encontrar lugares que coincidan con su reclamo con soporte para preguntas de seguimiento. Está impulsado por detalles sobre 250 millones de lugares, fotos, vídeos y reseñas enviados por usuarios.
cromo
Gemini Nano llega al navegador de escritorio Chrome para potenciar funciones del navegador como Help Me Typing. Debería estar disponible en la mayoría de las computadoras portátiles y de escritorio modernas.
búsqueda de Google
Junto con el lanzamiento de AI Overviews, Google ha presentado una vista previa de una serie de funciones próximas que llegarán por primera vez a Search Labs:
- Podrás tomar la descripción general original de la IA y hacerla «más simple» (solo unas pocas oraciones) o «desglosarla» (respuesta más larga).
- Las capacidades de razonamiento de varios pasos le permiten formular una pregunta compleja de una sola vez en lugar de dividirla en varias consultas.
- Planificación de comidas y viajes.
- Página de resultados de búsqueda organizada por IA
- Búsquedas de vídeos: graba un vídeo y haz una pregunta al respecto.
Androide
La aplicación multimedia Gemini Nano se lanzará en el Pixel “a finales de este año” y potenciará funciones como descripciones de TalkBack en el dispositivo/fuera de línea y alertas de fraude en tiempo real que escuchan llamadas en busca de patrones reveladores. Google compartirá más detalles a finales de este año.
En I/O 2024, Google también mostró una vista previa de cómo Gemini en Android pronto se convertirá en un panel superpuesto en lugar de abrir una interfaz de usuario en pantalla completa para mostrar los resultados. Además de mantener el contexto, esto te permitirá arrastrar y soltar la imagen generada en la conversación. Para los suscriptores de Gemini Advanced, los botones “Preguntar a este video” y “Preguntar a este PDF” verán videos y documentos de Gemini, respectivamente. Esto se implementará “durante los próximos meses”. Además, utilizará las sugerencias dinámicas de Gemini Nano con multimedia para comprender lo que hay en su pantalla:
Por ejemplo, si involucras a Géminis en una conversación sobre pickleball, las sugerencias pueden incluir «Encontrar clubes de pickleball cerca de mí» y «Reglas de pickleball para principiantes».
Otro añadido que resultará especialmente útil en dispositivos móviles son las extensiones Gemini para Google Calendar, Google Tasks y Keep. Este complemento te permitirá tomar una foto de una página que contenga varias fechas próximas y Gemini podrá convertirlas en eventos del calendario. En los próximos meses, la función «Utilidades» de la aplicación móvil Gemini permitirá el acceso a la aplicación Reloj en Android.
También estamos esperando que llegue la aplicación móvil Gemini a la tableta Pixel este verano.
mellizo
La aplicación Live te permitirá tener una conversación bidireccional con tu Géminis. Para que la experiencia sea más natural, la aplicación Gemini te enviará breves respuestas que podrás interrumpir para agregar nueva información o pedir una aclaración. Puede elegir entre 10 voces diferentes, y Google prevé que la aplicación Gemini Live sea útil para prepararse para una entrevista o practicar cómo dar un discurso. Estará disponible en los “próximos meses” para los miembros de Gemini Advanced.
“Más adelante este año”, Gemini Live te permitirá activar el modo de cámara en vivo. Simplemente señale algo en el mundo real y haga una pregunta al respecto. Esto está dirigido por el Proyecto Astra.
Las gemas son versiones personalizadas de Gemini que te permiten tener un “compañero de gimnasio, un segundo chef, un socio de programación o un mentor de escritura creativa”. Los miembros de Gemini Advanced podrán crear gemas personalizadas, mientras que todos los usuarios tendrán acceso a gemas ya preparadas, como el Learning Coach.
Simplemente describe lo que quieres que haga tu Gema y cómo quieres que responda, como por ejemplo: «Tú eres mi entrenador de carreras, dame un plan de carrera diario y sé positivo, optimista y motivado». Gemini tomará estas instrucciones y, con un clic, las optimizará para crear una joya que satisfaga sus necesidades específicas.
Los usuarios de Gemini Advanced también obtendrán un «planificador integral» que va más allá de simplemente sugerir actividades, sino que también toma en cuenta los tiempos de viaje y las paradas, así como los intereses de las personas, para crear un itinerario detallado. Gemini utilizará los detalles de su vuelo/viaje de Gmail, las recomendaciones de Google Maps para comidas y museos cerca de su hotel y buscará otras actividades.
FTC: utilizamos enlaces de afiliados para obtener ingresos automáticos. más.
More Stories
Microsoft dice que Call of Duty: Black Ops 6 establece un récord en la cantidad de “adiciones de suscriptores de Game Pass el día del lanzamiento”.
Las descargas de Call of Duty: Black Ops 6 maximizan su uso de Internet
Nada hace que el teléfono brille en la oscuridad