Un estudiante e investigador que filtra funciones ocultas de Android descubrió una configuración en lo profundo de los archivos raíz de Android que habilita Google Gemini directamente desde la búsqueda de Google de una manera que se asemeja a Apple iOS, lo que genera dudas sobre por qué está ahí y si podría conectarse a un sistema general. Se rumorea que el lanzamiento de la IA en la búsqueda se producirá en mayo de 2024.
Géminis: a qué podría enfrentarse el SEO
Sólo hay rumores de que se implementará algún tipo de búsqueda con IA. Pero si Google implementa el acceso a Gemini como una característica estándar, lo siguiente da una idea de lo que la comunidad de búsqueda tendría que esperar.
Gemini es el modelo de inteligencia artificial más poderoso de Google que contiene capacitación, tecnología y funciones avanzadas que, en muchos sentidos, van mucho más allá de los modelos existentes.
Por ejemplo, Gemini es el primer modelo de IA entrenado de forma nativa para ser multimodal. Multimodal significa esa capacidad de trabajar con imágenes, texto, video y audio y extraer conocimiento de cada una de las diferentes formas de medios. Todos los modelos de IA anteriores fueron entrenados para ser multimodales con componentes separados y luego las partes separadas se unieron. Según Google, la antigua forma de entrenar para la multimodalidad no funcionaba bien para tareas de razonamiento complejas. Sin embargo, Gemini está preentrenado con multimodalidad, lo que le permite tener habilidades de razonamiento complejas que superan las de todos los modelos anteriores.
Otro ejemplo de las capacidades avanzadas de Gemini es la escala sin precedentes de la ventana contextual. Una ventana de contexto es la cantidad de datos que un modelo de lenguaje puede considerar simultáneamente para tomar una decisión. La ventana de contexto es una medida de cuán poderoso es el modelo de lenguaje. Las ventanas de contexto se miden en “tokens” que representan la unidad más pequeña de información.
Comparación de ventanas de contexto
- ChatGPT tiene una ventana de contexto máxima de 32k
- GPT-4 Turbo tiene una ventana de contexto de 128k
- Gemini 1.5 pro tiene una ventana contextual de un millón de tokens.
Para poner esa ventana de contexto en perspectiva, la ventana de contexto de Gemini le permite procesar el texto completo de los tres libros de El Señor de los Anillos o diez horas de videos y hacerle cualquier pregunta al respecto. En comparación, la mejor ventana de contexto de OpenAI de 128k puede considerar el libro de Robinson Crusoe de 198 páginas o aproximadamente 1600 tweets.
La investigación interna de Google ha demostrado que sus tecnologías avanzadas permiten ventanas de contexto de hasta 10 millones de tokens.
La funcionalidad filtrada se asemeja a la implementación de iOS
Lo que se descubrió es que Android contiene una forma de acceder a Gemini AI directamente desde la barra de búsqueda en la aplicación de Google de la misma manera que está disponible en los dispositivos móviles de Apple.
Las instrucciones oficiales para el dispositivo Apple reflejan la funcionalidad que el investigador descubrió oculta en Android.
Así se describe el acceso a iOS Gemini:
“En los iPhone, puedes chatear con Gemini en la aplicación de Google. Con solo tocar la pestaña Gemini, desbloquea una forma completamente nueva de aprender, crear imágenes y obtener ayuda mientras estás en movimiento. Interactúa con él a través de texto, voz, imágenes y tu cámara para obtener ayuda de nuevas formas”.
El investigador que filtró la funcionalidad Gemini en la búsqueda de Google la descubrió oculta en Android. Al habilitar esta función, apareció un interruptor en la barra de búsqueda de Google que facilita a los usuarios deslizarse para acceder directamente a la funcionalidad Gemini AI exactamente de la misma manera que en iOS.
Habilitar esta funcionalidad requiere rootear un teléfono Android, lo que significa acceder al sistema operativo en el nivel más fundamental de archivos.
Según la persona que filtró la información, uno de los requisitos para alternar es que Gemini ya debería estar habilitado como asistente móvil. También se debe instalar una aplicación llamada GMS Flags para poder activar y desactivar las funciones de la aplicación Google.
Los requisitos son:
“Cosas requeridas –
Dispositivos rooteados con Android 12+
Última versión beta de la aplicación Google desde Play Store o Apkmirror
Aplicación GMS Flags instalada con permiso de root concedido. (GitHub)
Gemini ya debería estar disponible para usted en su aplicación de Google”.
Captura de pantalla de la nueva palanca de búsqueda
Captura de pantalla de Géminis activado en la búsqueda de Google
La persona que descubrió esta funcionalidad tuiteó:
“La aplicación de Google para Android pronto podrá alternar entre Gemini y Búsqueda [just like on iOS]”
La aplicación de Google para Android pronto podrá alternar entre Gemini y Búsqueda [just like on iOS]
📝 Leer – https://t.co/eMgD2NxZKX#Google #Androide pic.twitter.com/i19Msjb8wm
– EnsamblarDebug (@AssembleDebug) 7 de abril de 2024
¿Google se prepara para anunciar el lanzamiento oficial de SGE?
Ha habido rumores de que Google anunciará el lanzamiento oficial de Google Search Generative Experience en la conferencia I/O de mayo de 2024, donde Google anuncia periódicamente nuevas funciones de búsqueda (entre otros anuncios).
Eli Schwartz publicó recientemente en LinkedIn sobre el rumoreado lanzamiento de SGE:
“Esa fecha no surgió de las relaciones públicas de Google; sin embargo, a partir de la semana pasada, esa es la fecha de lanzamiento planificada actualmente internamente. Por supuesto, el cronograma aún podría cambiar, dado que todavía faltan 53 días. A lo largo del último año, se han perdido varias fechas de lanzamiento.
…Además, es importante explicar qué significa exactamente “lanzamiento”.
En este momento, la única forma de ver SGE, a menos que esté en el experimento beta, es si está habilitado para participar en los laboratorios.
El lanzamiento significa que mostrarán SGE a las personas que no han optado por participar, pero la escala de eso podría variar ampliamente”.
Se desconoce si esta palanca oculta es un marcador de lugar para una versión futura de la aplicación de búsqueda de Google o si es algo que permite el lanzamiento de SGE en un futuro.
Sin embargo, esta palanca oculta ofrece una posible pista para aquellos que tienen curiosidad sobre cómo Google puede implementar una interfaz basada en IA para realizar búsquedas y si esta palanca es un conector de alguna manera para esa función.
Lea cómo rootear para habilitar Gemini en la búsqueda de Android:
Cómo habilitar la barra de búsqueda de navegación inferior de materiales y la palanca de Gemini en Google Discover en Android [ROOT]
Lista de ventanas contextuales de OpenAI
Imagen destacada de Shutterstock/Mojahid Mottakin