¿Preparado para una significativa escalada en la Inteligencia Artificial Generativa? Porque es a lo que parece acercarse Google, más a pasos agigantados que pequeños, con el lanzamiento de Gemini 2.0 y las mejoras en sus diferentes modelos. Según Google, su IA inaugura la era de los agentes autónomos.
Gemini 2.0 viene potenciado, con avances en generación multimodal (procesa datos en múltiples formatos como texto, imágenes, vídeos y audio) y proyectos como Gemini Flash, Astra, y Mariner. Esta versión permite desarrollar agentes capaces de pensar, recordar y tomar decisiones guiados por los usuarios. Así es: la IA ya razona y recuerda.
De hecho, tenés la opción de comprobar cómo la IA razona pensamiento a pensamiento para llegar a una conclusión, visualizando todo el proceso en tiempo real. Su capacidad de resolución de problemas destaca, sobre todo, en las áreas exactas como matemática, física y programación.
Por supuesto, Google lanza a diario nuevos prototipos para ir afinando las habilidades con ayuda del feedback de los usuarios. Estos son algunos de los proyectos que están en prueba:
- Gemini 2.0 Flash: versión experimental que genera o edita imágenes y textos en distintos tonos. Estará disponible para desarrolladores en AI Studio y Vertex AI.
- Proyecto Astra: un prototipo que combina imágenes, videos y voz en una línea de tiempo, mejorando la recuperación de información y la interacción natural.
- Proyecto Mariner: reimagina la navegación web mediante capacidades de comprensión multimodal, automatizando tareas y acciones.
- Proyecto Jules: un asistente de codificación experimental que ayuda a desarrolladores a resolver errores y desafíos de programación.
Acerca de Deep Research
Investigar en línea no siempre es fácil, o más bien, podría ser más sencillo aún. En su comunicado de presentación, Google ejemplifica el funcionamiento de Deep Research con un estudiante de posgrado que se prepara para una presentación de robótica:
"Quieres aprender sobre las tendencias en sensores de vehículos autónomos y comprender cómo las diferentes tecnologías interactúan entre sí, además de tener un panorama sobre qué depara el futuro. Un proyecto así puede llevarte horas de investigación y referencias cruzadas en decenas de pestañas abiertas, eso si logras encontrar ese vínculo que sabes que dejaste en algún sitio…
Con tu supervisión, Deep Research hace el trabajo duro por ti. Después de que ingresas una pregunta, crea un plan de investigación de varios pasos para que lo revises o lo apruebes. Una vez que lo apruebas, comienza a analizar en profundidad la información pertinente de toda la Web.
En el transcurso de unos minutos, Gemini refina continuamente su análisis, navegando por la red como tú lo haces: buscando, encontrando información interesante y, a continuación, iniciando una nueva búsqueda basada en lo que aprendió. Repite este proceso varias veces y, una vez completado, genera un informe exhaustivo de las principales conclusiones, que puedes exportar a un Documento de Google".
Es, sin dudas, un proceso interesante para una IA. El resultado parece estar adecuadamente organizado, y, por supuesto, te comparte los vínculos a las fuentes originales. Eso ayuda a conectarte con sitios web y organizaciones o empresas que de otro modo no habrías encontrado, lo que te deja la chance de profundizar un poco más. Además, tal como lo hace ChatGPT, podés perfeccionar el informe dándole esas instrucciones a través del chat.
Deep Research es, fundamentalmente, la vista previa de cómo Gemini está mejorando en resolver tareas completas para ahorrar tiempo. No olvidemos el horizonte.
Ya está disponible para los suscriptores de Gemini Advanced y Google AI Studio, aunque, por el momento, solo interactúa en inglés. Los suscriptores solo deben dirigirse al menú desplegable en desktop y allí seleccionar el modelo “Gemini 1.5 Pro with Deep Research”. Google ha mencionado que llegará a la app de Gemini próximamente.
Ver 0 comentarios