Les modèles d'IA récents tels que   et   ont présenté des capacités impressionnantes de génération de texte et d'images. ChatGPT Midjourney  Cependant, il existe également des modèles spécialisés dans la compréhension de ces entrées, tels que les transformateurs de vision (ViT) pour les images et le modèle de langage Pathways (PaLM) pour le texte. Ces modèles peuvent interpréter et comprendre le sens des images et des phrases.  La combinaison de modèles de texte et d'image donnerait une IA capable de comprendre diverses formes de données et capable de comprendre presque tout.  Cependant, les capacités d'un tel modèle peuvent sembler limitées à première vue, car il ne serait capable que de comprendre les choses. Mais que se passe-t-il si ce modèle est intégré à un système robotique capable de se déplacer dans le monde physique ? C'est là qu'intervient PaLM-E.  Qu'est-ce que le modèle d'IA PaLM-E de Google ?  La dernière publication de Google, PaLM-E, est un   . modèle de langage multimodal incarné  Cela signifie qu'il s'agit d'un modèle capable d'interpréter et de comprendre différents types de données, y compris des images et du texte provenant respectivement des modèles ViT et PaLM, et de convertir ces informations en actions grâce à une main robotique.  En savoir plus dans la vidéo…   https://youtu.be/1RF06BL7VAc?embedable=true&transcript=true

Watch more on YouTube: https://www.youtube.com/c/WhatsAI

I explain Artificial Intelligence terms and news to non-experts.

2021 - HackerNoon Contributor of the Year - FACEBOOK

2022 - Best Data Science Newsletter

2022 - HackerNoon Contributor of the Year - Artificial Intelligence

2022 - HackerNoon Contributor of the Year - Computer Vision

2022 - HackerNoon Contributor of the Year - Data Science

2022 - HackerNoon Contributor of the Year - Google

2022 - HackerNoon Contributor of the Year - Innovation

2022 - HackerNoon Contributor of the Year - Machine Learning

2022 - HackerNoon Contributor of the Year - Natural Language Processing

2022 - Top Tech Youtuber

2021 - HackerNoon Contributor of the Year - DEEP-LEARNING

Nominated for 2022 - Best Data Science Newsletter

Nominated for 2022 - HackerNoon Contributor of the Year - Artificial Intelligence

Nominated for 2022 - Top Tech Youtuber

Nominated for 2022 - HackerNoon Contributor of the Year - Innovation

Nominated for 2022 - HackerNoon Contributor of the Year - Data Science

Nominated for 2022 - HackerNoon Contributor of the Year - Natural Language Processing

Le PaLM-E (IA Robot) de Google peut voir et comprendre le langage

Trop long; Pour lire

Qu'est-ce que le modèle d'IA PaLM-E de Google ?

About Author

ÉTIQUETTES

CET ARTICLE A ÉTÉ PARU DANS...

Categories

Trending Topics