paint-brush
Flux de travail d'IA et modèles de conception d'applications modernespar@artemivanov
4,073 lectures
4,073 lectures

Flux de travail d'IA et modèles de conception d'applications modernes

par Artem Ivanov12m2023/12/08
Read on Terminal Reader

Trop long; Pour lire

L'intelligence artificielle remodèle la conception de l'expérience utilisateur, en introduisant le paradigme d'interaction basée sur l'intention. Les interfaces traditionnelles cèdent la place à des interactions plus naturelles, dans lesquelles les utilisateurs expriment leurs désirs et non leurs commandes. Les chatbots, les flux de travail d'IA primaires, les interactions contextuelles et les systèmes d'IA invisibles présentent divers modèles, chacun nécessitant des considérations de conception uniques. Les concepteurs sont aux prises avec des défis tels que la charge cognitive et l’intuitivité de l’interface. Adoptant les meilleures pratiques, plusieurs options de sortie, des invites contextuelles et des commentaires des utilisateurs, l'UX basée sur l'IA s'efforce d'assurer la transparence et la convivialité. L'évolution de l'IA dans les interactions utilisateur promet des expériences transformatrices avec une prise en compte attentive des étapes d'entrée, de traitement et de sortie dans divers flux de travail.
featured image - Flux de travail d'IA et modèles de conception d'applications modernes
Artem Ivanov HackerNoon profile picture
0-item


La conception de l’expérience utilisateur est en constante évolution, mais l’essor actuel de l’intelligence artificielle a complètement bouleversé l’ensemble du domaine. L’IA inaugure une nouvelle ère d’interaction avec un nouveau paradigme. Les interfaces utilisateur traditionnelles sont basées sur un modèle de commande et de contrôle, dans lequel les utilisateurs indiquent à l'ordinateur une série de commandes pour accomplir certaines tâches utilisateur. Cependant, l’IA permet aux utilisateurs d’interagir plus naturellement avec les ordinateurs, en leur disant ce qu’ils veulent et non comment le faire.


Ce nouveau paradigme d’interaction avec l’IA, connu sous le nom de paradigme basé sur l’intention, en est encore à ses débuts, mais il a le potentiel de révolutionner la façon dont nous interagissons avec les ordinateurs. Par exemple, imaginez pouvoir dire à votre ordinateur : « Je veux réserver un vol pour Paris », et lui demander de trouver automatiquement les meilleurs vols et de les réserver pour vous. Ou imaginez pouvoir dire : « J'ai besoin d'aide pour mes impôts » et demander à votre ordinateur de vous guider pas à pas tout au long du processus. Cela ouvre de nombreuses opportunités absolument nouvelles pour concevoir une UX « ultime » et la rendre complètement holistique et transparente.


L’interaction basée sur l’intention n’est pas sans défis. Les modèles d’apprentissage des langues modernes, également connus sous le nom de LLM, sont déjà très efficaces pour comprendre le langage naturel. Cependant, l'état de l'IA dans l'UX est loin d'être parfait, le style d'interaction actuel basé sur le chat souffre du fait que les utilisateurs doivent écrire leurs problèmes sous forme de texte en prose, ce qui produit une charge cognitive élevée.


De plus, il peut être difficile de concevoir des interfaces utilisateur intuitives et faciles à utiliser pour ce type d’interaction. Cependant, les avantages potentiels de l’interaction basée sur l’intention sont importants, et les concepteurs UX étudient déjà la meilleure façon de mettre en œuvre ce nouveau paradigme.


Dans cet article, nous explorerons l'essor de l'interaction basée sur l'intention et ses implications pour la conception UX. Nous discuterons des types de produits basés sur l'IA actuellement existants, de la manière dont ils utilisent les modèles d'entrée et de sortie, et de la manière dont ils sont conçus pour améliorer l'expérience utilisateur dans l'environnement de l'IA.


Aperçu du contenu

  • Comment l'IA a changé le travail du designer
  • Principaux types de flux de travail d'IA dans les produits
    • Chatbots
    • Primaire (IA-first)
    • Contextuel
    • Invisible
  • Conclusion

Comment l'IA a changé le travail du designer

Comme nous l'avons déjà compris, le nouveau défi pour les concepteurs qui travaillent avec des produits d'IA est de concevoir dans un cadre paradigmatique axé sur l'intention d'abord. Lorsque vous pensez à un logiciel traditionnel, la façon dont vous interagissez avec lui consiste à envoyer une chaîne de commandes à l'intérieur du système pour obtenir le résultat souhaité. Votre saisie est une commande, elle peut être n'importe quoi d'interactif sur votre écran, comme des boutons, des listes déroulantes, des formulaires, etc. Les combinaisons de vos actions dans votre interface graphique forment une commande qui vous guide étape par étape tout au long de votre parcours.


Interaction basée sur les commandes


Après l'ensemble des étapes de navigation dans l'architecture de l'information dans un produit, vous obtenez enfin une solution à votre problème, la sortie du système. Par exemple, lorsque vous essayez de commander un taxi, vous envoyez un ensemble de commandes pour choisir un point de destination, configurer les paramètres du trajet et enfin, envoyer une commande pour confirmer un trajet, lorsque le système sélectionne un chauffeur pour vous.


L'interaction basée sur l'intention est limitée au système d'entrée-traitement-sortie. Vous donnez littéralement à un système ce que vous voulez obtenir dans le résultat (ce qu'on appelle l'invite), le système traite votre entrée et vous donne une sortie. Toutes les étapes de calcul sont sur le système, vous obtenez uniquement ce dont vous avez besoin. Revenons à notre exemple avec le taxi, dans le système basé sur l'intention, il vous suffit de donner votre invite (« Commander un taxi pour rentrer chez vous ») et vous obtiendrez un trajet.


Interaction basée sur l'intention


Ce paradigme nécessitera toujours des commandes dans les flux de travail, car les machines peuvent se tromper et les humains peuvent parfois vouloir modifier et contrôler une sortie ou l'utiliser dans différents flux, pour mieux adapter le comportement du système à leurs objectifs.


Principaux types de flux de travail d'IA dans les produits

Mettons-nous d'accord sur ces noms, cependant, lorsque nous intégrons l'IA dans le flux des utilisateurs, elle peut fonctionner différemment en fonction des flux de travail du produit, des tâches, des problèmes, des caractéristiques techniques et d'autres limitations. Au cours du processus de recherche et d'analyse, certains modèles dans les produits sont visibles, examinons-les. Nous vous expliquerons également comment tel ou tel produit utilise le modèle entrée-traitement-sortie, quelles solutions d'interface utilisateur il utilise et comment il résout les problèmes d'utilisabilité standard pour les produits d'IA. Alors allons-y.


1. Les chatbots

Parlons de l'exemple le plus évident. Le battage médiatique actuel autour de l’IA concerne principalement les chatbots et leurs capacités. Dans ce modèle, en utilisant LLM, le flux de travail de l'IA se produit via des échanges de dialogue via une interface de chatbot. L'utilisateur interagit avec le chatbot en ayant une conversation avec lui, et le chatbot répond aux questions et invites de l'utilisateur. Habituellement, ce type de flux de travail peut être utilisé pour réaliser un large éventail de tâches et de solutions, répondre aux demandes les plus larges, étudier de nouveaux sujets, etc.


Cependant, le style d'interaction actuel basé sur le chat crée une charge cognitive élevée pour les utilisateurs, car il les oblige à rédiger leurs problèmes sous forme de texte en prose. Pour résoudre ce problème, un nouveau rôle a été développé : celui de « l'ingénieur prompt ». Les ingénieurs d'invites sont chargés d'obtenir les résultats corrects de ChatGPT en fournissant les invites appropriées. En d’autres termes, les chatbots nécessitent beaucoup d’attention quant à leur conception ergonomique.


ChatGPT est un chatbot et LLM bien connu


Pi, un autre exemple de chatbot mobile


Entrées du chatbot

Les produits Chatbot utilisent généralement des modèles de saisie de texte. Cette approche permet aux utilisateurs de saisir et d'envoyer n'importe quelle demande sous forme de texte au système et d'écrire tout ce qu'ils veulent. Il offre la possibilité la plus large pour les résultats d’entrée et de sortie.


Le modèle d’invite de l’utilisateur apparaît généralement sous la forme d’un élément d’interface utilisateur de champ de texte. Dans les chatbots, il reste généralement fixe.


ChatGPT utilise un champ de texte, placé en bas de page


Invite textuelle de Google Bard


En combinaison avec les invites, des invites pré-écrites sont également souvent ajoutées, réduisant ainsi les malentendus et les idées fausses de l'utilisateur sur ce qu'il faut faire avec ce chatbot, fournissant des suggestions et simplifiant les choix.


ChatGPT affiche des exemples d'invites utilisateur au début d'une nouvelle discussion


De plus, les chatbots suggèrent assez souvent d'utiliser la saisie vocale pour remplir le champ de saisie de texte, vous permettant ainsi d'utiliser votre voix au lieu de taper au clavier. Cela crée un dialogue presque organique entre une personne et un ordinateur.


Par exemple, Bard offre la possibilité de saisir un indice à l'aide de la saisie vocale de l'utilisateur.


Traitement des chatbots

Il est important de montrer dans quel état se trouve le système et comment il traite la demande de l'utilisateur. Différentes applications utilisent différentes approches. L’approche la plus courante dans les chatbots est la génération de texte en temps réel. Étant donné que l'algorithme peut mettre un certain temps à fournir un résultat, afficher la génération de texte en déplacement est une bonne pratique, vous permettant de garder l'attention de l'utilisateur concentrée et de rendre la transition entre l'entrée et la sortie plus transparente.


L'assistant chatbot Pi affiche le résultat dans le processus de génération en temps réel


Sortie du chatbot

Dans les applications chatbot, les types de résultats peuvent varier considérablement. Il peut s'agir de texte, d'images (générées par saisie de texte, par exemple) ou d'autres résultats qui dépendent du sujet cible de l'application et de ses fonctions. Il est important que la rédaction du résultat reflète la contribution de l'utilisateur ainsi que le caractère et la personnalité souhaités de l'application (le cas échéant).


Si vous envisagez de concevoir un chatbot, vous devez tenir compte des meilleures pratiques déjà utilisées par d'autres applications.


  1. Sorties multiples. Étant donné que les résultats du système peuvent être différents et parfois de mauvaise qualité ou que le système peut mal comprendre la demande de l'utilisateur, il est conseillé d'ajouter la possibilité de plusieurs sorties pour augmenter les chances du système de deviner la requête que l'utilisateur souhaite. voir.


Bard suggère que trois versions du système répondent


Bing Image Generator crée plusieurs images à partir d'une seule invite


  1. Veuillez m'excuser pour l'inexactitude. L'intelligence artificielle du système peut produire des résultats incorrects qui entraînent de la confusion, un contenu offensant ou un sentiment de malaise pour l'utilisateur. Le système s'excuse pour toute inexactitude potentielle qui pourrait survenir.


Bard s'excuse par avance pour les résultats potentiellement inexacts


  1. Interactions enregistrées. Mémorisez les actions récentes des utilisateurs au sein du système, ce qui nous permet de nous y référer plus facilement. L’affichage des destinations récentes, des recherches et d’autres entrées peut être un coup de pouce utile pour alléger la charge cognitive.


Bard affiche l'historique des conversations récentes



2. Primaire (l'IA d'abord)

Ce type de produit est très similaire aux chatbots, alimentés par des modèles d'apprentissage des langues, sauf que leur positionnement est restreint à des cas d'utilisation spécifiques et qu'ils peuvent produire des types de résultats très différents, depuis des images jusqu'à des réponses interactives complexes à des questions dans un secteur spécifique.


Ces produits utilisent l'IA comme flux de travail principal via des interactions en plein écran et des formulaires par étapes.


Copy.ai ressemble à un chatbot, mais sa fonction principale est restreinte à vous aider à rédiger des textes marketing


La saisie rapide de DALLE occupe la première place dans le flux de travail du système, mais sa sortie sous la forme d'une génération d'images


Entrée pour le type principal

Comme nous l'avons déjà mentionné, la saisie ressemble aux modèles de saisie du chatbot, qui ressemblent généralement au champ d'invite de texte. Les meilleures pratiques restent également similaires, telles que les modèles d'invite (pour vous aider à démarrer votre processus de réflexion) et la saisie vocale.


Champ d'invite Copy.ai avec possibilité de configurer les paramètres d'entrée


De plus, il est parfois judicieux de laisser l'utilisateur définir certains paramètres s'ils peuvent être appliqués à la sortie du système. Cela signifie l’utilisation de curseurs de critères et d’autres modèles d’interface utilisateur standard, familiers à l’utilisateur.


Application pour générer des actifs graphiques Recraft utilise un curseur de critères pour configurer le niveau de détails de sortie


Traitement pour le type principal

Modèles de traitement cohérents avec les autres types de flux de travail, la meilleure pratique ici consiste à générer simplement une sortie système en déplacement. Mais lors de la conception d'un traitement pour des flux de travail axés sur l'IA, faites attention au résultat, s'il est possible de le montrer partie par partie. Par exemple, si une image peut être affichée en cours de génération, ou si votre technologie vous permet uniquement de l'afficher terminée.


Si tel est le cas, envisagez de fournir des messages de progression granulaires pendant les calculs.


Bing Creator affiche la barre de progression lors de la génération d'une image



Sortie pour le type principal

Dans les flux de travail axés sur l'IA, les types de sortie peuvent varier des images à différentes structures d'interface utilisateur (ou même à des éléments d'interface utilisateur dynamiques), en fonction de ce que le système essaie de donner à son utilisateur et de la solution qu'il tente d'atteindre.


Lors de la conception de ce type de flux de travail, envisagez d'utiliser plusieurs résultats de sortie, autorisez le réglage fin d'une sortie pour permettre à l'utilisateur d'atteindre le résultat souhaité, autorisez une nouvelle invite et offrez la possibilité d'ajouter des commentaires sur le travail du système.


Bing Create affiche plusieurs images à partir d'une seule invite


Copy.ai affiche deux boutons pouce vers le haut/pouce vers le bas pour évaluer une sortie du côté de l'utilisateur


Recraft permet une reproduction infinie de l'image existante




3. Contextuel

Dans ce type, le workflow IA est ajouté au workflow principal existant via des déclencheurs et des actions contextuelles. Grâce à LLM, il propose des solutions aux tâches contextuelles à travers divers éléments d'interface utilisateur.


ClickUp suggère d'utiliser son assistant IA dans le cadre des fonctionnalités déjà proposées


Linear propose ses services d'IA pour créer rapidement un filtrage de données complexe



Entrée pour les flux de travail contextuels

Les entrées dans les flux de travail contextuels dépendent des types de tâches et peuvent varier considérablement. Il peut s'agir d'une entrée textuelle, de modèles d'invite ou de boutons permettant d'activer des tâches spécifiques, telles que le résumé de texte.


Lorsque vous utilisez cette approche, envisagez de concevoir le processus d'activation/désactivation, de quelle manière l'utilisateur déclenche ces invites ou commandes.


ClickUp déclenche son assistant IA lors de la saisie de l'IA dans le document et permet de choisir entre un ensemble d'invites pré-construites


Dans les prochaines fonctionnalités de Dovetail AI, vous pourrez également résumer les données provenant de diverses sources. Par exemple, simplifiez une longue conversation d'assistance ou transformez une transcription d'entretien client d'une heure en quelques puces.


Construction rapide

Ce modèle apparaît sous la forme d'assistants guidés qui aident les utilisateurs à créer des invites détaillées sans les écrire et utilise différents éléments de saisie de l'interface utilisateur, tels que des champs de texte, des listes déroulantes, des boutons radio et autres. Tout cela se combine dans des structures de formulaire qui s'adaptent au contexte de la tâche et permettent de diviser une invite complexe en petites parties logiques, réduisant ainsi la charge de l'utilisateur et le libérant de la nécessité de beaucoup réfléchir au format de l'invite. rapide. Cela peut être particulièrement utile lorsque vous avez une requête fréquemment répétée avec la même structure, vous pouvez alors laisser l'utilisateur remplir uniquement les parties qui changent, afin de ne pas avoir à écrire une nouvelle invite à chaque fois.


ClickUp permet aux utilisateurs de remplir le formulaire pour créer une invite détaillée en raison du contexte de son flux de travail


Traitement pour les workflows contextuels

Il n’est pas surprenant que les systèmes contextuels nécessitent une approche contextuelle de la conception des traitements. Encore une fois, la bonne méthode dépend fortement des types de tâches que le logiciel doit accomplir, mais les pratiques générales restent les mêmes. Si possible, affichez la sortie des résultats au fur et à mesure de leur génération. Sinon, affichez l'étape à laquelle l'algorithme travaille actuellement et un indicateur explicite de traitement (icône de chargement ou barre de progression)


ClickUp AI générant une sortie en déplacement


Sortie pour les workflows contextuels

Lors de la conception de la sortie pour les workflows d’IA intégrés, permettez à un utilisateur de vérifier la sortie dans le contexte avant de l’appliquer au workflow principal. Cela permettra à l'utilisateur de vérifier l'exactitude du résultat généré par l'intelligence artificielle et, en cas de résultats incorrects, de le supprimer ou de le modifier.


ClickUp permet de vérifier le texte généré avant qu'il puisse être inséré dans le document


Combinez les avantages des approches d’interaction basées sur les commandes et sur les intentions. En fonction de la tâche que votre produit résout, laissez les utilisateurs modifier et utiliser le résultat donné pour atteindre leurs objectifs. Fournir un flux aussi fluide et facile que possible.


Par exemple, dans les situations où le corps du texte est volumineux, les utilisateurs ayant des problèmes cognitifs ou d'alphabétisation souhaitent savoir ce que contient ce contenu sans avoir à lire l'intégralité du texte. L'utilisateur peut cliquer pour afficher une version raccourcie et simplifiée du texte généré par une IA.


Bard utilise un menu déroulant pour afficher les modificateurs de réponse possibles, ce qui permet de rendre le résultat plus court ou plus long.


C'est également une bonne pratique de stocker et d'afficher les requêtes récentes pour vous permettre d'y revenir rapidement si nécessaire.


ClickUp affiche les invites récentes de l'utilisateur



4. Invisibles

Les flux de travail d’IA invisibles peuvent être considérés comme les plus traditionnels. Ces types existent depuis longtemps et sont apparus bien avant le récent battage médiatique des modèles linguistiques. L'IA « invisible » est littéralement invisible car le système traite les actions des utilisateurs en arrière-plan. Travaillant de manière autonome, les algorithmes d’apprentissage automatique tentent de trouver du contenu pertinent, d’améliorer les invites, ainsi que de calculer et d’analyser le comportement. Les points de contact et les interactions dans les systèmes invisibles sont minimisés


TikTok a recommandé des vidéos comme exemple de flux de travail invisible. En analysant le comportement et les intérêts de l’utilisateur, leurs algorithmes d’IA prédisent ce qui sera le plus intéressant pour l’utilisateur.


Les systèmes invisibles peuvent également aider les utilisateurs à accomplir diverses tâches, interrompant ainsi leurs flux de travail. Les suggestions et l'auto-complétion qui s'adaptent en déplacement sont des moyens de mettre en pratique cette idée. Les fonctionnalités de saisie semi-automatique offrant plusieurs suggestions à la fois sont également un moyen de réduire les erreurs et lorsque le système d'IA n'est pas sûr de ce que veut un utilisateur, permettant à l'utilisateur de choisir parmi une liste sélectionnée plutôt que de lui proposer une seule option. Faites néanmoins attention, même si certaines corrections basées sur l'IA sont judicieuses, elles peuvent toujours être erronées et les ignorer ne devrait pas être difficile. Ainsi conçu pour permettre d'accepter, de modifier ou de rejeter les suggestions de l'IA.


Dovetail fournit des suggestions calculées pour faire apparaître des balises pertinentes pour une analyse plus rapide, transparente et liée à la tâche en cours, se rapprochant des principes de l'interaction invisible.


Lors de la création de l'expérience invisible, assurez-vous que le système affiche des informations pertinentes, en fonction des activités actuelles de l'utilisateur et donnez la priorité aux recommandations personnalisées. La mise à jour a fourni des recommandations rapidement et souvent.


Afficher des recommandations à l'utilisateur, indiquer clairement la source des données et expliquer pourquoi un résultat spécifique a été prédit ou suggéré.


Spotify montre l'artiste source, expliquant pourquoi il a choisi ces listes de lecture


Permettre aux utilisateurs du système d’IA d’exprimer leurs préférences via des interactions régulières. Prenez en compte les commentaires des utilisateurs et informez-les lorsque des ajustements seront effectués. Au lieu de simplement remercier les utilisateurs, expliquez comment leurs commentaires leur seront utiles. Cela les rendra plus susceptibles de fournir à nouveau des commentaires. Lorsqu'un utilisateur appuie sur le bouton Je n'aime pas, le système doit fournir un retour immédiat et confirmer qu'il verra moins de ce type de contenu à l'avenir.


Le bouton Supprimer de Spotify permet aux utilisateurs de clarifier les suggestions, informant ainsi le système qu'ils souhaitent moins voir les chansons similaires.


Conclusion

L’IA va définitivement changer la façon dont nous interagissons avec les systèmes informatiques. Cependant, la conception de workflows d’IA nécessite un examen attentif du type de workflow créé et de l’utilisateur cible. Que votre système d'IA soit basé sur le chat, contextuel, invisible ou principal, il est essentiel de garder à l'esprit les meilleures pratiques issues d'autres systèmes d'IA similaires. Proposer plusieurs options de sortie, s'excuser pour les inexactitudes et permettre aux utilisateurs d'exprimer leurs préférences ne sont que quelques exemples des meilleures pratiques qui ont été établies. De plus, il est essentiel de prendre en compte les étapes d'entrée, de traitement et de sortie du flux de travail et de les concevoir de manière transparente et facile à comprendre pour l'utilisateur. En suivant ces bonnes pratiques et en tenant compte des besoins uniques de vos utilisateurs, vous pouvez créer des produits d'IA efficaces, efficients et conviviaux.