paint-brush
AI ワークフローと最新のアプリケーション設計パターン@artemivanov
4,076 測定値
4,076 測定値

AI ワークフローと最新のアプリケーション設計パターン

Artem Ivanov12m2023/12/08
Read on Terminal Reader

長すぎる; 読むには

人工知能はユーザーエクスペリエンスのデザインを再構築し、インテントベースのインタラクションパラダイムを導入しています。従来のインターフェイスは、ユーザーがコマンドではなく自分の欲求を表現する、より自然なインタラクションに取って代わられています。チャットボット、主要な AI ワークフロー、コンテキスト インタラクション、目に見えない AI システムには多様なパターンがあり、それぞれに独自の設計上の考慮事項が必要です。デザイナーは、認知負荷やインターフェースの直観性などの課題に取り組んでいます。ベスト プラクティス、複数の出力オプション、コンテキスト プロンプト、およびユーザー フィードバックを採用し、AI 主導の UX はシームレスさとユーザー フレンドリー性を目指しています。ユーザー インタラクションにおける AI の進化は、さまざまなワークフローにおける入力、処理、出力の各段階を慎重に考慮した、革新的なエクスペリエンスを約束します。
featured image - AI ワークフローと最新のアプリケーション設計パターン
Artem Ivanov HackerNoon profile picture
0-item


ユーザー エクスペリエンスデザインは常に進化していますが、現在の人工知能の台頭により、この分野全体が完全に一変しました。 AI は、新しいパラダイムによる新しいインタラクション時代の到来をもたらしています。従来のユーザー インターフェイスはコマンド アンド コントロール パターンに基づいており、ユーザーはコンピューターに一連のコマンドを指示して、いくつかのユーザー タスクを実行します。しかし、AI により、ユーザーは、やり方ではなく、何を望んでいるのかを伝えることで、より自然にコンピュータと対話できるようになりました。


インテントベースのパラダイムとして知られる、この AI との対話の新しいパラダイムはまだ初期段階にありますが、私たちがコンピューターと対話する方法に革命をもたらす可能性があります。たとえば、コンピューターに「パリ行きのフライトを予約したい」と伝えると、コンピューターが自動的に最適なフライトを見つけて予約してくれると想像してください。あるいは、「税金に関して助けが必要です」と言え、コンピューターがそのプロセスを段階的に案内してくれると想像してみてください。これにより、「究極の」UX を設計し、それを完全に総合的かつシームレスにするための、まったく新しい機会が数多く開かれます。


インテントベースのインタラクションには課題がないわけではありません。 LLM としても知られる最新の言語学習モデルは、すでに自然言語の理解に非常に優れています。しかし、UX における AI の状態は完璧とは程遠く、現在のチャットベースの対話スタイルでは、ユーザーが問題を散文で書き出す必要があるため、高い認知負荷が生じます。


さらに、この種のインタラクションに直感的で使いやすい UI を設計するのは難しい場合があります。ただし、インテントベースのインタラクションの潜在的な利点は重要であり、UX デザイナーはすでにこの新しいパラダイムを最適に実装する方法を模索しています。


この記事では、インテントベースのインタラクションの台頭と、それが UX デザインに与える影響について探っていきます。現在存在するタイプの AI 駆動型製品、入出力パターンの使用方法、および AI 環境でのユーザー エクスペリエンスを向上させるために製品がどのように設計されているかについて説明します。


コンテンツの概要

  • AI はデザイナーの仕事をどう変えたのか
  • 製品における AI ワークフローの主な種類
    • チャットボット
    • プライマリ (AI ファースト)
    • 文脈に応じた
    • 見えない
  • 結論

AI はデザイナーの仕事をどう変えたのか

すでにわかったように、AI 製品を扱うデザイナーにとっての新たな課題は、インテントファーストのパラダイム フレームワークでデザインすることです。従来のソフトウェアについて考えると、ソフトウェアと対話する方法は、システム内に一連のコマンドを送信して、目的の出力を取得することです。入力はコマンドであり、ボタン、ドロップダウン、フォームなど、画面上でインタラクティブなものであれば何でもかまいません。GUIでのアクションの組み合わせがコマンドを形成し、これによって段階的に作業が進められます。


コマンドベースの対話


製品内の情報アーキテクチャをナビゲートする一連の手順を経て、最終的に問題の解決策、つまりシステムの出力が得られます。たとえば、タクシーを注文しようとしている場合、システムがドライバーを選択するときに、目的地を選択し、乗車パラメータを設定し、最後に運転を確認するコマンドを送信することになります。


インテントベースのインタラクションは、入力-処理-出力システムに絞り込まれます。文字通り、結果 (いわゆるプロンプト) として取得したいものをシステムに与えると、システムは入力を処理して出力を返します。計算のすべてのステップはシステム上で行われるため、必要なものだけが得られます。タクシーの例に戻りますが、インテントベースのシステムでは、プロンプト (「家までタクシーを注文して」) を伝えるだけで、乗車できます。


インテントベースのインタラクション


このパラダイムでは、引き続きワークフローでコマンドが必要になります。機械が間違う可能性があり、人間が出力を変更して制御したり、出力を別のフローで使用したりして、システムの動作を目標に合わせてより適切に設定したい場合があるためです。


製品における AI ワークフローの主な種類

これらの命名については同意しますが、AI をユーザー フローに統合すると、製品のワークフロー、タスク、問題、技術的特徴、その他の制限に応じて動作が異なる可能性があります。研究と分析の過程で、製品の特定のパターンが見えてくるので、それを見てみましょう。また、この製品またはその製品が入力-処理-出力パターンをどのように使用しているか、どのような UI ソリューションが使用されているか、AI 製品に標準的なユーザビリティの問題をどのように解決しているかについても説明します。それでは、始めましょう。


1. チャットボット

最もわかりやすい例について話しましょう。 AI に関する現在の誇大宣伝は、主にチャットボットとその機能に関するものです。このパターンでは、LLM を使用し、チャットボット インターフェイスを介した対話のやり取りを通じて AI ワークフローが発生します。ユーザーはチャットボットと会話することで対話し、チャットボットはユーザーの質問やプロンプトに応答します。通常、このタイプのワークフローは、幅広いタスクやソリューション、最も広範なリクエスト、新しいトピックの検討などを完了するために使用できます。


ただし、現在のチャットベースの対話スタイルでは、問題を散文で書き出す必要があるため、ユーザーに高い認知的負荷が生じます。この問題に対処するために、「プロンプト エンジニア」という新しい役割が開発されました。プロンプト エンジニアは、適切なプロンプトを提供することで ChatGPT から正しい結果を引き出す責任があります。言い換えれば、チャットボットはユーザビリティの設計に細心の注意を払う必要があります。


ChatGPT はよく知られたチャットボットおよび LLM です


Pi、モバイル チャットボットのもう 1 つの例


チャットボット入力

チャットボット製品は通常、テキストプロンプトの入力パターンを使用します。このアプローチにより、ユーザーはテキスト形式でリクエストを入力してシステムに送信し、必要なものを何でも書き込むことができます。これにより、入力結果と出力結果に最も幅広い可能性が提供されます。


ユーザー プロンプト パターンは通常、テキスト フィールドの UI 要素として表示されます。チャットボットでは通常、所定の位置に固定されたままになります。


ChatGPT は、ページの下部に配置されるテキスト フィールドを使用します。


Google Bard のテキスト プロンプト


プロンプトと組み合わせて、事前に作成されたプロンプトも追加されることが多く、これにより、このチャットボットで何をすべきかについてのユーザーの誤解や誤解が減り、提案が提供され、選択が簡素化されます。


ChatGPT は、新しいチャットの開始時にユーザー プロンプトの例を表示します


また、チャットボットは、テキスト入力フィールドに入力するために音声入力の使用を提案することが多く、キーボード入力の代わりに音声を使用できるようになります。これにより、人間とコンピュータの間にほぼ有機的な対話が生まれます。


たとえば、Bard はユーザーの音声入力を使用してヒントを入力する機能を提供します。


チャットボット処理

システムがどのような状態にあり、ユーザーのリクエストをどのように処理するかを示すことが重要です。アプリケーションごとに異なるアプローチが使用されます。チャットボットにおける最も一般的なアプローチは、リアルタイムのテキスト生成です。アルゴリズムが結果を提供するまでに時間がかかる場合があるため、外出中にテキスト生成を表示することをお勧めします。これにより、ユーザーの注意を集中させ、入力と出力の間の移行をよりシームレスに行うことができます。


Pi チャットボット アシスタントは、リアルタイムの生成プロセスで出力を表示します


チャットボットの出力

チャットボット アプリケーションでは、出力の種類は大きく異なる場合があります。これには、テキスト、画像 (テキスト入力などで生成)、またはアプリケーションのターゲット トピックとその機能に応じたその他の結果が含まれます。出力されるコピーライティングには、ユーザー入力と、アプリの望ましい性格や個性 (該当する場合) が反映されていることが重要です。


チャットボットを設計する場合は、他のアプリがすでに使用しているベスト プラクティスを考慮する必要があります。


  1. 複数の出力。システムの結果は異なる可能性があり、場合によっては高品質ではない場合や、システムがユーザーのリクエストを誤解する可能性があるため、複数の出力の可能性を追加して、ユーザーが望んでいるクエリをシステムが推測する可能性を高めることをお勧めします。見る。


吟遊詩人は、システムの 3 つの草案が対応することを示唆しています


Bing Image Generator は 1 つのプロンプトで複数のイメージを作成します


  1. 不正確なことをお詫び申し上げます。システム内の人工知能は、ユーザーに混乱、攻撃的なコンテンツ、または不安感をもたらす誤った結果を生成する可能性があります。システムは、発生する可能性のある不正確さをお詫び申し上げます。


Bard は不正確な結果の可能性があることについて事前に謝罪します


  1. 保存されたインタラクション。システム内でのユーザーの最近のアクションを記憶し、それらをより簡単に参照できるようにします。最近の目的地、検索、その他の入力を表示すると、認知的負荷を軽減するのに役立ちます。


吟遊詩人は最近の会話履歴を表示します



2. プライマリ (AI ファースト)

このタイプの製品は、言語学習モデルを利用したチャットボットとよく似ていますが、その位置づけが特定のユースケースに限定されており、写真から特定の業界の質問に対する複雑なインタラクティブな回答まで、非常に異なるタイプの結果を生成できる点が異なります。


これらの製品は、全画面インタラクションとステップ フォームを通じて AI を主要なワークフローとして使用します。


Copy.ai はチャットボットのように見えますが、その主な機能はマーケティング コピーの作成を支援するために絞り込まれています。


DALLE のプロンプト入力はシステム ワークフローの中で最初に行われますが、出力は画像生成の形式で行われます。


プライマリタイプの入力

すでに述べたように、入力はチャットボットの入力パターンに似ており、通常はテキストのプロンプトフィールドのように見えます。プロンプト テンプレート (思考のプロセスを開始するのに役立ちます) や音声入力などのベスト プラクティスも同様に残されています。


入力パラメータを設定できる Copy.ai プロンプト フィールド


また、システムの出力に適用できる場合は、ユーザーがいくつかのパラメーターを設定できるようにすることが合理的な場合もあります。これは、ユーザーに馴染みのある基準スライダーやその他の標準的な UI パターンの使用を意味します。


グラフィック アセットを生成するアプリ Recraft は、詳細の出力レベルを設定するために基準スライダーを使用します


プライマリタイプの処理

他のワークフロー タイプと一貫した処理パターン。ここでのベスト プラクティスは、外出先でシステム出力を簡単に生成することです。ただし、AI ファーストのワークフローの処理を設計するときは、部分ごとに示すことが可能であれば、出力に注意してください。たとえば、画像の生成過程を表示できる場合、またはテクノロジーによって完成した画像のみを表示できる場合などです。


この場合、計算中に詳細な進行状況メッセージを提供することを検討してください。


Bing Creator は画像の生成中に進行状況バーを表示します



プライマリタイプの出力

AI ファーストのワークフローでは、システムがユーザーに何を提供しようとしているのか、どのようなソリューションを達成しようとしているのかに応じて、出力タイプは画像からさまざまな UI 構造 (または動的 UI 要素) までさまざまです。


このタイプのワークフローを設計するときは、複数の出力結果の使用を検討し、ユーザーが目的の結果を達成できるように出力を微調整できるようにし、再プロンプトを許可し、システムの動作に関するフィードバックを追加できるようにします。


Bing Create では 1 つのプロンプトから複数の画像が表示されます


Copy.ai には、ユーザー側からの出力を評価するための 2 つの親指ボタンと親指ボタンが表示されます


Recraft により、既存のイメージを無限に再プロンプトできます




3. 状況に応じた

このタイプでは、トリガーとコンテキスト アクションを通じて、AI ワークフローが既存のプライマリ ワークフローの上に追加されます。 LLM を使用して、さまざまな UI 要素を通じてコンテキスト タスクに対するソリューションを提供します。


ClickUp は、すでに提供されている機能のコンテキストで AI アシスタントを使用することを提案しています


Linear は、複雑なデータ フィルタリングを迅速に構築する AI サービスを提供します



コンテキストに応じたワークフローへの入力

コンテキスト ワークフローでの入力はタスクの種類に依存し、大きく異なる場合があります。これは、テキスト入力、プロンプト テンプレート、またはテキストの要約などの特定のタスクを有効にするためのボタンです。


このアプローチを使用する場合は、ユーザーがこれらのプロンプトまたはコマンドをトリガーする方法であるアクティブ化/非アクティブ化プロセスの設計を検討してください。


ClickUp は、ドキュメントに AI を入力すると AI アシスタントをトリガーし、事前に構築された一連のプロンプトから選択できるようにします


今後の Dovetail AI 機能では、さまざまなソースからのデータを要約することもできるようになります。たとえば、長いサポート会話を簡略化したり、1 時間にわたる顧客インタビューの記録をいくつかの箇条書きに変換したりできます。


即時構築

このパターンは、ユーザーが詳細なプロンプトを作成することなく詳細なプロンプトを作成できるようにするガイド付きウィザードとして表示され、テキスト フィールド、ドロップダウン、ラジオ ボタンなどのさまざまな UI 入力要素を使用します。これらすべてがフォーム構造に結合され、タスクのコンテキストに適応し、複雑なプロンプトを小さな論理部分に分割できるようになり、ユーザーの負荷が軽減され、ユーザーはプロンプトの形式について多くのことを考える必要がなくなります。プロンプト。これは、同じ構造で頻繁に繰り返されるクエリがある場合に特に便利です。その場合、毎回新しいプロンプトを作成する手間を省くために、変更された部分のみをユーザーに入力させることができます。


ClickUp を使用すると、ユーザーはワークフローのコンテキストに基づいてフォームに入力して詳細なプロンプトを作成できます。


コンテキストに応じたワークフローの処理

当然のことですが、コンテキスト システムでは、処理設計に対してコンテキスト アプローチが必要です。繰り返しますが、正しい方法はソフトウェアが実行する必要があるタスクの種類に大きく依存しますが、一般的な方法は変わりません。可能であれば、生成された結果の出力を表示します。そうでない場合は、アルゴリズムが現在動作しているステップと、処理の明示的なインジケーター (読み込みアイコンまたは進行状況バー) を表示します。


ClickUp AI が外出先で出力を生成


コンテキストワークフローの出力

統合 AI ワークフローの出力を設計する場合は、主要なワークフローに適用する前に、ユーザーがコンテキスト内で出力を確認できるようにします。これにより、ユーザーは人工知能によって生成された結果の正しさを検証し、結果が正しくない場合には、結果を削除または変更することができます。


ClickUp を使用すると、生成されたテキストをドキュメント内に挿入する前にチェックできます。


コマンドベースとインテントベースの対話アプローチの両方の利点を組み合わせます。製品の解決策であるタスクに応じて、ユーザーが目的を達成するために指定された出力を変更して使用できるようにします。できるだけスムーズで簡単な流れを提供します。


たとえば、本文が大量にある状況では、認知力や読み書き能力に問題があるユーザーは、テキスト全体を読まなくても、そのコンテンツに何が含まれているかを知りたいと考えます。ユーザーはクリックすると、AI によって生成されたテキストの短縮および簡略化されたバージョンを表示できます。


Bard はドロップダウン メニューを使用して可能な応答修飾子を表示し、結果を短くしたり長くしたりすることができます。


また、必要に応じてすぐに戻れるように、最近のクエリを保存して表示することもお勧めします。


ClickUp はユーザーの最近のプロンプトを表示します



4. 目に見えない

目に見えない AI ワークフローは、最も伝統的なワークフローと考えることができます。これらの型は長い間存在しており、最近の言語モデルの誇大宣伝よりずっと前に登場しました。 「目に見えない」AI は、システムがユーザーのアクションをバックグラウンド モードで処理するため、文字通り目に見えません。機械学習アルゴリズムは自律的に動作し、関連するコンテンツを見つけ、プロンプトを改善し、動作を計算して分析しようとします。目に見えないシステムでのタッチポイントとインタラクションは最小限に抑えられます


TikTokは目に見えないワークフローの例として動画を推奨しました。 AI アルゴリズムはユーザーの行動と興味を分析し、ユーザーにとって何が最も興味深いかを予測します。


目に見えないシステムは、ユーザーがさまざまなタスクを実行するのを支援し、ワークフローを中断することもあります。外出先でも適応する提案とオートコンプリートは、このアイデアを実践する方法です。一度に複数の提案を提供するオートコンプリート機能は、間違いを減らしたり、AI システムがユーザーが何を望んでいるのかわからない場合に、ユーザーが 1 つの選択肢を与えるのではなく、選択したラインナップから選択できるようにする方法でもあります。ただし、AI を活用した特定の修正が賢明であるとしても、間違いである可能性があり、それらをオーバーライドするのは難しくないはずであることに注意してください。 AI の提案を受け入れ、編集、拒否できるように設計されています。


Dovetail は、より迅速な分析のために関連タグを表面化するための計算された提案を提供します。これはシームレスで現在のタスクに関連しており、目に見えない相互作用の原理にアプローチしています。


目に見えないエクスペリエンスを作成するときは、ユーザーの現在のアクティビティに基づいて関連情報がシステムに表示され、パーソナライズされた推奨事項が優先されるようにしてください。提供された推奨事項を迅速かつ頻繁に更新します。


ユーザーに推奨事項を表示し、データのソースを明確に示し、特定の結果が予測または提案された理由を説明します。


Spotify はソースアーティストを表示し、これらのプレイリストを選んだ理由を説明します


AI システムのユーザーが定期的な対話を通じて自分の好みを表現できるようにします。ユーザーのフィードバックを確認し、調整が行われる時期を通知します。単にユーザーに感謝するのではなく、ユーザーのフィードバックがどのように役立つかを説明してください。そうすることで、再びフィードバックを提供してくれる可能性が高くなります。ユーザーが「嫌い」ボタンをタップすると、システムは即座にフィードバックを提供し、今後その種のコンテンツが表示されなくなることを確認する必要があります。


Spotify の削除ボタンを使用すると、ユーザーは提案を明確にし、類似した曲をあまり見たくないことをシステムに通知できます


結論

AI は間違いなく、私たちがコンピューター システムと対話する方法を変えるでしょう。ただし、AI ワークフローを設計するには、作成するワークフローの種類と対象ユーザーを慎重に考慮する必要があります。 AI システムがチャットベース、コンテキスト、非表示、プライマリのいずれであっても、他の同様の AI システムから得られたベスト プラクティスを念頭に置くことが重要です。複数の出力オプションを提供すること、不正確さについて謝罪すること、ユーザーが好みを表現できるようにすることは、確立されているベスト プラクティスのほんの一例にすぎません。さらに、ワークフローの入力、処理、出力の各段階を考慮し、それらをシームレスでユーザーにとって理解しやすい方法で設計することが重要です。これらのベスト プラクティスに従い、ユーザー固有のニーズを考慮することで、効果的、効率的、そしてユーザー フレンドリーな AI 製品を作成できます。