大人の塗り絵はリラックスできる瞑想的なリラックス方法を提供し、近年人気が急上昇しています。しかし、店頭での品揃えは一般的なパターンや形状に焦点を当てる傾向があります。
そして、興味深いコンテンツについて自分のアイデアがある場合でも、アーティストを雇ったり、詳細な図面を自分で作成したりしない限り、たとえば友達に自分の塗り絵を作成する簡単な方法はありません。
では、実際にその問題を回避する方法があると言ったらどうなるでしょうか?
あることが分かりました。次のような新しい AI 画像生成モデル
適切なモデル (またはモデルのチェーン...詳細は後ほど) と適切なプロンプトを使用すると、塗り絵のアイデアにぴったりの詳細な画像を得ることができます。
この記事では、AI の力を活用して、大人が気に入るカスタムの塗り絵を作成する方法を検討します。
を詳しく見ていきます。
また、プロンプトを変更して画像の複雑さのレベルを変更し、クレヨンを持っている大人 (または子供) のスキル レベルに合わせてモデルを効果的に調整する方法も見ていきます。
さあ行こう。
Hasdx の概要と概要
DALL-E 2、Midjourney、Stable Diffusion などの最近の AI モデルは、さまざまな AI 技術を使用して、テキスト プロンプトから非常にリアルで多様な画像を生成します。彼らは、単語と視覚的概念の間の関連性を「学習」するために、画像とテキストの巨大なデータセットでトレーニングされます。
適切なプロンプトを入力することで、これらのモデルをガイドして、塗り絵に適したカスタム イラストを作成できます。
大人の塗り絵プロジェクトでは、
私が Hasdx を選んだのは、特に Hasdx が Stable Diffusion の微調整されたバージョンであり、塗り絵に最適な高品質で多様な画像を生成できるためです。
Hasdxはどのように開発されたのですか?なぜ使用するのか?
クリエイターが Stable Diffusion の実験を開始すると、画質やトレーニング制御などの側面を強化するために特化したモデルが登場しました。
そのようなモデルの 1 つが HuggingFace でした
同じ時期に、2 つのチェックポイント モデルがその芸術的能力で認められるようになりました。
その結果、フォトリアルな人物画像に優れています。一方、デジタル アーティストの handas2077 によって作成された handas-3dkx10b は、3D モデリング技術を採用して、卓越した精度とディテールを実現しました。
相乗効果の機会を特定する開発者
複雑な以前のバージョンとは異なり、Hasdx はシンプルさ、柔軟性、および忠実度の高い結果を強調しました。これにより、大人の塗り絵のイラストを生成するなど、複雑なデザインでも長いプロンプトを必要とせずに Hasdx の詳細を活用できるクリエイティブなアプリケーションにとって魅力的なものとなりました。
Hasdx は、さまざまなスキル レベルのユーザーにとって、プロレベルの画像生成を手の届くところにもたらしました。
レプリケートデモ UI を使用して Hasdx と対話する方法
このガイドの手順に従い、私と一緒に Hasdx を使用して大人の塗り絵の画像を生成してみたい場合は、デモ UI を複製するのが最も速くて簡単な方法です。アクセス方法は次のとおりです。
- モデルの詳細ページに移動します。
ハスデックス AImodels.fyi で
- 右側の列で、Replicate デモのリンクを見つけます ( 「Model Link」 -> 「View on Replicate」 )。
- レプリケートアカウントを作成し、Hasdxページの「デモ」タブを選択します。
- 必要に応じてプロンプトフィールドを直接操作し、「生成」をクリックして入力をテストします。
モデルを操作する方法について詳しくは、
Hasdx の入力と出力
大人の塗り絵プロジェクトに Hasdx を使用する場合、調整できるキー入力がいくつかあります。次のセクションではプロンプトに焦点を当てますが、徹底的に説明するために、操作できるすべてのパラメータのリストをここに示します。
- プロンプト- AI に生成させたい内容を説明するテキスト プロンプトを指定する場所です。大人向けの本の場合は、テーマと複雑な詳細に焦点を当てます。
- negative_prompt - テキストや邪魔な背景オブジェクトなど、画像に表示したくないものを指定します。
- 幅/高さ- Hasdx は、768x768 などの高解像度で最適に動作します。サイズが大きいほど、より詳細な情報がキャプチャされます。
- num_inference_steps - 約 80 ステップで、時間をかけずに詳細を適切にレンダリングします。
- guide_scale - 出力がプロンプトに厳密に従うように、これを 9 ~ 10 などの高い値に保ちます。
- シード- シードを変更して、それ以外は同一のプロンプト間のバリエーションを取得します。
Hasdx からの主な出力は、プロンプトの詳細と一致する高解像度の PNG 画像になります。適切なプロンプト (以下を参照) を使用すると、AI は印刷可能な大人の塗り絵のページに最適なシャープで複雑なイラストを生成します。
Replicate を使用してモデルを操作している場合 (この例で行うように)、出力は次のようになります。
{ "type": "array", "items": { "type": "string", "format": "uri" }, "title": "Output" }
プロンプトの作成
AI で優れた画像を生成する鍵は、テキスト プロンプトを注意深く作成することです。塗り絵では、輪郭が太いシンプルな白黒の線画が必要です。
これは、Chase Lean の著書からインスピレーションを得た、うまく機能するプロンプト構造です。
adult coloring book, cartoon, [theme], intricate details, advanced patterns, black and white
[テーマ] を、動物、乗り物、食べ物など、描きたいものに置き換えてください。いくつかの例を試してみましょう。
- 大人の塗り絵、漫画、繊細な花、複雑な詳細、高度なパターン、白黒
- 大人の塗り絵、漫画、美しい戦士、複雑な詳細、高度なパターン、白黒
- 大人の塗り絵、漫画、アールデコ調の建物、複雑な詳細、高度なパターン、白黒
否定的なプロンプトを設定することによっても、多くのことが得られます。私が使用したものは次のとおりです。
- 色、写真、ファックス、スクリーンショット、境界線、ぼやけた、粒子の粗い
上で確認した他のパラメータを設定できます。以下に、非常に優れた出力が得られる完全な例を示します。
- プロンプト:大人の塗り絵、漫画、美しい戦士、複雑な詳細、高度なパターン、白黒
- 否定的なプロンプト:写真、ファックス、スクリーンショット、境界線、ぼやけた、粒子が粗い
- 幅: 512
- 身長: 512
- 出力数: 1
- 推論ステップ数: 185
- 誘導スケール: 12
- スケジューラ: DPMsolverMultistep
- シード:なし (空白)
複雑さの調整
生成された画像の複雑さを調整することもできます。成人向けの本の場合は、複雑な詳細と高度なパターンが好まれます。一方、児童書では、読者の細かい運動能力のレベルに応じて、通常、よりシンプルな画像が好まれます。
よりシンプルな児童書用のより基本的なイラストを作成するには、次のことを考慮してください。
b/w outline art for kids coloring book page, rabbit, Kids coloring pages, full white, kids style, white background, whole body, Sketch style, full body (((((white background))))), only use outline. , cartoon style, line art, coloring book, clean line art, white background, Sketch style
(プロンプトからのオリジナルのプロンプト)
適切な詳細レベルを取得するには、さまざまなスタイル値を試してください。ただし、ほとんどの大人は高度な複雑さを楽しんでいることを覚えておいてください。
画像のアップスケーリング
Hasdx によって生成された画像は、特に最終的に印刷したい書籍用に画像を拡大する必要がある場合、少しぼやけて見えることがあります。
幸いなことに、出力を別のモデルで実行して、さらに優れたファイルを取得できます。これらのモデルはアップスケーラーと呼ばれ、多くの人気のあるオプションがあります。
エスガン : 理想的な劣化シミュレーションに対して優れた結果を提供します。このモデルは、Hasdx で作成しているような合成イメージを復元するのに適しています。
リアル ESRGAN : 現実世界の破損に対処するように調整されていますが、それでも合成画像をクリーンアップすることができます古い ESRGAN モデルと同じように 。
コードフォーマー: 堅牢な顔復元アルゴリズム 古い写真と AI で生成された顔の両方を処理できるように設計されています。塗り絵用のポートレートタイプの世代の奇妙なアーティファクトをクリーンアップするのに適しています。
GFPGA :コードフォーマーに似ている 、このモデルは顔を復元するのに適しています 塗り絵の画像として生成されたポートレートをクリーンアップするのに役立ちます。
以下は、Real-ESRGAN を介して最初の出力例を実行すると、より高品質の画像が得られることを示す例です。
結果はかなり微妙ですが、アップスケールされた画像と元の画像を並べて見ると、改善された線によって画像の色付けがいかに簡単になっているかがわかります。灰色の領域が減り、境界が鮮明になることは、このタイプのアプリケーションに最適です。
完全なブックの生成
プロンプトを完成させ、画像のアップスケーリングを練習したら、基本的には準備完了です。次の一般的なプロセスに従って、書籍用のイラストの完全なセットを生成できるようになりました。
- 含めたいテーマとトピックのリストを作成します。
- 上記の式を使用してそれぞれのプロンプトを作成し、必要に応じてスタイルを調整します。スタイルの一貫性を保つためにシードの使用を検討してください。
- 詳細が不十分なイラストを修正します。アップスケーラーを使用して強化してください。
- 出版ソフトウェアを使用して、最終画像を印刷可能なページに配置します。
これで、AI が生成したカスタムの大人の塗り絵が完成しました。これらのモデルが作成できる複雑で詳細な画像の膨大な範囲により、本をあらゆるスタイルや主題に合わせて簡単に調整できます。
結論
AI を使用してカスタムの大人の塗り絵を作成することは、生成画像モデルのエキサイティングな新しいアプリケーションです。これまで見てきたように、Hasdx のようなツールは、高度にパーソナライズされた本を作成するためのユニークで複雑なイラストの無限のソースを提供します。
このプロセス全体を確認した後の重要なポイントをいくつか紹介します。
- Stable Diffusion などの最近の AI モデルでは、慎重に作成されたテキスト プロンプトを通じてカスタム画像を生成できます。微調整により、特定のクリエイティブなニーズに合わせて調整された Hasdx のような特殊なモデルが生成されます。
- Hasdx は、リアリズムとディテールに重点を置きながら、一般的な機能のバランスをとります。このため、詳細な大人の塗り絵の画像に適しています。
- プロンプト構造により、生成されるイラストのテーマと複雑さを正確に制御できます。否定的なプロンプトは、望ましくない要素を回避するのに役立ちます。
- アップスケーリング モデルを通じて Hasdx 出力を実行すると、印刷の品質が向上します。 ESRGAN などはディテールとラインをシャープにします。
- 膨大な範囲のイラストが用意されているため、個人のスタイルや興味に合わせてカスタムブックを簡単にカスタマイズできます。
- AI は、クリエイターがユニークな塗り絵やその他のパーソナライズされた画像ベースの製品を作成できるようにする上で、ゲームチェンジャーとなる準備ができているようです。
生成 AI の世界は急速に進化しています。モデルの機能とアクセシビリティが向上し続けるにつれて、カスタムの大人の塗り絵など、さらに多くの新しいアプリケーションが登場する可能性があります。 AI の創造性を活用する未来は明るいです。読んでくれてありがとう。
リソースと詳細情報
AI ベースの大人の塗り絵プロジェクトに取り組む際に参照すると便利なリソースをいくつか紹介します。
Hasdxモデル - 創造性に最適化された混合安定拡散モデル
Hasdx の魔法を明らかにする - 混合安定拡散モデルの包括的なガイド
リアル ESRGAN - AI画像アップスケーリングモデル
コードフォーマー - AI顔復元モデル
GFPGA - AI顔復元モデル
プロンプトヒーロー - テキストプロンプトを最適化するツール
チェイス・リーンのTwitterスレッド - 旅の途中で役立つデザインのヒント
ここでも公開されています