paint-brush
טכניקה חדשה טוענת לעזור לבינה מלאכותית לחשוב כמו בני אדםעל ידי@mahakshah
850 קריאות
850 קריאות

טכניקה חדשה טוענת לעזור לבינה מלאכותית לחשוב כמו בני אדם

על ידי Mahak Shah4m2025/01/15
Read on Terminal Reader

יותר מדי זמן; לקרוא

שרשרת המחשבה מחוללת מהפכה באופן שבו אנו מתקשרים עם AI. זה מפרק בעיות מורכבות לנתחים ניתנים לעיכול, ומאפשר למודל להתמודד עם כל רכיב באופן שיטתי. גישה מובנית זו מבטיחה דיוק ומדגימה את תהליך החשיבה, דבר בעל ערך במיוחד כאשר עוסקים בפעולות מתמטיות מורכבות.
featured image - טכניקה חדשה טוענת לעזור לבינה מלאכותית לחשוב כמו בני אדם
Mahak Shah HackerNoon profile picture


תהיתם פעם איך לגרום לבינה מלאכותית לחשוב יותר כמו אדם? בעוד שמודלים של שפה גדולה (LLM) מצטיינים בניבוי המילה הבאה ברצף, לעתים קרובות הם מועדים כאשר מתמודדים עם בעיות הדורשות חשיבה שיטתית. היכנס לשרשרת מחשבה - טכניקה משנה משחק שמחוללת מהפכה באופן שבו אנו מתקשרים עם AI.

פירוק שרשרת מחשבה


דמיינו לעצמכם ללמד ילד לפתור חידה מורכבת. במקום להראות להם את התמונה הסופית, אתה מנחה אותם בכל שלב. זה בעצם מה שההנחיה של שרשרת המחשבה (CoT) עושה עבור LLMs. על ידי מתן דוגמאות המציגות חשיבה שלב אחר שלב, אנו עוזרים למודלים אלה להגיע לפתרונות מדויקים באמצעות התקדמות לוגית.


מקור תמונה: Wei et al. (2022)


נוסחת הקסם: למה זה עובד


שיטות הנחיה מסורתיות מובילות לעתים קרובות לתוצאות פגיעה או החמצה. עם זאת, הנחיית CoT מפרקת בעיות מורכבות לנתחים ניתנים לעיכול, ומאפשרת למודל להתמודד עם כל רכיב באופן שיטתי. גישה זו הוכיחה את עצמה כל כך מוצלחת עד שדגמים חדישים כמו ההצעות האחרונות של OpenAI שילבו אותה בפונקציונליות הליבה שלהם.


יישום בעולם האמיתי: פתרון חידות מתמטיות


בואו נצלול לדוגמא מעשית. תאר לעצמך שאתה עוזר לבינה מלאכותית לפתור את המשוואה הזו

5x - 4 = 16


הנה איך הנחיה CoT מנחה את המודל:

  1. שלב ראשון: הוסף 4 לשני הצדדים
    • 5x - 4 + 4 = 16 + 4
    • 5x = 20
  2. שלב שני: מחלקים את שני הצדדים ב-5
    • 5x/5 = 20/5

    • x = 4


גישה מובנית זו מבטיחה דיוק ומדגימה את תהליך החשיבה - דבר בעל ערך במיוחד כאשר עוסקים בפעולות מתמטיות מורכבות.


שרשרת מחשבה לעומת הנחה מועטה של יריות: הבנת ההבחנה


שתי הטכניקות הללו עשויות להיראות דומות במבט ראשון, אך הן משרתות מטרה אחרת:


  • בקשת יריות מועטות : מספק דוגמאות המציגות קלט ופלט, כמו מקש תשובה מרובה.

  • שרשרת מחשבה : מדגים את תהליך ההגיון המלא, כמו הצגת כל העבודה בבעיה מתמטית.


הנחיית ירי מועטים תיראה כך:

 Example 1: Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Answer: $22 Example 2: Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Answer: $22


שרשרת המחשבה תיראה כך:

 Problem: If a store sells books for $5 each and markers for $3 each, how much would 2 books and 4 markers cost? Thinking: 1. Calculate cost of books: 2 books × $5 = $10 2. Calculate cost of markers: 4 markers × $3 = $12 3. Total cost = Cost of books + Cost of markers = $10 + $12 = $22 Answer: $22 Problem: If a store sells notebooks for $4 each and pens for $2 each, how much would 3 notebooks and 5 pens cost? Thinking: 1. Calculate cost of notebooks: 3 notebooks × $4 = $12 2. Calculate cost of pens: 5 pens × $2 = $10 3. Total cost = Cost of notebooks + Cost of pens = $12 + $10 = $22 Answer: $22

אפס-שוט שרשרת מחשבה


באמצעות הביטוי הפשוט אך העוצמתי של " בואו נחשוב צעד אחר צעד", ההנחיה של Zero-shot CoT משמשת בנסיבות שבהן אין לך מקרים לדוגמה בהישג יד. לדוגמה, "בואו נחשוב צעד אחר צעד: הסבר פיזיקת קוונטים."

מתי עליך להשתמש בהנחיית CoT?


הנחיית CoT זורחת כאשר מתמודדים עם:

  • חשבון מסובך
  • חשיבה לוגית מרובה שלבים
  • הִגָיוֹן
  • מניפולציה סמלית


המדדים העדכניים ביותר של קלוד הראו ששיטות המשתמשות בהנחיית CoT של 3 יריות או 5 יריות מצליחות למשימות כבדות חשיבה: GPQA ו-MMLU.

העתיד: שרשרת מחשבה רב-מודאלית


ההתקדמות האחרונה בתחום החשיבה בינה מלאכותית משלבת רכיבים חזותיים וטקסטואליים בתהליכים קוגניטיביים. דמיינו בינה מלאכותית המאבחנת תיקון אופניים, מבינה את המדריך ומספקת הדרכה חזותית ואודיו לאורך כל שלב בתהליך. הגישה הרב-מודאלית מסמלת את ההתקדמות הקרובה בתמיכה בבינה מלאכותית.


מקור תמונה: Zhang et al. (2023)

מקסום את האפקטיביות של הנחיות ה-CoT שלך


בעוד שרשרת המחשבה היא רבת עוצמה, היא פועלת עם מגבלות מסוימות. נתיב ההיגיון שהמודל מבצע אינו מובטח ללא תקלות והוא משתנה מעט בתוצאות.


הנה כמה טיפים להשגת תוצאות טובות יותר:

  • בדוק היטב עם גישות שונות.
  • שקול לשלב הנחיית CoT עם אסטרטגיות הנחיה אחרות.
  • השתמש בדגמים גדולים יותר עם יותר מ-100 מיליארד פרמטרים, אם אפשר.

מַסְקָנָה


לאור התקדמות הבינה המלאכותית, ברור שהנחיה של שרשרת מחשבה (CoT) היא טכניקה יעילה לניצול יכולות חשיבה מתקדמות יותר. חשוב לציין כי שימוש ב-CoT הנחיה לפיתוח יישומים או להשגת תוצאות אופטימליות יותר במעורבות בינה מלאכותית מעלה מאוד את הסיכויים להשגת הצלחה.


הכוונה היא לא רק להשיג את התגובה המדויקת, אלא גם להבין את ההליך שננקט לשם כך, וזה היופי בהנחיית שרשרת המחשבה.

הערות שוליים

  1. Wei, J., Wang, X., Schuurmans, D., Bosma, M., Ichter, B., Xia, F., Chi, E., Le, Q., & Zhou, D. (2022). שרשרת המחשבה מעוררת היגיון במודלים של שפות גדולות.
  2. Kojima, T., Gu, SS, Reid, M., Matsuo, Y., & Iwasawa, Y. (2022). דגמי שפה גדולים הם נימוקים של Zero-Shot.
  3. Zhang, Zhuosheng, et al. "הנמקה של שרשרת מחשבתית רב-תכליתית במודלים של שפה." arXiv preprint arXiv:2302.00923 (2023).