האם CoT זה פאסה? אסטרטגיית הנחיה חדשה כובשת את עולם הבינה המלאכותית - הכירו את "שרשרת הטיוטה"

נדב נוה
4 במרץ 2025
זמן קריאה 4 דקות

עודכן: 22 באפר׳ 2025

נמאס לכם לחכות?

מודלים של בינה מלאכותית חושבים מהר יותר - וגם זול יותר!

אם חשבתם ש"שרשרת מחשבה" (Chain of Thought) היא פסגת הטכנולוגיה בתחום מודלי השפה הגדולים (LLMs), תחשבו שוב! אסטרטגיית הנחיה חדשה ומהפכנית מגיעה לעולם הבינה המלאכותית, והיא מבטיחה לעשות את מה שחשבנו לבלתי אפשרי: לגרום למודלים לחשוב מהר יותר, ביעילות רבה יותר ובעלות נמוכה משמעותית, מבלי להתפשר על האיכות. קבלו את "שרשרת הטיוטה" (Chain of Draft) - השיטה החדשה שמשנה את כללי המשחק!

שרשרת המחשבה: גישה גאונית - אך לא חפה מחסרונות

עד לא מזמן, "שרשרת מחשבה" נחשבה לטכניקה פורצת דרך שאיפשרה למודלים של בינה מלאכותית להגיע לרמות דיוק וביצועים חסרות תקדים. הרעיון מאחורי השיטה פשוט אך גאוני: במקום שהמודל ייתן תשובה ישירה, מלמדים אותו "לחשוב בקול רם", כלומר לפרק את הבעיה לשלבים, להסביר את תהליך החשיבה, ורק אז להציג את התשובה הסופית.

התוצאות היו מדהימות. מודלים שיישמו את "שרשרת המחשבה" הראו שיפור עצום ביכולתם לפתור בעיות מורכבות, במיוחד בתחומים כמו מתמטיקה, חשיבה לוגית וידע כללי. אך למרות ההצלחה, "שרשרת המחשבה" סבלה מחיסרון משמעותי: היא יקרה ואיטית.

למה? כי "לחשוב בקול רם" דורש מהמודל לייצר כמות עצומה של טקסט ביניים - כל אותם שלבי חשיבה מפורטים. ככל שהבעיה מורכבת יותר, כך גדלה כמות הטקסט, ובהתאם לכך עולים משמעותית זמן התגובה והעלות החישובית. במילים אחרות, "שרשרת המחשבה" אמנם מדמה תהליך חשיבה אנושי, אך היא עושה זאת בצורה מאוד "פטפטנית" ולא יעילה.

"שרשרת הטיוטה": חושבים כמו בני אדם - באמת!

כאן נכנסת לתמונה "שרשרת הטיוטה", גישה חדשה שפותחה על ידי חוקרים מחברת זום (כן, אותה חברת תוכנת ועידות הוידאו!). החוקרים הבינו שבעוד "שרשרת המחשבה" מחקה חלק מתהליך החשיבה האנושי, היא מפספסת נקודה קריטית: בני אדם לא חושבים ב"נאומים" ארוכים ומפורטים. במקום זאת, אנחנו נוטים לרשום לעצמנו הערות קצרות, טיוטות מהירות, ונקודות עיקריות שמקדמות אותנו לעבר פתרון.

"שרשרת הטיוטה" מחקה בדיוק את הגישה הזו. במקום לייצר שלבי חשיבה מפורטים ומלאי מלל, היא מעודדת את המודל לייצר טיוטות קצרות, דחוסות ואינפורמטיביות בכל שלב. במקום "לכתוב רומן" על כל צעד בתהליך החשיבה, המודל כותב רק את "הנקודות החשובות", את אותם רסיסי מידע חיוניים שדוחפים אותו קדימה.

במילים פשוטות: פחות מילים, יותר תוצאות.

דוגמה קטנה, הבדל גדול: הסוכריות של ג'ייסון

כדי להבין את ההבדל, בואו נסתכל על דוגמה פשוטה:

השאלה: לג'ייסון היו 20 סוכריות. הוא נתן לדני כמה סוכריות. עכשיו לג'ייסון יש 12 סוכריות. כמה סוכריות ג'ייסון נתן לדני?

גישה סטנדרטית: המודל פשוט ייתן את התשובה: "8". נכון, אבל לא מלמד אותנו כלום על איך הוא הגיע לתשובה.

שרשרת מחשבה: המודל יפרט את כל שלבי החשיבה: "בואו נחשוב צעד אחר צעד. לג'ייסון היו בהתחלה 20 סוכריות. אחרי שנתן לדני כמה סוכריות, נשארו לו 12. כדי לגלות כמה הוא נתן, אנחנו צריכים לעשות פעולת חיסור פשוטה. 20 פחות 12 שווה 8. התשובה היא 8." נכון, מפורט, אבל גם מאוד "מייגע" עבור שאלה כזו פשוטה.

שרשרת טיוטה: המודל ייתן טיוטה קצרה וקולעת: "20 - X = 12, X = 20 - 12, X = 8". עדיין רואים את תהליך החשיבה, אבל בצורה תמציתית, יעילה ומהירה.

לא רק מהר יותר, גם חכם יותר?

המחקר של זום לא רק הראה ש"שרשרת הטיוטה" מהירה וזולה יותר מ"שרשרת המחשבה". התוצאות הראו דבר מדהים נוסף: במקרים רבים, "שרשרת הטיוטה" גם הגיעה לתוצאות מדויקות יותר!

במבחני ביצועים סטנדרטיים, כמו פתרון בעיות מתמטיות (GSM-AK), חשיבה הגיונית, הבנת ספורט והערכת הטלת מטבע, "שרשרת הטיוטה" הציגה ביצועים זהים או אפילו טובים יותר מ"שרשרת המחשבה", תוך שימוש בפחות אסימונים (tokens) ועם זמן תגובה מהיר משמעותית.

המשמעות ברורה: "שרשרת הטיוטה" לא רק חוסכת לנו זמן וכסף, היא גם עשויה להוביל למודלים חכמים ויעילים יותר.

פשוט ליישום - מהפכה בהנחיה

אחד היתרונות הבולטים של "שרשרת הטיוטה" הוא הפשטות היישום. לא נדרשים שינויים במודל עצמו, לא צריך "ללמד" אותו מחדש, ולא צריך טכניקות מורכבות של למידת חיזוק. כל מה שצריך זה לשנות את ההנחיה (prompt) שנותנים למודל!

הנה דוגמה להנחיה פשוטה בעברית ליישום "שרשרת הטיוטה":

"חשוב צעד אחר צעד, אך שמור על טיוטה מינימלית לכל שלב חשיבה, עד חמש מילים לכל היותר. החזר את התשובה בסוף התגובה, אחרי מפריד של ארבע סולמיות (####)."

זה כל הסיפור! שינוי קטן בהנחיה, ופתאום מודל הבינה המלאכותית חושב כמונו - מהר, יעיל וממוקד.

העתיד כבר כאן: בינה מלאכותית חושבת מהר וזול יותר

"שרשרת הטיוטה" היא תזכורת עוצמתית לכך שחדשנות בעולם הבינה המלאכותית לא תמיד חייבת לבוא בדמות ארכיטקטורות מודל חדשות ומורכבות. לעיתים, הפתרונות הטובים ביותר נמצאים דווקא בשינויים קטנים, חכמים ויצירתיים - כמו שינוי ההנחיה.

הגישה החדשה הזו פותחת דלת לעתיד שבו מודלי בינה מלאכותית יהיו נגישים, יעילים ומהירים יותר, ויאפשרו לנו לנצל את מלוא הפוטנציאל שלהם במגוון עצום של יישומים. משיפור שירות לקוחות ועד פיתוח תרופות חדשות, "שרשרת הטיוטה" עשויה להיות הצעד הבא לקראת עתיד חכם יותר - ומהיר יותר.

אז בפעם הבאה שאתם משתמשים במודל שפה גדול, זכרו: לא תמיד צריך "לדבר הרבה" כדי להגיע לתוצאות הטובות ביותר. לפעמים, טיוטה קצרה וממוקדת - שווה הרבה יותר.

למחקר המלא: https://arxiv.org/abs/2502.18600

יש לכם רעיון? חזון? זה העידן להוציא אותו החוצה.

בעולם שבו הכלים הנכונים מחליפים מחלקות שלמות – אין שום סיבה לחכות.

רוצים להעמיק עוד, לגמרי בחינם?

מוזמנים לאקדמיה החינמית שלנו:

לאקדמיה החינמית

כמו כן, מוזמנים לחפש אותנו ב:

באינסטגרם:

אינסטגרם

בקבוצת הפייסבוק:

קבוצת הפייסבוק שלנו