אפשר לדעת מה כלבים וחתולים "אומרים לנו"?!

האם יש AI שיכול לתרגם לאנגלית ולעברית נביחות ויללות? ובכלל - אילו טכנולוגיות יש היום "על המדף" שמתיימרות לאפשר לחיות המחמד שלנו לדבר איתנו במילים? ועד כמה הן באמת עובדות?

the dog is hiding behind a tree. Border Collie the lake shore in summer. a dog looks out from behind a tree

מודל שפה גדול ובעיית מאגר הנתונים

בינה מלאכותית (Artificial intelligence, ובקיצור AI) היא תחום במדעי המחשב שרוב השנים המחקר וההתקדמות בו התקיימו הרחק מעין הציבור, להוציא אירועים נדירים שבהם היא רשמה הישג פורץ דרך, כמו הניצחון שנחלה ב-1997 על אלוף העולם בשחמט, גארי קאספרוב.

אבל בשנים האחרונות פרצה הבינה המלאכותית למרכז הבמה הטכנולוגית והתרבותית והפכה לאחד הנושאים המדוברים והחמים ביותר, ורבים מאי-פעם עוקבים בדריכות אחרי ההתפתחויות האחרונות בה. מה גרם לפריצה הזאת ביכולות הבינה המלאכותית?

בשורש הזינוק בהישגי מערכות AI בעשור האחרון עומדת מהפכת ה"למידה העמוקה". זוהי "למידת מכונה" - עצמאית או בעזרת (בהנחיית) אדם - שמבוססת על רשתות עצביות מלאכותיות. ה"עומק" מתייחס לשכבות הרבות של רשתות הנוירונים האלה. במיוחד צברו יכולות מדהימות (ופופולאריות גבוהה) תוכנות כמו צ'אט-GPT שמבוססות על "מודל שפה גדול" (Large Language Model ובקיצור LLM) שהוא רשת עצבית מלאכותית בעלת מיליארדי פרמטרים שאומנה להשתמש בשפה טבעית (אנגלית, עברית, קוריאנית - לא שפת מחשב). בבסיס זה מודל שעבר אימונים מפרכים במשימה אחת: לנחש, על בסיס סטטיסטי, מה המילה הבאה במשפט - השלמת מילים. היכולת הכאילו-פשוטה הזאת מספיקה בשביל לייצר בעצם כל סוג של טקסט.

כלומר, האנושות בדיוק פיתחה כלי עוצמתי לשימוש אוטומטי בשפות טבעיות. לכלי הזה ממש לא אכפת אם השפה הטבעית היא עברית או סינית או קלינגונית או… לווייתנית! כן, אפשר לאמן בדיוק באותה צורה מודל שפה גדול להשתמש בתקשורת טבעית של חיות ממינים אחרים - ואולי אפילו לפענח אותה עבורנו "על הדרך". האסטרטגיה הזאת כבר הצליחה להראות לנו למשל, שפילים משתמשים בשמות פרטיים!

Two African elephants engaged in a mock battle

אבל… יש איתה רק בעיה אחת - טכנית אמנם - אבל עדיין מאוד קשה להתגבר עליה. בשביל שהמודל השפה הסטטיסטי יעבוד צריך לאמן אותו על כמות נתונים מפלצתית. צ'אט-GPT-4 אומן לפי ההערכות על 45 *טרה*-בייט של טקסט! זה כולל את כל הטקסט באינטרנט - ועוד הרבה. זה טקסט בכמות שיכולה למלא 100 מיליון ספרים! כמעט מיותר לציין שאין לנו שום מאגר טקסטים בגודל דומה של אף מין אחר. כמו שנראה בדוגמאות שלהלן, הפער הזה במאגרי הנתונים הוא כנראה הגורם העיקרי לכך שמודלים שמאומנים על תקשורת בעלי חיים מספקים בינתיים תוצאות צנועות יותר.

טכנולוגיות תרגום מכלבית וחתולית

מחקר שהתפרסם ממש עכשיו (סקירה ב-ynet) גילה (בין היתר) שחתולים מבינים מילים בשפה אנושית הרבה יותר מהר ממה שהיינו משערים. אז כדאי לדעת שאם הם מתעלמים ממשהו שאמרתם - זה לאו דווקא כי הם לא הבינו אתכם. אבל מה לגבי ההבנה שלנו אותם?

רוב תוכנות ומכשירי ה"תרגום" לכלבים וחתולים שמתחילים לצוץ בשנים האחרונות לא מתבססים על שום יכולת לשונית, אלא על יכולתה של בינה מלאכותית לנתח ולהסיק רגשות מקולות ושפת גוף והתנהגות - דרכים לא מילוליות שחיות (גם אנושיות) חושפות בהן את רגשותיהן לא פחות מאשר באמצעות קולותיהן.

A girl sitting on a sofa with a pet cat. ,Girl and Cat

באוניברסיטת מישיגן, למשל, פיתחו AI שיודע לזהות את המצב הרגשי של כלב רק לפי שמיעת הנביחות שלו, עם דיוק של 70% (לטענת החוקרים) בינתיים. החוקרים אספו מאגר מרשים של אלפי נביחות מ-74 כלבים מגזעים, גילאים ורקעים שונים. לכל נביחה צורף מידע לגבי הנסיבות בהן נשמעה: האם הכלב דרש תשומת לב? שיחק? הזהיר מסכנה? איסוף הנתונים הקפדני הזה - שכולל עריכת אינספור הקלטות וניקוי ומיון וקטלוג שלהן - הצריך מהחוקרים בוודאי עבודת נמלים, אבל בהשוואה לכמויות המידע שצ'אט-GPT4 (למשל) אומן עליהן - מדובר בטיפה בים. המודל התבסס על מודל שכבר אומן להבין רגשות מדיבור אנושי, דבר שעזר לו להתמודד עם המחסור במאגר נתונים גדול. המודל הצליח לזהות דפוסי קול אופייניים שונים לפעילויות ורגשות מסוגים שונים ומיפה אותם. המודל הבחין למשל גם בכך שכלבים משתמשים בנביחות מסוג שונה לאנשים זרים חולפים ולסנאים חולפים, וייתכן שהם בכוונה מנסים להכריז בקריאה מסוג שונה על סוג ה"פולש" השונה, כלומר משתמשים בנביחות השונות כסוג של "מילים" שונות.

יש חברות (הראשונה היתה קוריאנית) שכבר השיקו קולר AI לכלב שמתיימר לאבחן את המצב הרגשי שלו לפי הנביחות - ולדווח כמובן לטלפון של ה"בעלים" באופן שגרתי ובמקרים של חשש לאירוע שמצריך טיפול דחוף.

אפליקציית "MeowTalk" כבר מציעה לכם לקבל עדכונים ודיווחים שוטפים לטלפון על מצב הרוח של החתולים שלכם, תרגום יללות בזמן אמת ואפילו ארכיון שיחות.

יש תוכנות שמתיימרות לנתח התנהגות של חיות מחמד בעזרת מצלמות מעקב ביתיות. כי הרי כלבים וחתולים לא מביעים את עצמם רק בעזרת קולות כמובן. תנועות הזנב, כיפוף האוזניים, צורת ההליכה - כל אלה ומאפיינים רבים נוספים משקפים את המצב הנפשי של החתול או הכלב לא פחות מכל נביחה או יללה. AI יכול כיום גם להבחין בקלות אם כלב או חתול שמצולמים בקביעות מתנהגים בצורה חריגה, שדורשת בדיקה או טיפול. חלק מהתוכנות מאפשרות ל"בעלים" לתקשר מרחוק עם החיה בעזרת רמקולים.

יש אפליקציות שמבטיחות גם "לחנך" את חיות המחמד - ולא רק לנתח ולדווח. למשל לגעור בכלב (בצירוף השם שלו, בדיבור שמושמע ברמקולים) כשהוא עושה דברים שהוגדרו כ"אסורים". כאן כבר אפשר להבחין במדרון חלקלק לעבר שימושים מפוקפקים אפשריים בכלי (ובכלים מסוגו) שעלולים להוביל לפגיעה בבעלי חיים. די להזכיר את הקולרים המחשמלים נגד נביחות (ואפילו רק תאונות שנגרמו כתוצאה מרעשים בדירות סמוכות שהקולרים פירשו כנביחות) כדי להבין לאן דברים כאלה עלולים להידרדר.

טכנולוגיות תקשורת

אם באופציה הקודמת הכלב/חתול היה לגמרי פאסיבי, אז בטכנולוגיות האלה, מהצד השני של הסקאלה - האחריות עוברת לכלב/חתול. מדובר על עזרים מאוד פשוטים מבחינה טכנולוגית - בעיקרון, לחצן פלסטיק עם רמקול - שמאפשרים ל"חיות מחמד" להגיד דברים ספציפיים למי שמטפלים בהם. ראיתם פעם את הלחצנים/מקלדות האלה לכלבים וחתולים?

כל לחצן מייצג מילה, ומשמיע אותה כשלוחצים עליו. למעשה זאת לרוב בקשה כמו לצאת לטיול או לקבל ליטוף. אמורים להוסיף לחצנים בהדרגה, לחצן חדש רק אחרי שהכלב/חתול הבין טוב ותרגל את כל הלחצנים הקודמים. מסרטונים ביוטיוב נראה שיש כבר כאלה שבנו לכלבתול שלהם אוצר מילים-בקשות גדול למדי. זה כמובן לא ניסוי מדעי, אלא יותר סוג של משחק, וייתכן שחלק מהסרטונים (לפחות) לא משקפים בדיוק את המציאות לאשורה; אבל עדיין נראה בבירור שלא מעט כלבתולים מצליחים להשתמש בלחצנים האלה לסוג מיוחד וכיפי של תקשורת עם האנשים שמטפלים בהם - וזה מקסים.

לתת להם לדבר… ביניהם

סוג שונה מאוד של טכנולוגיית תקשורת לחיות מחמד יכול להיות לא עם מי שמטפלים בהם אלא… עם בני המין שלהם בבתים אחרים. סוג כזה של תקשורת עלה לכותרות בעקבות ניסוי מעניין שפורסם לפני שנה בכלי תקשורת רבים. בניגוד לכלבים שפוגשים לרוב כלבים אחרים בטיולים בחוץ, ולחתולים שהם ממילא חיות סוליטריות (יחידאיות, שלא חיות כחלק מלהקה או מתעניינות במיוחד בחיי חברה בבגרותן) - תוכים הם חיות חברתיות מאוד. תוכים מכל המינים הם חיות בר שחיות בלהקה גדולה, לרוב גם בזוגיות מונוגמית שיכולה להימשך עד עשרות שנים. אבל בתור "חיות מחמד" הם לרוב כלואים בבתים סגורים, בכלובים, לבד - בלי בת זוג או להקה - כל החיים הארוכים שלהם, ולא זוכים לשום תקשורת עם יצורים דומים להם.

על הרקע הזה, מרגש לראות את תוצאות הניסוי שפורסם בשנה שעברה ונתן לתוכים אפשרות יוצאת דופן לערוך ביוזמתם שיחות וידאו (בטאבלט) לתוכים אחרים שהכירו להם, וחיים כמוהם ללא חברת בני מינם בבית אחר. בראש ובראשונה מרגש לגלות שהתוכים שהשתתפו בניסוי החלו להרגיש בודדים פחות, ופיתחו התנהגויות חברתיות טבעיות כמו טיפוח עצמי, משחק ושירה כתוצאה מהתקשורת החדשה.

כל 15 התוכים שהשתתפו בניסוי - יזמו שיחות וידאו, ואלה שיזמו הכי הרבה שיחות - גם קיבלו הכי הרבה שיחות. וההתנהגויות במהלך השיחות היו מאוד מגוונות: חלקם פטפטו זה עם זה או חיקו זה את זה, חלק התנקו או הלכו לישון "ביחד", היו תוכים שהלכו להביא איזה חפץ כדי להראות למי שדיברו איתם. התוכים היו לרוב ממינים שונים זה מזה של תוכים - וייתכן שהיכרות בין תוכים מאותו מין ממש - תוכל להוביל לתקשורת עמוקה אף יותר.

אפשר רק לקוות שלצד שלל המוצרים שמתמקדים בתקשורת מרחוק בין ה"בעלים" לחיית המחמד, לרוב ביוזמת הבעלים, יהיו גם כאלה ששיתוכננו במטרה להפיג את הבדידות והשעמום של חיות, ויאפשרו להן ליזום תקשורת עם חיות אחרות במצבן.

האם המוצרים האלה "באמת עובדים"?

אם השאלה היא כמה הם מדויקים - אז לגבי רוב המוצרים אנחנו לא באמת יודעים. אפילו המחקר של אוניברסיטת מישיגן שטוען לדיוק של 70% בפענוח - יכול להתברר כשגוי בעתיד הלא רחוק. אנחנו נמצאים עדיין רק בתחילת הדרך, וסביר שכמו בתחומים אחרים, גם בתחום הזה נבין כמה דברים אנחנו מבינים לא נכון בימים אלה. חשוב לזכור את זה. האינטואיציה שלנו כיצורים ביולוגיים וכבני אדם כלפי יצורים ביולוגיים אחרים היא כלי חשוב ואמין יותר מכל AI, לפחות בינתיים.

כדאי להתייחס לכל מכשיר או יישומון "תרגום" בין-מיני שזמין כיום בתור סוג של צעצוע - שיכול אולי לעזור לעלות על דברים, או לשמש לפעילות משותפת - אבל בעיקר כמקור שעשוע, לא כמקור סמכות. בוודאי לא בתור מאבחן ומשגיח (ובוודאי שלא "מאלף") שסומכים עליו בעיניים עצומות. וכמובן שאם מדובר במכשיר שמצמידים לחיה כמו קולר - חשוב לוודא היטב שהוא נבדק בטיחותית ושהוא לא מכביד על החיה או עלול לפגוע בה בדרך אחרת.

האינטואיציה שלנו היא עדיין הכלי השימושי ביותר שלנו לתקשורת ולאבחון רגשות גם בקולות של חיות אחרות. הראינו לא מזמן שאפילו אנשים שלא פגשו מעולם תרנגול יודעים באינטואיציה להבדיל בין קולות תרנגולים מתוסכלים לבין קולות של תרנגולים מאושרים. גם מי שלא מכירים כלבים לא יתקשו להבחין בין נהמה עמוקה ונמוכה של כלב לא מרוצה או מאיים - לבין נביחות שמחה גבוהות ועליזות של כלב משחק - ולרוב גם בגוונים דקים הרבה יותר של רגשות ונימות. אולי כבר בשנים הקרובות תעקוף אותנו הבינה המלאכותית ביכולותיה לפענח את קולות בעלי החיים. אולי. וגם אז עדיין יהיה כדאי כנראה שלא נסמוך על הקביעות שלה בעיניים עצומות.