124 ע בין דיוק מדעי לחדשנות טכנולוגית: הערכת תוכן שנוצר באמצעות בינה מלאכותית יוצרת )מאמר קצר( teachers as a prerequisite for the informed and responsible integration of technological innovation in education. Keywords: Generative artificial intelligence (GenAI), evaluation, professional development (PD), science education. תקציר שילובן הגובר של טכנולוגיות בינה מלאכותית יוצרת )במ " י( בהוראת המדעים מחייב פיתוח מיומנויות הערכה ביקורתיות ושיטתיות, שכן תוכן הנוצר באמצעותן עלול לכלול טעויות מדעיות ולהנציח תפיסות שגויות. מחקר אמפירי זה בחן כיצד מורים למדעים מעריכים תוכן שנוצר על ידי במ"י וכיצד הם תופסים את שילובן של פרקטיקות הערכה אלו במסגרת הוראתם. משתתפי המחקר כללו שישים מורים בחטיבות ביניים אשר לקחו חלק בסדנה לפיתוח מקצועי בטכניון. במסגרת הסדנה, המורים יצרו באמצעות ChatGPT שאלות מסדר ח שיבה שונה ותשובות תואמות, והעריכו אותן בהתבסס על הידע הפדגוגי - מקצועי שברשותם, לפי קריטריונים של דיוק מד עי, בהירות לשונית והתאמה לתוכנית הלימודים. הנתונים נותחו בגישה דואלית - אנליטית, שכללה ניתוח כמותי של הדירוגים המספריים לצד ניתוח איכותני של ההסברים והרפלקציות שהוגשו. ממצאי המחקר חשפו כי שאלות מסדר חשיבה נמוך זכו להערכות גבוהות ועקביות, בעוד ששאלות מסדר חשי בה גבוה נתפסו כמציגות פערים מושגיים וניסוחים מעורפלים. עם זאת, המורים זיהו את תרומתן הפדגוגית של שאלות אלו לטיפוח חשיבה רפלקטיבית ולקישור החומר הנלמד להקשרים יומיומיים. רפלקציות המשתתפים הדגישו כי הערכה ביקורתית של תוצרי במ"י תורמת ישירות לשיפור איכות ההור אה באמצעות חיזוק השיח הדיסציפלינרי, שכלול גישות הערכה חדשניות, גישור על פערי נסיון בהוראה, והגדרה מחודשת של תפקיד המורה כ " מעריך " . הממצאים מדגישים את חשיבותן של שילוב פרקטיקות להערכה ביקורתית של תוצרי במ " י בתוכניות פיתוח מקצועי למורי מדעים, כתנאי לשילוב מושכל ואחראי של חדשנות טכנולוגית בחינוך. מילות מפתח: בינה מלאכותית יוצרת )במ " י(, הערכה, פיתוח מקצועי, הוראת מדעים. מבוא שילובה של בינה מלאכותית יוצרת )במ " י( במערכת החינוך טומן פוטנציאל חינוכי משמעותי, אך במקביל מציב אתגרים פדגוגיים ואפיסטמולוגיים ) Adiguzel et al., 2023; Chang et al., 2024 (. אתגרים אלו מתחדדים במיוחד בהקשר של החינוך המדעי, שבו דיוק מושגי וחשיבה דיסציפלינרית הם תנאים הכרחיים להבנה ולפיתוח אוריינות מדעית ) .(Usher & Barak, 2025; Blonder et al., 2024 ( מודלים מבוססי שפה LLMs) כגון ChatGPT מסוגלים להפיק טקסטים רהוטים ומשכנעים, אולם לעיתים עושים זאת על חשבון הדיוק העובדתי, תופעה המכונה " הזיות " ) .(Birhane et al., 2023 הספרות מצביעה על מספר ממדים מרכזיים להערכת תוצרים שנוצרו ע " י במ " י: דיוק מדעי, בהירות לשונית ו התאמה לתוכנית הלימודים. דיוק מדעי מהווה מימד מרכזי, במיוחד בהקשרים של חינוך מדעי. במחקרים אחרונים נמצא כי במבחנים ארציים מערכות אלו הפגינו לעיתים קרובות ביצועים חלקיים או שגויים, ואף עשויות לחזק תפיסות שגויות בקרב לומדים ) Feldman-Maggor et al., 2025; Yamtinah et al., 2025 .( מימד נוסף, בהירות לשונית, מוגדר בספרות כמאפייניו של טקסט תקין תחבירית, מדויק ונגיש לקהל היעד. מחקרים מצביעים על יכולתן של מערכות במ " י להפיק תוכ ן רהוט ובעל ערך פדגוגי ) Mahowald et al., 2024; Lee et al., 2024 (. בנוסף, בוזיאן ובוזיאן 2024) ( מצאו כי ChatGPT יעיל במיוחד בתיקון שגיאות טכניות ובהפקת ניסוחים תקינים, אך מוגבל ביכולתו להעריך עומק מושגי. באשר ל התאמה לתוכנית הלימודים , ממד זה טרם נבחן לעומק. עדויות עדכניות מצביעות על כך שרמת ההתאמה תלויה במידה רבה בתיווך פעיל של מורים, אשר מרחיבים ומתאימים את הפלטים של הבמ"י על בסיס הידע הדיסציפלינרי והניסיון הפדגוגי ) Karataş et al., 2025 (. למרות ששלושת הממדים הללו , מוכרים כ חיוניים להערכת תוכן שנוצר על ידי במ " י, מרבית המחקרים בחנו כל ממד בנפרד, ולא התעמקו באופן שבו מורים משלבים אותם בתהליכי הערכה בפועל.
RkJQdWJsaXNoZXIy Mjk0MjAwOQ==