ผู้แต่ง:
(1) Krist Shingjergji สาขาวิชาวิทยาศาสตร์การศึกษา มหาวิทยาลัยเปิดแห่งเนเธอร์แลนด์ เฮร์เลน เนเธอร์แลนด์ ([email protected])
(2) Deniz Iren, ศูนย์วิจัยเชิงปฏิบัติการ, มหาวิทยาลัยเปิดแห่งเนเธอร์แลนด์ , เฮร์เลน, เนเธอร์แลนด์ ([email protected]);
(3) Felix Bottger, ศูนย์วิจัยเชิงปฏิบัติการ, มหาวิทยาลัยเปิดแห่งเนเธอร์แลนด์ , เฮร์เลน, เนเธอร์แลนด์
(4) Corrie Urlings, วิทยาศาสตร์การศึกษา, มหาวิทยาลัยเปิดแห่งเนเธอร์แลนด์ , Heerlen, เนเธอร์แลนด์
(5) Roland Klemke สาขาวิชาวิทยาศาสตร์การศึกษา มหาวิทยาลัยเปิดแห่งเนเธอร์แลนด์ เฮร์เลน เนเธอร์แลนด์
หมายเหตุของบรรณาธิการ: นี่คือส่วนที่ 1 จากทั้งหมด 6 ส่วนของการศึกษาวิจัยที่ให้รายละเอียดเกี่ยวกับการพัฒนาวิธีการเล่นเกมในการรับข้อมูลอารมณ์บนใบหน้าพร้อมคำอธิบายประกอบ อ่านส่วนที่เหลือด้านล่าง
การฝึกโมเดลการจดจำอารมณ์บนใบหน้าต้องใช้ชุดข้อมูลจำนวนมากและกระบวนการใส่คำอธิบายประกอบที่มีต้นทุนสูง เพื่อบรรเทาปัญหานี้ เราจึงพัฒนาวิธีการเล่นเกมเพื่อรับข้อมูลอารมณ์บนใบหน้าพร้อมคำอธิบายประกอบโดยไม่ต้องมีการใส่คำอธิบายประกอบโดยมนุษย์ เกมที่เราตั้งชื่อว่า Facegame ท้าทายผู้เล่นให้เลียนแบบภาพใบหน้าที่แสดงอารมณ์พื้นฐานเฉพาะอย่างหนึ่ง ในแต่ละรอบที่ผู้เล่นเล่น จะสร้างข้อมูลใหม่ซึ่งประกอบด้วยชุดคุณลักษณะและจุดสังเกตของใบหน้า ซึ่งมีคำอธิบายประกอบด้วยป้ายอารมณ์ของการแสดงอารมณ์บนใบหน้าเป้าหมายแล้ว แนวทางดังกล่าวจะสร้างกระบวนการฝึกการเรียนรู้ของเครื่องที่มีประสิทธิภาพ ยั่งยืน และต่อเนื่องได้อย่างมีประสิทธิภาพ เราได้ประเมิน Facegame ด้วยการทดลองที่เผยให้เห็นถึงการมีส่วนสนับสนุนหลายประการในด้านการคำนวณอารมณ์ ประการแรก วิธีการรวบรวมข้อมูลเกมช่วยให้เราเข้าถึงการแสดงออกทางสีหน้าที่หลากหลายของอารมณ์พื้นฐานแต่ละอย่างได้ เนื่องมาจากการแสดงออกทางสีหน้าและความสามารถในการแสดงออกของผู้เล่นนั้นแตกต่างกันตามธรรมชาติ เรารายงานว่าความแม่นยำดีขึ้นเมื่อใช้ข้อมูลที่รวบรวมมาเพื่อเสริมชุดข้อมูลอารมณ์บนใบหน้าที่เป็นที่รู้จักดีและใช้ต่อเนื่องเพื่อฝึกโมเดลการจดจำอารมณ์บนใบหน้า ประการที่สอง วิธีการกำหนดภาษาธรรมชาติที่ใช้โดย Facegame ถือเป็นแนวทางใหม่สำหรับการอธิบายที่สามารถตีความได้ ซึ่งสามารถนำไปใช้กับแบบจำลองการจดจำอารมณ์บนใบหน้าใดๆ ก็ได้ ในที่สุด เราพบว่ามีการปรับปรุงที่สำคัญในทักษะการรับรู้อารมณ์บนใบหน้าและการแสดงออกของผู้เล่นผ่านการเล่นเกมซ้ำๆ
ดัชนีคำศัพท์ — การคำนวณเชิงอารมณ์ การจดจำอารมณ์บนใบหน้า การเล่นเกม AI ที่สามารถอธิบายได้ การเรียนรู้ของเครื่องจักรที่สามารถตีความได้
การแสดงออกทางสีหน้ามีความจำเป็นต่อการสื่อสารของมนุษย์ที่ไม่ใช้คำพูด เนื่องจากการแสดงสีหน้าช่วยให้สามารถถ่ายทอดข้อมูลเกี่ยวกับสภาวะอารมณ์ [1] รวมถึงเจตนาในการแสดงออก [2] ของบุคคล อารมณ์เป็นองค์ประกอบพื้นฐานของปฏิสัมพันธ์ทางสังคม [3] และความสามารถในการแสดงออกและรับรู้ความรู้สึกถือเป็นทรัพยากรที่มีค่าอย่างยิ่งสำหรับการสร้างความสัมพันธ์ทางสังคม เป้าหมายสูงสุดของการคำนวณเชิงอารมณ์คือการเสริมพลังให้ระบบคอมพิวเตอร์สามารถรับรู้และแสดงออกถึงอารมณ์ และสามารถสร้างความสัมพันธ์ทางสังคมกับผู้ใช้ที่เป็นมนุษย์ได้ [4] จนกระทั่งเมื่อไม่นานนี้ ความสามารถนี้ถือเป็นสิ่งที่มีเฉพาะในมนุษย์เท่านั้น อย่างไรก็ตาม โดยเฉพาะอย่างยิ่งกับความก้าวหน้าล่าสุดในด้านปัญญาประดิษฐ์ (AI) ได้มีการศึกษามากมายที่เน้นที่การจดจำอารมณ์โดยอัตโนมัติ [5]
แนวทางทั่วไปในการฝึกโมเดลการเรียนรู้ของเครื่องสำหรับการจดจำอารมณ์บนใบหน้า (FER) คือการเรียนรู้แบบมีผู้ดูแล ซึ่งต้องใช้ชุดข้อมูลจำนวนมาก [6] โดยเฉพาะอย่างยิ่ง โมเดล FER เชิงลึกมักประสบปัญหาเนื่องจากขาดข้อมูลเพียงพอสำหรับการฝึก [7] การรวบรวมและดูแลชุดข้อมูลขนาดใหญ่ดังกล่าวเป็นความพยายามที่สิ้นเปลืองเวลาและมีค่าใช้จ่ายสูง เนื่องจากจำเป็นต้องมีการติดฉลากโดยผู้ให้คำอธิบายที่เป็นมนุษย์ [8] ซึ่งเป็นอุปสรรคต่อการปรับปรุงประสิทธิภาพอย่างมีนัยสำคัญในการวิจัยการจดจำอารมณ์
ความท้าทายที่สำคัญอีกประการหนึ่งอยู่ที่การอธิบายและตีความของโมเดลการจดจำอารมณ์ การศึกษาส่วนใหญ่ประเมินโมเดลการจดจำอารมณ์โดยใช้เมทริกซ์ความแม่นยำและความสับสน อย่างไรก็ตาม เมตริกเหล่านี้มักรายงานประโยชน์ใช้สอยของโมเดลสำหรับมนุษย์ได้ไม่เพียงพอ โมเดลที่ตีความได้ควรให้คำอธิบายที่เรียบง่ายเพียงพอที่ผู้ใช้จะเข้าใจได้ และให้ในภาษาที่มีความหมายสำหรับพวกเขา [9] ความสามารถในการอธิบายของโมเดลการจดจำอารมณ์นั้นแทบจะไม่เคยถูกกล่าวถึงในเอกสารเลย แนวทางในการบรรลุถึงความสามารถในการอธิบายนั้นจำกัดอยู่เพียงวิธีการที่ไม่สนใจโมเดลซึ่งอธิบายผลลัพธ์ของโมเดลโดยอิงจากอินพุต และวิธีการที่โปร่งใสต่อโมเดล (เช่น [10], [11]) ซึ่งเน้นที่การเปิดใช้งานในเลเยอร์ต่างๆ ของเครือข่ายประสาทเทียม [12] อย่างไรก็ตาม แนวทางทั้งสองไม่ได้ให้คำอธิบายที่เป็นมิตรกับมนุษย์ซึ่งผู้ใช้สามารถตีความได้เสมอไป
ความท้าทายเกี่ยวกับการรวบรวมและดูแลข้อมูลที่มีป้ายกำกับจำนวนมากเกินไปสำหรับการฝึกโมเดล FER และการให้คำอธิบายที่สามารถตีความได้จากโมเดลดังกล่าวต้องใช้วิธีการที่ต่างจากเดิม ในการศึกษานี้ เราเสนอแนวทางการเล่นเกมเพื่อรวบรวมข้อมูลอารมณ์บนใบหน้าที่มีคำอธิบายประกอบ เกมที่เสนอซึ่งมีชื่อว่า Facegame นำเสนอวิธีการให้คำสั่งภาษาธรรมชาติเป็นข้อมูลตอบรับแก่ผู้เล่น ซึ่งทำหน้าที่เป็นวิธีการบรรลุความสามารถในการอธิบายที่สามารถตีความได้ โดยสรุปแล้ว การมีส่วนสนับสนุนของเราในสาขาการคำนวณอารมณ์มีดังต่อไปนี้:
• เรานำเสนอแนวทางการเล่นเกมสำหรับการรวบรวมข้อมูลอารมณ์บนใบหน้าพร้อมคำอธิบายประกอบอย่างรวดเร็ว ซึ่งอุดมไปด้วยการแสดงออกทางสีหน้าที่หลากหลาย ในลักษณะที่มีต้นทุนต่ำและใช้ความพยายามน้อย
• เราเสนอแนวทางใหม่สำหรับการอธิบายที่สามารถตีความได้โดยการแปลคุณลักษณะใบหน้ากลางเป็นการกำหนดภาษาธรรมชาติ และมอบให้เป็นคำอธิบายสำหรับการจำแนกอารมณ์ที่ให้ไว้โดยแบบจำลอง FER
• แนวทางการเล่นเกมที่นำเสนอนี้ส่งผลให้ทักษะการรับรู้อารมณ์ทางสีหน้าและการแสดงออกทางอารมณ์ของผู้เล่นดีขึ้นอย่างมาก
เอกสารที่เหลือมีโครงสร้างดังต่อไปนี้ ส่วนที่ II เป็นการทบทวนวรรณกรรมเกี่ยวกับการจดจำอารมณ์ ปัญญาประดิษฐ์ที่สามารถอธิบายได้ และการรวบรวมข้อมูลในรูปแบบเกม ส่วนที่ III อธิบายถึงผลงานหลัก ส่วนที่ IV นำเสนอรายละเอียดของการศึกษาทดลองของเรา ส่วนที่ V เปิดเผยผลการทดลองของเรา และสุดท้าย ส่วนที่ VI นำเสนอการอภิปรายเกี่ยวกับผลกระทบทางทฤษฎีและทางปฏิบัติของผลงานของเรา และสรุปเอกสาร
เอกสารนี้ เผยแพร่บน arxiv ภายใต้ใบอนุญาต CC BY 4.0 DEED