ไมโครซอฟท์เปิดตัวโมเดลปัญญาประดิษฐ์รูปแบบใหม่ที่มีชื่อว่า UserLM-8b ซึ่งถือเป็นการพลิกบทบาทของ AI จากที่เคยทำหน้าที่ตอบคำถามและปฏิบัติตามคำสั่งของผู้ใช้ มาเป็นการทำหน้าที่เป็น "ผู้สั่ง" ที่สามารถสร้างคำสั่งและถามคำถามได้เอง โมเดลนี้ถูกเผยแพร่บนแพลตฟอร์ม HuggingFace และสะท้อนถึงทิศทางใหม่ของการพัฒนา Large Language Model ที่มุ่งเน้นการจำลองพฤติกรรมผู้ใช้งานจริง
UserLM-8b ได้รับการฝึกด้วยวิธีการที่แตกต่างจาก LLM ทั่วไป แม้จะใช้ชุดข้อมูลการสนทนาแบบเดียวกัน แต่เป้าหมายการเรียนรู้ถูกออกแบบให้กลับทิศทาง แทนที่โมเดลจะเรียนรู้ว่าควรตอบอย่างไรเมื่อได้รับคำถาม UserLM-8b ถูกฝึกให้ทำนายว่าผู้ใช้จะถามคำถามหรือสั่งอะไร โดยอ้างอิงจากบริบทที่มีอยู่ วิธีการฝึกแบบนี้ทำให้โมเดลสามารถทำหน้าที่เป็น User Simulator ที่สมจริง ซึ่งเป็นประโยชน์อย่างมากในการทดสอบและประเมินประสิทธิภาพของระบบ AI อื่นๆ
การใช้งาน UserLM-8b ทำได้โดยการกำหนดเป้าหมายหรือความต้องการเบื้องต้น จากนั้นปล่อยให้โมเดลสร้างคำสั่งและคำถามต่อเนื่อง พร้อมทั้งประมวลผลคำตอบที่ได้รับจนกว่าจะบรรลุเป้าหมายที่ตั้งไว้ แนวคิดนี้แตกต่างจากการใช้ AI แบบดั้งเดิมที่ผู้ใช้ต้องเป็นฝ่ายคิดคำถามเอง ด้วย UserLM-8b ผู้ใช้สามารถมอบหมายความต้องการโดยรวม แล้วให้ AI เป็นผู้ขับเคลื่อนการสนทนาไปสู่เป้าหมาย
ความสามารถเด่นของ UserLM-8b อยู่ที่การจำลองพฤติกรรมผู้ใช้ที่สมจริง ซึ่งมีประโยชน์ในหลายด้าน เช่น การทดสอบระบบ Conversational AI โดยอัตโนมัติแทนการจ้างผู้ทดสอบจริง การสร้างข้อมูลสังเคราะห์สำหรับการฝึกโมเดลอื่นๆ และการประเมินประสิทธิภาพของระบบ AI ในสถานการณ์ที่หลากหลาย นอกจากนี้ยังสามารถนำไปใช้ในการพัฒนา LLM อื่นๆ ให้มีความสามารถในการตอบสนองที่ดีขึ้น โดยใช้ UserLM-8b เป็นเครื่องมือทดสอบและปรับปรุงประสิทธิภาพ
โมเดล UserLM-8b มีขนาด 8 พันล้านพารามิเตอร์ และถูกเผยแพร่เป็น Open Source บนแพลตฟอร์ม HuggingFace ทำให้นักพัฒนาและนักวิจัยสามารถนำไปใช้งานและพัฒนาต่อยอดได้อย่างอิสระ การเปิดตัวโมเดลนี้สะท้อนให้เห็นถึงทิศทางใหม่ของการพัฒนา AI ที่ไม่เพียงแต่มุ่งเน้นให้ AI ตอบคำถามได้ดีขึ้น แต่ยังรวมถึงการทำให้ AI เข้าใจและจำลองพฤติกรรมของผู้ใช้ได้อย่างแท้จริง ซึ่งจะช่วยสร้างระบบ AI ที่มีปฏิสัมพันธ์กับมนุษย์ได้อย่างเป็นธรรมชาติมากยิ่งขึ้น
ที่มา: HuggingFace Microsoft, รายงานจากการวิจัยเกี่ยวกับ User Simulation ด้วย Large Language Models
