เอกสารไวท์เปเปอร์

กับดัก B+: ปัญญาประดิษฐ์บีบอัดขอบเขตความคิดสร้างสรรค์ได้อย่างไร

ระบบ AI ที่ได้รับการฝึกฝนด้วย RLHF จะได้รับการให้รางวัลอย่างเป็นระบบสำหรับการสร้างผลลัพธ์ที่ได้คะแนนดีตามความชอบเฉลี่ยของมนุษย์ ซึ่งในทางคณิตศาสตร์แล้วผลักดันให้ระบบเหล่านั้นไปสู่ความธรรมดาในด้านความคิดสร้างสรรค์ บทความนี้ให้คำจำกัดความของกับดัก B+ ระบุว่า RLHF เป็นกลไกเชิงโครงสร้าง และเสนอโครงสร้าง AI แบบกบฏที่สร้างขึ้นบนการค้นหาสิ่งใหม่ ตัวแทนที่แตกต่างกันแบบต่อต้าน และการป้อนกลับแบบอภิปัญญา

DOI:

10.13140/RG.2.2.10486.46403

มีจำหน่ายแล้วที่

ลิงก์ 1 ลิงก์ 2 ลิงก์ 3

ผู้เขียน:

ฟาบิโอ ลอเรีย

กับดัก B+: ปัญญาประดิษฐ์บีบอัดขอบเขตความคิดสร้างสรรค์ได้อย่างไร

ชื่อสิ่งพิมพ์