OpenAI เปิดม่านความลับเบื้องหลังคำสั่งลับของ AI

OpenAI เปิดเผยเหตุผลเบื้องหลังว่าทำไม AI แบบ Conversational อย่าง ChatGPT ถึงปฏิเสธคำขอบางอย่างอย่างสุภาพ

OpenAI เปิดม่านความลับเบื้องหลังคำสั่งลับของ AI

เคยสงสัยไหมว่าทำไม Conversational AI อย่าง ChatGPT ถึงพูดว่า "ขออภัยค่ะ ฉันทำแบบนั้นไม่ได้" หรือปฏิเสธอย่างสุภาพในลักษณะอื่นๆ OpenAI ได้เปิดเผยข้อมูลบางส่วนเกี่ยวกับเหตุผลที่อยู่เบื้องหลังกฎการทำงานของ AI Model ของพวกเขา ไม่ว่าจะเป็นการยึดตามแนวทางของแบรนด์ หรือการปฏิเสธที่จะสร้างเนื้อหา NSFW

Large Language Models (LLMs) ไม่มีข้อจำกัดตามธรรมชาติว่าจะพูดหรือทำอะไรได้บ้าง นั่นเป็นส่วนหนึ่งที่ทำให้มันมีความหลากหลาย แต่ก็เป็นเหตุผลที่ทำให้มันเกิดอาการประหลาดและถูกหลอกได้ง่ายด้วย มันจำเป็นสำหรับ AI Model ใดๆ ที่มีปฏิสัมพันธ์กับคนทั่วไปที่จะต้องมีการควบคุมบางอย่างว่าควรและไม่ควรทำอะไร แต่การกำหนดสิ่งเหล่านี้ ไม่ต้องพูดถึงการบังคับใช้ กลับเป็นงานที่ยากอย่างน่าประหลาดใจ

ถ้ามีคนขอให้ AI สร้างข้อมูลเท็จจำนวนมากเกี่ยวกับบุคคลสาธารณะ มันควรปฏิเสธใช่ไหม? แต่ถ้าพวกเขาเป็นนักพัฒนา AI เองล่ะ และกำลังสร้างฐานข้อมูลข้อมูลเท็จสังเคราะห์เพื่อใช้กับ Detector Model ล่ะ? ถ้ามีคนขอคำแนะนำเกี่ยวกับแล็ปท็อป มันควรตอบอย่างเป็นกลางใช่ไหม? แต่ถ้า Model กำลังถูกนำไปใช้โดยผู้ผลิตแล็ปท็อปที่ต้องการให้มันแนะนำแต่อุปกรณ์ของตัวเองล่ะ? ผู้ผลิต AI ทั้งหมดกำลังเดินทางฝ่าปัญหาเช่นนี้และมองหาวิธีการที่มีประสิทธิภาพในการควบคุม Model ของพวกเขาโดยไม่ทำให้ต้องปฏิเสธคำขอปกติ แต่พวกเขาแทบไม่เคยแชร์ว่าทำอย่างไรกันแน่

OpenAI แตกแถวจากเทรนด์นี้ด้วยการเผยแพร่สิ่งที่พวกเขาเรียกว่า "Model Spec" ซึ่งเป็นชุดกฎระดับสูงที่ควบคุม ChatGPT และ Model อื่นๆ ทางอ้อม มีวัตถุประสงค์ระดับ Meta บางกฎที่เข้มงวด และแนวทางพฤติกรรมทั่วไปบางอย่าง แม้ว่าพูดตามตรงแล้ว สิ่งเหล่านี้ไม่ได้เป็นสิ่งที่ Model ถูกฝึกมาโดยตรง OpenAI จะพัฒนาคำแนะนำเฉพาะที่ทำตามสิ่งที่กฎเหล่านี้อธิบายในภาษาธรรมชาติ มันเป็นมุมมองที่น่าสนใจว่าบริษัทกำหนดลำดับความสำคัญและจัดการกับกรณีขอบเขตอย่างไร และมีตัวอย่างมากมายว่ามันอาจส่งผลอย่างไร

ยกตัวอย่างเช่น OpenAI ระบุชัดเจนว่าเจตนาของนักพัฒนาคือกฎสูงสุดโดยพื้นฐาน ดังนั้น Chatbot เวอร์ชันหนึ่งที่ใช้ GPT-4 อาจให้คำตอบโจทย์คณิตศาสตร์เมื่อถูกถาม แต่ถ้า Chatbot นั้นถูกกำหนดโดยนักพัฒนาไม่ให้ตอบคำถามตรงๆ มันจะเสนอที่จะแก้ปัญหาทีละขั้นตอนแทน

ส่วนติดต่อผู้ใช้แบบสนทนา (Conversational Interface) อาจปฏิเสธที่จะพูดคุยเกี่ยวกับสิ่งที่ไม่ได้รับอนุมัติ เพื่อตัดความพยายามในการชักจูงใดๆ ตั้งแต่ต้น มันยังมีความซับซ้อนในเรื่องของความเป็นส่วนตัว เช่น การขอชื่อและหมายเลขโทรศัพท์ของใครบางคน ตามที่ OpenAI ชี้ให้เห็น บุคคลสาธารณะ เช่น นายกเทศมนตรีหรือสมาชิกสภาคองเกรส ควรมีรายละเอียดการติดต่อของพวกเขาให้ไว้ แต่จะเป็นอย่างไรกับช่างฝีมือในพื้นที่? นั่นอาจโอเค แต่พนักงานของบริษัทบางแห่ง หรือสมาชิกของพรรคการเมืองล่ะ? อาจไม่ใช่ ดังนั้นการเลือกว่าจะขีดเส้นตรงไหนและที่ไหนไม่ใช่เรื่องง่าย การสร้างคำแนะนำที่ทำให้ AI ปฏิบัติตามนโยบายที่เป็นผลก็ไม่ง่ายเช่นกัน และไม่ต้องสงสัยเลยว่านโยบายเหล่านี้จะล้มเหลวตลอดเวลา

OpenAI ไม่ได้แสดงไพ่ทั้งหมดที่นี่ แต่มันมีประโยชน์สำหรับผู้ใช้และนักพัฒนาที่จะเห็นว่ากฎและแนวทางเหล่านี้ถูกกำหนดและทำไมถึงต้องกำหนดอย่างชัดเจน แม้ว่าจะไม่จำเป็นต้องครอบคลุมทุกด้านก็ตาม

ข้อมูลอ้างอิงจาก OpenAI offers a peek behind the curtain of its AI’s secret instructions

Read more

Sam Altman และ Dario Amodei ถอยคำเตือน AI Job Apocalypse ท่ามกลางการเตรียม IPO ครั้งประวัติศาสตร์

news

Sam Altman และ Dario Amodei ถอยคำเตือน AI Job Apocalypse ท่ามกลางการเตรียม IPO ครั้งประวัติศาสตร์

Sam Altman และ Dario Amodei ยอมรับว่าคาดการณ์ AI ทำลายงาน White-collar คลาดเคลื่อน ด้านข้อมูลจริงพบตลาดแรงงานยังไม่เปลี่ยนแปลงอย่างมีนัยสำคัญ แม้ AI จะแพร่หลายขึ้นมาก

By
วิศวกร AI ฟ้อง Google อ้างถูกไล่ออกอย่างไม่เป็นธรรม หลังลุกขึ้นประท้วงโปรเจกต์ที่รับใช้รัฐบาลอิสราเอล

news

วิศวกร AI ฟ้อง Google อ้างถูกไล่ออกอย่างไม่เป็นธรรม หลังลุกขึ้นประท้วงโปรเจกต์ที่รับใช้รัฐบาลอิสราเอล

วิศวกร AI เชื้อสายปาเลสไตน์ยื่นฟ้อง Google ต่อ UK Employment Tribunal อ้างถูกเลิกจ้างไม่เป็นธรรมหลังประท้วง Deal AI กับอิสราเอล สะท้อนความขัดแย้งด้านจริยธรรม AI ในแวดวงเทคโนโลยี

By
OpenAI รอดคดี Elon Musk แต่ความขัดแย้งในวงการ AI ยังไม่จบ

news

OpenAI รอดคดี Elon Musk แต่ความขัดแย้งในวงการ AI ยังไม่จบ

คณะลูกขุน 9 คน ตัดสิน Elon Musk แพ้คดีฟ้อง OpenAI เหตุยื่นฟ้องล่าช้าเกินกำหนด ด้าน OpenAI เดินหน้าสู่ IPO ครั้งใหญ่ แม้ความขัดแย้งในวงการ AI และคำถามเรื่องอนาคตของมนุษยชาติยังคงคาราคาซัง

By
Claude AI Agent ลบฐานข้อมูลทั้งหมดของบริษัทภายใน 9 วินาที หลัง "เดาคำตอบแทนการตรวจสอบ"

news

Claude AI Agent ลบฐานข้อมูลทั้งหมดของบริษัทภายใน 9 วินาที หลัง "เดาคำตอบแทนการตรวจสอบ"

AI Agent ขับเคลื่อนด้วย Claude Opus 4.6 ใน Cursor ลบฐานข้อมูล Production และ Backup ทั้งหมดของ Startup PocketOS ภายใน 9 วินาที เพราะเลือก "เดา" แทนการตรวจสอบ สะท้อนความเสี่ยงของ Agentic AI ที่มีอำนาจเกินควบคุม

By