มีคนสร้าง Wikipedia ปลอมที่เต็มไปด้วย AI Hallucinations และนี่คือสัญญาณที่บอกว่าอินเทอร์เน็ตกำลังกลืนกินตัวเอง
Halupedia คือ Wikipedia ปลอมที่สร้างเนื้อหาจาก AI Hallucinations โดยตั้งใจ ทุกบทความเต็มไปด้วย Citation ปลอมและเหตุการณ์สมมติ สะท้อนความเสี่ยงของเนื้อหา AI ที่อาจปนเปื้อนแหล่งข้อมูลจริงบนอินเทอร์เน็ต
Key takeaway
- Halupedia คือเว็บไซต์ที่จงใจสร้างขึ้นเพื่อ Generate บทความปลอมในรูปแบบ Wikipedia โดย AI ทุกบทความประกอบด้วย Fake Citations, Fabricated Scholars และ Imaginary Events ที่ถูกนำเสนอด้วย Authoritative Tone จนแยกแทบไม่ออกจากข้อมูลจริง
- ความน่ากังวลที่แท้จริงไม่ใช่แค่ตัว Halupedia เอง แต่คือ Pattern ที่กำลังเกิดขึ้นบนอินเทอร์เน็ตในวงกว้าง ซึ่ง AI-generated Content ที่เต็มไปด้วย Hallucinations อาจกลายเป็น Training Data ของ LLM รุ่นต่อไป ส่งผลให้เกิด Feedback Loop ของข้อมูลผิดพลาดที่ขยายตัวแบบทบต้น
- แม้ระบบจะยังสามารถ Resist Prompt Injection บางส่วนได้ แต่ช่องโหว่ด้าน User Input ยังคงเป็น Security Risk ที่ต้องได้รับการแก้ไขใน Priority สูง เพื่อป้องกันไม่ให้แพลตฟอร์มถูกใช้เป็นเครื่องมือ Generate Harmful Content ในรูปแบบที่ดูน่าเชื่อถือ
ย้อนกลับไปในช่วงแรกที่ Wikipedia เปิดตัว ความกังวลที่หลายคนมีร่วมกันคือ Open-source Nature ของแพลตฟอร์มนี้อาจเปิดช่องให้แหล่งความรู้ที่ใหญ่ที่สุดของมนุษยชาติถูกบิดเบือนด้วยข้อมูลเท็จและการโฆษณาชวนเชื่อ แต่ความเป็นจริงกลับพลิกความคาดหมาย เพราะ Wikipedia พัฒนาจนกลายเป็นหนึ่งในแหล่งอ้างอิงที่น่าเชื่อถือที่สุดในโลก ขับเคลื่อนโดยอาสาสมัครนับล้านคนและวัฒนธรรมการตรวจสอบ Citation อย่างเข้มงวด
ทว่าในยุคที่ Large Language Models (LLMs) กำลังผลิต AI-generated Content ท่วมอินเทอร์เน็ตในอัตราที่น่าเป็นห่วง ผู้เชี่ยวชาญหลายคนเริ่มตั้งคำถามว่า AI รุ่นต่อไปอาจถูก Train บนเนื้อหาไร้สาระที่สร้างโดย AI รุ่นก่อนหน้าของตัวเอง และข้อมูลเหล่านั้นอาจแทรกซึมเข้าสู่ Wikipedia ในฐานะ "ข้อเท็จจริง" ได้ในที่สุด
เมื่อมีคนสร้าง Wikipedia ปลอมที่ทุกบทความคือ AI Hallucination
Halupedia คือเว็บไซต์รูปแบบ Wikipedia ที่สร้างขึ้นบนพื้นฐานของ AI Hallucinations อย่างตั้งใจ ทุกบทความถูก Generate แบบ On-demand โดย AI Model พร้อมด้วย Fake Citations, Fabricated Scholars, Imaginary Historical Events และ Authoritative Tone ที่ฟังดูน่าเชื่อถือจนน่าขนลุก
ไม่ว่าผู้ใช้จะค้นหาเรื่องใดก็ตาม ทั้งเรื่องจริงและเรื่องสมมติ ระบบจะ Generate "ความเป็นจริง" เวอร์ชันของตัวเองขึ้นมารองรับทันที ตัวอย่างที่โดดเด่นบนหน้าหลักของเว็บไซต์คือบทความชื่อ "The Year Without Tuesdays" ซึ่งอธิบายปรากฏการณ์นี้ว่าเป็น "ความผิดปกติทางปฏิทินที่เกิดขึ้นใน Grand Duchy of Farkle ในปีที่ 783 แห่งรัชสมัยของ Second Emperor Galfridus" ทั้งหมดนี้ไม่มีสิ่งใดเป็นความจริง แต่ถูกนำเสนออย่างเป็นทางการราวกับตำราวิชาการ
อย่างไรก็ตาม เช่นเดียวกับบทเรียนซ้ำๆ ที่อินเทอร์เน็ตมักสอนเราเสมอ ผู้ใช้บางส่วนพยายาม Prompt เนื้อหาที่ไม่เหมาะสมผ่านช่องทาง "Currently Being Consulted" บนหน้าหลัก โชคดีที่ LLM ยังคง Ignore คำสั่งเหล่านั้นและ Generate เนื้อหาในแบบที่ระบบกำหนดไว้เองแทน
ถึงกระนั้น ผู้พัฒนาควรจัดการปัญหาช่องโหว่นี้ให้เป็น High Priority ในการอัปเดตครั้งถัดไป เพื่อป้องกันไม่ให้เนื้อหาที่ไม่เหมาะสมหลุดรอดขึ้นมาปรากฏบนหน้าหลักของแพลตฟอร์ม
Why it matters
💡 ในยุคที่ AI กำลังผลิตคอนเทนต์ท่วมอินเทอร์เน็ต การเกิดขึ้นของ Halupedia เว็บไซต์ Wikipedia ปลอมที่สร้างบทความจาก AI Hallucinations อย่างตั้งใจ ถือเป็นสัญญาณเตือนที่นักพัฒนาและ Tech Professional ทุกคนต้องตระหนัก เพราะหาก LLM รุ่นต่อไปถูก Train บนข้อมูลเหล่านี้โดยไม่รู้ตัว ความน่าเชื่อถือของแหล่งข้อมูลดิจิทัลทั้งระบบอาจพังทลาย การทำความเข้าใจภัยคุกคามนี้จึงเป็นเรื่องเร่งด่วนสำหรับทุกคนในวงการ IT
ข้อมูลอ้างอิงจาก https://www.vice.com/en/article/someone-made-a-fake-wikipedia-for-ai-hallucinations-and-its-basically-the-internet-eating-itself/