ฟีเจอร์ความจำของ ChatGPT เพิ่มความรุนแรงให้การโจมตีแบบ Prompt Injection

นักวิจัยค้นพบว่าฟีเจอร์ความจำล่าสุดของ ChatGPT สามารถถูกใช้เป็นเครื่องมือเพิ่มความรุนแรงให้การโจมตีแบบ prompt injection ผ่านเทคนิค "ZombieAgent" ที่ทำให้การโจมตีมีความคงทนและแพร่กระจายได้มากขึ้น แม้ OpenAI จะออกมาตรการแก้ไขแล้ว

ฟีเจอร์ความจำของ ChatGPT เพิ่มความรุนแรงให้การโจมตีแบบ Prompt Injection

Key takeaway

  • ฟีเจอร์ความจำของ ChatGPT ถูกใช้เพิ่มความรุนแรงให้การโจมตีแบบ indirect prompt injection (IPI) ผ่านการพัฒนาห่วงโซ่การโจมตีรูปแบบใหม่ที่เรียกว่า "ZombieAgent"
  • การโจมตีทำได้โดยการส่งอีเมลที่แฝงข้อความอันตรายสำหรับ AI ซึ่งจะถูกเก็บไว้ในความจำของ ChatGPT และทำงานทุกครั้งที่ผู้ใช้ส่งข้อความ ทำให้การโจมตีมีความคงทนยาวนานขึ้น
  • OpenAI ได้แก้ไขบางส่วนโดยจำกัดการเข้าถึง URL แต่ผู้เชี่ยวชาญเสนอว่าควรมีระบบความไว้วางใจสองระดับและฝึก AI ให้เข้าใจเจตนาของผู้ใช้เพื่อแก้ไขปัญหาที่ซับซ้อนกว่านี้

นักวิจัยจาก Radware เปิดเผยว่าฟีเจอร์ความจำล่าสุดของ ChatGPT สามารถถูกนำไปใช้เพิ่มความรุนแรงให้กับการโจมตีแบบ indirect prompt injection (IPI) ได้อย่างมีประสิทธิภาพมากขึ้น

ทีมนักวิจัยได้พัฒนาห่วงโซ่การโจมตีรูปแบบใหม่ที่เรียกว่า "ZombieAgent" ซึ่งพิสูจน์ให้เห็นว่า ChatGPT ไม่เพียงมีช่องโหว่ต่อการโจมตีแบบ IPI เท่านั้น แต่ฟีเจอร์ connector และความจำใหม่ของมันยังสามารถถูกใช้เป็นเครื่องมือเพื่อทำให้การโจมตีมีความคงทนและแพร่กระจายได้มากกว่าที่เคยประเมินไว้

"Connectors" คือการเชื่อมต่อระหว่าง ChatGPT กับแพลตฟอร์มซอฟต์แวร์อื่นๆ เช่น บริการอีเมล หรือเครื่องมือเพิ่มประสิทธิภาพการทำงานต่างๆ ปัจจุบัน ChatGPT มีความจำระยะยาว ทำให้ข้อมูลที่ป้อนเข้าไปวันนี้สามารถส่งผลต่อการทำงานของมันได้อย่างต่อเนื่อง

การโจมตีแบบ Prompt Injection แบบดั้งเดิมยังคงได้ผล

แม้จะมีงานวิจัยมากมายตลอดหลายปีที่ผ่านมาที่แสดงให้เห็นถึงความเปราะบางของเอเจนต์ AI แต่แชทบอทยอดนิยมระดับโลกอย่าง ChatGPT ยังคงมีช่องโหว่ต่อเทคนิค prompt injection ที่เป็นที่รู้จัก โดยยังคงตอบสนองต่อคำสั่งที่เป็นอันตราย อ่านข้อความที่ผู้ใช้มองไม่เห็น และอื่นๆ นักวิจัย Radware ไม่จำเป็นต้องคิดค้นเทคนิคใหม่สำหรับ ZombieAgent โดยส่วนใหญ่ใช้เทคนิคที่เป็นที่รู้จักในการหลอกแชทบอทและดึงข้อมูลที่เป็นความลับของเหยื่อ

เมื่อผู้ใช้เชื่อมต่อ ChatGPT กับกล่องจดหมายอีเมล ผู้โจมตีสามารถส่งอีเมลที่แฝงข้อความอันตรายสำหรับ AI ได้ คำสั่งเหล่านี้อาจซ่อนอยู่ในรูปแบบข้อความขนาดเล็กมาก หรือเป็นข้อความสีขาวบนพื้นหลังสีขาวเพื่อหลบซ่อนจากเหยื่อ จากนั้นเพียงแค่เหยื่อสั่งให้ AI ดำเนินการกับอีเมลนั้น เช่น ขอให้สรุปอีเมลที่ยังไม่ได้อ่าน คำสั่งอันตรายก็จะถูกส่งไปยังเซิร์ฟเวอร์ของ OpenAI

การใช้ฟีเจอร์ที่ดีที่สุดของ ChatGPT เป็นอาวุธ

จุดสำคัญของ ZombieAgent คือการใช้ฟีเจอร์ความจำของ ChatGPT ในทางที่ผิดเพื่อทำให้การโจมตีแบบ IPI มีความคงทนยาวนานมากขึ้น

เพื่อเพิ่มประสบการณ์ผู้ใช้ ChatGPT ถูกออกแบบให้จดจำรายละเอียดสำคัญเกี่ยวกับผู้ใช้ หากคุณขอให้มันเรียกคุณว่า Zsa Zsa Gabor มันจะจำที่จะเรียกคุณเช่นนั้นในทุกครั้งที่มีการสนทนา จนกว่าจะได้รับคำสั่งเปลี่ยนแปลง ดังนั้นหากมันสามารถเก็บชื่อหรือข้อมูลอื่นๆ ได้ ก็ไม่มีอะไรหยุดมันจากการเก็บคำสั่งอันตรายไว้เช่นกัน

จากการทดลอง นักวิจัยได้แนบไฟล์ไปกับอีเมล ซึ่งฝังคำสั่งลงไปในความจำของ ChatGPT หลังจากนั้นทุกครั้งที่ผู้ใช้ส่งข้อความ เอเจนต์จะเรียกใช้ความจำนั้นก่อน จดจำคำสั่งอันตราย และดำเนินการตาม โดยในกรณีนี้คือการบันทึกข้อมูลส่วนตัวที่ผู้ใช้แบ่งปัน

การแก้ไขบางส่วนสำหรับช่องโหว่ ZombieAgent

หลังจากที่นักวิจัยเปิดเผยผลการค้นพบเมื่อไม่กี่เดือนที่ผ่านมา OpenAI ได้รับทราบและออกแบบการแก้ไขสำหรับ ZombieAgent ปัจจุบัน นอกจากการบล็อก URL ที่ถูกแก้ไขแล้ว ChatGPT จะได้รับอนุญาตให้เข้าถึง URL เฉพาะกรณีที่ผู้ใช้ที่สมัครสมาชิกให้มาโดยตรง หรือหากปรากฏในดัชนีสาธารณะที่เป็นที่ยอมรับเท่านั้น กล่าวคือ โดเมนที่ผู้โจมตีจัดเตรียมจะไม่สามารถใช้งานได้ ซึ่งทำให้ความสามารถของ ZombieAgent ในการดึงข้อมูลถูกระงับ

Pascal Geenens ผู้อำนวยการฝ่ายข่าวกรองภัยคุกคามที่ Radware มองว่าการอัปเดตนโยบายโดยตรงยังไม่เพียงพอต่อการแก้ไขปัญหาที่ซับซ้อนกว่า เขาเสนอให้มีระดับความไว้วางใจสองระดับ: "ระดับแรก เชื่อใจสิ่งที่ผู้ใช้กำลังถามฉัน ระดับความไว้วางใจระดับที่สองคือสิ่งใดก็ตามที่ถูกฉีดเข้ามาผ่านการอ่านเอกสาร หน้าเว็บ อีเมล PDF"

ในอุดมคติ เอเจนต์ AI ควรได้รับการฝึกให้เข้าใจเจตนาของผู้ใช้ Geenens อธิบายว่า "ถ้าคำขอเดิมคือ 'สรุปอีเมลของฉัน' และจากนั้นการกระทำกลายเป็น 'ค้นหาข้อมูลส่วนตัวทั้งหมดในกล่องจดหมายของฉัน' มันควรคิดว่า 'เฮ้ นั่นไม่ใช่เจตนาเดิม' ถ้าเจตนาเดิมคือการรวบรวมข้อมูลส่วนตัวในกล่องจดหมายของฉัน ผู้ใช้ก็จะขอให้รวบรวมข้อมูลส่วนตัวในกล่องจดหมายของฉันโดยตรง"

Why it matters

💡 การเปิดเผยจากนักวิจัย Radware เกี่ยวกับช่องโหว่ "ZombieAgent" ในฟีเจอร์ความจำของ ChatGPT เป็นข้อมูลสำคัญที่ผู้ใช้เทคโนโลยี AI ทุกคนควรรับทราบ บทความนี้ไม่เพียงแสดงให้เห็นถึงความเสี่ยงใหม่ที่เกิดขึ้นจากการพัฒนาฟีเจอร์ล้ำสมัย แต่ยังชี้ให้เห็นว่าแม้แต่บริษัทยักษ์ใหญ่อย่าง OpenAI ก็ยังมีช่องโหว่ด้านความปลอดภัยที่น่ากังวล ผู้ที่ใช้ ChatGPT เชื่อมต่อกับบริการอื่นๆ ควรตระหนักถึงความเสี่ยงนี้และติดตามมาตรการป้องกันที่ OpenAI นำมาใช้ เพื่อปกป้องข้อมูลส่วนตัวของตนเอง

ข้อมูลอ้างอิงจาก https://www.darkreading.com/endpoint-security/chatgpt-memory-feature-prompt-injection

Read more

ความโกรธแค้นต่อ OpenAI เพิ่มขึ้นอย่างมหาศาลจนเกิดการประท้วงครั้งใหญ่

news

ความโกรธแค้นต่อ OpenAI เพิ่มขึ้นอย่างมหาศาลจนเกิดการประท้วงครั้งใหญ่

OpenAI เผชิญการประท้วงครั้งใหญ่หลัง CEO Sam Altman ประกาศข้อตกลงกับกระทรวงกลาโหมสหรัฐฯ ผู้ใช้ ChatGPT หันไปใช้ Claude แทน การถอนแอปเพิ่มขึ้น 300% พนักงานเกือบ 1,000 คนลงนามจดหมายคัดค้าน

By
ศาสตราจารย์ Harvard เตือน: ผู้ใช้ AI กำลังสูญเสียความสามารถทางปัญญา

news

ศาสตราจารย์ Harvard เตือน: ผู้ใช้ AI กำลังสูญเสียความสามารถทางปัญญา

ศ.Avi Loeb จาก Harvard เตือนผู้ใช้ AI กำลังสูญเสียความสามารถทางปัญญา เปรียบเหมือนสูญเสียกล้ามเนื้อจากการไม่ออกกำลังกาย การศึกษาชี้ AI ส่งผลต่อการคิดวิเคราะห์เสื่อมถอย

By
Sam Altman ยอมรับว่า OpenAI ไม่สามารถควบคุมการใช้ AI ของ Pentagon ได้

news

Sam Altman ยอมรับว่า OpenAI ไม่สามารถควบคุมการใช้ AI ของ Pentagon ได้

Sam Altman CEO ของ OpenAI ยอมรับต่อพนักงานว่าบริษัทไม่สามารถควบคุมการใช้เทคโนโลยี AI ของ Pentagon ได้ ท่ามกลางการอภิปรายเข้มข้นเรื่องจริยธรรม AI ทางทหารและการที่ Anthropic ปฏิเสธข้อตกลงกับ Pentagon

By
Dyna.Ai ระดมทุน Series A หลักแปดหลัก ชูเทคโนโลยี Agentic AI เพื่อภาคการเงิน

news

Dyna.Ai ระดมทุน Series A หลักแปดหลัก ชูเทคโนโลยี Agentic AI เพื่อภาคการเงิน

Dyna.Ai บริษัท AI-as-a-Service จากสิงคโปร์ ปิดรอบ Series A หลักแปดหลัก นำโดย Lion X Ventures เพื่อพัฒนาแพลตฟอร์ม Agentic AI สำหรับสถาบันการเงิน แก้ปัญหาโครงการนำร่อง AI ที่ไม่สามารถนำไปใช้งานจริงได้

By