Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Salesforce พัฒนาเครื่องจำลองธุรกิจ CRMArena-Pro เพื่อทดสอบ AI Agent ในสถานการณ์จริงก่อนนำไปใช้งาน หลังพบว่าโครงการนำร่องส่วนใหญ่ล้มเหลว พร้อมเปิดตัวเกณฑ์มาตรฐานใหม่ 5 ด้านสำหรับประเมินประสิทธิภาพ

Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Key takeaway

  • Salesforce พัฒนา CRMArena-Pro เป็นสภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent ก่อนนำไปใช้งานจริง หลังพบว่า 95% ของโครงการนำร่อง AI ในองค์กรไม่สามารถนำไปใช้งานจริงได้ โดยระบบนี้จะจำลองสถานการณ์ธุรกิจที่ซับซ้อนเพื่อเตรียมความพร้อม AI Agent
  • บริษัทได้แนะนำเกณฑ์มาตรฐาน 5 ประการสำหรับประเมิน AI Agent ได้แก่ ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม เพื่อให้องค์กรสามารถเลือกใช้โมเดล AI ที่เหมาะสมกับความต้องการ
  • การพัฒนานี้เกิดขึ้นท่ามกลางความท้าทายด้านความปลอดภัยและการนำ AI ไปใช้งานจริง โดย Salesforce เน้นย้ำว่าการทดสอบในสภาพแวดล้อมจำลองมีความสำคัญ เพราะสภาพแวดล้อมธุรกิจจริงมีความซับซ้อนมากกว่าการสาธิตทั่วไป

Salesforce กำลังเดิมพันว่าการทดสอบในสภาพแวดล้อมธุรกิจจำลองจะแก้ไขปัญหาสำคัญของ AI ในองค์กร นั่นคือ AI Agent ที่แม้จะทำงานได้ดีในการสาธิต แต่กลับล้มเหลวเมื่อเผชิญกับความซับซ้อนในการดำเนินงานจริง

บริษัทยักษ์ใหญ่ด้านซอฟต์แวร์คลาวด์ได้เปิดตัวโครงการวิจัย AI สำคัญสามโครงการในสัปดาห์นี้ หนึ่งในนั้นคือ CRMArena-Pro ซึ่งถูกเรียกว่าเป็น "ดิจิทัลทวิน" ของการดำเนินธุรกิจที่ AI Agent สามารถถูกทดสอบภายใต้สถานการณ์กดดันก่อนนำไปใช้งานจริง การประกาศนี้เกิดขึ้นในช่วงที่องค์กรต่างๆ กำลังประสบปัญหาความล้มเหลวของโครงการนำร่อง AI อย่างแพร่หลาย รวมถึงความกังวลด้านความปลอดภัยใหม่ๆ หลังจากการละเมิดข้อมูลล่าสุดที่ส่งผลกระทบต่อลูกค้า Salesforce หลายร้อยราย

"นักบินไม่ได้เรียนรู้การบินในพายุ พวกเขาฝึกในเครื่องจำลองการบินที่เตรียมความพร้อมสำหรับความท้าทายที่รุนแรงที่สุด" Silvio Savarese หัวหน้านักวิทยาศาสตร์และหัวหน้าวิจัย AI ของ Salesforce กล่าวระหว่างการแถลงข่าว "เช่นเดียวกัน AI Agent ได้รับประโยชน์จากการทดสอบและฝึกฝนในสภาพแวดล้อมจำลอง เพื่อเตรียมพร้อมรับมือกับความไม่แน่นอนของสถานการณ์ธุรกิจประจำวันก่อนนำไปใช้งานจริง"

การมุ่งเน้นการวิจัยครั้งนี้สะท้อนถึงความผิดหวังที่เพิ่มขึ้นขององค์กรต่างๆ กับการนำ AI ไปใช้งาน รายงานล่าสุดจาก MIT พบว่า 95% ของโครงการนำร่อง Generative AI ในบริษัทต่างๆ ล้มเหลวในการนำไปสู่การใช้งานจริง ขณะที่การศึกษาของ Salesforce เองแสดงให้เห็นว่า Large Language Models (LLMs) เพียงอย่างเดียวประสบความสำเร็จเพียง 35% ในสถานการณ์ธุรกิจที่ซับซ้อน

CRMArena-Pro: สภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent

CRMArena-Pro เป็นความพยายามของ Salesforce ในการลดช่องว่างระหว่างสิ่งที่ AI สัญญาว่าจะทำได้กับประสิทธิภาพที่เกิดขึ้นจริง ต่างจากมาตรฐานการทดสอบทั่วไปที่มีอยู่ แพลตฟอร์มนี้ประเมิน Agent บนงานองค์กรจริง เช่น การยกระดับบริการลูกค้า การคาดการณ์ยอดขาย และการจัดการปัญหาห่วงโซ่อุปทาน โดยใช้ข้อมูลธุรกิจสังเคราะห์ที่สมจริง

"หากข้อมูลสังเคราะห์ไม่ได้ถูกสร้างขึ้นอย่างระมัดระวัง อาจนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดหรือมองโลกในแง่ดีเกินไปเกี่ยวกับประสิทธิภาพของ Agent ของคุณในสภาพแวดล้อมจริง" Jason Wu ผู้จัดการวิจัยที่ Salesforce ซึ่งนำทีมพัฒนา CRMArena-Pro อธิบาย

แพลตฟอร์มนี้ทำงานภายในสภาพแวดล้อมการผลิตจริงของ Salesforce แทนที่จะเป็นการจำลองอย่างง่าย โดยใช้ข้อมูลที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญที่มีประสบการณ์ธุรกิจที่เกี่ยวข้อง รองรับทั้งสถานการณ์ธุรกิจกับธุรกิจ (B2B) และธุรกิจกับผู้บริโภค (B2C) และสามารถจำลองการสนทนาหลายรอบที่จับพลวัตการสื่อสารจริง

เกณฑ์มาตรฐานห้าประการสำหรับ AI Agent ที่พร้อมใช้งานในองค์กร

ควบคู่ไปกับสภาพแวดล้อมจำลอง Salesforce ได้แนะนำ Agentic Benchmark for CRM ซึ่งออกแบบมาเพื่อประเมิน AI Agent ตามเกณฑ์วัดที่สำคัญห้าประการสำหรับองค์กร: ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม

เกณฑ์ด้านความยั่งยืนมีความโดดเด่นเป็นพิเศษ ช่วยให้บริษัทต่างๆ ปรับขนาดโมเดลให้เหมาะกับความซับซ้อนของงานเพื่อลดผลกระทบต่อสิ่งแวดล้อม ในขณะที่ยังคงรักษาประสิทธิภาพ "ด้วยการตัดสัญญาณรบกวนจากโมเดลที่มากเกินไป เกณฑ์มาตรฐานนี้ให้วิธีที่ชัดเจนและอิงข้อมูลแก่ธุรกิจในการจับคู่โมเดลที่เหมาะสมกับ Agent ที่เหมาะสม" บริษัทระบุ

การรวมข้อมูลเพื่อ AI ที่เชื่อถือได้

โครงการที่สามมุ่งเน้นไปที่ข้อกำหนดพื้นฐานสำหรับ AI ที่เชื่อถือได้: ข้อมูลที่สะอาดและเป็นเอกภาพ ความสามารถ Account Matching ของ Salesforce ใช้โมเดลภาษาที่ปรับแต่งเพื่อระบุและรวมบันทึกที่ซ้ำซ้อนข้ามระบบโดยอัตโนมัติ สามารถรู้ได้ว่า "The Example Company, Inc." และ "Example Co." เป็นองค์กรเดียวกัน

ลูกค้าผู้ให้บริการคลาวด์รายใหญ่รายหนึ่งประสบความสำเร็จในการจับคู่ 95% โดยใช้เทคโนโลยีนี้ ช่วยให้ทีมขายประหยัดเวลา 30 นาทีต่อการเชื่อมต่อ โดยไม่ต้องสลับหลายหน้าจอด้วยตนเองเพื่อระบุบัญชี

ความกังวลด้านความปลอดภัยและช่องว่างระหว่างการสาธิต AI กับความเป็นจริงขององค์กร

การประกาศเหล่านี้เกิดขึ้นท่ามกลางความกังวลด้านความปลอดภัยที่เพิ่มขึ้นหลังจากแคมเปญขโมยข้อมูลที่ส่งผลกระทบต่อองค์กรลูกค้า Salesforce มากกว่า 700 แห่งเมื่อต้นเดือนนี้ แฮกเกอร์ได้ใช้ประโยชน์จาก OAuth token จาก Salesloft's Drift chat agent เพื่อเข้าถึงระบบ Salesforce และขโมยข้อมูลประจำตัวสำหรับ AWS, Snowflake และแพลตฟอร์มอื่นๆ

โครงการจำลองและการวัดมาตรฐานสะท้อนให้เห็นถึงการตระหนักอย่างกว้างขวางว่า การนำ AI ไปใช้ในองค์กรต้องการมากกว่าวิดีโอสาธิตที่น่าประทับใจ สภาพแวดล้อมธุรกิจจริงมีซอฟต์แวร์เก่า รูปแบบข้อมูลที่ไม่สม่ำเสมอ และกระบวนการทำงานที่ซับซ้อนซึ่งสามารถทำให้แม้แต่ระบบ AI ที่ซับซ้อนล้มเหลวได้

แนวทางของ Salesforce เน้นย้ำความจำเป็นที่ AI Agent ต้องทำงานได้อย่างเชื่อถือได้ในสถานการณ์ที่หลากหลาย มากกว่าการเชี่ยวชาญเฉพาะในงานแคบๆ แนวคิด "Enterprise General Intelligence" (EGI) ของบริษัทมุ่งเน้นการสร้าง Agent ที่ทั้งมีความสามารถและทำงานได้อย่างสม่ำเสมอในการจัดการงานธุรกิจที่ซับซ้อน

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจการนำ AI ไปใช้ในองค์กร เนื่องจากเผยให้เห็นปัญหาสำคัญที่หลายองค์กรกำลังเผชิญ - นั่นคือ 95% ของโครงการนำร่อง AI ไม่สามารถนำไปใช้งานจริงได้ Salesforce กำลังนำเสนอวิธีแก้ปัญหาที่น่าสนใจผ่าน 'เครื่องจำลองการบิน' สำหรับ AI Agent ซึ่งอาจเป็นจุดเปลี่ยนสำคัญในการพัฒนาและทดสอบ AI ให้พร้อมสำหรับการใช้งานจริงในองค์กร ข่าวนี้จึงมีประโยชน์อย่างมากสำหรับผู้บริหารและทีม IT ที่กำลังวางแผนนำ AI มาใช้ในองค์กร

ข้อมูลอ้างอิงจาก https://venturebeat.com/ai/salesforce-builds-flight-simulator-for-ai-agents-as-95-of-enterprise-pilots-fail-to-reach-production/?utm_source=flipboard&utm_content=venturebeat/magazine/AI

Read more

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

news

เบราว์เซอร์ Comet AI จาก Perplexity เปิดให้ทุกคนใช้งานแล้ว

Perplexity เปิดตัว Comet เว็บเบราว์เซอร์ AI ให้ทุกคนใช้งานฟรี มาพร้อมผู้ช่วย AI อัจฉริยะที่ตอบคำถามและทำงานแทนผู้ใช้ได้ ท้าทายการครองตลาดของ Google Chrome

By
ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

news

ชายวัย 29 ปีถูกจับกุมหลังใช้ ChatGPT สร้างภาพไฟไหม้ก่อนก่อเหตุจริง

ตำรวจจับกุม Jonathan Rinderknecht วัย 29 ปี ผู้ต้องสงสัยก่อเหตุไฟไหม้ใน Pacific Palisades หลังพบหลักฐานใช้ ChatGPT สร้างภาพเหตุการณ์ล่วงหน้า 5 เดือน เหตุคร่าชีวิต 12 ราย บ้านเสียหายกว่า 6,000 หลัง

By
การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

news

การหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงิน 76 ล้านดอลลาร์ต่อปี

ผลการศึกษาจาก New Relic เผยการหยุดชะงักของระบบ IT ทำให้ธุรกิจสูญเสียเงินมัธยฐาน 76 ล้านดอลลาร์ต่อปี หรือ 33,333 ดอลลาร์ต่อนาที พร้อมเผยสาเหตุหลักและแนวทางแก้ไข

By
โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

news

โรงพยาบาลจำเป็นต้องเตรียมพร้อมรับมือการโจมตีแบบฟิชชิ่งที่ใช้ AI

ภัยคุกคามจากการโจมตีฟิชชิ่งที่ใช้ AI ในโรงพยาบาลเพิ่มขึ้นกว่า 700% ในปี 2024 สร้างความเสี่ยงต่อข้อมูลผู้ป่วยและระบบสาธารณสุข จำเป็นต้องเพิ่มการฝึกอบรมและระบบป้องกันอย่างเร่งด่วน

By