Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้
Salesforce พัฒนาเครื่องจำลองธุรกิจ CRMArena-Pro เพื่อทดสอบ AI Agent ในสถานการณ์จริงก่อนนำไปใช้งาน หลังพบว่าโครงการนำร่องส่วนใหญ่ล้มเหลว พร้อมเปิดตัวเกณฑ์มาตรฐานใหม่ 5 ด้านสำหรับประเมินประสิทธิภาพ
Key takeaway
- Salesforce พัฒนา CRMArena-Pro เป็นสภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent ก่อนนำไปใช้งานจริง หลังพบว่า 95% ของโครงการนำร่อง AI ในองค์กรไม่สามารถนำไปใช้งานจริงได้ โดยระบบนี้จะจำลองสถานการณ์ธุรกิจที่ซับซ้อนเพื่อเตรียมความพร้อม AI Agent
- บริษัทได้แนะนำเกณฑ์มาตรฐาน 5 ประการสำหรับประเมิน AI Agent ได้แก่ ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม เพื่อให้องค์กรสามารถเลือกใช้โมเดล AI ที่เหมาะสมกับความต้องการ
- การพัฒนานี้เกิดขึ้นท่ามกลางความท้าทายด้านความปลอดภัยและการนำ AI ไปใช้งานจริง โดย Salesforce เน้นย้ำว่าการทดสอบในสภาพแวดล้อมจำลองมีความสำคัญ เพราะสภาพแวดล้อมธุรกิจจริงมีความซับซ้อนมากกว่าการสาธิตทั่วไป
Salesforce กำลังเดิมพันว่าการทดสอบในสภาพแวดล้อมธุรกิจจำลองจะแก้ไขปัญหาสำคัญของ AI ในองค์กร นั่นคือ AI Agent ที่แม้จะทำงานได้ดีในการสาธิต แต่กลับล้มเหลวเมื่อเผชิญกับความซับซ้อนในการดำเนินงานจริง
บริษัทยักษ์ใหญ่ด้านซอฟต์แวร์คลาวด์ได้เปิดตัวโครงการวิจัย AI สำคัญสามโครงการในสัปดาห์นี้ หนึ่งในนั้นคือ CRMArena-Pro ซึ่งถูกเรียกว่าเป็น "ดิจิทัลทวิน" ของการดำเนินธุรกิจที่ AI Agent สามารถถูกทดสอบภายใต้สถานการณ์กดดันก่อนนำไปใช้งานจริง การประกาศนี้เกิดขึ้นในช่วงที่องค์กรต่างๆ กำลังประสบปัญหาความล้มเหลวของโครงการนำร่อง AI อย่างแพร่หลาย รวมถึงความกังวลด้านความปลอดภัยใหม่ๆ หลังจากการละเมิดข้อมูลล่าสุดที่ส่งผลกระทบต่อลูกค้า Salesforce หลายร้อยราย
"นักบินไม่ได้เรียนรู้การบินในพายุ พวกเขาฝึกในเครื่องจำลองการบินที่เตรียมความพร้อมสำหรับความท้าทายที่รุนแรงที่สุด" Silvio Savarese หัวหน้านักวิทยาศาสตร์และหัวหน้าวิจัย AI ของ Salesforce กล่าวระหว่างการแถลงข่าว "เช่นเดียวกัน AI Agent ได้รับประโยชน์จากการทดสอบและฝึกฝนในสภาพแวดล้อมจำลอง เพื่อเตรียมพร้อมรับมือกับความไม่แน่นอนของสถานการณ์ธุรกิจประจำวันก่อนนำไปใช้งานจริง"
การมุ่งเน้นการวิจัยครั้งนี้สะท้อนถึงความผิดหวังที่เพิ่มขึ้นขององค์กรต่างๆ กับการนำ AI ไปใช้งาน รายงานล่าสุดจาก MIT พบว่า 95% ของโครงการนำร่อง Generative AI ในบริษัทต่างๆ ล้มเหลวในการนำไปสู่การใช้งานจริง ขณะที่การศึกษาของ Salesforce เองแสดงให้เห็นว่า Large Language Models (LLMs) เพียงอย่างเดียวประสบความสำเร็จเพียง 35% ในสถานการณ์ธุรกิจที่ซับซ้อน
CRMArena-Pro: สภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent
CRMArena-Pro เป็นความพยายามของ Salesforce ในการลดช่องว่างระหว่างสิ่งที่ AI สัญญาว่าจะทำได้กับประสิทธิภาพที่เกิดขึ้นจริง ต่างจากมาตรฐานการทดสอบทั่วไปที่มีอยู่ แพลตฟอร์มนี้ประเมิน Agent บนงานองค์กรจริง เช่น การยกระดับบริการลูกค้า การคาดการณ์ยอดขาย และการจัดการปัญหาห่วงโซ่อุปทาน โดยใช้ข้อมูลธุรกิจสังเคราะห์ที่สมจริง
"หากข้อมูลสังเคราะห์ไม่ได้ถูกสร้างขึ้นอย่างระมัดระวัง อาจนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดหรือมองโลกในแง่ดีเกินไปเกี่ยวกับประสิทธิภาพของ Agent ของคุณในสภาพแวดล้อมจริง" Jason Wu ผู้จัดการวิจัยที่ Salesforce ซึ่งนำทีมพัฒนา CRMArena-Pro อธิบาย
แพลตฟอร์มนี้ทำงานภายในสภาพแวดล้อมการผลิตจริงของ Salesforce แทนที่จะเป็นการจำลองอย่างง่าย โดยใช้ข้อมูลที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญที่มีประสบการณ์ธุรกิจที่เกี่ยวข้อง รองรับทั้งสถานการณ์ธุรกิจกับธุรกิจ (B2B) และธุรกิจกับผู้บริโภค (B2C) และสามารถจำลองการสนทนาหลายรอบที่จับพลวัตการสื่อสารจริง
เกณฑ์มาตรฐานห้าประการสำหรับ AI Agent ที่พร้อมใช้งานในองค์กร
ควบคู่ไปกับสภาพแวดล้อมจำลอง Salesforce ได้แนะนำ Agentic Benchmark for CRM ซึ่งออกแบบมาเพื่อประเมิน AI Agent ตามเกณฑ์วัดที่สำคัญห้าประการสำหรับองค์กร: ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม
เกณฑ์ด้านความยั่งยืนมีความโดดเด่นเป็นพิเศษ ช่วยให้บริษัทต่างๆ ปรับขนาดโมเดลให้เหมาะกับความซับซ้อนของงานเพื่อลดผลกระทบต่อสิ่งแวดล้อม ในขณะที่ยังคงรักษาประสิทธิภาพ "ด้วยการตัดสัญญาณรบกวนจากโมเดลที่มากเกินไป เกณฑ์มาตรฐานนี้ให้วิธีที่ชัดเจนและอิงข้อมูลแก่ธุรกิจในการจับคู่โมเดลที่เหมาะสมกับ Agent ที่เหมาะสม" บริษัทระบุ
การรวมข้อมูลเพื่อ AI ที่เชื่อถือได้
โครงการที่สามมุ่งเน้นไปที่ข้อกำหนดพื้นฐานสำหรับ AI ที่เชื่อถือได้: ข้อมูลที่สะอาดและเป็นเอกภาพ ความสามารถ Account Matching ของ Salesforce ใช้โมเดลภาษาที่ปรับแต่งเพื่อระบุและรวมบันทึกที่ซ้ำซ้อนข้ามระบบโดยอัตโนมัติ สามารถรู้ได้ว่า "The Example Company, Inc." และ "Example Co." เป็นองค์กรเดียวกัน
ลูกค้าผู้ให้บริการคลาวด์รายใหญ่รายหนึ่งประสบความสำเร็จในการจับคู่ 95% โดยใช้เทคโนโลยีนี้ ช่วยให้ทีมขายประหยัดเวลา 30 นาทีต่อการเชื่อมต่อ โดยไม่ต้องสลับหลายหน้าจอด้วยตนเองเพื่อระบุบัญชี
ความกังวลด้านความปลอดภัยและช่องว่างระหว่างการสาธิต AI กับความเป็นจริงขององค์กร
การประกาศเหล่านี้เกิดขึ้นท่ามกลางความกังวลด้านความปลอดภัยที่เพิ่มขึ้นหลังจากแคมเปญขโมยข้อมูลที่ส่งผลกระทบต่อองค์กรลูกค้า Salesforce มากกว่า 700 แห่งเมื่อต้นเดือนนี้ แฮกเกอร์ได้ใช้ประโยชน์จาก OAuth token จาก Salesloft's Drift chat agent เพื่อเข้าถึงระบบ Salesforce และขโมยข้อมูลประจำตัวสำหรับ AWS, Snowflake และแพลตฟอร์มอื่นๆ
โครงการจำลองและการวัดมาตรฐานสะท้อนให้เห็นถึงการตระหนักอย่างกว้างขวางว่า การนำ AI ไปใช้ในองค์กรต้องการมากกว่าวิดีโอสาธิตที่น่าประทับใจ สภาพแวดล้อมธุรกิจจริงมีซอฟต์แวร์เก่า รูปแบบข้อมูลที่ไม่สม่ำเสมอ และกระบวนการทำงานที่ซับซ้อนซึ่งสามารถทำให้แม้แต่ระบบ AI ที่ซับซ้อนล้มเหลวได้
แนวทางของ Salesforce เน้นย้ำความจำเป็นที่ AI Agent ต้องทำงานได้อย่างเชื่อถือได้ในสถานการณ์ที่หลากหลาย มากกว่าการเชี่ยวชาญเฉพาะในงานแคบๆ แนวคิด "Enterprise General Intelligence" (EGI) ของบริษัทมุ่งเน้นการสร้าง Agent ที่ทั้งมีความสามารถและทำงานได้อย่างสม่ำเสมอในการจัดการงานธุรกิจที่ซับซ้อน
Why it matters
💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจการนำ AI ไปใช้ในองค์กร เนื่องจากเผยให้เห็นปัญหาสำคัญที่หลายองค์กรกำลังเผชิญ - นั่นคือ 95% ของโครงการนำร่อง AI ไม่สามารถนำไปใช้งานจริงได้ Salesforce กำลังนำเสนอวิธีแก้ปัญหาที่น่าสนใจผ่าน 'เครื่องจำลองการบิน' สำหรับ AI Agent ซึ่งอาจเป็นจุดเปลี่ยนสำคัญในการพัฒนาและทดสอบ AI ให้พร้อมสำหรับการใช้งานจริงในองค์กร ข่าวนี้จึงมีประโยชน์อย่างมากสำหรับผู้บริหารและทีม IT ที่กำลังวางแผนนำ AI มาใช้ในองค์กร