Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Salesforce พัฒนาเครื่องจำลองธุรกิจ CRMArena-Pro เพื่อทดสอบ AI Agent ในสถานการณ์จริงก่อนนำไปใช้งาน หลังพบว่าโครงการนำร่องส่วนใหญ่ล้มเหลว พร้อมเปิดตัวเกณฑ์มาตรฐานใหม่ 5 ด้านสำหรับประเมินประสิทธิภาพ

Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Key takeaway

  • Salesforce พัฒนา CRMArena-Pro เป็นสภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent ก่อนนำไปใช้งานจริง หลังพบว่า 95% ของโครงการนำร่อง AI ในองค์กรไม่สามารถนำไปใช้งานจริงได้ โดยระบบนี้จะจำลองสถานการณ์ธุรกิจที่ซับซ้อนเพื่อเตรียมความพร้อม AI Agent
  • บริษัทได้แนะนำเกณฑ์มาตรฐาน 5 ประการสำหรับประเมิน AI Agent ได้แก่ ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม เพื่อให้องค์กรสามารถเลือกใช้โมเดล AI ที่เหมาะสมกับความต้องการ
  • การพัฒนานี้เกิดขึ้นท่ามกลางความท้าทายด้านความปลอดภัยและการนำ AI ไปใช้งานจริง โดย Salesforce เน้นย้ำว่าการทดสอบในสภาพแวดล้อมจำลองมีความสำคัญ เพราะสภาพแวดล้อมธุรกิจจริงมีความซับซ้อนมากกว่าการสาธิตทั่วไป

Salesforce กำลังเดิมพันว่าการทดสอบในสภาพแวดล้อมธุรกิจจำลองจะแก้ไขปัญหาสำคัญของ AI ในองค์กร นั่นคือ AI Agent ที่แม้จะทำงานได้ดีในการสาธิต แต่กลับล้มเหลวเมื่อเผชิญกับความซับซ้อนในการดำเนินงานจริง

บริษัทยักษ์ใหญ่ด้านซอฟต์แวร์คลาวด์ได้เปิดตัวโครงการวิจัย AI สำคัญสามโครงการในสัปดาห์นี้ หนึ่งในนั้นคือ CRMArena-Pro ซึ่งถูกเรียกว่าเป็น "ดิจิทัลทวิน" ของการดำเนินธุรกิจที่ AI Agent สามารถถูกทดสอบภายใต้สถานการณ์กดดันก่อนนำไปใช้งานจริง การประกาศนี้เกิดขึ้นในช่วงที่องค์กรต่างๆ กำลังประสบปัญหาความล้มเหลวของโครงการนำร่อง AI อย่างแพร่หลาย รวมถึงความกังวลด้านความปลอดภัยใหม่ๆ หลังจากการละเมิดข้อมูลล่าสุดที่ส่งผลกระทบต่อลูกค้า Salesforce หลายร้อยราย

"นักบินไม่ได้เรียนรู้การบินในพายุ พวกเขาฝึกในเครื่องจำลองการบินที่เตรียมความพร้อมสำหรับความท้าทายที่รุนแรงที่สุด" Silvio Savarese หัวหน้านักวิทยาศาสตร์และหัวหน้าวิจัย AI ของ Salesforce กล่าวระหว่างการแถลงข่าว "เช่นเดียวกัน AI Agent ได้รับประโยชน์จากการทดสอบและฝึกฝนในสภาพแวดล้อมจำลอง เพื่อเตรียมพร้อมรับมือกับความไม่แน่นอนของสถานการณ์ธุรกิจประจำวันก่อนนำไปใช้งานจริง"

การมุ่งเน้นการวิจัยครั้งนี้สะท้อนถึงความผิดหวังที่เพิ่มขึ้นขององค์กรต่างๆ กับการนำ AI ไปใช้งาน รายงานล่าสุดจาก MIT พบว่า 95% ของโครงการนำร่อง Generative AI ในบริษัทต่างๆ ล้มเหลวในการนำไปสู่การใช้งานจริง ขณะที่การศึกษาของ Salesforce เองแสดงให้เห็นว่า Large Language Models (LLMs) เพียงอย่างเดียวประสบความสำเร็จเพียง 35% ในสถานการณ์ธุรกิจที่ซับซ้อน

CRMArena-Pro: สภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent

CRMArena-Pro เป็นความพยายามของ Salesforce ในการลดช่องว่างระหว่างสิ่งที่ AI สัญญาว่าจะทำได้กับประสิทธิภาพที่เกิดขึ้นจริง ต่างจากมาตรฐานการทดสอบทั่วไปที่มีอยู่ แพลตฟอร์มนี้ประเมิน Agent บนงานองค์กรจริง เช่น การยกระดับบริการลูกค้า การคาดการณ์ยอดขาย และการจัดการปัญหาห่วงโซ่อุปทาน โดยใช้ข้อมูลธุรกิจสังเคราะห์ที่สมจริง

"หากข้อมูลสังเคราะห์ไม่ได้ถูกสร้างขึ้นอย่างระมัดระวัง อาจนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดหรือมองโลกในแง่ดีเกินไปเกี่ยวกับประสิทธิภาพของ Agent ของคุณในสภาพแวดล้อมจริง" Jason Wu ผู้จัดการวิจัยที่ Salesforce ซึ่งนำทีมพัฒนา CRMArena-Pro อธิบาย

แพลตฟอร์มนี้ทำงานภายในสภาพแวดล้อมการผลิตจริงของ Salesforce แทนที่จะเป็นการจำลองอย่างง่าย โดยใช้ข้อมูลที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญที่มีประสบการณ์ธุรกิจที่เกี่ยวข้อง รองรับทั้งสถานการณ์ธุรกิจกับธุรกิจ (B2B) และธุรกิจกับผู้บริโภค (B2C) และสามารถจำลองการสนทนาหลายรอบที่จับพลวัตการสื่อสารจริง

เกณฑ์มาตรฐานห้าประการสำหรับ AI Agent ที่พร้อมใช้งานในองค์กร

ควบคู่ไปกับสภาพแวดล้อมจำลอง Salesforce ได้แนะนำ Agentic Benchmark for CRM ซึ่งออกแบบมาเพื่อประเมิน AI Agent ตามเกณฑ์วัดที่สำคัญห้าประการสำหรับองค์กร: ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม

เกณฑ์ด้านความยั่งยืนมีความโดดเด่นเป็นพิเศษ ช่วยให้บริษัทต่างๆ ปรับขนาดโมเดลให้เหมาะกับความซับซ้อนของงานเพื่อลดผลกระทบต่อสิ่งแวดล้อม ในขณะที่ยังคงรักษาประสิทธิภาพ "ด้วยการตัดสัญญาณรบกวนจากโมเดลที่มากเกินไป เกณฑ์มาตรฐานนี้ให้วิธีที่ชัดเจนและอิงข้อมูลแก่ธุรกิจในการจับคู่โมเดลที่เหมาะสมกับ Agent ที่เหมาะสม" บริษัทระบุ

การรวมข้อมูลเพื่อ AI ที่เชื่อถือได้

โครงการที่สามมุ่งเน้นไปที่ข้อกำหนดพื้นฐานสำหรับ AI ที่เชื่อถือได้: ข้อมูลที่สะอาดและเป็นเอกภาพ ความสามารถ Account Matching ของ Salesforce ใช้โมเดลภาษาที่ปรับแต่งเพื่อระบุและรวมบันทึกที่ซ้ำซ้อนข้ามระบบโดยอัตโนมัติ สามารถรู้ได้ว่า "The Example Company, Inc." และ "Example Co." เป็นองค์กรเดียวกัน

ลูกค้าผู้ให้บริการคลาวด์รายใหญ่รายหนึ่งประสบความสำเร็จในการจับคู่ 95% โดยใช้เทคโนโลยีนี้ ช่วยให้ทีมขายประหยัดเวลา 30 นาทีต่อการเชื่อมต่อ โดยไม่ต้องสลับหลายหน้าจอด้วยตนเองเพื่อระบุบัญชี

ความกังวลด้านความปลอดภัยและช่องว่างระหว่างการสาธิต AI กับความเป็นจริงขององค์กร

การประกาศเหล่านี้เกิดขึ้นท่ามกลางความกังวลด้านความปลอดภัยที่เพิ่มขึ้นหลังจากแคมเปญขโมยข้อมูลที่ส่งผลกระทบต่อองค์กรลูกค้า Salesforce มากกว่า 700 แห่งเมื่อต้นเดือนนี้ แฮกเกอร์ได้ใช้ประโยชน์จาก OAuth token จาก Salesloft's Drift chat agent เพื่อเข้าถึงระบบ Salesforce และขโมยข้อมูลประจำตัวสำหรับ AWS, Snowflake และแพลตฟอร์มอื่นๆ

โครงการจำลองและการวัดมาตรฐานสะท้อนให้เห็นถึงการตระหนักอย่างกว้างขวางว่า การนำ AI ไปใช้ในองค์กรต้องการมากกว่าวิดีโอสาธิตที่น่าประทับใจ สภาพแวดล้อมธุรกิจจริงมีซอฟต์แวร์เก่า รูปแบบข้อมูลที่ไม่สม่ำเสมอ และกระบวนการทำงานที่ซับซ้อนซึ่งสามารถทำให้แม้แต่ระบบ AI ที่ซับซ้อนล้มเหลวได้

แนวทางของ Salesforce เน้นย้ำความจำเป็นที่ AI Agent ต้องทำงานได้อย่างเชื่อถือได้ในสถานการณ์ที่หลากหลาย มากกว่าการเชี่ยวชาญเฉพาะในงานแคบๆ แนวคิด "Enterprise General Intelligence" (EGI) ของบริษัทมุ่งเน้นการสร้าง Agent ที่ทั้งมีความสามารถและทำงานได้อย่างสม่ำเสมอในการจัดการงานธุรกิจที่ซับซ้อน

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจการนำ AI ไปใช้ในองค์กร เนื่องจากเผยให้เห็นปัญหาสำคัญที่หลายองค์กรกำลังเผชิญ - นั่นคือ 95% ของโครงการนำร่อง AI ไม่สามารถนำไปใช้งานจริงได้ Salesforce กำลังนำเสนอวิธีแก้ปัญหาที่น่าสนใจผ่าน 'เครื่องจำลองการบิน' สำหรับ AI Agent ซึ่งอาจเป็นจุดเปลี่ยนสำคัญในการพัฒนาและทดสอบ AI ให้พร้อมสำหรับการใช้งานจริงในองค์กร ข่าวนี้จึงมีประโยชน์อย่างมากสำหรับผู้บริหารและทีม IT ที่กำลังวางแผนนำ AI มาใช้ในองค์กร

ข้อมูลอ้างอิงจาก https://venturebeat.com/ai/salesforce-builds-flight-simulator-for-ai-agents-as-95-of-enterprise-pilots-fail-to-reach-production/?utm_source=flipboard&utm_content=venturebeat/magazine/AI

Read more

เปรียบเทียบ Perplexity AI และ NotebookLM: เครื่องมือ AI สำหรับการค้นคว้าวิจัยยุคใหม่

news

เปรียบเทียบ Perplexity AI และ NotebookLM: เครื่องมือ AI สำหรับการค้นคว้าวิจัยยุคใหม่

ทดสอบเปรียบเทียบ Perplexity AI และ Google NotebookLM ใน 5 สถานการณ์จริง ตั้งแต่การดูแลต้นไม้ ซีเรียลอาหารเช้า ไปจนถึงการประหยัดพลังงาน ดูว่าเครื่องมือ AI ไหนตอบโจทย์การค้นคว้าได้ดีกว่ากัน

By
เครื่องมือ AI ใหม่คล้าย ChatGPT ใช้งานบนเดสก์ท็อปส่วนตัว ไม่ต้องสมัครสมาชิก

news

เครื่องมือ AI ใหม่คล้าย ChatGPT ใช้งานบนเดสก์ท็อปส่วนตัว ไม่ต้องสมัครสมาชิก

Pansophy ผู้ช่วย AI แบบ local ทำงานบนเดสก์ท็อปของคุณ รองรับ PC, Mac, Linux ไม่ส่งข้อมูลออกจากเครื่อง ไม่จำกัดการใช้งาน ราคา 79 ดอลลาร์ตลอดชีพ เหมาะสำหรับผู้ที่ต้องการความเป็นส่วนตัวสูง

By
วิธีใช้ ChatGPT เพิ่มประสิทธิภาพการเรียนรู้ภาษา

news

วิธีใช้ ChatGPT เพิ่มประสิทธิภาพการเรียนรู้ภาษา

ค้นพบวิธีใช้ ChatGPT เป็นติวเตอร์ส่วนตัวในการเรียนรู้ภาษาใหม่ ตั้งแต่การเขียน prompt ที่มีประสิทธิภาพ การสร้างคลังคำศัพท์ ไปจนถึงการฝึกสนทนาด้วย AI เพื่อเร่งความก้าวหน้าในการเรียนรู้ภาษา

By
Snowflake ขยายความร่วมมือเชิงกลยุทธ์ท่ามกลางการใช้งาน AI ที่เพิ่มสูงขึ้นของลูกค้า

news

Snowflake ขยายความร่วมมือเชิงกลยุทธ์ท่ามกลางการใช้งาน AI ที่เพิ่มสูงขึ้นของลูกค้า

Snowflake ขยายความร่วมมือกับ Anthropic และ Accenture เพื่อเสริมศักยภาพ Agentic AI และ Generative AI รายงานรายได้ Q3 ที่ 1.21 พันล้านดอลลาร์ เติบโต 29% YoY มีลูกค้ากว่า 1,200 รายใช้งาน AI Agents

By