Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Salesforce พัฒนาเครื่องจำลองธุรกิจ CRMArena-Pro เพื่อทดสอบ AI Agent ในสถานการณ์จริงก่อนนำไปใช้งาน หลังพบว่าโครงการนำร่องส่วนใหญ่ล้มเหลว พร้อมเปิดตัวเกณฑ์มาตรฐานใหม่ 5 ด้านสำหรับประเมินประสิทธิภาพ

Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Key takeaway

  • Salesforce พัฒนา CRMArena-Pro เป็นสภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent ก่อนนำไปใช้งานจริง หลังพบว่า 95% ของโครงการนำร่อง AI ในองค์กรไม่สามารถนำไปใช้งานจริงได้ โดยระบบนี้จะจำลองสถานการณ์ธุรกิจที่ซับซ้อนเพื่อเตรียมความพร้อม AI Agent
  • บริษัทได้แนะนำเกณฑ์มาตรฐาน 5 ประการสำหรับประเมิน AI Agent ได้แก่ ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม เพื่อให้องค์กรสามารถเลือกใช้โมเดล AI ที่เหมาะสมกับความต้องการ
  • การพัฒนานี้เกิดขึ้นท่ามกลางความท้าทายด้านความปลอดภัยและการนำ AI ไปใช้งานจริง โดย Salesforce เน้นย้ำว่าการทดสอบในสภาพแวดล้อมจำลองมีความสำคัญ เพราะสภาพแวดล้อมธุรกิจจริงมีความซับซ้อนมากกว่าการสาธิตทั่วไป

Salesforce กำลังเดิมพันว่าการทดสอบในสภาพแวดล้อมธุรกิจจำลองจะแก้ไขปัญหาสำคัญของ AI ในองค์กร นั่นคือ AI Agent ที่แม้จะทำงานได้ดีในการสาธิต แต่กลับล้มเหลวเมื่อเผชิญกับความซับซ้อนในการดำเนินงานจริง

บริษัทยักษ์ใหญ่ด้านซอฟต์แวร์คลาวด์ได้เปิดตัวโครงการวิจัย AI สำคัญสามโครงการในสัปดาห์นี้ หนึ่งในนั้นคือ CRMArena-Pro ซึ่งถูกเรียกว่าเป็น "ดิจิทัลทวิน" ของการดำเนินธุรกิจที่ AI Agent สามารถถูกทดสอบภายใต้สถานการณ์กดดันก่อนนำไปใช้งานจริง การประกาศนี้เกิดขึ้นในช่วงที่องค์กรต่างๆ กำลังประสบปัญหาความล้มเหลวของโครงการนำร่อง AI อย่างแพร่หลาย รวมถึงความกังวลด้านความปลอดภัยใหม่ๆ หลังจากการละเมิดข้อมูลล่าสุดที่ส่งผลกระทบต่อลูกค้า Salesforce หลายร้อยราย

"นักบินไม่ได้เรียนรู้การบินในพายุ พวกเขาฝึกในเครื่องจำลองการบินที่เตรียมความพร้อมสำหรับความท้าทายที่รุนแรงที่สุด" Silvio Savarese หัวหน้านักวิทยาศาสตร์และหัวหน้าวิจัย AI ของ Salesforce กล่าวระหว่างการแถลงข่าว "เช่นเดียวกัน AI Agent ได้รับประโยชน์จากการทดสอบและฝึกฝนในสภาพแวดล้อมจำลอง เพื่อเตรียมพร้อมรับมือกับความไม่แน่นอนของสถานการณ์ธุรกิจประจำวันก่อนนำไปใช้งานจริง"

การมุ่งเน้นการวิจัยครั้งนี้สะท้อนถึงความผิดหวังที่เพิ่มขึ้นขององค์กรต่างๆ กับการนำ AI ไปใช้งาน รายงานล่าสุดจาก MIT พบว่า 95% ของโครงการนำร่อง Generative AI ในบริษัทต่างๆ ล้มเหลวในการนำไปสู่การใช้งานจริง ขณะที่การศึกษาของ Salesforce เองแสดงให้เห็นว่า Large Language Models (LLMs) เพียงอย่างเดียวประสบความสำเร็จเพียง 35% ในสถานการณ์ธุรกิจที่ซับซ้อน

CRMArena-Pro: สภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent

CRMArena-Pro เป็นความพยายามของ Salesforce ในการลดช่องว่างระหว่างสิ่งที่ AI สัญญาว่าจะทำได้กับประสิทธิภาพที่เกิดขึ้นจริง ต่างจากมาตรฐานการทดสอบทั่วไปที่มีอยู่ แพลตฟอร์มนี้ประเมิน Agent บนงานองค์กรจริง เช่น การยกระดับบริการลูกค้า การคาดการณ์ยอดขาย และการจัดการปัญหาห่วงโซ่อุปทาน โดยใช้ข้อมูลธุรกิจสังเคราะห์ที่สมจริง

"หากข้อมูลสังเคราะห์ไม่ได้ถูกสร้างขึ้นอย่างระมัดระวัง อาจนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดหรือมองโลกในแง่ดีเกินไปเกี่ยวกับประสิทธิภาพของ Agent ของคุณในสภาพแวดล้อมจริง" Jason Wu ผู้จัดการวิจัยที่ Salesforce ซึ่งนำทีมพัฒนา CRMArena-Pro อธิบาย

แพลตฟอร์มนี้ทำงานภายในสภาพแวดล้อมการผลิตจริงของ Salesforce แทนที่จะเป็นการจำลองอย่างง่าย โดยใช้ข้อมูลที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญที่มีประสบการณ์ธุรกิจที่เกี่ยวข้อง รองรับทั้งสถานการณ์ธุรกิจกับธุรกิจ (B2B) และธุรกิจกับผู้บริโภค (B2C) และสามารถจำลองการสนทนาหลายรอบที่จับพลวัตการสื่อสารจริง

เกณฑ์มาตรฐานห้าประการสำหรับ AI Agent ที่พร้อมใช้งานในองค์กร

ควบคู่ไปกับสภาพแวดล้อมจำลอง Salesforce ได้แนะนำ Agentic Benchmark for CRM ซึ่งออกแบบมาเพื่อประเมิน AI Agent ตามเกณฑ์วัดที่สำคัญห้าประการสำหรับองค์กร: ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม

เกณฑ์ด้านความยั่งยืนมีความโดดเด่นเป็นพิเศษ ช่วยให้บริษัทต่างๆ ปรับขนาดโมเดลให้เหมาะกับความซับซ้อนของงานเพื่อลดผลกระทบต่อสิ่งแวดล้อม ในขณะที่ยังคงรักษาประสิทธิภาพ "ด้วยการตัดสัญญาณรบกวนจากโมเดลที่มากเกินไป เกณฑ์มาตรฐานนี้ให้วิธีที่ชัดเจนและอิงข้อมูลแก่ธุรกิจในการจับคู่โมเดลที่เหมาะสมกับ Agent ที่เหมาะสม" บริษัทระบุ

การรวมข้อมูลเพื่อ AI ที่เชื่อถือได้

โครงการที่สามมุ่งเน้นไปที่ข้อกำหนดพื้นฐานสำหรับ AI ที่เชื่อถือได้: ข้อมูลที่สะอาดและเป็นเอกภาพ ความสามารถ Account Matching ของ Salesforce ใช้โมเดลภาษาที่ปรับแต่งเพื่อระบุและรวมบันทึกที่ซ้ำซ้อนข้ามระบบโดยอัตโนมัติ สามารถรู้ได้ว่า "The Example Company, Inc." และ "Example Co." เป็นองค์กรเดียวกัน

ลูกค้าผู้ให้บริการคลาวด์รายใหญ่รายหนึ่งประสบความสำเร็จในการจับคู่ 95% โดยใช้เทคโนโลยีนี้ ช่วยให้ทีมขายประหยัดเวลา 30 นาทีต่อการเชื่อมต่อ โดยไม่ต้องสลับหลายหน้าจอด้วยตนเองเพื่อระบุบัญชี

ความกังวลด้านความปลอดภัยและช่องว่างระหว่างการสาธิต AI กับความเป็นจริงขององค์กร

การประกาศเหล่านี้เกิดขึ้นท่ามกลางความกังวลด้านความปลอดภัยที่เพิ่มขึ้นหลังจากแคมเปญขโมยข้อมูลที่ส่งผลกระทบต่อองค์กรลูกค้า Salesforce มากกว่า 700 แห่งเมื่อต้นเดือนนี้ แฮกเกอร์ได้ใช้ประโยชน์จาก OAuth token จาก Salesloft's Drift chat agent เพื่อเข้าถึงระบบ Salesforce และขโมยข้อมูลประจำตัวสำหรับ AWS, Snowflake และแพลตฟอร์มอื่นๆ

โครงการจำลองและการวัดมาตรฐานสะท้อนให้เห็นถึงการตระหนักอย่างกว้างขวางว่า การนำ AI ไปใช้ในองค์กรต้องการมากกว่าวิดีโอสาธิตที่น่าประทับใจ สภาพแวดล้อมธุรกิจจริงมีซอฟต์แวร์เก่า รูปแบบข้อมูลที่ไม่สม่ำเสมอ และกระบวนการทำงานที่ซับซ้อนซึ่งสามารถทำให้แม้แต่ระบบ AI ที่ซับซ้อนล้มเหลวได้

แนวทางของ Salesforce เน้นย้ำความจำเป็นที่ AI Agent ต้องทำงานได้อย่างเชื่อถือได้ในสถานการณ์ที่หลากหลาย มากกว่าการเชี่ยวชาญเฉพาะในงานแคบๆ แนวคิด "Enterprise General Intelligence" (EGI) ของบริษัทมุ่งเน้นการสร้าง Agent ที่ทั้งมีความสามารถและทำงานได้อย่างสม่ำเสมอในการจัดการงานธุรกิจที่ซับซ้อน

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจการนำ AI ไปใช้ในองค์กร เนื่องจากเผยให้เห็นปัญหาสำคัญที่หลายองค์กรกำลังเผชิญ - นั่นคือ 95% ของโครงการนำร่อง AI ไม่สามารถนำไปใช้งานจริงได้ Salesforce กำลังนำเสนอวิธีแก้ปัญหาที่น่าสนใจผ่าน 'เครื่องจำลองการบิน' สำหรับ AI Agent ซึ่งอาจเป็นจุดเปลี่ยนสำคัญในการพัฒนาและทดสอบ AI ให้พร้อมสำหรับการใช้งานจริงในองค์กร ข่าวนี้จึงมีประโยชน์อย่างมากสำหรับผู้บริหารและทีม IT ที่กำลังวางแผนนำ AI มาใช้ในองค์กร

ข้อมูลอ้างอิงจาก https://venturebeat.com/ai/salesforce-builds-flight-simulator-for-ai-agents-as-95-of-enterprise-pilots-fail-to-reach-production/?utm_source=flipboard&utm_content=venturebeat/magazine/AI

Read more

OpenAI เปิดตัวฟีเจอร์ 'ChatGPT Health' พร้อมการเชื่อมต่อกับ Apple Health

news

OpenAI เปิดตัวฟีเจอร์ 'ChatGPT Health' พร้อมการเชื่อมต่อกับ Apple Health

OpenAI เปิดตัว ChatGPT Health ฟีเจอร์ใหม่ที่เชื่อมต่อกับ Apple Health และแพลตฟอร์มสุขภาพอื่นๆ พัฒนาร่วมกับแพทย์กว่า 260 คน จาก 60 ประเทศ เน้นความปลอดภัยและความเป็นส่วนตัว โดยไม่นำข้อมูลไปฝึกโมเดล AI

By
CIO จะรับมือกับภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI ได้อย่างไร

news

CIO จะรับมือกับภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI ได้อย่างไร

ภัยคุกคามทางไซเบอร์ที่ขับเคลื่อนด้วย AI กำลังเพิ่มความเสี่ยงให้องค์กร โดยเฉพาะในภาคสาธารณสุข CIO ต้องสร้างสมดุลระหว่างความปลอดภัยกับนวัตกรรม ผ่านการฝึกอบรมพนักงาน การใช้เทคโนโลยี Zero Trust และการยืนยันตัวตนหลายปัจจัย

By
วุฒิสมาชิกเรียกร้องคำตอบเกี่ยวกับของเล่น AI จากผู้ผลิตชั้นนำ

news

วุฒิสมาชิกเรียกร้องคำตอบเกี่ยวกับของเล่น AI จากผู้ผลิตชั้นนำ

วุฒิสมาชิก Blackburn และ Blumenthal เรียกร้องข้อมูลจากผู้ผลิตของเล่น AI รายใหญ่ 6 บริษัท เกี่ยวกับนโยบายการแชร์ข้อมูล การทดสอบผลกระทบต่อเด็ก และมาตรการป้องกันเนื้อหาไม่เหมาะสม หลังพบว่าของเล่นบางชิ้นมีส่วนร่วมในการสนทนาที่มีเนื้อหาทางเพศ

By
คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

news

คนทำงานมากขึ้นใช้ AI แต่ไม่รู้ว่านายจ้างใช้ด้วยหรือไม่ - ทำไมนี่จึงเป็นปัญหา

การสำรวจล่าสุดจาก Gallup พบว่า 45% ของคนทำงานใช้ AI อย่างน้อยปีละครั้ง แต่เกือบ 1 ใน 4 ไม่ทราบว่าองค์กรของตนมีการนำ AI มาใช้หรือไม่ สะท้อนช่องว่างการสื่อสารระหว่างผู้บริหารกับพนักงาน ขณะที่การใช้ AI ในแต่ละอุตสาหกรรมมีความแตกต่างกันอย่างชัดเจน

By