Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Salesforce พัฒนาเครื่องจำลองธุรกิจ CRMArena-Pro เพื่อทดสอบ AI Agent ในสถานการณ์จริงก่อนนำไปใช้งาน หลังพบว่าโครงการนำร่องส่วนใหญ่ล้มเหลว พร้อมเปิดตัวเกณฑ์มาตรฐานใหม่ 5 ด้านสำหรับประเมินประสิทธิภาพ

Salesforce สร้าง 'เครื่องจำลองการบิน' สำหรับ AI Agent หลังพบว่า 95% ของโครงการนำร่องในองค์กรไม่สามารถนำไปใช้งานจริงได้

Key takeaway

  • Salesforce พัฒนา CRMArena-Pro เป็นสภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent ก่อนนำไปใช้งานจริง หลังพบว่า 95% ของโครงการนำร่อง AI ในองค์กรไม่สามารถนำไปใช้งานจริงได้ โดยระบบนี้จะจำลองสถานการณ์ธุรกิจที่ซับซ้อนเพื่อเตรียมความพร้อม AI Agent
  • บริษัทได้แนะนำเกณฑ์มาตรฐาน 5 ประการสำหรับประเมิน AI Agent ได้แก่ ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม เพื่อให้องค์กรสามารถเลือกใช้โมเดล AI ที่เหมาะสมกับความต้องการ
  • การพัฒนานี้เกิดขึ้นท่ามกลางความท้าทายด้านความปลอดภัยและการนำ AI ไปใช้งานจริง โดย Salesforce เน้นย้ำว่าการทดสอบในสภาพแวดล้อมจำลองมีความสำคัญ เพราะสภาพแวดล้อมธุรกิจจริงมีความซับซ้อนมากกว่าการสาธิตทั่วไป

Salesforce กำลังเดิมพันว่าการทดสอบในสภาพแวดล้อมธุรกิจจำลองจะแก้ไขปัญหาสำคัญของ AI ในองค์กร นั่นคือ AI Agent ที่แม้จะทำงานได้ดีในการสาธิต แต่กลับล้มเหลวเมื่อเผชิญกับความซับซ้อนในการดำเนินงานจริง

บริษัทยักษ์ใหญ่ด้านซอฟต์แวร์คลาวด์ได้เปิดตัวโครงการวิจัย AI สำคัญสามโครงการในสัปดาห์นี้ หนึ่งในนั้นคือ CRMArena-Pro ซึ่งถูกเรียกว่าเป็น "ดิจิทัลทวิน" ของการดำเนินธุรกิจที่ AI Agent สามารถถูกทดสอบภายใต้สถานการณ์กดดันก่อนนำไปใช้งานจริง การประกาศนี้เกิดขึ้นในช่วงที่องค์กรต่างๆ กำลังประสบปัญหาความล้มเหลวของโครงการนำร่อง AI อย่างแพร่หลาย รวมถึงความกังวลด้านความปลอดภัยใหม่ๆ หลังจากการละเมิดข้อมูลล่าสุดที่ส่งผลกระทบต่อลูกค้า Salesforce หลายร้อยราย

"นักบินไม่ได้เรียนรู้การบินในพายุ พวกเขาฝึกในเครื่องจำลองการบินที่เตรียมความพร้อมสำหรับความท้าทายที่รุนแรงที่สุด" Silvio Savarese หัวหน้านักวิทยาศาสตร์และหัวหน้าวิจัย AI ของ Salesforce กล่าวระหว่างการแถลงข่าว "เช่นเดียวกัน AI Agent ได้รับประโยชน์จากการทดสอบและฝึกฝนในสภาพแวดล้อมจำลอง เพื่อเตรียมพร้อมรับมือกับความไม่แน่นอนของสถานการณ์ธุรกิจประจำวันก่อนนำไปใช้งานจริง"

การมุ่งเน้นการวิจัยครั้งนี้สะท้อนถึงความผิดหวังที่เพิ่มขึ้นขององค์กรต่างๆ กับการนำ AI ไปใช้งาน รายงานล่าสุดจาก MIT พบว่า 95% ของโครงการนำร่อง Generative AI ในบริษัทต่างๆ ล้มเหลวในการนำไปสู่การใช้งานจริง ขณะที่การศึกษาของ Salesforce เองแสดงให้เห็นว่า Large Language Models (LLMs) เพียงอย่างเดียวประสบความสำเร็จเพียง 35% ในสถานการณ์ธุรกิจที่ซับซ้อน

CRMArena-Pro: สภาพแวดล้อมจำลองสำหรับทดสอบ AI Agent

CRMArena-Pro เป็นความพยายามของ Salesforce ในการลดช่องว่างระหว่างสิ่งที่ AI สัญญาว่าจะทำได้กับประสิทธิภาพที่เกิดขึ้นจริง ต่างจากมาตรฐานการทดสอบทั่วไปที่มีอยู่ แพลตฟอร์มนี้ประเมิน Agent บนงานองค์กรจริง เช่น การยกระดับบริการลูกค้า การคาดการณ์ยอดขาย และการจัดการปัญหาห่วงโซ่อุปทาน โดยใช้ข้อมูลธุรกิจสังเคราะห์ที่สมจริง

"หากข้อมูลสังเคราะห์ไม่ได้ถูกสร้างขึ้นอย่างระมัดระวัง อาจนำไปสู่ผลลัพธ์ที่ทำให้เข้าใจผิดหรือมองโลกในแง่ดีเกินไปเกี่ยวกับประสิทธิภาพของ Agent ของคุณในสภาพแวดล้อมจริง" Jason Wu ผู้จัดการวิจัยที่ Salesforce ซึ่งนำทีมพัฒนา CRMArena-Pro อธิบาย

แพลตฟอร์มนี้ทำงานภายในสภาพแวดล้อมการผลิตจริงของ Salesforce แทนที่จะเป็นการจำลองอย่างง่าย โดยใช้ข้อมูลที่ได้รับการตรวจสอบโดยผู้เชี่ยวชาญที่มีประสบการณ์ธุรกิจที่เกี่ยวข้อง รองรับทั้งสถานการณ์ธุรกิจกับธุรกิจ (B2B) และธุรกิจกับผู้บริโภค (B2C) และสามารถจำลองการสนทนาหลายรอบที่จับพลวัตการสื่อสารจริง

เกณฑ์มาตรฐานห้าประการสำหรับ AI Agent ที่พร้อมใช้งานในองค์กร

ควบคู่ไปกับสภาพแวดล้อมจำลอง Salesforce ได้แนะนำ Agentic Benchmark for CRM ซึ่งออกแบบมาเพื่อประเมิน AI Agent ตามเกณฑ์วัดที่สำคัญห้าประการสำหรับองค์กร: ความแม่นยำ, ต้นทุน, ความเร็ว, ความไว้วางใจและความปลอดภัย, และความยั่งยืนด้านสิ่งแวดล้อม

เกณฑ์ด้านความยั่งยืนมีความโดดเด่นเป็นพิเศษ ช่วยให้บริษัทต่างๆ ปรับขนาดโมเดลให้เหมาะกับความซับซ้อนของงานเพื่อลดผลกระทบต่อสิ่งแวดล้อม ในขณะที่ยังคงรักษาประสิทธิภาพ "ด้วยการตัดสัญญาณรบกวนจากโมเดลที่มากเกินไป เกณฑ์มาตรฐานนี้ให้วิธีที่ชัดเจนและอิงข้อมูลแก่ธุรกิจในการจับคู่โมเดลที่เหมาะสมกับ Agent ที่เหมาะสม" บริษัทระบุ

การรวมข้อมูลเพื่อ AI ที่เชื่อถือได้

โครงการที่สามมุ่งเน้นไปที่ข้อกำหนดพื้นฐานสำหรับ AI ที่เชื่อถือได้: ข้อมูลที่สะอาดและเป็นเอกภาพ ความสามารถ Account Matching ของ Salesforce ใช้โมเดลภาษาที่ปรับแต่งเพื่อระบุและรวมบันทึกที่ซ้ำซ้อนข้ามระบบโดยอัตโนมัติ สามารถรู้ได้ว่า "The Example Company, Inc." และ "Example Co." เป็นองค์กรเดียวกัน

ลูกค้าผู้ให้บริการคลาวด์รายใหญ่รายหนึ่งประสบความสำเร็จในการจับคู่ 95% โดยใช้เทคโนโลยีนี้ ช่วยให้ทีมขายประหยัดเวลา 30 นาทีต่อการเชื่อมต่อ โดยไม่ต้องสลับหลายหน้าจอด้วยตนเองเพื่อระบุบัญชี

ความกังวลด้านความปลอดภัยและช่องว่างระหว่างการสาธิต AI กับความเป็นจริงขององค์กร

การประกาศเหล่านี้เกิดขึ้นท่ามกลางความกังวลด้านความปลอดภัยที่เพิ่มขึ้นหลังจากแคมเปญขโมยข้อมูลที่ส่งผลกระทบต่อองค์กรลูกค้า Salesforce มากกว่า 700 แห่งเมื่อต้นเดือนนี้ แฮกเกอร์ได้ใช้ประโยชน์จาก OAuth token จาก Salesloft's Drift chat agent เพื่อเข้าถึงระบบ Salesforce และขโมยข้อมูลประจำตัวสำหรับ AWS, Snowflake และแพลตฟอร์มอื่นๆ

โครงการจำลองและการวัดมาตรฐานสะท้อนให้เห็นถึงการตระหนักอย่างกว้างขวางว่า การนำ AI ไปใช้ในองค์กรต้องการมากกว่าวิดีโอสาธิตที่น่าประทับใจ สภาพแวดล้อมธุรกิจจริงมีซอฟต์แวร์เก่า รูปแบบข้อมูลที่ไม่สม่ำเสมอ และกระบวนการทำงานที่ซับซ้อนซึ่งสามารถทำให้แม้แต่ระบบ AI ที่ซับซ้อนล้มเหลวได้

แนวทางของ Salesforce เน้นย้ำความจำเป็นที่ AI Agent ต้องทำงานได้อย่างเชื่อถือได้ในสถานการณ์ที่หลากหลาย มากกว่าการเชี่ยวชาญเฉพาะในงานแคบๆ แนวคิด "Enterprise General Intelligence" (EGI) ของบริษัทมุ่งเน้นการสร้าง Agent ที่ทั้งมีความสามารถและทำงานได้อย่างสม่ำเสมอในการจัดการงานธุรกิจที่ซับซ้อน

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจการนำ AI ไปใช้ในองค์กร เนื่องจากเผยให้เห็นปัญหาสำคัญที่หลายองค์กรกำลังเผชิญ - นั่นคือ 95% ของโครงการนำร่อง AI ไม่สามารถนำไปใช้งานจริงได้ Salesforce กำลังนำเสนอวิธีแก้ปัญหาที่น่าสนใจผ่าน 'เครื่องจำลองการบิน' สำหรับ AI Agent ซึ่งอาจเป็นจุดเปลี่ยนสำคัญในการพัฒนาและทดสอบ AI ให้พร้อมสำหรับการใช้งานจริงในองค์กร ข่าวนี้จึงมีประโยชน์อย่างมากสำหรับผู้บริหารและทีม IT ที่กำลังวางแผนนำ AI มาใช้ในองค์กร

ข้อมูลอ้างอิงจาก https://venturebeat.com/ai/salesforce-builds-flight-simulator-for-ai-agents-as-95-of-enterprise-pilots-fail-to-reach-production/?utm_source=flipboard&utm_content=venturebeat/magazine/AI

Read more

AI ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปี ได้สมบูรณ์เป็นครั้งแรกในประวัติศาสตร์

news

AI ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปี ได้สมบูรณ์เป็นครั้งแรกในประวัติศาสตร์

AI และเทคโนโลยี Virtual Unwrapping ถอดรหัสม้วนคัมภีร์ Herculaneum อายุ 2,000 ปีสำเร็จเป็นครั้งแรกในประวัติศาสตร์ เผยข้อความปรัชญาโบราณกว่า 140 Columns โดยไม่ทำลายต้นฉบับ

By
นักดนตรีออสเตรเลียส่งเสียงเตือน หลังผลงานของ Nick Cave, Kylie และศิลปินดังอีกมากมายถูกดูดเข้า AI Training Tool

news

นักดนตรีออสเตรเลียส่งเสียงเตือน หลังผลงานของ Nick Cave, Kylie และศิลปินดังอีกมากมายถูกดูดเข้า AI Training Tool

นักดนตรีออสเตรเลียอย่าง Nick Cave, Kylie Minogue และ Darren Hayes พบผลงานถูกดูดเข้า AI Training Dataset โดยไม่ได้รับอนุญาต ขณะที่ APRA AMCOS ประณาม Big Tech ไม่ยอมเจรจา และรัฐบาลออสเตรเลียปฏิเสธข้อยกเว้นกฎหมาย AI แล้ว

By
ซานโฮเซแปลงศาลาว่าการเป็น AI Boot Camp ฝึกพนักงานรัฐกว่า 1,000 คน เชี่ยวชาญ Generative AI

news

ซานโฮเซแปลงศาลาว่าการเป็น AI Boot Camp ฝึกพนักงานรัฐกว่า 1,000 คน เชี่ยวชาญ Generative AI

ซานโฮเซเปิดตัว AI Upskilling Program ฝึกพนักงานภาครัฐกว่า 1,000 คนให้เชี่ยวชาญ Generative AI ผ่านหลักสูตร 10 สัปดาห์ร่วมกับ San José State University ช่วยประหยัดเวลางานได้สูงสุด 20,000 ชั่วโมง

By
LinkedIn เผยผลวิจัยชี้ครึ่งหนึ่งของผู้บริหาร C-Suite ยังไร้ทิศทาง AI — CBO ระบุแนวทางที่ใช้อยู่ไม่ได้ผล

news

LinkedIn เผยผลวิจัยชี้ครึ่งหนึ่งของผู้บริหาร C-Suite ยังไร้ทิศทาง AI — CBO ระบุแนวทางที่ใช้อยู่ไม่ได้ผล

LinkedIn เผยผลสำรวจผู้บริหาร C-Suite กว่า 1,252 คน พบครึ่งหนึ่งขาดความชัดเจนด้าน AI ขณะที่ CBO ชี้การสั่งการแบบ Top-Down ไม่ได้ผล และองค์กรต้องการ Change Management ที่แท้จริง

By