Amazon เปิดตัว Nova Act เอเจนต์ AI ที่ควบคุมเว็บเบราว์เซอร์ได้

Amazon เปิดตัว Nova Act เอเจนต์ AI ที่ควบคุมเว็บเบราว์เซอร์ได้อัตโนมัติ พร้อม SDK สำหรับนักพัฒนา โดยจะเป็นส่วนสำคัญของ Alexa+ ที่กำลังจะเปิดตัว แข่งขันกับ OpenAI และ Anthropic ในตลาดเอเจนต์ AI

Amazon เปิดตัว Nova Act เอเจนต์ AI ที่ควบคุมเว็บเบราว์เซอร์ได้

Key takeaway

  • Nova Act เป็นเอเจนต์ AI ตัวใหม่จาก Amazon ที่สามารถควบคุมเว็บเบราว์เซอร์และทำงานอัตโนมัติพื้นฐานได้ โดยจะเป็นส่วนสำคัญของ Alexa+ ที่กำลังจะเปิดตัวในอนาคต
  • Amazon อ้างว่า Nova Act มีประสิทธิภาพสูงกว่าคู่แข่งอย่าง OpenAI และ Anthropic โดยได้คะแนน 94% ใน ScreenSpot Web Text test ซึ่งสูงกว่าคู่แข่งที่ได้ 88% และ 90% ตามลำดับ
  • Nova Act พัฒนาโดยห้องปฏิบัติการ AGI ของ Amazon ที่นำโดย David Luan และ Pieter Abbeel อดีตนักวิจัยจาก OpenAI โดยมีเป้าหมายในการสร้างระบบ AI ที่สามารถช่วยมนุษย์ทำงานบนคอมพิวเตอร์ได้ทุกอย่าง

Amazon เปิดตัว Nova Act เมื่อวันจันทร์ ซึ่งเป็นเอเจนต์ AI อเนกประสงค์ที่สามารถควบคุมเว็บเบราว์เซอร์และทำงานพื้นฐานได้โดยอัตโนมัติ พร้อมกันนี้ บริษัทยังได้เปิดตัว Nova Act SDK ชุดเครื่องมือสำหรับนักพัฒนาในการสร้างต้นแบบเอเจนต์ด้วยเทคโนโลยีดังกล่าว

Nova Act พัฒนาโดยห้องปฏิบัติการ AGI ของ Amazon ที่เพิ่งเปิดในซานฟรานซิสโก จะเป็นกำลังสำคัญในการขับเคลื่อนฟีเจอร์หลักของ Alexa+ ที่กำลังจะเปิดตัว ซึ่งเป็นเวอร์ชันของผู้ช่วยเสียงยอดนิยมที่เสริมด้วย generative AI อย่างไรก็ตาม เวอร์ชันของ Nova Act ที่เปิดให้ใช้งานวันนี้ยังไม่สมบูรณ์ โดย Amazon ระบุว่าเป็นเพียง "research preview" เท่านั้น

นักพัฒนาสามารถเข้าถึงชุดเครื่องมือ Nova Act ได้ที่เว็บไซต์ nova.amazon.com ซึ่งยังทำหน้าที่เป็นศูนย์รวมโมเดลพื้นฐาน Nova ต่างๆ ของ Amazon

Nova Act เป็นความพยายามของ Amazon ในการแข่งขันกับ OpenAI's Operator และ Anthropic's Computer Use ด้วยเทคโนโลยีเอเจนต์ AI อเนกประสงค์ของตัวเอง บริษัทเทคโนโลยีชั้นนำเชื่อว่าเอเจนต์ AI ที่สามารถท่องเว็บแทนผู้ใช้จะทำให้แชทบอท AI ในปัจจุบันมีประโยชน์มากขึ้นอย่างมีนัยสำคัญ

แม้ Amazon อาจไม่ใช่รายแรกที่พัฒนาเทคโนโลยีประเภทนี้ แต่ผ่าน Alexa+ บริษัทอาจสามารถเข้าถึงผู้ใช้ได้กว้างที่สุด

Amazon ระบุว่านักพัฒนาที่ใช้ Nova Act SDK สามารถสร้างเอเจนต์ที่ทำงานพื้นฐานแทนผู้ใช้ได้โดยอัตโนมัติ เช่น สั่งอาหารจาก Sweetgreen หรือจองร้านอาหาร ด้วยชุดเครื่องมือดังกล่าว นักพัฒนาสามารถรวมฟีเจอร์ที่ช่วยให้เอเจนต์ AI นำทางหน้าเว็บ กรอกแบบฟอร์ม หรือเลือกวันที่ในปฏิทินได้

Amazon อ้างว่า Nova Act มีประสิทธิภาพเหนือกว่าเอเจนต์จาก OpenAI และ Anthropic ในการทดสอบภายใน โดยใน ScreenSpot Web Text ซึ่งวัดการโต้ตอบกับข้อความบนหน้าจอ Nova Act ได้คะแนน 94% สูงกว่า OpenAI's CUA (88%) และ Anthropic's Claude 3.7 Sonnet (90%) อย่างไรก็ตาม Amazon ไม่ได้ทดสอบด้วยการประเมินที่พบบ่อย เช่น WebVoyager

Nova Act เป็นผลิตภัณฑ์สาธารณะชิ้นแรกจากห้องปฏิบัติการ AGI ของ Amazon ซึ่งนำโดย David Luan และ Pieter Abbeel อดีตนักวิจัยจาก OpenAI ทั้งคู่เคยก่อตั้งสตาร์ทอัพมาก่อน โดย Luan ก่อตั้ง Adept ส่วน Abbeel ร่วมก่อตั้ง Covariant ก่อนที่ Amazon จะจ้างพวกเขาเมื่อปีที่แล้วเพื่อนำทีมพัฒนาเอเจนต์ AI

Luan เผยกับ TechCrunch ว่าเขามองเอเจนต์เป็นขั้นตอนสำคัญสู่การสร้างระบบ AI ที่ฉลาดเหนือมนุษย์ โดยนิยาม AGI ว่าเป็น "ระบบ AI ที่สามารถช่วยคุณทำทุกอย่างที่มนุษย์ทำบนคอมพิวเตอร์" ทีมของเขาออกแบบ Nova Act SDK ให้ทำงานสั้นๆ ง่ายๆ ได้อย่างน่าเชื่อถือ พร้อมเครื่องมือสำหรับนักพัฒนาในการกำหนดจุดที่ต้องการให้มนุษย์เข้ามาแทรกแซงในเวิร์กโฟลว์

ปัญหาใหญ่ของเอเจนต์ AI รุ่นแรกๆ จาก OpenAI, Google และ Anthropic คือความน่าเชื่อถือในสถานการณ์ที่แตกต่างกัน ในการทดสอบของ TechCrunch พบว่าระบบเหล่านี้ทำงานช้า มีปัญหาในการทำงานอิสระเป็นเวลานาน และมักทำผิดพลาดในจุดที่มนุษย์จะไม่ทำ เร็วๆ นี้เราจะได้เห็นว่า Amazon จะแก้ปัญหานี้ได้หรือไม่ หรือจะประสบปัญหาเดียวกับคู่แข่ง

Why it matters

💡 ข่าวนี้มีความสำคัญอย่างยิ่งสำหรับผู้ที่สนใจด้านเทคโนโลยี AI และการพัฒนาซอฟต์แวร์ เนื่องจาก Nova Act ของ Amazon เป็นการก้าวกระโดดครั้งสำคัญในวงการ AI Agent ที่สามารถควบคุมเว็บเบราว์เซอร์ได้โดยอัตโนมัติ ซึ่งจะส่งผลกระทบต่อการพัฒนาแอปพลิเคชันและการใช้งาน AI ในอนาคต โดยเฉพาะอย่างยิ่งเมื่อ Amazon เปิดให้นักพัฒนาสามารถเข้าถึง SDK เพื่อสร้างโซลูชันของตนเอง ทำให้เกิดโอกาสใหม่ๆ ในการพัฒนานวัตกรรมด้าน AI

ข้อมูลอ้างอิงจาก https://techcrunch.com/2025/03/31/amazon-unveils-nova-act-an-ai-agent-that-uses-a-web-browser/

Read more

CIO กังวลความเสี่ยงด้านความปลอดภัยพุ่งสูง ท่ามกลางกระแสการนำ AI มาใช้งานในองค์กร

news

CIO กังวลความเสี่ยงด้านความปลอดภัยพุ่งสูง ท่ามกลางกระแสการนำ AI มาใช้งานในองค์กร

รายงาน Logicalis เผย 57% ของ CIO ทั่วโลกกังวลพนักงานใช้ AI สร้างความเสี่ยงด้าน Data Security ขณะที่ 94% ระบุองค์กรขาดแคลน Cybersecurity Skills และมีเพียง 37% ที่มี Visibility ติดตามการใช้งาน AI ในองค์กรได้จริง

By
5 วิธีใช้ AI อย่างคุ้มค่าเมื่องบประมาณมีจำกัด

news

5 วิธีใช้ AI อย่างคุ้มค่าเมื่องบประมาณมีจำกัด

ไม่ต้องใช้งบมหาศาลก็สามารถเริ่มต้นกับ AI ได้ ผู้เชี่ยวชาญแนะนำ 5 วิธี ตั้งแต่การใช้ Tool ที่มีอยู่แล้ว Open-Source Cloud Services ไปจนถึงการมุ่งเน้น Outcome และคงความยืดหยุ่นต่อการเปลี่ยนแปลง

By
AI Agents แพร่กระจายทั่วองค์กร 94% ห่วง AI Sprawl เสี่ยงซับซ้อน-ละเมิดความปลอดภัย

news

AI Agents แพร่กระจายทั่วองค์กร 94% ห่วง AI Sprawl เสี่ยงซับซ้อน-ละเมิดความปลอดภัย

OutSystems เผยผลสำรวจ IT Leaders กว่า 1,900 ราย พบ 96% ขององค์กรใช้ AI Agents แล้ว แต่ 94% กังวล AI Sprawl เพิ่มความเสี่ยงด้าน Security มีเพียง 12% ที่มี Centralized Platform รับมือปัญหานี้อย่างจริงจัง

By
Claude, OpenClaw และความเป็นจริงใหม่: ยุค AI Agents มาถึงแล้ว — พร้อมกับความท้าทายที่ต้องเผชิญ

news

Claude, OpenClaw และความเป็นจริงใหม่: ยุค AI Agents มาถึงแล้ว — พร้อมกับความท้าทายที่ต้องเผชิญ

ยุค Agentic AI มาถึงแล้ว! Claude Cowork, OpenClaw และ Google Antigravity กำลังปฏิวัติการทำงาน แต่ก็มาพร้อมความเสี่ยงด้าน Governance และ Responsible AI ที่ทุกภาคส่วนต้องร่วมกันรับมืออย่างจริงจัง

By