ElevenLabs เปิดตัว “Reader” AI ที่รองรับ 32 ภาษา สำหรับสร้างและแก้ไขเสียง

ElevenLabs เปิดตัว AI Reader รองรับ 32 ภาษา พร้อมฟีเจอร์สุดล้ำในการสร้างและแก้ไขเสียง

ElevenLabs เปิดตัว “Reader” AI ที่รองรับ 32 ภาษา สำหรับสร้างและแก้ไขเสียง

Key takeaway

  • ElevenLabs เปิดตัวแอป Reader ที่รองรับ 32 ภาษา สำหรับสร้างและแก้ไขเสียง AI
  • แอปนี้ช่วยให้ผู้ใช้สามารถอัปโหลดเนื้อหาข้อความและฟังในภาษาและเสียงที่หลากหลาย
  • ElevenLabs ได้เพิ่มเสียงใหม่หลายร้อยเสียงและได้ license เสียงของนักแสดงชื่อดังสำหรับใช้ในแอป
  • การรองรับภาษาที่เพิ่มขึ้นถูกขับเคลื่อนโดย Turbo v2.5 model ซึ่งช่วยปรับปรุงคุณภาพและลดการดีเลย์ของเสียง

ElevenLabs สตาร์ทอัพผู้พัฒนาเครื่องมือ AI สำหรับสร้างและแก้ไข synthetic voices กำลังทำให้แอป Reader ของพวกเขาพร้อมใช้งานทั่วโลก โดยรองรับถึง 32 ภาษา

แอปนี้เปิดตัวครั้งแรกในเดือนมิถุนายนที่สหรัฐอเมริกา สหราชอาณาจักร และแคนาดา ช่วยให้ผู้ใช้ สามารถอัปโหลดเนื้อหาข้อความใดๆ เช่น บทความ เอกสาร PDF หรือ e-books แล้วฟังในภาษาและเสียงที่แตกต่างกัน ตอนนี้ Reader รองรับภาษาต่างๆถึง 32 ภาษา รวมถึงโปรตุเกส สเปน ฝรั่งเศส ฮินดี เยอรมัน ญี่ปุ่น อาหรับ เกาหลี อิตาลี ทมิฬ และสวีเดน

ElevenLabs ซึ่งกลายเป็น unicorn ในปีนี้ หลังระดมทุน 80 ล้านดอลลาร์จากนักลงทุน รวมถึง Andreessen Horowitz , Rabbit r1 รวมเครื่องมือค้นหาที่ขับเคลื่อนด้วย AI อย่าง Perplexity และแพลตฟอร์มอย่าง Pocket FM และ Kuku FM

ElevenLabs กล่าวว่า เมื่อเดือนที่แล้วพวกเขาได้เพิ่มเสียงใหม่หลายร้อยเสียงจากไลบรารีที่เหมาะกับภาษาต่างๆ นอกจากนี้ บริษัทยังได้ license เสียงของนักแสดงอย่าง Judy Garland, James Dean, Burt Reynolds และ Sir Laurence Olivier สำหรับใช้ในแอปนี้

การรองรับภาษาที่ถูกพัฒนาขึ้นของแอป Reader ถูกขับเคลื่อนโดย Turbo v2.5 model ซึ่งช่วยลด การดีเลย์ของเสียง ในการแปลง text-to-speech และปรับปรุงคุณภาพ และยังเพิ่มคุณสมบัติอื่นๆ ให้กับแอป เช่น การรองรับแบบ offline และความสามารถในการแชร์ไฟล์ audio

คู่แข่งที่ใกล้เคียงที่สุดของแอป Reader คือ Speechify ซึ่งมีคุณสมบัติเพิ่มเติม เช่น การสแกนเอกสารเพื่อหาข้อความ การทำ integrations กับ Gmail และ Canvas รวมถึงการให้ผู้ใช้ clone เสียงของตัวเองเพื่ออ่านข้อความ แอปเสียงของ Mozilla ที่เป็นเจ้าของ Pocket และ Audm-based ของ The New York Times ก็ช่วยให้ผู้ใช้ฟังเนื้อหาได้เช่นกัน

Why it matters

💡
ข่าวนี้น่าสนใจสำหรับผู้ที่ต้องการติดตามความก้าวหน้าล่าสุดในเทคโนโลยี AI และการประมวลผลภาษาธรรมชาติ ElevenLabs กำลังขยายขอบเขตของเทคโนโลยีเสียงสังเคราะห์ด้วยการรองรับหลายภาษาและเสียงที่หลากหลาย ซึ่งอาจส่งผลกระทบต่อวิธีที่เราบริโภคเนื้อหาดิจิทัลในอนาคต นอกจากนี้ ยังแสดงให้เห็นถึงการแข่งขันที่เพิ่มขึ้นในตลาดแอปพลิเคชันเสียง AI ซึ่งอาจนำไปสู่นวัตกรรมและการพัฒนาผลิตภัณฑ์ที่น่าตื่นเต้นยิ่งขึ้น

ข้อมูลอ้างอิงจาก ElevenLabs’ text-to-speech app Reader is now available globally

Read more

ภาพแสดงถึงการวิจัยที่ชี้ให้เห็นว่า AI สามารถสร้างข้อมูลเท็จได้ มีภาพหน้ากากหุ่นยนต์ที่มีคำว่า "AI"

News

AI สร้างข้อมูลเท็จ ผลวิจัยชี้ชัด

ผลวิจัยล่าสุดชี้ว่า AI ยังคงสร้างข้อมูลเท็จ โดยเฉพาะชื่อ software packages ที่ไม่มีอยู่จริง ซึ่งอาจนำไปสู่ความเสี่ยงด้านความปลอดภัย นักวิจัยเตือนให้ระมัดระวังในการใช้งาน AI สำหรับงานสำคัญ

By
LinkedIn ใช้ข้อมูลผู้ใช้งานเพื่อฝึก AI สำหรับการสร้างเนื้อหาโดยไม่ได้ขออนุญาตผู้ใช้ล่วงหน้า

News

LinkedIn ใช้ข้อมูลผู้ใช้ฝึก AI โดยไม่ขออนุญาต

LinkedIn ตกเป็นข่าวใหญ่หลังถูกจับได้ว่านำข้อมูลผู้ใช้ไปฝึก AI โดยไม่ขออนุญาต ผู้ใช้สามารถปิดการใช้งานได้ในภายหลัง แต่ข้อมูลที่ถูกนำไปใช้แล้วจะไม่ถูกลบ สะท้อนการแข่งขันด้าน AI ที่ดุเดือดของบริษัทเทคโนโลยี

By
Meta เปิดตัว Llama 3.2 รุ่นใหม่แบบ Open Source เน้นการพัฒนาและปรับปรุงประสิทธิภาพ

News

Meta เปิดตัว Llama 3.2 แบบ Open Source

Meta เปิดตัว Llama 3.2 AI รุ่นใหม่ที่ทำงานบนมือถือได้ มีทั้งหมด 4 รุ่น สามารถวิเคราะห์ภาพและข้อความ เปิดโอกาสให้ผู้ใช้มี AI ส่วนตัวบนอุปกรณ์ โดยไม่ต้องส่งข้อมูลไปยังเซิร์ฟเวอร์

By
ซีอีโอของ OpenAI กล่าวถึงความเป็นไปได้ในการปรับโครงสร้างองค์กร

News

OpenAI อาจปรับโครงสร้าง เพื่อดึงดูดนักลงทุนใหม่

OpenAI กำลังพิจารณาปรับโครงสร้างองค์กรเพื่อดึงดูดนักลงทุนรายใหม่ โดยเฉพาะ MGX จากอาบูดาบี ที่สนใจลงทุนหลายพันล้านดอลลาร์ การเปลี่ยนแปลงนี้อาจส่งผลให้ Microsoft ได้รับส่วนแบ่งความเป็นเจ้าของด้วย

By