สวัสดีครับ นี่คือ บทความแรกของ MePromptHub เลยขอหยิบเอาเรื่องสุดฮอตที่กำลังถูกพูดถึงกันอยู่ในตอนนี้มาก่อน สำหรับ Sora โมเดลสร้างวิดีโอจากข้อความของ OpenAI
ในบล็อกนี้ ผมจะสรุปให้ทราบว่า Sora คืออะไร ทำอะไรได้บ้าง ทำงานยังไง แล้วทำไมถึงสำคัญ มาลองอ่านกันดูครับ
ยาวไปไม่อ่าน; งั้นสรุปให้ก่อน
- Sora คือโมเดลปัญญาประดิษฐ์ (AI) จาก OpenAI ที่สามารถสร้างวิดีโอได้แบบสมจริง
- หรือจะ Generate ออกมาแบบเว่อร์วังอลังการก็ทำได้ แล้วแต่ Prompt หรือคำสั่งที่เราป้อนเข้าไป
- สามารถเจนวิดีโอจากข้อความ, รูปภาพ และวิดีโอได้ และทำตามคำสั่งได้อย่างละเอียด
- Sora ถือเป็นความก้าวหน้าครั้งใหญ่ในการสร้างและจำลองวิดีโอ แต่ยังจำกัดให้ใช้เฉพาะกลุ่มเท่านั้น ยังไม่มีแผนให้ใช้โดยทั่วไปครับ
Sora คืออะไร?
https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP
— Sam Altman (@sama) February 15, 2024
Sora แปลว่า “ท้องฟ้า” ในภาษาญี่ปุ่น เป็นโมเดลที่สามารถสร้างวิดีโอความยาวสูงสุดหนึ่งนาทีที่ตรงกับคำสั่งของผู้ใช้ทั้งในด้านเนื้อหาและรูปแบบ ตัวอย่างเช่น เราสามารถสั่งให้ Sora สร้างตัวอย่างภาพยนตร์ที่มีนักบินอวกาศสวมหมวกสีแดง หรือสารคดีธรรมชาติเกี่ยวกับนกเพนกวินได้ Sora ยังสามารถทำให้ภาพหรือวิดีโอที่มีอยู่แล้วเคลื่อนไหว ขยายเติมภาพส่วนที่ขาดหาย หรือทำตามคำสั่งอย่างละเอียดได้ครับ
Sora ทำงานโดยใช้โมเดลแบบแพร่กระจาย โดยจะเริ่มต้นด้วยวิดีโอคล้ายสัญญาณรบกวน (Noise) แล้วค่อยๆ ปรับแต่ง (Denoise) จนตรงกับคำสั่งของผู้ใช้ โดยใช้โครงข่าย Transformer ในการจัดรูปแบบข้อความความและตัวล้างสัญญาณวิดีโอ (decompressor) ในการเปลี่ยนพื้นที่ที่รอข้อมูลใหม่ (latent space) เป็นพื้นที่ปกติ Sora ยังใช้เทคนิคการใส่คำบรรยายภาพใหม่ โดยจะสร้างคำบรรยายที่ดียิ่งขึ้นสำหรับวิดีโอที่ไม่มีคำบรรยายที่ดีมาตั้งแต่แรกครับ
Sora ได้รับการฝึกฝนด้วยวิดีโอสาธารณะทั่วไป รวมถึงวิดีโอที่มีลิขสิทธิ์ที่ได้รับอนุญาต แต่ OpenAI ไม่ได้เปิดเผยจำนวน หรือแหล่งที่มาที่แน่ชัดของวิดีโอทั้งหมด OpenAI แสดงวิดีโอความละเอียดสูงที่สร้างโดย Sora จำนวนหนึ่งต่อสาธารณชนในวันที่ 15 กุมภาพันธ์ 2024 โดยระบุว่าระบบเทคโนโลยีนี้สามารถสร้างวิดีโอความยาวถึงหนึ่งนาทีได้ บริษัทได้แบ่งปันรายงานทางเทคนิคในภายหลังโดยเน้นถึงวิธีการที่ใช้ในการฝึกโมเดล และเพื่อให้สามารถสร้างวิดีโอได้
Introducing Sora, our text-to-video model.
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
— OpenAI (@OpenAI) February 15, 2024
ทำไม Sora ถึงสำคัญ?
Sora คือความก้าวหน้าที่สำคัญในการสร้างและการจำลองวิดีโอ เพราะแสดงให้เห็นทั้งคุณภาพและความหลากหลายที่จำเป็นสำหรับแอปพลิเคชันวิดีโอที่ใช้งานได้จริง สามารถช่วยแก้ปัญหาต่างๆ สำหรับผู้ที่ต้องการสร้างสื่อสำหรับโลกแห่งความเป็นจริง เช่น ด้านการศึกษา บันเทิง ศิลปะ และงานวิจัย Sora ยังมีศักยภาพแห่งความคิดสร้างสรรค์และการแสดงออกรูปแบบใหม่ ๆ เช่น การเล่าเรื่องที่ดีกว่า ความเข้าใจในการทำวิดีโอ สไตล์ที่หลากหลาย
Sora ยังมีความท้าทายและความเสี่ยง เนื่องจากทำให้เกิดประเด็นทางจริยธรรมและสังคมที่เกี่ยวข้องกับการใช้เทคโนโลยีนี้ในทางที่ผิด สามารถสร้างชิ้นงานบิดเบือน โฆษณาชวนเชื่อ และ deepfakes บนโลกออนไลน์ ซึ่งสามารถบ่อนทำลายความไว้วางใจและความมั่นคงได้
Sora ยังอาจทำชิ้นงานที่ละเมิดลิขสิทธิ์ ความเป็นส่วนตัว ซึ่งอาจทำร้ายสิทธิและผลประโยชน์ของผู้สร้างสรรค์และต้นแบบงาน รวมถึงอาจมีผลที่คาดไม่ถึงและไม่ได้ไตร่ตรองไว้ล่วงหน้า เช่นการเลือกข้าง ความไม่เป็นธรรม และเกิดอันตราย จึงทำให้ Sora ในตอนนี้ยังอยู่ในขั้นของการทดสอบและควบคุมอยู่ครับ
Sora ถูกทดสอบและควบคุมยังไง?
OpenAI ระบุว่าไม่มีแผนจะปล่อย Sora สู่สาธารณะเนื่องจากมีความกังวลว่า Sora อาจถูกนำไปใช้ในทางที่ผิด บริษัทอนุญาตให้กลุ่มย่อยขนาดเล็กที่รวมถึงนักวิชาการและนักวิจัยที่ได้รับอนุญาตให้ใช้งาน Sora ได้ในช่วงนี้ถูกเรียกว่า Red Team เข้าถึงได้โดยมีเป้าหมายประเมินอันตรายและความเสี่ยงที่อาจเกิดขึ้นจาก Sora วิดีโอที่สร้างโดย Sora จะถูกแท็กด้วย ข้อมูล Metadata C2PA เพื่อระบุว่าถูกสร้างด้วย AI เพื่อช่วยตรวจจับเนื้อหาที่อาจนำไปสู่ความเข้าใจผิด
นอกจากนี้ OpenAI ยังแบ่งปัน Sora กับกลุ่มคนทำงานสร้างสรรค์มืออาชีพขนาดเล็ก ซึ่งรวมถึงผู้สร้างวิดีโอและศิลปิน เพื่อขอคำติชมเกี่ยวกับประโยชน์และผลกระทบของมัน แซม อัลท์แมน CEO ของ OpenAI ยังเชิญชวนให้ประชาชนทั่วไปส่งคำสั่งให้กับ Sora หรือ เสนอแนะไอเดียของตัวเอง ซึ่งสามารถช่วยปรับปรุงโมเดลและสร้างแรงบันดาลใจให้เกิดการใช้งานรูปแบบใหม่ ๆ ได้
we’d like to show you what sora can do, please reply with captions for videos you’d like to see and we’ll start making some!
— Sam Altman (@sama) February 15, 2024
ทวีตของ แซม อัลท์แมน ที่เชิญชวนให้คนลองเสนอไอเดียในการสร้างวิดีโอผ่าน Sora
บทสรุป
Sora คือโมเดลการสร้างวิดีโอจากข้อความที่น่าประทับใจและล้ำสมัย ซึ่งสร้างวิดีโอที่สมจริงและมีความคิดสร้างสรรค์จากคำอธิบายที่เป็นข้อความ นอกจากนี้ Sora ยังสามารถปรับเปลี่ยนภาพหรือวิดีโอที่มีอยู่แล้วให้เคลื่อนไหวได้ในแบบที่ต้องการ ขยายเติมภาพส่วนที่ขาดหาย หรือทำตามคำสั่งอย่างละเอียดได้อีกด้วย Sora เป็นความก้าวหน้าในการสร้างและจำลองวิดีโอ แต่ก็มีอุปสรรค และความกังวลด้านความเสี่ยงบางอย่างเช่นกัน Sora กำลังถูกทดสอบและควบคุมโดย OpenAI และพันธมิตร ทีมทดสอบ Red Team ที่พยายามทดสอบ วิจัยให้มั่นใจว่าเทคโนโลยีนี้จะถูกใช้อย่างปลอดภัยและไม่มีปัญหาตามมา
หวังว่าเพื่อนๆจะสนุก และได้รู้จัก Sora มากขึ้นนะครับ ถ้ามีคำถามหรือข้อเสนอแนะใด ๆ บอก Comment บอกกันได้เลยน้า แล้วเจอกันบทความหน้าครับ 😊