Sora คืออะไร ทำไมถึงเป็นกระแส?

Sora คือโมเดลการสร้างวิดีโอจากข้อความที่น่าประทับใจและล้ำสมัย ซึ่งสร้างวิดีโอที่สมจริงและมีความคิดสร้างสรรค์จากคำอธิบายที่เป็นข้อความ นอกจากนี้ Sora ยังสามารถปรับเปลี่ยนภาพหรือวิดีโอที่มีอยู่แล้วให้เคลื่อนไหวได้ในแบบที่ต้องการ ขยายเติมภาพส่วนที่ขาดหาย

By Tattiphong

17/02/2024

0

2914

Sora generated video — ช็อตหนึ่งในวิดีโอที่ถูกสร้างโดย Sora

สวัสดีครับ นี่คือ บทความแรกของ MePromptHub เลยขอหยิบเอาเรื่องสุดฮอตที่กำลังถูกพูดถึงกันอยู่ในตอนนี้มาก่อน สำหรับ Sora โมเดลสร้างวิดีโอจากข้อความของ OpenAI

ในบล็อกนี้ ผมจะสรุปให้ทราบว่า Sora คืออะไร ทำอะไรได้บ้าง ทำงานยังไง แล้วทำไมถึงสำคัญ มาลองอ่านกันดูครับ

ยาวไปไม่อ่าน; งั้นสรุปให้ก่อน

Sora คือโมเดลปัญญาประดิษฐ์ (AI) จาก OpenAI ที่สามารถสร้างวิดีโอได้แบบสมจริง
หรือจะ Generate ออกมาแบบเว่อร์วังอลังการก็ทำได้ แล้วแต่ Prompt หรือคำสั่งที่เราป้อนเข้าไป
สามารถเจนวิดีโอจากข้อความ, รูปภาพ และวิดีโอได้ และทำตามคำสั่งได้อย่างละเอียด
Sora ถือเป็นความก้าวหน้าครั้งใหญ่ในการสร้างและจำลองวิดีโอ แต่ยังจำกัดให้ใช้เฉพาะกลุ่มเท่านั้น ยังไม่มีแผนให้ใช้โดยทั่วไปครับ

Sora คืออะไร?

https://t.co/uCuhUPv51N pic.twitter.com/nej4TIwgaP

— Sam Altman (@sama) February 15, 2024

Sora แปลว่า “ท้องฟ้า” ในภาษาญี่ปุ่น เป็นโมเดลที่สามารถสร้างวิดีโอความยาวสูงสุดหนึ่งนาทีที่ตรงกับคำสั่งของผู้ใช้ทั้งในด้านเนื้อหาและรูปแบบ ตัวอย่างเช่น เราสามารถสั่งให้ Sora สร้างตัวอย่างภาพยนตร์ที่มีนักบินอวกาศสวมหมวกสีแดง หรือสารคดีธรรมชาติเกี่ยวกับนกเพนกวินได้ Sora ยังสามารถทำให้ภาพหรือวิดีโอที่มีอยู่แล้วเคลื่อนไหว ขยายเติมภาพส่วนที่ขาดหาย หรือทำตามคำสั่งอย่างละเอียดได้ครับ

Sora ทำงานโดยใช้โมเดลแบบแพร่กระจาย โดยจะเริ่มต้นด้วยวิดีโอคล้ายสัญญาณรบกวน (Noise) แล้วค่อยๆ ปรับแต่ง (Denoise) จนตรงกับคำสั่งของผู้ใช้ โดยใช้โครงข่าย Transformer ในการจัดรูปแบบข้อความความและตัวล้างสัญญาณวิดีโอ (decompressor) ในการเปลี่ยนพื้นที่ที่รอข้อมูลใหม่ (latent space) เป็นพื้นที่ปกติ Sora ยังใช้เทคนิคการใส่คำบรรยายภาพใหม่ โดยจะสร้างคำบรรยายที่ดียิ่งขึ้นสำหรับวิดีโอที่ไม่มีคำบรรยายที่ดีมาตั้งแต่แรกครับ

Sora ได้รับการฝึกฝนด้วยวิดีโอสาธารณะทั่วไป รวมถึงวิดีโอที่มีลิขสิทธิ์ที่ได้รับอนุญาต แต่ OpenAI ไม่ได้เปิดเผยจำนวน หรือแหล่งที่มาที่แน่ชัดของวิดีโอทั้งหมด OpenAI แสดงวิดีโอความละเอียดสูงที่สร้างโดย Sora จำนวนหนึ่งต่อสาธารณชนในวันที่ 15 กุมภาพันธ์ 2024 โดยระบุว่าระบบเทคโนโลยีนี้สามารถสร้างวิดีโอความยาวถึงหนึ่งนาทีได้ บริษัทได้แบ่งปันรายงานทางเทคนิคในภายหลังโดยเน้นถึงวิธีการที่ใช้ในการฝึกโมเดล และเพื่อให้สามารถสร้างวิดีโอได้

Introducing Sora, our text-to-video model.

Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W

Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf

— OpenAI (@OpenAI) February 15, 2024

ทำไม Sora ถึงสำคัญ?

Sora คือความก้าวหน้าที่สำคัญในการสร้างและการจำลองวิดีโอ เพราะแสดงให้เห็นทั้งคุณภาพและความหลากหลายที่จำเป็นสำหรับแอปพลิเคชันวิดีโอที่ใช้งานได้จริง สามารถช่วยแก้ปัญหาต่างๆ สำหรับผู้ที่ต้องการสร้างสื่อสำหรับโลกแห่งความเป็นจริง เช่น ด้านการศึกษา บันเทิง ศิลปะ และงานวิจัย Sora ยังมีศักยภาพแห่งความคิดสร้างสรรค์และการแสดงออกรูปแบบใหม่ ๆ เช่น การเล่าเรื่องที่ดีกว่า ความเข้าใจในการทำวิดีโอ สไตล์ที่หลากหลาย

Sora ยังมีความท้าทายและความเสี่ยง เนื่องจากทำให้เกิดประเด็นทางจริยธรรมและสังคมที่เกี่ยวข้องกับการใช้เทคโนโลยีนี้ในทางที่ผิด สามารถสร้างชิ้นงานบิดเบือน โฆษณาชวนเชื่อ และ deepfakes บนโลกออนไลน์ ซึ่งสามารถบ่อนทำลายความไว้วางใจและความมั่นคงได้

Sora ยังอาจทำชิ้นงานที่ละเมิดลิขสิทธิ์ ความเป็นส่วนตัว ซึ่งอาจทำร้ายสิทธิและผลประโยชน์ของผู้สร้างสรรค์และต้นแบบงาน รวมถึงอาจมีผลที่คาดไม่ถึงและไม่ได้ไตร่ตรองไว้ล่วงหน้า เช่นการเลือกข้าง ความไม่เป็นธรรม และเกิดอันตราย จึงทำให้ Sora ในตอนนี้ยังอยู่ในขั้นของการทดสอบและควบคุมอยู่ครับ

Sora ถูกทดสอบและควบคุมยังไง?

OpenAI ระบุว่าไม่มีแผนจะปล่อย Sora สู่สาธารณะเนื่องจากมีความกังวลว่า Sora อาจถูกนำไปใช้ในทางที่ผิด บริษัทอนุญาตให้กลุ่มย่อยขนาดเล็กที่รวมถึงนักวิชาการและนักวิจัยที่ได้รับอนุญาตให้ใช้งาน Sora ได้ในช่วงนี้ถูกเรียกว่า Red Team เข้าถึงได้โดยมีเป้าหมายประเมินอันตรายและความเสี่ยงที่อาจเกิดขึ้นจาก Sora วิดีโอที่สร้างโดย Sora จะถูกแท็กด้วย ข้อมูล Metadata C2PA เพื่อระบุว่าถูกสร้างด้วย AI เพื่อช่วยตรวจจับเนื้อหาที่อาจนำไปสู่ความเข้าใจผิด

นอกจากนี้ OpenAI ยังแบ่งปัน Sora กับกลุ่มคนทำงานสร้างสรรค์มืออาชีพขนาดเล็ก ซึ่งรวมถึงผู้สร้างวิดีโอและศิลปิน เพื่อขอคำติชมเกี่ยวกับประโยชน์และผลกระทบของมัน แซม อัลท์แมน CEO ของ OpenAI ยังเชิญชวนให้ประชาชนทั่วไปส่งคำสั่งให้กับ Sora หรือ เสนอแนะไอเดียของตัวเอง ซึ่งสามารถช่วยปรับปรุงโมเดลและสร้างแรงบันดาลใจให้เกิดการใช้งานรูปแบบใหม่ ๆ ได้

we’d like to show you what sora can do, please reply with captions for videos you’d like to see and we’ll start making some!

— Sam Altman (@sama) February 15, 2024

ทวีตของ แซม อัลท์แมน ที่เชิญชวนให้คนลองเสนอไอเดียในการสร้างวิดีโอผ่าน Sora

บทสรุป

Sora คือโมเดลการสร้างวิดีโอจากข้อความที่น่าประทับใจและล้ำสมัย ซึ่งสร้างวิดีโอที่สมจริงและมีความคิดสร้างสรรค์จากคำอธิบายที่เป็นข้อความ นอกจากนี้ Sora ยังสามารถปรับเปลี่ยนภาพหรือวิดีโอที่มีอยู่แล้วให้เคลื่อนไหวได้ในแบบที่ต้องการ ขยายเติมภาพส่วนที่ขาดหาย หรือทำตามคำสั่งอย่างละเอียดได้อีกด้วย Sora เป็นความก้าวหน้าในการสร้างและจำลองวิดีโอ แต่ก็มีอุปสรรค และความกังวลด้านความเสี่ยงบางอย่างเช่นกัน Sora กำลังถูกทดสอบและควบคุมโดย OpenAI และพันธมิตร ทีมทดสอบ Red Team ที่พยายามทดสอบ วิจัยให้มั่นใจว่าเทคโนโลยีนี้จะถูกใช้อย่างปลอดภัยและไม่มีปัญหาตามมา

หวังว่าเพื่อนๆจะสนุก และได้รู้จัก Sora มากขึ้นนะครับ ถ้ามีคำถามหรือข้อเสนอแนะใด ๆ บอก Comment บอกกันได้เลยน้า แล้วเจอกันบทความหน้าครับ 😊

SourceOpenAI

บทความถัดไป

รีวิวโมเดล MagMix Teen V2 Beta1 + Preset Soft Film

Sora คืออะไร ทำไมถึงเป็นกระแส?

ยาวไปไม่อ่าน; งั้นสรุปให้ก่อน

Sora คืออะไร?

ทำไม Sora ถึงสำคัญ?

Sora ถูกทดสอบและควบคุมยังไง?

บทสรุป

รีวิว Higgsfield “Cinema Studio”: เมื่อ AI ยอมให้เราเลือก “รุ่นกล้อง” และ “เลนส์” ได้เหมือนผู้กำกับหนัง!

สรุปการรีวิว Samsung Galaxy S25 Ultra จาก SPIN9, IAUMReview และ Tump Yung

รีวิว Image Playground บน iOS 18.2

Most Popular

รีวิว Higgsfield “Cinema Studio”: เมื่อ AI ยอมให้เราเลือก “รุ่นกล้อง” และ “เลนส์” ได้เหมือนผู้กำกับหนัง!

อัปเดตล่าสุด! Galaxy S24 Beta 5 (ZYC6) แก้ไขบั๊ก และเพิ่มฟีเจอร์ใหม่!

One UI 7 Beta 4 บน S24 มาแล้ว! อัปเดตใหม่มีอะไรบ้าง?

3+1 เหตุผล ทำไม One UI 7 ถึงมาช้ากว่าที่คิด

Recent Comments