คำพูดล่าสุดของ David Holz ซีอีโอของ Midjourney: AI เป็นส่วนเสริมของตัวเรา

巴比特_

ที่มา: Tencent Technology

เมื่อวันที่ 7 กรกฎาคม David Holz ซีอีโอของ Midjourney พูดในการประชุมปัญญาประดิษฐ์โลกปี 2023 โดยอ้างว่า AI จะกลายเป็นพาหะและเครื่องมือใหม่แห่งความคิดสร้างสรรค์และจินตนาการ ด้วย AI เรามีศักยภาพในการขยายจินตนาการดิบของเผ่าพันธุ์มนุษย์ทั้งหมด เกี่ยวกับชื่อบริษัท Midjouney โฮลซ์กล่าวว่ามาจากแนวคิดทางสายกลางในหนังสือลัทธิเต๋า “จ้วงโจว” เขาเชื่อว่าวรรณกรรมคลาสสิกของจีนได้นำเสนอความคิดที่สวยงามและลึกซึ้งที่สุดมากมาย

ปัจจุบัน Midjouney กำลังพัฒนาเวอร์ชัน 5.3 และจะมอบชุดความสามารถในการซูมและการแพนกล้องเพื่อสร้างภาพใหม่ที่เกี่ยวข้องกับมุมต่างๆ โดยอัตโนมัติในเวอร์ชัน 6 และสามารถควบคุมการสุ่มของภาพที่สร้างขึ้น ทำให้ผู้เขียนรู้สึกแปลกๆ ค้นหา สมดุลระหว่างความสวยงามกับภาพที่ชวนตะลึง ในอนาคต Midjourney ตั้งเป้าที่จะพัฒนาภาพที่สร้างขึ้นแบบสามมิติ แบบเรียลไทม์ และปรับเปลี่ยนไดนามิกได้

เกี่ยวกับอนาคตของเทคโนโลยี เขาไม่แน่ใจว่ามันจะไปทางไหน แต่โมเดลฟิวชัน (โมเดลรูปภาพ/ข้อความสำหรับฟิวชัน) อาจเป็นทิศทางการพัฒนาที่มีแนวโน้มมากกว่า เขาเชื่อว่าศักยภาพของความก้าวหน้าทางเทคโนโลยีของ AI ยังไม่ได้รับการตระหนักอย่างเต็มที่ และมันแข็งแกร่งกว่าที่เป็นอยู่ในปัจจุบันถึงสิบเท่า และความก้าวหน้าร้อยเท่าเป็นสิ่งที่หลีกเลี่ยงไม่ได้

เขาเชื่อว่าความก้าวหน้าทางเทคโนโลยีส่วนใหญ่มาจากการพยายามทำให้ผู้คนดีขึ้น พยายามขยายขีดความสามารถของมนุษย์ ดังนั้นอาจไม่จำเป็น AGI ในฐานะที่เป็นส่วนขยายของมนุษย์ของเรา AI เป็นทางเลือกที่ดีกว่าในการเพิ่มขีดความสามารถของมนุษย์

ต่อไปนี้คือสำเนาของสุนทรพจน์:

สวัสดีทุกคน ผมชื่อ David Holz ซีอีโอและผู้ก่อตั้ง Midjourney ผมรู้สึกเป็นเกียรติที่ได้รับเชิญจากเทศบาลนครเซี่ยงไฮ้ให้เข้าร่วมการประชุมระดับโลกด้านปัญญาประดิษฐ์และหวังว่าจะได้เข้าร่วมงานในวันนี้

หนึ่งในเทคโนโลยีที่สำคัญที่สุดในโลกคือเครื่องยนต์ เครื่องยนต์คือเครื่องจักรที่ใช้ในการสร้าง ถ่ายโอน หรือขยายเสียง เราใช้เครื่องยนต์ในการสร้างยานพาหนะทุกประเภท เช่น รถยนต์ เครื่องบิน และเรือในโรงงานต่างๆ และตอนนี้ ถึงเวลาที่จะคิดว่า AI เป็นเครื่องมือชนิดใหม่

ที่ MidJourney เรากำลังพยายามใช้เครื่องมือนี้เพื่อสร้างยานพาหนะประเภทใหม่ ซึ่งไม่ใช่ยานพาหนะ แต่เป็นยานพาหนะที่บรรจุความคิดและจินตนาการของเรา

เหมือนคุณสามารถหมุนโลกด้วยลูกฟุตบอล แต่ยังต้องใช้ขาเพื่อเตะมัน เราหวังว่าจะสร้างยานพาหนะประเภทใหม่ที่คุณสามารถใช้จินตนาการได้ ไม่ใช่แค่สร้างการเคลื่อนไหว ก่อนที่เราจะสร้าง เราต้องจินตนาการก่อนว่าเราจะเป็นอะไร ไปไหนได้ อะไรเป็นไปได้ ฉันคิดว่าเครื่องมือที่เราสร้างขึ้นเน้นที่การขยายพลังแห่งจินตนาการมากกว่าสิ่งอื่นใด เรามีโอกาสที่จะขยายไม่เพียงแค่บุคคลใดบุคคลหนึ่ง แต่ขยายจินตนาการของเผ่าพันธุ์มนุษย์ทั้งหมด ฉันเคยไปประเทศจีนหลายครั้งด้วย Leap Motion (อุปกรณ์จดจำท่าทาง) และสำนักงานแห่งแรกของ Leap Motion อยู่ที่เซี่ยงไฮ้ เซี่ยงไฮ้มีความรู้สึกพิเศษที่ฉันชอบมาก ดูเหมือนว่าจะเป็นการรวมกันของซานฟรานซิสโก ลอสแองเจลิส นิวยอร์ก และเมืองในยุโรปเก่าบางเมือง มันมีความแข็งแกร่งของประวัติศาสตร์และวัฒนธรรมโบราณ แต่ก็มีความรู้สึกถึงอนาคตที่ไม่บริสุทธิ์ มันเจ๋งมากและเป็นสองสิ่งที่ฉันโปรดปราน

อันที่จริง โดยพื้นฐานแล้วฉันเป็นนักอ่านนิยายวิทยาศาสตร์ตัวยง และฉากที่บ้าคลั่งที่สุดที่ฉันเคยเห็นมาจากนิยายคลาสสิกของจีน ฉันคิดว่าวรรณกรรมจีนโบราณมีแง่คิดที่งดงามและลึกซึ้งที่สุดในประวัติศาสตร์ของมนุษย์ จริงๆ แล้วชื่อ MidJourney มาจากคำแปลของตำราลัทธิเต๋าโบราณที่ฉันชื่นชอบมากที่สุดบทหนึ่งจาก Zhuang Zhou ตัวอย่างเช่น “ความฝันของผีเสื้อของ Zhuang Zhou”, “Zi Fei Yu”, “Paod Ding Jie Niu”, “Wood of Unworthy Wood”, “Empty Boat” ฉันชอบสิ่งเหล่านี้ สิ่งที่ฉันชอบเกี่ยวกับชื่อ MidJourney คือฉันคิดว่าผู้คนมักจะลืมอดีตในบางครั้ง และอาจรู้สึกหลงทางและไม่มั่นใจเกี่ยวกับอนาคต แต่ฉันรู้สึกมากกว่านั้นจริง ๆ แล้วเรากำลังเดินทางครึ่งทาง เรามาจากอดีตที่มั่งคั่งและสวยงาม และเรามีอนาคตที่สดใสและเหลือเชื่อรออยู่ข้างหน้า

เราเพิ่งเปิดตัวเวอร์ชัน 5.2 ของ Mid Journey และกำลังทำงานในเวอร์ชัน 5.3 หลังจากนั้นฉันหวังว่าจะออกการอัปเดตครั้งใหญ่ ซึ่งฉันหวังว่าจะเรียกว่าเวอร์ชัน 6 คุณลักษณะล่าสุดที่เราแนะนำคือทั้งหมดที่เกี่ยวกับการปรับขนาดภาพ และเมื่อคุณซูมออก คุณสามารถสร้างเรื่องราวและสภาพแวดล้อมต่างๆ ที่เปลี่ยนแปลงตามธีมหลักได้ สัปดาห์นี้ เราจะเปิดตัวฟีเจอร์ที่คล้ายกันที่ให้คุณเลื่อนกล้องไปรอบๆ และเมื่อคุณเลื่อนกล้องไปด้านข้าง คุณสามารถเปลี่ยนคิวและเล่าเรื่องได้เรื่อยๆ และเราจะเปิดตัวระบบควบคุมสุดเก๋นี้ รวมคุณสมบัติใหม่เหล่านี้เพื่อการควบคุมการสร้างภาพที่ดียิ่งขึ้น

คุณยังสามารถรวมเข้ากับการควบคุมสไตล์ได้อีกด้วย “การควบคุมสไตล์” อาจดูสับสนเล็กน้อย แต่แนวคิดคือคุณต้องการบอก AI ว่าคุณต้องการสร้างมันให้สวยงามเพียงใด และคุณต้องเสี่ยงแค่ไหนในการสร้างความสวยงามนั้น แม้ว่ามันจะแหวกแนว ยุ่งเหยิง และแปลกประหลาด แต่บางครั้งผลลัพธ์ก็น่าทึ่งจริงๆ

บางครั้งคุณต้องกล้าเสี่ยง และวิธีนี้ทำให้สามารถควบคุมความสมดุลระหว่างความเสี่ยงและความสุ่มเสี่ยงของความงาม หรือความใส่ใจที่จ่ายให้กับความงามทั่วไปของภาพมากน้อยเพียงใด เรายังได้แนะนำสิ่งที่เราเรียกว่าโหมดเทอร์โบ โหมดเทอร์โบคือจุดที่เราใช้ GPU มากที่สุด ทำให้การสร้างภาพเร็วมาก สิ่งนี้ทำให้การสร้างเร็วขึ้น 4 ถึง 5 เท่า โหมดนี้ทำให้ดูเหมือนว่าคุณกำลังใช้ GPU 64 ตัวหรือมากกว่า 100 ตัวในการสร้างภาพ เพื่อให้ได้พลังการประมวลผลนี้ คอมพิวเตอร์ของคุณควรมีมูลค่าประมาณ 500,000 ดอลลาร์สหรัฐ ฟังดูบ้าๆ บอๆ และเรากำลังพัฒนาให้บ้ากว่านี้อีก ในขณะที่ส่วนใหญ่ยังคงผลิตอยู่ เราคิดว่าเมื่อเวลาผ่านไป Midjourney จะพัฒนาไม่เพียงสร้างภาพ 2 มิติเท่านั้น แต่ยังสร้างภาพ 3 มิติ ภาพเคลื่อนไหว และคุณยังสามารถโต้ตอบกับพิกเซลได้ด้วย ในอนาคตคุณอาจจะสามารถจัดลำดับใหม่และปรับแต่งสิ่งที่คุณวาดได้แบบเรียลไทม์

เพียงแค่ต้องการโปรเซสเซอร์ AI ขนาดมหึมา จากนั้นมันก็สามารถฝันถึงโลกที่แตกต่างกันทั้งหมด และความฝันสามารถโต้ตอบกับจิตใจของเราได้ และเรากำลังฝันถึงมัน (AI) และนั่นจะเจ๋งมาก การค้นพบตามลำดับของโมเดล Diffusion, Transformer model และ Clip model ทำให้ AI สามารถเข้าสู่พื้นที่ภาพได้ เมื่อประมาณ 2 ปีที่แล้ว ก่อนที่บริการ Image AI จะออกมา นักวิจัยของเราทุกคนกำลังสื่อสารกันในซานฟรานซิสโก ฉันจำได้ว่า แบบจำลองเหล่านี้ โดยเฉพาะ โมเดล Diffusion จะนำสิ่งที่แตกต่างไปจากเดิมอย่างสิ้นเชิงอย่างแน่นอน นอกจากนี้ยังมีเทคโนโลยีเครือข่ายการเผชิญหน้าแบบเจเนอเรทีฟ ซึ่งเป็นเทคโนโลยีพื้นฐานที่ทุกคนเคยใช้ในการสร้างภาพมาก่อน

ฉันจำได้แค่ว่าทุกคนพยักหน้าอย่างผิดปกติทันที โดยบอกว่าโมเดล Diffusion นั้นแตกต่างออกไปจริงๆ มันเป็นช่วงเวลาที่หนักหนาสาหัสมาก และฉันก็มีความรู้สึกที่ดีที่จะต้องเข้าไปมีส่วนร่วมและนำส่วนต่อประสานกับผู้ใช้ที่เป็นมนุษย์มากขึ้นมาสู่เทคโนโลยีนี้

แต่ในอนาคตยากที่จะทราบแน่ชัดว่าเทคโนโลยีจะพัฒนาไปอย่างไร บางครั้งเราพูดถึงวิธีเปลี่ยนโมเดลภาษาเป็นโมเดลการแพร่ นั่นคือใช้โมเดลการแพร่เพื่อสร้างข้อความ หรือโมเดลภาพจะกลายเป็นเหมือนโมเดลภาษามากขึ้น สิ่งนี้สำเร็จได้อย่างไร? คำศัพท์ทางเทคนิคสำหรับแนวทางนี้คือ autoregressive Transformer หรือ AI จะพัฒนาไปสู่รูปแบบไฮบริด แต่มันยากที่จะบอก ฉันคิดว่าเราเพิ่งเริ่มต้นการเปลี่ยนแปลงนี้ แต่ฉันมั่นใจ 100% ว่ายังมีความคืบหน้าอีกมากที่ต้องทำ การปรับปรุงสิบเท่าร้อยเท่าน่าจะหลีกเลี่ยงไม่ได้

ความก้าวหน้านี้ไม่ใช่แค่ในด้านประสิทธิภาพเท่านั้น แต่ยังรวมถึงอินเทอร์เฟซผู้ใช้และผลิตภัณฑ์ที่ช่วยให้เราสามารถใช้เทคโนโลยีเหล่านี้ได้ดียิ่งขึ้น ทั้งรายบุคคลและส่วนรวมสามารถสร้างสิ่งดีๆ ที่แก้ปัญหาได้ดีขึ้น Douglas Engelbart เป็นคนแรกที่สร้างโปรแกรมแก้ไขข้อความ ในขั้นต้น คอมพิวเตอร์ถูกตั้งโปรแกรมโดยการตอกบัตรหรือรูในบัตร แต่ดักลาสเริ่มคิดว่าจะเกิดอะไรขึ้นถ้าเราตั้งโปรแกรมคอมพิวเตอร์ ซึ่งฟังดูบ้ามากในตอนนั้น แนวคิดของเขาคือการเขียนโปรแกรมคอมพิวเตอร์บนคอมพิวเตอร์ เราสามารถเร่งวงจรนี้ ทำให้สิ่งที่เราทำดีขึ้น ทำให้คอมพิวเตอร์มีประสิทธิภาพมากขึ้น ขยายทุกอย่าง ในที่สุดความคิดนี้ก็เป็นจริง แม้ว่าเราจะมีวัฒนธรรมที่แตกต่างกัน เช่น AI, อินเทอร์เฟซระหว่างมนุษย์กับเครื่องจักร, วัฒนธรรมแอปพลิเคชันอัจฉริยะ ฉันคิดว่าความก้าวหน้าส่วนใหญ่ในเทคโนโลยีจนถึงขณะนี้มาจากการพยายามทำให้ผู้คนดีขึ้น พยายามที่จะขยายขีดความสามารถของมนุษย์

เรายังไม่เคยเห็นยุคของ AI มาถึง ซึ่งเราจะมี AI อิสระในการแก้ปัญหา แต่ถ้าเราคิดมากเกี่ยวกับการก้าวไปในทิศทางนั้น เราอาจพลาดโอกาสมากมายที่มีอยู่ในเทคโนโลยี ฉันไม่ได้คิดแค่ว่า AI จะทำอะไรได้บ้าง แต่ยังคิดถึงวิธีสร้างความลื่นไหลและความยุ่งเหยิงระหว่างสิ่งต่างๆ ด้วย เนื่องจากเครื่องมือไม่ควรรู้สึกเหมือนเป็นคน แต่ควรรู้สึกเหมือนเป็นส่วนเสริมของตัวคุณเอง ร่างกายของคุณ และจิตใจของคุณ ฉันกำลังคิดเกี่ยวกับวิธีสร้างเทคโนโลยีเหล่านี้โดยที่มนุษย์และ AI เชื่อมโยงกันเพื่อไม่ให้รู้สึกว่าคุณกำลังร่วมมือกับศิลปิน แต่เหมือนคุณกำลังจินตนาการถึงบางสิ่งและมันอยู่บนหน้าจอ หลายคนอธิบายการเดินทางของฉันราวกับว่าจุดหมายปลายทางเหล่านั้นเป็นส่วนหนึ่งของความคิดของพวกเขา ฉันคิดว่านี่คือสิ่งที่ AI ส่วนใหญ่ควรเป็น ควรเป็นส่วนเสริมของตัวเรา

ดังนั้นฉันอยากจะกล่าวขอบคุณคุณเฉินและผู้ชมทั้งหมดอีกครั้ง WAIC ค่อนข้างเจ๋งและฉันหวังว่าจะได้เข้าร่วมด้วยตนเองในอนาคตและเป็นส่วนหนึ่งของงานนี้ ฉันรอคอยที่จะร่วมมือกับจีนมากขึ้น ฉันจำประสบการณ์ส่วนตัวที่ยอดเยี่ยมทั้งหมดที่ฉันได้รับที่นั่น และฉันหวังว่าทุกคนจะสนุกกับการมีปฏิสัมพันธ์ที่นั่นเช่นกัน

ดูต้นฉบับ
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น