ฟีเจอร์ใหม่ของ Claude Code: AI ควบคุมหน้าจอ Mac ของคุณโดยตรง ตั้งแต่การเขียนโปรแกรมผ่านเทอร์มินัลไปจนถึงการทดสอบด้วยการคลิกแบบครบวงจร

ChainNewsAbmedia

Anthropic ได้เปิดตัวฟีเจอร์ใหม่ “การใช้งานคอมพิวเตอร์” (Computer Use) สำหรับเครื่องมือเอเจนต์โค้ด AI ของบริษัทอย่าง Claude Code โดยให้ผู้ใช้ macOS เข้าถึงในรูปแบบตัวอย่างเพื่อการวิจัย (Research Preview) ฟีเจอร์นี้ทำให้ Claude สามารถควบคุมหน้าจอคอมพิวเตอร์ของผู้ใช้ได้โดยตรง—เปิดแอป คลิกปุ่ม ป้อนข้อความ ถ่ายภาพหน้าจอ และเชื่อมโยงการทำงานแบบครบวงจรจากการเขียนโค้ดไปจนถึงการทดสอบ UI ภายในบทสนทนาเดียว โดยไม่ต้องออกจากเทอร์มินัล

Claude ช่วยให้คุณ “คลิก” อะไรได้บ้าง?

จากเอกสารทางเทคนิคอย่างเป็นทางการ Computer Use ถูกออกแบบมาเพื่อเป็นหลักสำหรับงานที่ต้องใช้ส่วนติดต่อผู้ใช้แบบกราฟิก (GUI) นั่นคือสิ่งที่ “โดยปกติคุณต้องทิ้งเทอร์มินัลไว้แล้วลงมือทำเอง”:

สร้างและตรวจสอบแอปเนทีฟ: ให้ Claude เขียนแอปแบบแถบเมนูของ macOS มันจะคอมไพล์ เริ่มทำงาน และไล่คลิกตัวควบคุมทั้งหมดเพื่อยืนยันว่าฟังก์ชันทำงานได้ถูกต้อง แม้ว่าคุณยังไม่เคยเปิดแอปนี้เลยก็ตาม

ทดสอบ UI แบบครบกระบวนการ: ชี้ไปที่แอปโลคอลของ Electron แล้วบอกว่า “ทดสอบขั้นตอนการเริ่มต้นสำหรับผู้ใช้ใหม่” Claude จะเปิดแอป คลิกขั้นตอนการลงทะเบียน และถ่ายภาพหน้าจอสำหรับแต่ละหน้าจอ ไม่ต้องตั้งค่า Playwright ไม่ต้องใช้เฟรมเวิร์กสำหรับการทดสอบ

ดีบักปัญหาเรื่องภาพและเลย์เอาต์: บอก Claude ว่า “Modal นี้ถูกตัดออกในหน้าต่างขนาดเล็ก” มันจะย่อขนาดหน้าต่างเพื่อทำซ้ำบั๊ก ถ่ายภาพหน้าจอ แก้ไข CSS และยืนยันผลการแก้ไขอีกครั้ง—มันเห็นภาพที่คุณเห็น

เครื่องมือที่มีเฉพาะ GUI: เครื่องมือออกแบบ แผงควบคุมฮาร์ดแวร์ iOS Simulator หรือซอฟต์แวร์เฉพาะทางใดๆ ที่ไม่มี CLI หรือ API

ลำดับความสำคัญในการเลือกเครื่องมือของ Claude

Computer Use คือเครื่องมือที่ “ครอบคลุมที่สุดแต่ช้าที่สุด” Claude จะเลือกวิธีที่แม่นยำที่สุดตามลำดับความสำคัญดังนี้:

มี MCP Server ที่รองรับ → ใช้ MCP

เป็นคำสั่ง Shell → ใช้ Bash

เป็นการทำงานผ่านเบราว์เซอร์และมีการตั้งค่าให้ Claude in Chrome → ใช้ส่วนขยาย Chrome

ทั้งหมดไม่เข้าเงื่อนไข → ค่อยเปิดใช้ Computer Use

ดังนั้นการควบคุมหน้าจอจึงสงวนไว้สำหรับสถานการณ์ที่ “วิธีอื่นทำไม่ได้”: แอปเนทีฟ เครื่องจำลอง หรือเครื่องมือที่ไม่มี API

วิธีเปิดใช้ Computer Use

Computer Use ให้มาในรูปแบบ MCP Server ที่มีมาในตัวเครื่อง (ชื่อ:

computer-use

) ปิดไว้โดยค่าเริ่มต้น ต้องเปิดใช้งานเอง:

ในเซสชันงานของ Claude Code แบบอินเทอร์แอคทีฟให้รัน /mcp จากรายการให้หา computer-use (แสดงเป็นปิดใช้งาน)

หลังจากเลือกแล้วให้คลิก Enable การตั้งค่าจะถูกบันทึกอย่างถาวรตามโปรเจกต์ โดยปกติแต่ละโปรเจกต์ตั้งครั้งเดียวก็พอ

เมื่อเป็นครั้งแรกที่ให้ Claude ควบคุมคอมพิวเตอร์ macOS จะขออนุญาตสองรายการ: การใช้เพื่อการช่วยเหลือ (Accessibility) และการบันทึกหน้าจอ (Screen Recording) หลังจากอนุญาตแล้วให้เลือก “ลองอีกครั้ง” ในบางสถานการณ์อาจต้องรีสตาร์ท Claude Code

ต้องอนุญาตทีละแอปในทุกเซสชันงาน

เปิดใช้

computer-use

การเปิดใช้งาน

computer-use

ไม่ได้หมายความว่า Claude จะสามารถควบคุมแอปทั้งหมดบนคอมพิวเตอร์ของคุณได้ ทุกครั้งที่ในเซสชันงาน Claude จำเป็นต้องควบคุมแอปใดแอปหนึ่งเป็นครั้งแรก เทอร์มินัลจะแสดงพร้อมแจ้งเตือน โดยระบุ:

Claude ต้องการควบคุมแอปใดบ้าง

มีการขอสิทธิ์เพิ่มเติมหรือไม่ (เช่น การเข้าถึงคลิปบอร์ด)

ระหว่างทำงานมีแอปอื่นๆ อีกกี่แอปที่จะถูกซ่อนไว้

เลือก “อนุญาตสำหรับเซสชันนี้” หรือ “ปฏิเสธ” การอนุญาตจะมีผลเฉพาะในเซสชันงานปัจจุบันเท่านั้น สำหรับแอปที่มีสิทธิ์เข้าถึงระบบอย่างกว้าง ระบบยังจะแสดงคำเตือนเพิ่มเติม:

Claude จะทำงานบนหน้าจอของคุณอย่างไร

ล็อกแบบผูกขาดทั้งเครื่อง: หลังจาก Computer Use เริ่มทำงาน มันจะได้สิทธิ์ล็อกแบบตัดขาดระดับเครื่อง หากมีเซสชันงาน Claude Code อีกอันกำลังใช้คอมพิวเตอร์อยู่ คำขอใหม่จะล้มเหลวและจะแจ้งให้คุณยุติเซสชันงานอีกอันก่อน

แอปอื่นๆ จะถูกซ่อนชั่วคราว: เมื่อ Claude เริ่มควบคุมหน้าจอ แอปที่มียังไม่ได้รับอนุญาตซึ่งมองเห็นได้จะถูกซ่อน เพื่อให้มั่นใจว่า Claude โต้ตอบได้เฉพาะกับแอปที่ได้รับอนุญาตเท่านั้น หน้าต่างเทอร์มินัลของคุณยังคงมองเห็นและจะไม่ถูกถ่ายภาพหน้าจอ คุณสามารถติดตามได้แบบเรียลไทม์ และ Claude ก็จะไม่เห็นเอาต์พุตของตัวเอง เมื่อ Claude ทำเสร็จ แอปที่ถูกซ่อนจะถูกคืนค่าอัตโนมัติ

หยุดได้ทุกเมื่อ: หลังจาก Claude ได้รับล็อก macOS จะแสดงการแจ้งเตือน “Claude is using your computer · press Esc to stop” กด

Esc

หรือกด Ctrl+C ในเทอร์มินัลได้ทันทีเพื่อหยุดการทำงาน ระหว่างนั้น Claude จะปล่อยล็อก คืนค่าแอปทั้งหมด และส่งคืนสิทธิ์การควบคุม

กลไกความปลอดภัยและขอบเขตความไว้วางใจ

เอกสารทางการเน้นเป็นพิเศษว่า ต่างจากเครื่องมือแบบ Bash ที่ถูกทำให้อยู่ในแซนด์บ็อกซ์ Computer Use จะทำงานโดยตรงในสภาพแวดล้อมเดสก์ท็อปของคุณ ดังนั้นขอบเขตความไว้วางใจจะแตกต่างกัน แผงป้องกันความปลอดภัยที่มีมาในตัวรวมถึง:

อนุญาตทีละแอป: Claude สามารถควบคุมได้เฉพาะแอปที่ได้รับอนุญาตอย่างชัดเจนในเซสชันงานปัจจุบันเท่านั้น

คำเตือนผู้เฝ้าระวัง (sentinel): แอปที่ได้รับสิทธิ์เข้าถึง Shell ระบบไฟล์ หรือการตั้งค่าระบบ จะถูกทำเครื่องหมายเป็นพิเศษก่อนการอนุญาต

การตรวจจับการฉีดคำใบ้โดยอัตโนมัติ: Claude จะตรวจสอบเนื้อหาบนหน้าจอ และทำเครื่องหมายการโจมตีที่อาจเป็นการฉีดคำใบ้

เงื่อนไขและข้อจำกัดที่ใช้ได้

ต้องสมัครแผน Pro หรือ Max (แผน Team、Enterprise ใช้ไม่ได้)

ต้องใช้ Claude Code เวอร์ชัน 2.1.85 ขึ้นไป

ขณะนี้รองรับเฉพาะ macOS (ช่วงตัวอย่างเพื่อการวิจัย)

ต้องใช้ในเซสชันงานแบบอินเทอร์แอคทีฟ ไม่รองรับโหมดที่ไม่ใช่อินเทอร์แอคทีฟ (ธง -p)

แอปอย่างเบราว์เซอร์และแพลตฟอร์มการซื้อขายมีได้เฉพาะ “โหมดดูเท่านั้น”; เทอร์มินัลและ IDE คือ “โหมดคลิก”; แอปอื่นๆ คือ “ควบคุมได้เต็มรูปแบบ”

MacRumors ชี้ว่า เมื่อเทียบกับคู่แข่ง Computer Use ของ Claude ใช้การออกแบบลำดับความสำคัญด้านสิทธิ์ที่เข้มงวดกว่า และตอนนี้มีเฉพาะบน Mac เท่านั้น ขณะที่แผนอื่นๆ รองรับ macOS, Windows และ Linux แล้ว

สำหรับนักพัฒนา มูลค่าสูงสุดของฟีเจอร์นี้คือการทำให้รอบ “เขียนโค้ด→ทดสอบ→แก้บั๊ก” สั้นลง—Claude ไม่เพียงแค่เขียนโค้ด แต่ยังสามารถเฝ้ามองหน้าจอของคุณเองเพื่อยืนยันผลลัพธ์ได้

คำเตือนเกี่ยวกับความเสี่ยง การลงทุนสกุลเงินเข้ารหัสมีความเสี่ยงสูง ราคาของมันอาจผันผวนอย่างรุนแรง และคุณอาจสูญเสียเงินต้นทั้งหมด โปรดประเมินความเสี่ยงอย่างรอบคอบ

บทความนี้ Claude Code ฟีเจอร์ใหม่: AI ควบคุมหน้าจอ Mac ของคุณโดยตรง ตั้งแต่การเขียนโค้ดบนเทอร์มินัลจนถึงการทดสอบแบบคลิกครบสายพาน เผยแพร่ครั้งแรกที่ 鏈新聞 ABMedia

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น