Skip to content

Grok ของ xAI มองเห็นผ่าน “กล้องโทรศัพท์” ของเราได้แล้ว

เมื่อวันอังคารที่ผ่านมา (22 Apr 2025) xAI ได้ประกาศเปิดตัว Grok Vision ที่ช่วยให้ผู้ใช้สามารถเล็งโทรศัพท์ไปที่วัตถุต่างๆ เช่น สินค้า ป้าย และเอกสาร แล้วถามคำถามเกี่ยวกับสิ่งเหล่านั้นได้

Grok Vision ทำอะไรได้บ้าง?

ลองนึกภาพว่าคุณกำลังเดินอยู่ในซูเปอร์มาร์เก็ตและไม่แน่ใจว่าผลิตภัณฑ์ตัวไหนดีที่สุดสำหรับคุณ ด้วย Grok Vision คุณสามารถสแกนฉลากของผลิตภัณฑ์ต่างๆ และถาม Grok ว่าผลิตภัณฑ์ไหนมีน้ำตาลน้อยที่สุด หรือมีส่วนผสมที่คุณต้องการหรือไม่

หรือสมมติว่าคุณกำลังเดินทางและเห็นป้ายที่เขียนด้วยภาษาที่คุณไม่เข้าใจ เพียงแค่ใช้ Grok Vision สแกนป้ายนั้น แล้วถามว่าป้ายนั้นหมายถึงอะไร Grok จะแปลป้ายนั้นให้คุณได้ทันที

Grok Vision แตกต่างจาก Gemini และ ChatGPT อย่างไร?

ถึงแม้ว่า Gemini และ ChatGPT จะมีฟีเจอร์ vision ที่คล้ายกัน แต่ Grok Vision มีข้อได้เปรียบตรงที่สามารถเข้าถึงข้อมูลแบบ real-time จาก X (เดิมคือ Twitter) ได้ ซึ่งหมายความว่า Grok สามารถให้ข้อมูลที่เป็นปัจจุบันและเกี่ยวข้องกับเหตุการณ์ปัจจุบันได้

อนาคตของ Grok Vision

xAI กำลังทำงานอย่างต่อเนื่องเพื่อพัฒนา Grok Vision ให้ดียิ่งขึ้น ในอนาคต พวกเขาหวังว่าจะสามารถเพิ่มความสามารถในการจดจำวัตถุและการวิเคราะห์ภาพให้แม่นยำยิ่งขึ้น นอกจากนี้ พวกเขายังวางแผนที่จะเพิ่มการรองรับภาษาอื่นๆ เพิ่มเติมด้วย

Grok Vision: เปลี่ยนวิธีที่เราโต้ตอบกับโลก

Grok Vision เป็นก้าวสำคัญในการพัฒนา AI ที่สามารถเข้าใจและโต้ตอบกับโลกทางกายภาพได้ ด้วยความสามารถในการมองเห็นและเข้าใจสิ่งต่างๆ รอบตัวเรา Grok Vision มีศักยภาพที่จะเปลี่ยนแปลงวิธีที่เราเรียนรู้ ทำงาน และใช้ชีวิต

สรุป

Grok Vision เป็นฟีเจอร์ใหม่ที่น่าตื่นเต้นจาก xAI ที่ช่วยให้ Grok สามารถ “มองเห็น” โลกได้ ทำให้ผู้ใช้สามารถถามคำถามเกี่ยวกับสิ่งที่กล้องสมาร์ทโฟนของพวกเขามองเห็นได้ สิ่งนี้มีศักยภาพที่จะปฏิวัติวิธีที่เราโต้ตอบกับโลกและเข้าถึงข้อมูล

แหล่งข้อมูล:
* ข้อมูลนี้อ้างอิงจากประกาศอย่างเป็นทางการของ xAI

Back To Top
Your Cart

Your cart is empty.