Tôi chưa bao giờ sử dụng các thiết bị VR hoặc AR, cũng không có nhiều hiểu biết về công nghệ liên quan. Nhận thức của tôi về trải nghiệm chìm đắm chỉ dừng lại ở chuyến bay qua chân trời tại Disneyland Thượng Hải. Tuy nhiên, sau vài ngày theo dõi các bài quảng cáo và phân tích trên mạng về Apple Vision Pro, tôi thực sự có cảm giác tương lai đã đến.
Dưới đây là ba thách thức mà tôi rút ra từ những gì mình đã đọc. Trong quá trình tìm hiểu, tôi càng nhận thức rõ hơn về độ khó của việc phát triển thực tế ảo. Không ngạc nhiên khi làn sóng thực tế ảo đã đi qua nhiều vòng nhưng vẫn chưa thực sự phổ biến. Hy vọng Apple sẽ dẫn dắt ngành công nghiệp này tiến lên.
Một: Làm thế nào để tạo phản hồi vật lý trong tương tác không gian?
Chúng ta thường thấy trong các bộ phim khoa học viễn tưởng cảnh “tương tác cử chỉ không gian” trên hình ảnh toàn tức (khác với “cử chỉ mặt phẳng” trên điện thoại). Nhưng hãy nghĩ kỹ, tương tác cử chỉ không gian không có phản hồi vật lý (cảm giác chạm, lực cản, rung động, v.v.), điều này trái ngược với trực giác và làm giảm chất lượng trải nghiệm. Mặc dù Nintendo Switch không phải là thiết bị 3D, nhưng trong một số trò chơi yêu cầu vận động cơ thể, tay cầm có chức năng rung, và ai đã từng chơi đều hiểu rằng phản hồi rung này quan trọng như thế nào đối với trải nghiệm trò chơi. Nguyên tắc này cũng áp dụng cho tương tác không gian 3D.
Apple Vision Pro hiện tại chưa giải quyết được vấn đề phản hồi trong tương tác cử chỉ không gian, thay vào đó nó chọn cách tiếp cận khác biệt bằng cách tối đa hóa việc giảm thiểu tương tác cử chỉ. Nhiều tình huống được minh họa trong Vision Pro vẫn dựa trên tương tác mặt phẳng, chẳng hạn như duyệt web, xem ảnh, gọi Facetime, v.v., giống như iPhone nhưng nền tảng này tồn tại trong không gian ảo.
Tương tác mặt phẳng chủ yếu xoay quanh lựa chọn, nhấp chuột và kéo thả. Vision Pro giao hoàn toàn hoạt động chọn lựa cho mắt - nhìn vào đâu, nơi đó sẽ được chọn mà không cần dùng cử chỉ tay. Nhấp chuột và kéo thả cũng không yêu cầu bạn đưa tay lên màn hình; chỉ cần cử động nhẹ ngón tay, ví dụ như chụm hai ngón là xác nhận nhấp chuột, vuốt sang trái/phải hoặc lên/xuống là cuộn, giống như thao tác trên giao diện điện thoại. Các tương tác này rất phù hợp với trực giác và không phụ thuộc vào vị trí đặt tay của tin tức bóng đá bạn - nếu đang ngồi, bạn có thể để tay trên đầu gối.
Nguyên lý thực hiện tương tác ngón tay khá đơn giản: các camera được bố trí xung quanh kính có khả năng chụp cử chỉ người dùng. Phạm vi thị trường của các camera này rất rộng nên tay bạn có thể ở bất kỳ vị trí nào.
Tuy nhiên, nếu bạn cần nhập văn bản mà không dùng giọng nói, bạn chỉ có thể gõ vào bàn phím ảo trong không khí. Khi gõ bàn phím ảo, có thể có phản hồi âm thanh và thị giác (như nút sáng lên), nhưng chắc chắn không có cảm giác chạm như bàn phím vật lý. Với các tương tác phức tạp trên giao diện 3D, chẳng hạn như lắp ghép khối lập phương 3D, bạn hầu như phải đưa tay lên không trung để thao tác. Về lâu dài, con người có thể thích nghi hoàn toàn với tương tác không có phản hồi, nhưng điều đó không phải là hình thái tốt nhất của thực tế ảo vì trong cuộc sống thực, cảm giác chạm đóng vai trò rất quan trọng.
Một hướng phát triển tiềm năng hơn là sử dụng các thiết bị ngoại vi như găng tay hoặc áo vest để mô phỏng phản hồi xúc giác.
Hai: Làm thế nào để tạo mô hình cho chính người dùng?
Apple Vision Pro là thiết bị kín hoàn toàn, bên trong là hai màn hình 4K. Cảnh quan môi trường bên ngoài mà mắt bạn nhìn thấy thực chất là hình ảnh được chụp bởi camera và hiển thị thời gian thực sau khi xử lý và kết xuất. Vì độ phân giải cao (4K) và tốc độ kết xuất nhanh (theo báo cáo là 12ms), hình ảnh trông như thể mắt bạn đang nhìn trực tiếp vào môi trường thực tế.
Do các camera tỷ lệ ngoại hạng anh tập trung xung quanh phần khung kính, chúng chỉ có thể xây dựng mô hình cho môi trường trước mặt người dùng, không thể xây dựng mô hình cho chính người dùng và môi trường phía sau.
Điều này gây ra vấn đề nếu hai người dùng ở xa nhau sử dụng kính để bước vào cùng một không gian ảo. Họ cần nhìn thấy toàn thân lẫn nhau. Ví dụ: bạn đang thử quần áo và muốn bạn bè ở xa đánh giá hiệu quả. Vision Pro dường như không thể đáp ứng.
Trong buổi giới thiệu sản phẩm, Apple đã minh họa cuộc gọi FaceTime. Đây vẫn là video phẳng, chỉ là được chiếu vào không gian. Điều này không khác gì so với video phẳng trên iPhone. Thực tế, chất lượng video còn kém hơn video phẳng trên iPhone vì Vision Pro không thể chụp trực tiếp khuôn mặt người dùng. Thay vào đó, nó sử dụng AI để xây dựng mô hình đại diện ảo cho người dùng. Apple gọi công nghệ này là “EyeSight”.
Theo tôi, Vision Pro không thể tạo mô hình cho chính người dùng, đặc biệt là biểu cảm khuôn mặt, dẫn đến bất kỳ tình huống nào yêu cầu tương tác đối mặt giữa nhiều người dùng đều không thể tái hiện chính xác, từ đó hạn chế đáng kể khả năng ứng dụng của nó.
Tương tự như FaceTime, trong trường hợp họp, đồng nghiệp làm việc từ xa tụ họp trong một phòng họp ảo, có thể có bảng trắng chung và bàn tròn, mọi người ngồi quanh, nhưng hình ảnh của họ không đủ chân thực, đặc biệt là biểu cảm khuôn mặt, do đó không đạt được trải nghiệm như khi họp trực tiếp.
Tuy nhiên, trong các tình huống 3D không có người ngoài, Vision Pro hoàn toàn có khả năng đáp ứng. Đơn giản nhất là “xem” phim 3D, phức tạp hơn là các tình huống có tương tác, chẳng hạn như:
Ba: Thể tích và trọng lượng?
Không có gì để nói chi tiết, lựa chọn của Apple Vision Pro là tách pin ra ngoài. Điều này không đẹp mắt nhưng cũng không có giải pháp tốt hơn.
Tất nhiên còn có các thách thức kỹ thuật khác, chẳng hạn như kết xuất mô hình thời gian thực với độ trung thực cao cho môi trường bên ngoài. Nhờ sức mạnh phần cứng vượt trội của Apple (đặc biệt là khả năng phát triển chip) và chiến lược tích hợp phần mềm-phần cứng, cộng thêm việc không tiếc tiền đầu tư, vấn đề này tu vi tuan moi đã được giải quyết rất tốt. Ít nhất là trong số các thiết bị thực tế ảo hiện tại, đây là sản phẩm làm tốt nhất.
Về trải nghiệm chức năng hiện tại, nếu đủ nhẹ và rẻ, có lẽ sản phẩm sẽ bán chạy. Điều này cho thấy trải nghiệm hiện tại đã đạt tiêu chuẩn cấp tiêu dùng. Khi công nghệ tiến bộ, kích thước, trọng lượng và giá cả sẽ dần giảm xuống, do đó, việc thiết bị này trở thành hàng tiêu dùng đại trà có lẽ sẽ không còn xa.
Tài liệu
Tôi đã đọc rất nhiều nguồn, nhưng ấn tượng nhất vẫn là ba nguồn dưới đây:
[Tiếp tục liệt kê các nguồn
Sửa đổi lần cuối vào 2025-02-23