Hiểu nhanh về cảm biến nhận diện chiều sâu môi trường trên smartphone

Xperia XZ1 8

Tại thời điểm này, có thể bạn đã nghe nhiều về cảm biến 3D trên smartphone. Với việc công bố iPhone X hồi tháng Chín năm 2017, Apple đã hướng cả cộng đồng công nghệ vào cảm biến 3D nhận diện chiều sâu môi trường, thứ mà ở trên iPhone X được gọi là hệ thống camera TrueDepth. Thực ra thì cảm biến 3D đã tồn tại từ lâu trong ngành và được khai thác rất rộng rãi bởi nhiều hãng, tuy nhiên với tầm ảnh hưởng và trọng lượng của Apple đối với người tiêu dùng, giới công nghệ, cảm biến 3D trở nên nóng hơn bao giờ hết. Nó cũng giống như việc điện thoại Motorola, nội địa Nhật (Sharp, Kyocera,…) và Sony Xperia có khả năng kháng nước từ lâu, nhưng phải đến khi Apple chính thức hỗ trợ kháng nước trên iPhone 7, đại bộ phận khách hàng mới coi đó là một tiêu chuẩn trên smartphone cao cấp. Rất thú vị!

Theo ước tính, tổng giá trị thị trường của cảm biến 3D sẽ tăng lên hàng chục tỉ chỉ trong vài năm tới, chính bởi việc Apple công bố nó trên iPhone sẽ tạo ra cú huých tác động to lớn cho ngành công nghiệp. Hàng ngàn công ty đang làm việc với nó, hàng loạt các lĩnh vực đầy tiềm năng để ứng dụng cảm biến 3D như AR/VR, xe hơi (đặc biệt xe tự lái), máy bay không người lái, sinh trắc học, robot, gaming, laptop,… Và bài viết hôm nay sẽ giúp các bạn nắm một cách “mơ hồ” nhưng tương đối dễ hiểu nhất về công nghệ đang hot này.

Về cơ bản, có ba cách tiếp cận chính để xây dựng nên một cấu trúc cảm biến 3D phức tạp:

  1. Stereo Vision.
  2. Time-of-filght (ToF).
  3. Structure Light.

Đa phần các công ty hiện nay tập trung vào hai phương pháp ToF và Structure Light, hoặc đôi khi họ sẽ kết hợp để tạo ra cụm cảm biến 3D như ý. Mặc dù có rất nhiều các loại sản phẩm có thể ứng dụng cảm biến 3D, tuy nhiên ở đây chúng ta sẽ tập trung vào thứ gần gũi nhất với tất cả: smartphone.

depth sensing tech 1

Bảng so sánh cơ bản về các công nghệ tạo nên một hệ thống nhận diện chiều sâu 3D trên smartphone (ảnh: Yole)

Một cụm camera 3D sẽ có nhiều thành phần tạo nên, cụ thể:

  • Stereo Vision: hai camera cận hồng ngoại (NIR) với global shutter, nguồn chiếu cận hồng ngoại (không bắt buộc), bộ xử lí tăng tốc đồ họa 3D.
  • ToF: camera ToF, nguồn chiếu cận hồng ngoại.
  • Structure Light: một camera cận hồng ngoại với global shutter, nguồn chiếu cận hồng ngoại có cấu trúc, phần mềm tái lập đồ họa 3D.

Một số nhà cung cấp các thành phần trên bao gồm:

  • Camera cận hồng ngoại: Omnivision, STMicroelectronics,…
  • Nguồn chiếu cận hồng ngoại: Osram, Lumentum, Finisar, ams,…
  • Nguồn chiếu cận hồng ngoại có cấu trúc: Himax, Namuga, Goertek,…
  • Phần mềm tái lập đồ họa 3D: Primesense (thuộc Apple), Mantis Vision, Namuga, Orbbec,…
  • Camera ToF: Sony, PMD,…

Bây giờ chúng ta sẽ đi sâu hơn vào hai cách tiếp cận là ToF và Struture Light, vốn là hai lựa chọn phổ biến của các hãng hiện nay.

1. Time-of-flight (ToF).

depth sensing tech 3

Một số công ty nổi bật phát triển công nghệ ToF (ảnh: LEDinside)

Cách tiếp cận ToF được hiểu là tính toán để tìm ra khoảng cách giữa bề mặt vật thể đến cảm biến (hay cụm camera), dựa trên thời gian mà ánh sáng đi từ nguồn phát đến bề mặt vật thể rồi quay về. Module quan trọng đối với giải pháp ToF bắt buộc là nguồn chiếu sáng, thường là LED hoặc laser. Bên cạnh đó, tất nhiên là cảm biến hình ảnh của camera. Các công ty đầu tư phát triển công nghệ này gồm có Microsoft, Sony, Infineon, và PMD Technologies.

Năm 2009, Microsoft đầu tư 35 triệu USD để mua lại 3DV Systems, sau đó là công ty chuyên sản xuất cảm biến 3D Canesta. Sau này, Microsoft phát hành phụ kiện Kinect cho hệ máy Xbox One, chính là dựa trên cảm biến ToF để giúp người chơi có thể chơi game bằng cử chỉ, ra lệnh.

Sony cũng không đứng ngoài cuộc chơi khi mua lại công ty Bỉ SoftKinetic năm 2015, nay đổi tên thành Sony Depthsensing Solutions. Vừa rồi, công ty đã công bố mẫu cảm biến ToF nhỏ nhất thế giới với diện tích điểm ảnh chỉ 10 micron, trong khi vẫn mang lại sự chính xác cực kì cao. Cảm biến còn áp dụng công nghệ back-illuminated (chiếu sáng hậu) giúp tăng hiệu quả nhận diện môi trường.

Infineon và PMD Technologies là hai công ty Đức cũng phát triển cảm biến 3D công nghệ ToF và ứng dụng trên nhiều lĩnh vực khác nhau. Ví dụ cảm biến ToF Real3 trên Asus Zenfone AR. PMD cũng chính là tác giả của module 3D trên Lenovo Phab 2 Pro và dự án Tango của Google trước kia.

Texas Instrument là một hãng bán dẫn gạo cội của Mĩ, đứng sau hàng loạt các cảm biến nhận diện cử chỉ, hệ thống tự lái, robot,…

3-D sensor

Cảm biến ToF 3D đang là hướng phát triển tương lai của Sony (ảnh: Bloomberg)

Bởi vì quá trình cảm nhận cũng như phương pháp tính toán của công nghệ ToF rất nhanh, tính khoảng cách có độ chính xác cao, đây là lựa chọn phổ biến cho các ứng dụng cần xác định hướng chuyển động, thu thập dữ liệu bằng đo đạc khoảng cách.

2. Structured Light.

Đây là giải pháp được ưa chuộng hiện nay với các hãng smartphone để tạo nên hệ thống nhận diện khuôn mặt 3D, nổi tiếng nhất là TrueDepth của Apple. Một hệ thống camera 3D Structure Light về cơ bản, bao gồm một bộ phát và bộ thu tín hiệu ánh sáng. Trước tiên chiếu lên bề mặt vật thể chùm ánh sáng có cấu trúc hình mẫu, sau đó nhận về các tín hiệu mẫu ánh sáng bị bóp méo bởi bề mặt vật thể. Hàng lọat thuật toán được chạy sau đó để tính ra chiều sâu, dựa trên các hình mẫu bị biến dạng. Đặc biệt, để tăng độ chính xác quang học của chùm sáng, người ta dùng các VCSEL.

Rất nhiều người nhầm lẫn Structure Light và Time-of-flight là một, hy vọng qua bài viết này mọi người sẽ không còn nữa. Đôi khi cũng có nhà sản xuất tích hợp thêm vào hệ thống camera 3D Structure Light cả cảm biến ToF.

Về mức độ phổ biến, Structure Light có lẽ sẽ được trọng dụng hơn bởi các hãng smartphone. Apple đã tiên phong và vừa rồi các công ty như Oppo, Xiaomi đều hưởng ứng. Sau này dự đoán có thể có thêm nhiều hãng khác tham gia. Structure Light được chú ý nhiều hơn ToF vì chi phí rẻ hơn, ngoài ra độ phân giải cũng đang được cải thiện rất đáng kể.

depth sensing tech 2

Nhóm các công ty đáng chú ý tập trung vào công nghệ Structure Light (ảnh: LEDinside)

Một trong những mấu chốt của Structure Light là thành phần VSCEL giúp hội tụ ánh sáng tập trung, nằm ở nguồn chiếu cận hồng ngoại và máy chiếu điểm trên cụm camera. Ưu thế của nó là độ chính xác cao, kích thước nhỏ, tiêu thụ điện năng thấp,…

Như các bạn biết, trong đêm tối thì hiệu quả của công nghệ nhận diện khuôn mặt thường kém đi, để khắc phục điều này người ta lơi dụng tia hồng ngoại để giúp camera có thể hoạt động tốt hơn kể cả khi thiếu sáng, và nó ít gây hại cho mắt người – còn hơn là bật sáng màn hình. Và thật thú vị, không chỉ iPhone X mà cả Airpod cũng có VSCEL, dùng để xác định xem tai nghe có được sử dụng hay không để bật/tắt.

3. ToF và Structure Light.

So sánh hai phương pháp này thực ra không có nhiều ý nghĩa với người dùng chúng ta lẫn “dân công nghệ.” Đầu tiên bởi có quá ít các nhà sản xuất kịp tích hợp chúng lên sản phẩm. Thứ nữa, mỗi phương pháp lại có ưu thế, nhược điểm riêng, khó mà hoàn mĩ, trong khi với tiến bộ công nghệ diễn ra từng ngày, cả hai đều sẽ phát triển rất nhanh để đáp ứng tốt hơn nhu cầu sử dụng.

Ví dụ với nhận diện khuôn mặt, Structure Light thu hút chú ý nhiều hơn và được tận dụng nhiều hơn, như vậy chủ yếu nó sẽ được dùng cho camera trước để bảo mật bằng khuôn mặt 3D. Đối với các yêu cầu về VR/AR, ToF có lợi thế hơn khi cho phép đo khoảng cách nhanh chóng, chính xác, như vậy sẽ được dùng nhiều trên camera sau.

ToF vs structure light

Hai công nghệ chủ đạo trên smartphone time-of-filght và structure light

Và còn một điều nữa! Cảm biến 3D hiện nay đang có hai khó khăn chính đối với các hãng sản xuất smartphone đó là: Chọn một giải pháp thích hợp để đo khoảng cách, nhận diện chiều sâu, hiện nay chúng ta đã có ToF hoặc Structure Light. Thứ hai, xây dựng phần mềm để diễn giải lại các thông số của cảm biến 3D đo được một cách chi tiết, trong khi tiến hành nhận diện xác thực khuôn mặt. Phần cứng rất sẵn có và chuỗi cung ứng đang tăng tốc để đáp ứng nhu cầu, cái khó nằm ở phương pháp phù hợp – chi phí hợp lí mà vẫn mang lại hiệu suất cao tương xứng, và đặc biệt nhất là phần mềm. Chính thuật toán mỗi hãng mới quyết định lớn đến mức độ khai thác hiệu quả.

Cách tiếp cận (ToF hay Structure Light) và phần cứng đều tồn tại từ lâu và hãng nào cũng có thể sử dụng, nhưng “ngon” đến đâu lại nhờ ở thuật toán phần mềm. Và nếu tự nghiên cứu thuật toán quá tốn kém thời gian cũng như tiền bạc, các công ty có thể tìm đến đối tác bên ngoài giúp đỡ để kịp lịch trình ra mắt sản phẩm.

Nguồn: LEDinside (1), LEDinside (2), EEtimes.

The following two tabs change content below.

Check Also

DV and HDR10

Kỉ nguyên HDR (2a): Các định dạng HDR10, Dolby Vision, HDR10+, HLG là gì?

Trong bài viết trước, chúng ta đã tìm hiểu cơ bản về tiêu chuẩn hình …

x940e

Chấm lượng tử sẽ giúp TV LCD chống lại OLED như thế nào?

Rảnh rảnh lại viết một bài chia sẻ về công nghệ bên lề các sản …

Leave a Reply