Tin tức

Xử lý hình ảnh/video kỹ thuật số (Phần 1) – Cơ bản về hình ảnh/video kỹ thuật số

Xử lý hình ảnh/video kỹ thuật số (Phần 1) – Cơ bản về hình ảnh/video kỹ thuật số

June 12, 2020

Hình ảnh hay video ngày càng đóng vai trò lớn trong công cuộc điều tra tội phạm, đây là một trong những bằng chứng phổ biến do dễ thu thập, truyền tải và lưu trữ. Các hình ảnh, video có thể làm manh mối điều tra cũng như chứng cứ tại tòa. Một hình ảnh rõ ràng sẽ giúp rút ngắn quá trình điều tra và tạo ra bằng chứng thuyết phục hơn.

Tuy nhiên, có không ít khó khăn như hình ảnh bị mờ,  không rõ ràng và thậm chí, một số hình ảnh kỹ thuật số cũng rất dễ làm giả. Đó là lý do tại sao các cơ quan điều tra, các lực lượng thực thi pháp luật cần có những phần mềm làm nét hình ảnh, phần mềm xác thực hình ảnh/video nhằm khắc phục những trường hợp này để tìm ra các bằng chứng xác đáng.

Trước khi tìm hiểu về cách thức xử lý, làm nét các hình ảnh/video kỹ thuật số, chúng ta cần biết được những kiến thức cơ bản về hình ảnh/video kỹ thuật số là gì.

Hình ảnh/video kỹ thuật số là gì?

Một hình ảnh kỹ thuật số là một ma trận các số trên máy tính. Những con số này được giải nghĩa bởi một máy tính và màn hình hiển thị, biểu thị một màu sắc nhất định. Mỗi ô trong ma trận này là một pixel và mỗi pixel có một giá trị. Kích thước của hình ảnh kỹ thuật số được xác định bởi chiều rộng của hình ảnh tính bằng pixel nhân với chiều cao của hình ảnh tính bằng pixel. Ví dụ như trên hình là 4 x 4. Đối với hình ảnh HD kích thước là 1920×1080. Kích thước này cũng có thể được gọi là độ phân giải.

Một video kỹ thuật số là một chuỗi các hình ảnh kỹ thuật được hiển thị ở một tốc độ nhất định (khung hình trên giây)

Video kỹ thuật số
Video kỹ thuật số

Khung hình trên giây (fps) của video là đại lượng của số khung hình xuất hiện trong một giây của video đó. FPS càng cao thì hình ảnh sẽ mượt hơn. Trong thực tế, tốc độ 25-30 fps là tốc độ chuẩn thường được sử dụng nhất (phim ảnh, truyền hình,….), đủ để hình ảnh mượt mà và không gây mỏi mắt.

Với tốc độ cao hơn, có thể tạo ra được hiệu ứng quay chậm như slowmotion, được sử dụng để quay các đối tượng có vận tốc di chuyển nhanh, cần độ chính xác. Còn đối với các hệ thống camera giám sát thì tốc độ này thường sẽ thấp vì để giảm dung lượng lưu trữ và truyền tải.

Pixel là gì?

Giống như mô tả trong phần trên, pixel là một ô trong mà trận. Vậy một pixel bao gồm những gì ?

Mỗi pixel bao gồm 3 kênh: R (đỏ), G (xanh lục), B (xanh lam). Mỗi kênh có một giá trị số. Sự kết hợp của những con số này xác định màu sắc hiển thị cuối cùng.

Đối với hình ảnh thang độ xám: cả 3 kênh có giá trị giống nhau. Đối với hình ảnh màu, các kênh có thể có giá trị khác nhau.

Mỗi kênh (R,G,B) có một byte để lưu trữ một giá trị. Mỗi byte có 8 bit. Mỗi bit có giá trị “0” hoặc “1”.

 

Giá trị của pixel càng gần 0 thì càng tốt. Giá trị của pixel càng gần 255 thì càng sáng.

 

Thang độ xám

Hình ảnh thang độ xám là hình ảnh chỉ sử dụng màu đen, trắng và xám ở giữa. Cả 3 kênh RGB trong hình ảnh thang độ xám có giống nhau.

Hình ảnh thang độ xám có thể được tạo ra bằng cách chuyển đổi từ hình ảnh màu.

Có nhiều phương pháp để tính toán một giá trị thang độ xám từ một giá trị màu. Cách cơ bản nhất là chỉ chọn một trong các kênh màu và sao chép giá trị này sang các kênh khác.

Hình ảnh thang độ xám có thể được tạo ra bằng cách chuyển đổi từ hình ảnh màu

Như hiển thị trên hình thì cách này tạo ra 3 hình ảnh khác nhau và không thể hiện tốt được ảnh gốc.

Có một cách tốt hơn là tính giá trị trung bình của ba thành phần màu và sử dụng giá trị đó cho giá trị thang độ xám. Giá trị trung bình này được gọi là Cường độ (Intensity)

Intensity = (Red + Green + Blue) / 3

Một phương pháp khác để chuyển đổi sang thang độ xám là sử dụng giá trị Độ chói (Luminance).

Luminance = 0.30 x Red + 0.59 x Green + 0.11 x Blue

Trong hình ảnh màu trong hình, màu xanh lam có vẻ đậm hơn màu đỏ và màu đỏ dường như đậm hơn màu xanh lục. Điều này là do mắt người nhạy cảm với ánh sáng xanh lục hơn ánh sáng đỏ và nhạy cảm ánh sáng đỏ hơn với ánh sáng xanh lam. Độ chói được sử dụng để bù cho cường độ tương đối này của ba thành phần màu. Các hệ số 0.30, 0.59 và 0.11 trong phương trình độ chói là các yếu tố bù cho độ mạnh tương đối của các màu R, G và B. Chúng được xác định bởi các nghiên cứu sinh lý rộng rãi giữa các nhóm lớn người và chúng đại diện cho một con người trung bình.

Nén hình ảnh/video

Nén được sử dụng để biểu diễn thông tin trong ít bit hơn so với ban đầu:

  • Tiết kiệm không gian lưu trữ
  • Giảm chi phí
  • Giảm băng thông cần thiết để truyền dữ liệu

Có 2 loại nén: Nén không tổn hao (lossless) và Nén tổn hao (lossy)

Nén không tổn hao (lossless), không làm mất dữ liệu sau khi giải nén.

Nén có tổn hao (lossy), lượng dữ liệu thực tế sẽ giảm sau khi giải nén.

Với việc nén hình ảnh/video này, nếu ứng dụng để lưu trữ thì phương pháp nén này là rất tốt. Tuy nhiên,  đối với việc xử lý hình ảnh, việc nén hình ảnh/video sẽ không bao giờ có thể khôi phục lại tất cả dữ liệu gốc.

Trên đây là những kiến thức cơ bản về hình ảnh/video kỹ thuật số, trong phần tiếp theo chúng tôi sẽ giới thiệu về cách tạo ra một hình ảnh hoặc video kỹ thuật số và các vấn đề gặp phải khi hình ảnh xấu, mờ, chất lượng thấp có nguyên nhân từ đâu và cách khắc phục các hình ảnh này như thế nào.

Hoàng Minh Huy

 

Share