Tin tức

Trí tuệ nhân tạo (AI) và Học máy tác động đến các cuộc điều tra kỹ thuật số như thế nào?

Trí tuệ nhân tạo (AI) và Học máy tác động đến các cuộc điều tra kỹ thuật số như thế nào?

November 20, 2020

Các cuộc điều tra kỹ thuật số ngày nay liên quan ngày càng nhiều đến việc truy cập vào dữ liệu ảnh và video từ các thiết bị điện tử thu giữ được của đối tượng. Với sự gia tăng của các ứng dụng chia sẻ hình ảnh và dung lượng lưu trữ ngày càng tăng trong các thiết bị kỹ thuật số, không có gì lạ khi một cuộc điều tra kỹ thuật số, liên quan đến một vài thiết bị, có thể chứa hàng trăm nghìn bức ảnh cũng như hàng trăm giờ quay video.

Nhiệm vụ của các lực lượng thực thi pháp luật là cần  tận dụng dữ liệu này một cách nhanh chóng để giải quyết cuộc điều tra.

Công nghệ phân tích video và hình ảnh đã có từ nhiều thập kỷ. Tuy nhiên, với sự ra đời của thị giác máy tính được hỗ trợ bởi AI, những công nghệ này giờ đây mạnh mẽ hơn và giá cả phải chăng hơn bao giờ hết.

Một trong những công nghệ đó là Media Categorization (Phân loại media (hình ảnh, video)). Kỹ thuật AI có thể “gắn cờ” những hình ảnh có thể mang giá trị quan trọng đối với các nhà điều tra bao gồm các hình ảnh có thể chứa ma túy, vũ khí, khuôn mặt, tiền, tài liệu, ảnh chụp màn hình, bản đồ, hình ảnh bất hợp pháp, v..v..

Trong bài viết này,  chúng ta sẽ tìm hiểu những bước đột phá gần đây về sự phát triển của AI và kỹ thuật phần mềm cho phép người dùng “dạy” máy tính nhận ra một danh mục mới chỉ trong vài phút — với ít nhất là vài chục hình ảnh.

Thị giác máy tính được hỗ trợ bởi AI

Trí tuệ nhân tạo (Artifcial Intelligence) và Học máy (Machine Learning)

Thuật ngữ trí tuệ nhân tạo (AI) có từ đầu năm 1956. Hồi đó, các nhà khoa học máy tính rất lạc quan về khả năng phát triển một “cỗ  máy tư duy ”trong vòng vài thập kỷ. Ngày nay, khả năng tư duy đó đã trở thành hiện thực, nhưng thuật ngữ này có thể gây nhầm lẫn.

Thuật ngữ “AI” và “học máy” thường được sử dụng thay thế cho nhau, tuy nhiên có một sự khác biệt nhỏ giữa chúng

Thuật ngữ “AI” và “học máy” thường được sử dụng thay thế cho nhau, tuy nhiên có sự khác biệt nhỏ giữa chúng. AI đề cập đến việc sử dụng máy tính để bắt chước các chức năng nhận thức của con người. AI có thể đề cập đến các hoạt động như vậy ngay cả khi các thuật toán đằng sau chúng được con người mã hóa cứng. Học máy đề cập đến khả năng máy tính tự học một thuật toán tối ưu, dựa trên dữ liệu mà chúng được cung cấp.

Việc huấn luyện máy tính để “suy nghĩ như con người” đạt được một phần nhờ sử dụng mạng nơ-ron. Mạng nơ-ron là một nhóm thuật toán được mô phỏng theo bộ não con người. Bộ não của chúng ta có thể nhận ra các mẫu và giúp chúng ta phân loại thông tin. Mạng nơ-ron cũng làm như vậy đối với máy tính. Bộ não không ngừng cố gắng hiểu thông tin mà nó đang xử lý. Để làm được điều này, nó điều chỉnh và thay đổi các kết nối giữa các tế bào thần kinh trong não. Mạng nơ-ron cũng làm như vậy đối với máy tính.

“Deep Learning” (còn được gọi là “mạng nơ-ron sâu” (Deep Neural Networks)), là một trong những tiến bộ mới nhất trong học máy.

Các mạng “deep learning” cần phải xem số lượng lớn các mục để được đào tạo. Thay vì được lập trình trước với các tham số (được gọi là “trọng số”), các hệ thống học từ việc tiếp xúc với hàng triệu điểm dữ liệu.

Sự bùng nổ của AI

Thời gian gần đây, chúng ta nhận thấy sự gia tăng trong học máy dựa trên mạng nơ-ron chủ yếu là do:

  • Giá cả phải chăng hơn
  • Nguồn dữ liệu có sẵn phong phú
  • Tăng cường tập trung vào nghiên cứu học thuật
  • Nó đang cung cấp sức mạnh cho các ngành công nghiệp chính như lái xe tự hành, hỗ trợ khách hàng, v.v.

Phân loại media bằng cách sử dụng Deep Neural Networks (Mạng nơ-ron sâu)

Năm 2012, Alex Krizhevsky, một sinh viên PHD từ Đại học Toronto, đã làm kinh ngạc thế giới thị giác máy tính bằng việc làm thay đổi, cải thiện đáng kể kết quả mới nhất hiện nay trong thử thách mang tên ImageNet. Thử thách này liên quan đến việc đào tạo một máy có khoảng một triệu hình ảnh được gắn thẻ của các đối tượng và khái niệm trong đời thực, sau đó cố gắng dự đoán các khái niệm và đối tượng trong các hình ảnh không được gắn thẻ.

Krizhevsky đã sử dụng mạng nơ-ron sâu tích chập (Convolutional Deep Neural Network) . Về cơ bản đây là một mạng nơ-ron được tạo ra từ nhiều lớp nơ-ron, nơi các chức năng truyền thông tin từ lớp này sang lớp khác giống như các thao tác cơ bản của pixel.

Hình ảnh mô tả Mạng Nơ-ron tích chập
Hình ảnh mô tả Mạng Nơ-ron tích chập

Kiến trúc mạng này được đặt tên là “AlexNet” và bắt đầu một kỷ nguyên của công nghệ và kiến trúc mạng thần kinh ngày càng cải tiến mà ngày nay, được cung cấp đủ sức mạnh để tính toán và hoạt động gần hoặc thậm chí tốt hơn con người.

Phân loại media Ad-Hoc tùy chỉnh

“Ad – Hoc là tập hợp nhiều nút mạng, có khả năng kết nối mà không cần đến các trạm thu phát tín hiệu. Ad-Hoc đang là công nghệ mới nhất trong công nghệ thông tin vô tuyến hiện nay, với tính năng và những ứng dụng vô cùng tiên tiến cho phép các nút mạng truyền trực tiếp với nhau, mà không cần qua các thiết bị trung gian. Nhờ có sự ra đời của Ad-Hoc mà các thiết bị cầm tay như điện thoại, laptop…và các thiết bị cố định khác như các điểm truy cập internet không dây, các trạm cơ sở được kết nối và liên hệ với nhau tạo thành hệ thống mạng toàn cầu”.

Dữ liệu trên các thiết bị kỹ thuật số không phải là ngẫu nhiên. Hầu hết các hình ảnh có trên điện thoại của một người không phải do ngẫu nhiên mà có. Chúng thường chứa các tập con liên quan đến một sự kiện hoặc chủ đề nào đó. Một vũ công có thể có nhiều hình ảnh và video khiêu vũ trên thiết bị của họ trong khi một người đi bộ đường dài có thể có nhiều hình ảnh ngoài trời. Điều này có nghĩa là số lượng “khái niệm” được thể hiện trên một thiết bị riêng lẻ tương đối ít hơn nhiều khi so sánh với tổng số lượng của tất cả các khái niệm có thể có trên thế giới.

Do đó, nếu chúng ta muốn phân loại hoặc “dạy” một máy xác định một khái niệm trong ngữ cảnh của thiết bị cụ thể đó (hoặc một bộ thiết bị), thì đây có thể trở thành một nhiệm vụ học máy đơn giản hơn nhiều so với việc cố gắng học khái niệm đó trong bối cảnh của hình ảnh ngẫu nhiên.

Tại sao nên chọn Cellebrite?

Là công ty hàng đầu trong ngành về các giải pháp pháp y kỹ thuật số, Cellebrite hiểu cấu trúc của dữ liệu hơn bất kỳ ai khác. Chuyên môn này đảm bảo các công cụ phân tích nâng cao của Cellebrite cung cấp thông tin chi tiết sâu sắc nhất, chính xác nhất có thể. Giờ đây, người dùng có thể đơn giản hóa và tự động hóa các câu hỏi phân tích phức tạp, thu được nhiều dữ liệu tiềm năng hơn trong thời gian ngắn hơn. Các thuật toán học máy dựa trên mạng nơ-ron tiên tiến của Cellebrite cho phép bạn khám phá các bằng chứng quan trọng nhanh hơn để giải quyết các trường hợp nhanh hơn.

Phân loại phương tiện tùy chỉnh đầu tiên trong ngành

Cellebrite Pathfinder hiện cho phép người dùng xác định danh mục hình ảnh của họ, quá trình này chỉ mất vài phút và chỉ cần vài chục hình ảnh mẫu.

Tóm tắt nội dung danh mục video

Tiết kiệm thời gian điều tra bằng cách chỉ tập trung vào các khung hình đáng quan tâm trong một đoạn video cụ thể. Công nghệ máy học dựa trên mạng nơ-ron mở rộng cung cấp phân loại hình ảnh và video tự động cho từng khung video riêng lẻ cho các danh mục được xác định:

  • Thuốc/Chất cấm/Chấ gây nghiện
  • Khuôn mặt
  • Bóc lột sức lao động trẻ em
  • Ảnh khỏa thân
  • Tiền
  • Cờ
  • Vũ khí
  • Bản đồ
  • Tài liệu

Các danh mục khác nhau được đánh dấu rõ ràng trên thanh phát lại video, cho phép người dùng nhanh chóng xem lại các danh mục khác nhau trong một đoạn video. Điều này cho phép người dùng tiết kiệm thời gian, tập trung vào các khung hình quan tâm cụ thể.

Nhận dạng khuôn mặt

Cellebrite Analytics tự động phát hiện và hiển thị các khuôn mặt bên trong các phương tiện media. Bạn có thể nhanh chóng và dễ dàng tìm kiếm các hình ảnh có khuôn mặt giống như trong hình ảnh đã xem xét, tiếp tục hiển thị các đối tượng tiềm năng và mở rộng điều tra bằng cách tạo kết nối tự động giữa các phương tiện truyền thông dựa trên những người nằm trong mối quan tâm.

Các hình ảnh/video tương tự

Vượt ra ngoài các hàm băm đã biết và việc tìm kiếm các hình ảnh/video tương tự chưa biết trước đây, người dùng có thể tải lên một hình ảnh hoặc chọn một hình ảnh từ các chứng kỹ thuật số và hệ thống tìm kiếm các hình ảnh tương tự theo cách giống như cách ghép các hình ảnh có khuôn mặt tương tự. Sự tương đồng được tính toán dựa trên mô hình học máy lấy cảm hứng từ cấu trúc não bộ của chúng ta. Với khả năng này, chúng tôi có thể “huấn luyện” hệ thống hiểu các đối tượng trong một hình ảnh bằng cách cung cấp cho nó nhiều ví dụ, do đó cho phép hệ thống “học” cách xác định các đối tượng mà hệ thống chưa nhìn thấy trước đó.

Khả năng này cho phép bạn tìm kiếm các hình ảnh tương tự về mặt trực quan như: biểu tượng, căn phòng, chủ đề hoặc hình ảnh,.. Ví dụ, trong các vụ bóc lột trẻ em, khi điều tra viên nghi ngờ rằng trong khi các nạn nhân thay đổi nhưng địa điểm là giống nhau, họ có thể có thêm các nạn nhân bằng cách ghép thêm các bức ảnh được chụp trong cùng một phòng. Trong trường hợp có sẵn hình chụp nghi phạm, bạn có thể tải hình ảnh lên và tìm kiếm trên toàn bộ dữ liệu vụ án để tìm hình ảnh có khuôn mặt giống như khuôn mặt đã tải lên. Điều này cho phép bạn chỉ tập trung vào phương tiện có liên quan để giảm thời gian xem xét hình ảnh.

Kết luận

Rõ ràng, phân loại media tùy chỉnh cung cấp một phương thức trực tiếp để các nhà điều tra xác định hình ảnh có thể chứa ma túy, vũ khí, khuôn mặt và các tiêu chí khác dễ dàng hơn.

Khi được kết hợp với học máy để tạo ra các nhúng (embeddings) có thể phân biệt các khái niệm cụ thể trong bối cảnh có hàng triệu hình ảnh trong một trường hợp cụ thể, công nghệ này trở nên mạnh mẽ hơn theo cấp số nhân, cho phép các nhà điều tra nhanh chóng sắp xếp thông qua khối lượng dữ liệu lớn hơn trong khoảng thời gian ngắn hơn nhiều, đồng thời ngăn chặn tình trạng làm việc quá sức của các điều tra viên. Và điều tuyệt với nhất là có thể dạy cho máy móc quá trình lặp đi lặp lại này chỉ vài phút sau khi điều tra viên được đào tạo bài bản.

Nguồn: Cellebrite

 

 

Share