Tìm hiểu về khía cạnh kĩ thuật của siêu dữ liệu hình ảnh (photo metadata), phân loại và một số ứng dụng cơ bản trong thực tế.
Tìm hiểu về siêu dữ liệu hình ảnh
Cách đây hơn hai thập kỉ, chúng ta thường thấy những chiếc máy chụp phim tự động có tính năng chèn luôn thời gian chụp lên phim. Ít lâu sau đó, những chiếc máy ảnh kĩ thuật số thì lại lưu “ngầm” thông tin thời gian này vào ảnh và người dùng có thể xem được nếu cần.
Ngoài bản thân bức ảnh là tập hợp các điểm ảnh, máy ảnh kĩ thuật số còn ghi lại thời gian chụp và hàng loạt các siêu dữ liệu khác. Ví dụ: tên thiết bị chụp, thông số kĩ thuật của bức ảnh (ISO, tốc độ, khẩu độ,…), tên người chụp, bản quyền và rất nhiều những thông tin mà người dùng thông thường không biết đến.
Trong bài này
1. Siêu dữ liệu hình ảnh là gì?
Siêu dữ liệu hình ảnh (photo metadata) là một tập hợp thông tin về các thông số kĩ thuật, xử lí hậu kì cũng như thông tin về các quyền và quản lí hình ảnh. Các dữ liệu này được gửi đi cùng tập tin (file) hình ảnh để phần mềm và người dùng có thể đọc được.
Về kĩ thuật, siêu dữ liệu hình ảnh được lưu theo hai cách:
- Nội tại: Nhúng trong tập tin hình ảnh, với các định dạng như JPEG, DNG, PNG, TIFF v.v
- Ngoại tại: Thông tin không được ghi vào tập tin mà lưu trong cơ sở dữ liệu của phần mềm quản lí ảnh (ví dụ: Lightroom, Capture One) hoặc trong một tập tin song hành (sidecar) như XMP của Adobe chẳng hạn.
2. Các chuẩn siêu dữ liệu hình ảnh phổ biến
Có ba chuẩn siêu dữ liệu phổ biến: Exif, XMP và IPTC. Mỗi chuẩn này lại chứa một nhóm thông tin đặc thù và không gây xung đột với nhau.
2.1. Exif
Exif là viết tắt của Exchangeable Image File Format. Thực ra đây là chuẩn để các dữ liệu hình ảnh, dữ liệu âm thanh và các thẻ siêu dữ liệu được định dạng trong ảnh JPEG, ảnh TIFF và các tập tin âm thanh. Exif được sử dụng nhiều nhất để miêu tả các siêu dữ liệu được nhúng trong ảnh JPEG.
Exif có từ đầu thập niên 1990 và được cập nhật dần theo thời gian. Đây là định dạng siêu dữ liệu phổ biến nhất và nhiều người đồng nhất Exif với siêu dữ liệu hình ảnh nói chung. Giống như người Nam Bộ gọi xe máy là xe Honda vậy.
Hầu hết các bức ảnh kĩ thuật số khi chưa bị can thiệp gì đều có các siêu dữ liệu cơ bản như sau:
- Tên nhà sản xuất máy ảnh/điện thoại;
- Model của máy ảnh/điện thoại;
- Hướng (ảnh ngang hay dọc);
- Ngày giờ;
- Thông số chụp (iso, khẩu độ, tốc độ, tiêu cự,…);
- Một phiên bản ảnh xem trước (thumbnail).
Nói chung Exif thiên về thông tin mô tả bức ảnh ở khía cạnh kĩ thuật. Để xem Exif, bạn có thể sử dụng phần mềm. Ví dụ như đơn giản nhất trên macOS thì bạn mở ảnh bằng Preview và chọn Tools / Show Inspector (Cmd+I).
Các phần mềm quản lí ảnh chuyên nghiệp như Lightroom đều hỗ trợ đầy đủ việc xem và sửa đổi Exif.
2.2. XMP
XMP là viết tắt của “Extensible Metadata Platform”. Đây là một chuẩn mở do Adobe phát triển và từ 2012 đã trở thành một chuẩn ISO. Ngoài việc khả năng nhúng siêu dữ liệu vào tập tin giống như Exif thì XMP còn có thể ghi riêng biệt ở dạng một tập tin song hành (sidecar).
Lightroom là một phần mềm xử lí không can thiệp vào nội dung gốc (non-destructive). Trong Lightroom, thông thường thì các thay đổi sẽ được lưu vào cơ sở dữ liệu chung. Nhưng nếu bạn chọn Metadata / Save Metadata to File (phím tắt Cmd+S hoặc Ctrl+S) thì các thông tin đó sẽ được lưu vào tập tin XMP song hành trong cùng thư mục với ảnh gốc. Do vậy, để gửi ảnh đã sửa, bạn phải xuất (export) thành một tập tin ảnh khác. Và toàn bộ nội dung XMP sẽ được nhúng trong tập tin mới đó.
2.3. IPTC
IPTC là viết tắt của “International Press Telecommunications Council”. Như chính tên gọi của nó, đây là tiêu chuẩn miêu tả siêu dữ liệu do Hội đồng Viễn thông Báo chí Quốc tế phát triển.
IPTC được phân ra ba nhóm nội dung chính:
- Miêu tả: Thông tin về nội dung trong bức ảnh. Thường sẽ là tiêu đề, chú thích và từ khoá. Ngoài ra còn có thể là tên người, địa điểm, tác phẩm nghệ thuật hay sản phẩm có trong ảnh.
- Bản quyền và quyền sử dụng: Xác định người chụp, thông tin bản quyền, công trạng (credit) và vấn đề liên quan đến quyền sử dụng hình ảnh của cá nhân hoặc tài sản được chụp. Ngoài ra, người dùng có thể ghi các điều khoản khác về quyền sử dụng và giấy phép sử dụng hình ảnh.
- Quản trị: Thời gian và địa điểm chụp, hướng dẫn sử dụng, và các thông tin khác.
Là hiệp hội của những hãng thông tấn hàng đầu thế giới, IPTC khẳng định rằng đây là chuẩn siêu dữ liệu được sử dụng rộng rãi và phổ biến nhất (trong lĩnh vực báo chí, truyền thông).
3. Tầm quan trọng của siêu dữ liệu
“Siêu dữ liệu là câu chuyện đằng sau mỗi bức ảnh”. Nó cho biết chính xác bức ảnh chụp ra bằng cách nào, khi nào (và có thể cả ở đâu). Đồng thời nó còn miêu tả nội dung bức ảnh, nói tên người chụp và cho bạn biết bức ảnh đã được xử lí hậu kì ra sao.
Những thông số như thiết bị chụp, ống kính, khẩu độ, tốc độ,… là những thông tin hữu ích cho người mới chụp ảnh học hỏi hoặc rút kinh nghiệm. Những thông tin này cũng rất giá trị cho việc quản lí và xử lí hậu kì.
Siêu dữ liệu là các văn bản tìm được. Bạn có thể thêm tiêu đề, miêu tả và từ khoá cho bức ảnh để sau này có thể nhanh chóng tìm được. Không những thế, nếu tải ảnh lên Internet thì người khác cũng có thể tìm được ảnh của bạn.
Ngay cả khi bạn không chèn watermark lên bức ảnh thì người khác cũng có thể biết được tác giả nếu như trước đó bạn đã nhập thông tin bản quyền. Từ nhiều năm nay Google đã hiển thị tên người chụp và thông tin bản quyền trong kết quả tìm kiếm hình ảnh.
Trong những bài viết tiếp theo, chúng tôi sẽ chia sẻ chi tiết hơn về việc xử lí và khai thác các siêu dữ liệu này.
Comments are closed.
1 Comment.
[…] thế anh thấy cần phải chèn tên tập tin vào siêu dữ liệu của bức ảnh. Nhưng rất không may là Capture One không hỗ trợ chèn tự động. Thế thì lại […]