Pizza là một trong những món ăn quen thuộc nhất hiện nay với người dân tại nhiều quốc gia trên thế giới. Trải qua nhiều lần du nhập với nhiều biến tấu về mặt công thức chế biến, hương vị của pizza giờ đây cũng trở nên cực kì đa dạng và độc đáo. Để hành trình sáng tạo ẩm thực không bị giới hạn, mới đây các nhà nghiên cứu tại Đại học Rutgers đã hé lộ 1 thuật toán machine learning với khả năng tạo ra những chiếc bánh pizza với đủ các loại topping khác nhau. Họ gọi nó là Multi-ingredient Pizza Generator (MPG) - Máy sản xuất Pizza đa nguyên liệu.
Đây không phải menu hay hình ảnh minh họa trong 1 nhà hàng nào cả, đây đều là sản phẩm pizza ảo do MPG tạo ra.
Về cơ bản, MPG là 1 mạng neural tổng hợp (GAN) sử dụng kiến trúc StyleGAN2 của NVIDIA. Đây cũng chính là kiến trúc từng được ứng dụng cho nhiều thuật toán để tạo ra các sản phẩm giả nhưng trông như thật khác, ví dụ như bộ sưu tập lông thú hoạt hình dưới đây. Tất cả những sản phẩm như vậy thường mang mục đích nghiên cứu, hoặc đơn giản hơn là… cho vui, chứ chưa có nhiều ứng dụng thực tiễn.
Kiến trúc StyleGAN2 của NVIDIA đã từng tạo ra những bộ lông thú hoạt hình mượt mà và chuyên nghiệp như thế này đây.
Thế nhưng, MPG thì lại khác, bởi nó có thể đóng vai trò như 1 phép thử hữu ích, đặc biệt là khi bạn đang tìm và khắc phục những vấn đề về việc sản xuất hình ảnh bằng trí tuệ nhân tạo (AI), ví dụ như chồng các lớp ảnh lên nhau. Hãy thử tưởng tượng thế này: Bạn phải tìm cách chế biến 1 món pizza giống y hệt như 1 bức ảnh mẫu trên mạng. Bạn biết rõ nguyên liệu là gì, thời gian nướng ra sao, nhưng lại không biết cách sắp xếp chúng thế nào cho hợp lý nhất. Trong khi đó, yếu tố tầng lớp topping là cực kì quan trọng để tạo ra 1 chiếc pizza hoàn chỉnh. Lúc này, với MPG, bạn có thể gắn nhãn cho mỗi bức ảnh nguyên liệu riêng biệt, và thuật toán sẽ tự động sắp xếp các lớp ảnh này để có thể cho ra kết quả gần với công thức gốc nhất. MPG cũng cực kì hữu ích mỗi khi bạn muốn trổ tài sáng tạo và thử nghiệm nướng 1 chiếc pizza kiểu mới.
Đội ngũ nghiên cứu đã tự tạo ra tệp dữ liệu cho riêng mình với tên gọi Pizza10, dựa trên 1 bộ hình ảnh bánh pizza trong dự án pizzaGAN của trường đại học MIT công bố vào năm ngoái. Theo đó, MIT đã tải về khoảng nửa triệu bức ảnh khác nhau, chủ yếu được lấy từ Instagram dựa theo hashtag liên quan đến pizza. Tiếp đến, họ loại bỏ những hình ảnh không đủ chất lượng và cuối cùng thu về 9.213 tác phẩm với 13 lựa chọn topping. Đội ngũ nhân viên tại Amazon Mechanical Turk chịu trách nhiệm dán nhãn cho những topping này.
Bên cạnh đó, hình ảnh mà MPG tạo ra còn đảm bảo về mặt thẩm mỹ, với chiếc pizza “pha-ke” y như thật, không hề giả trân 1 chút nào. Nếu so sánh cùng các mô hình tương tự khác như CookGan hay AttnGAN như hình ảnh dưới đây thì rõ ràng là MPG ngon hơn hẳn, cả về nghĩa đen lẫn nghĩa bóng.
Những hình ảnh do MPG tạo ra rõ ràng là có tính thẩm mĩ cao hơn, sát với thực tế hơn và cũng ngon mắt hơn hẳn.
Fangda Han, một trong những đồng tác giả của công trình nghiên cứu này, đã nêu rõ ràng và chi tiết những phương pháp để thêm nguyên liệu vào chiếc pizza giả của bạn trong đoạn video dưới đây.
Cách tạo ra 1 bức ảnh pizza hoàn chỉnh, ngon mắt với MPG.
Bạn đọc quan tâm có thể đọc nghiên cứu hoàn chỉnh về MPG tại đây.
Theo VICE