Tin tức Cổng (Gate News), ngày 3 tháng 4, Google phát hành mô hình đa phương thức Gemma 4. Gemma 4 có thể được sử dụng để xử lý đầu vào dạng văn bản và hình ảnh (mô hình nhỏ hỗ trợ đầu vào âm thanh) và tạo ra đầu ra dạng văn bản. Bản này bao gồm các mô hình trọng số mã nguồn mở đã được huấn luyện trước và tinh chỉnh theo hướng dẫn (instruction tuning). Cửa sổ ngữ cảnh của Gemma 4 tối đa có thể chứa 256.000 token và hỗ trợ hơn 140 ngôn ngữ. Gemma 4 đồng thời sử dụng kiến trúc dạng dày đặc (dense) và kiến trúc chuyên gia hỗn hợp (MoE), phù hợp cho các tác vụ như tạo sinh văn bản, mã hóa và suy luận. Các mô hình này có bốn quy mô khác nhau: E2B, E4B, 26B A4B và 31B, có thể triển khai trong nhiều môi trường từ điện thoại di động đến máy tính xách tay và máy chủ.