Hội nghị Google I/O 2025, diễn ra từ ngày 20 đến 21/5 tại trụ sở chính ở Mountain View, California (Mỹ), đã mang đến hàng loạt nâng cấp đột phá xoay quanh trí tuệ nhân tạo (AI). Từ các mô hình AI mới như Gemini 2.5, công cụ tạo ảnh – Video nâng cao, cho đến kính thông minh và trình duyệt tích hợp AI, Google thể hiện rõ định hướng tương lai là “AI trước, AI sâu và AI ở khắp mọi nơi”.
Gemini 2.5: Mô Hình AI Đa Dạng, Mạnh Mẽ Và Tối Ưu Hơn
Tâm điểm tại sự kiện chính là Gemini 2.5, phiên bản nâng cấp của mô hình trí tuệ nhân tạo từng được ca ngợi là “thông minh nhất hiện nay”. Hai biến thể nổi bật là Gemini 2.5 Pro và Gemini 2.5 Flash, mỗi phiên bản đều mang đến những thế mạnh riêng:
- Gemini 2.5 Pro tích hợp tính năng Deep Think, cho phép mô hình đánh giá nhiều giả thuyết trước khi đưa ra câu trả lời. Điều này đặc biệt hữu ích trong các lĩnh vực yêu cầu tư duy logic phức tạp như toán học hay lập trình. Theo Google, mô hình này đã đạt điểm cao trong kỳ thi Olympic Toán học Mỹ 2025.
- Gemini 2.5 Flash tập trung vào hiệu suất cao và tốc độ xử lý nhanh, sử dụng ít token hơn nhưng vẫn đảm bảo khả năng phân tích ngữ cảnh dài và xử lý dữ liệu đa phương thức. Mô hình này dự kiến ra mắt chính thức vào tháng 6 tới.
Ngoài ra, cả hai mô hình hiện đã hỗ trợ tính năng chuyển văn bản thành giọng nói, bao gồm hai giọng nói và hỗ trợ 24 ngôn ngữ, thông qua Gemini API.
Project Mariner: Tác Nhân AI Tự Động Hoàn Thành Nhiệm Vụ
Một điểm nổi bật khác là Project Mariner, được tích hợp vào Gemini API và Vertex AI. Đây là một tác nhân AI có thể điều hướng website, xử lý tác vụ phức tạp và hỗ trợ người dùng như một trợ lý ảo thực thụ – Từ đọc nội dung, điền form, đến tương tác với các dịch vụ web.
AI Mode Mới Cho Tìm Kiếm: Trải Nghiệm Chatbot Thay Thế Search Truyền Thống
Google chính thức giới thiệu AI Mode – Chế độ tìm kiếm bằng AI sẽ triển khai đầu tiên tại Mỹ trong tuần này, và mở rộng ra toàn cầu trong vài tháng tới. Dựa trên sức mạnh của Gemini 2.5, AI Mode biến hành vi tìm kiếm truyền thống thành cuộc trò chuyện dạng chatbot, cho phép người dùng nhận được câu trả lời tổng hợp, phân tích chuyên sâu.
Một số tính năng nổi bật:
- Tạo biểu đồ cho các chủ đề như tài chính, thể thao
- Truy vấn bằng hình ảnh thông qua Project Astra: người dùng chỉ cần hướng camera vào vật thể để tra cứu
- Thử đồ ảo và thông báo giảm giá khi mua sắm online
- Tổng hợp kiến thức nâng cao theo yêu cầu chuyên biệt
Theo ông Nick Fox, Giám đốc sản phẩm của Google, đây là bước tiến giúp công cụ tìm kiếm không còn chỉ là “truy xuất dữ liệu” mà đã tiến tới “lý luận và phân tích thông tin đa chiều”.
Imagen 4 Và Veo 3: Định Hình Lại Sáng Tạo Hình Ảnh & Video Bằng AI
Imagen 4 là phiên bản mới nhất của mô hình tạo hình ảnh từ văn bản của Google, với khả năng tạo ra hình ảnh cực kỳ chi tiết, từ các sợi vải đến giọt nước và lông động vật. Mô hình cũng xử lý chữ tốt hơn, hỗ trợ người dùng trong việc thiết kế thiệp mừng, áp phích, truyện tranh… với độ chính xác cao.
Trong khi đó, Veo 3 là mô hình tạo video AI với bước tiến mới: hỗ trợ âm thanh, lời thoại nhân vật và hiệu ứng môi trường. Đây là ưu điểm vượt trội khi hầu hết các đối thủ hiện tại chỉ có thể tạo video nền nhạc không lời.
Cùng với đó, Google giới thiệu ứng dụng AI Flow – Công cụ dựng phim AI cho phép tạo video 8 giây từ lời nhắc, ảnh hoặc clip đầu vào. Người dùng có thể ghép các cảnh, tinh chỉnh chi tiết để tạo video liền mạch, phù hợp cả cho sáng tạo nội dung lẫn công việc chuyên nghiệp.
Kính Thông Minh Project Aura Và Android XR: Tương Lai Cận Kề
Google cũng hé lộ Project Aura, kính thông minh tích hợp camera, micro, loa và màn hình thông báo – Cho phép dịch ngôn ngữ trực tiếp, dẫn đường, ra lệnh bằng giọng nói và chụp ảnh thông qua AI Gemini. Đây là sản phẩm cạnh tranh trực tiếp với kính Ray-Ban của Meta, và được phát triển hợp tác cùng Xreal.
Project Aura vận hành trên nền tảng Android XR – Hệ điều hành dành riêng cho thiết bị thực tế ảo tăng cường (AR/VR) – Hiện đã được nâng cấp để hỗ trợ các chức năng AI mạnh mẽ hơn.
Trí Tuệ Nhân Tạo Thâm Nhập Chrome, Gmail Và Google Meet
Trên Chrome
Người dùng Google AI Pro và Ultra sẽ thấy nút Gemini tích hợp ngay trên trình duyệt, giúp:
- Tóm tắt nội dung website
- Tự động tạo và thay đổi mật khẩu khi bị rò rỉ
- Mua sắm và điều hướng web thông minh
Trên Gmail
Google cũng mang đến một bước đột phá trên Gmail khi tích hợp AI viết thư thông minh sử dụng sức mạnh từ mô hình Gemini mới nhất. Không chỉ đơn thuần đưa ra gợi ý soạn thư như trước, công cụ mới có khả năng phân tích lịch sử email cá nhân để học phong cách viết đặc trưng của người dùng.
Nhờ kết nối sâu với Google Drive và các dữ liệu liên quan, AI có thể soạn thảo nội dung trả lời mang tính tự nhiên, đúng ngữ cảnh, thậm chí giữ được giọng điệu cá nhân hóa như thể người dùng tự tay viết. Điều này đặc biệt hữu ích cho doanh nhân, nhân sự văn phòng bận rộn, hoặc người dùng thường xuyên phản hồi email công việc phức tạp, giúp tiết kiệm thời gian mà vẫn đảm bảo chất lượng và độ chuyên nghiệp.
Trên Google Meet
Trong lĩnh vực hội họp và giao tiếp video, Google Meet được nâng cấp với khả năng dịch giọng nói trực tiếp theo thời gian thực – Một trong những tính năng được đánh giá cao nhất tại sự kiện Google I/O năm nay. Với sự hỗ trợ của mô hình Gemini, Meet giờ đây có thể dịch ngôn ngữ một cách mượt mà, chính xác gần như ngay lập tức, gần như không có độ trễ.
Tính năng này mở ra nhiều ứng dụng trong thực tế: từ các cuộc họp đa quốc gia giữa các công ty toàn cầu, đến các cuộc trò chuyện gia đình xuyên biên giới với nhiều thế hệ sử dụng ngôn ngữ khác nhau. Trải nghiệm giao tiếp qua video không còn bị giới hạn bởi rào cản ngôn ngữ, giúp các nhóm làm việc trở nên linh hoạt, cởi mở và hiệu quả hơn.
Google cho biết công nghệ dịch giọng nói bằng AI của họ hiện đã vượt trội về độ mượt mà, tốc độ phản hồi và độ chính xác so với hầu hết giải pháp hiện có trên thị trường.
Google I/O 2025 không chỉ là bản nâng cấp cho các công cụ hiện có, mà còn là sự khẳng định chiến lược AI lâu dài của Google – Đưa AI vào sâu hơn trong mọi mặt đời sống, từ tìm kiếm, sáng tạo, làm việc, đến thiết bị đeo. Với các cải tiến đầy hứa hẹn như Gemini 2.5, AI Mode trong Search, Imagen 4, Veo 3 và Project Aura, Google đang đặt nền móng vững chắc cho thế hệ công nghệ tiếp theo.