Sebastien Rousseau

Google Gemma: biến đổi phát triển AI mã nguồn mở

Mô hình ngôn ngữ mở của Google cho các nhà phát triển

3 phút đọc

Logo Gemma.class="img-fluid clearfix"

TL;DR. Gemma là họ mô hình ngôn ngữ mở của Google (2B và 7B tham số), được xây dựng từ cùng nghiên cứu và công nghệ với Gemini. Nó cho phép các nhà phát triển chạy AI cấp doanh nghiệp tại chỗ với giấy phép thân thiện với thương mại.

Điểm chính

  • Ý tưởng. Mô hình mở chất lượng cao cho phép triển khai tại chỗ và tuỳ biến.
  • Đổi mới. Hiệu suất cạnh tranh với các mô hình lớn hơn nhiều.
  • Trường hợp sử dụng. Triển khai trên thiết bị, tinh chỉnh cụ thể của miền, xử lý dữ liệu nhạy cảm.
  • Tác động. Đẩy nhanh cuộc đua AI mã nguồn mở (Llama 3, Mistral, Gemma).

Bối cảnh #

Cuộc đua AI mở #

Năm 2023, Meta phát hành Llama 2 dưới giấy phép thân thiện với thương mại, khởi đầu một cuộc đua AI mã nguồn mở. Mistral của Pháp tiếp nối với các mô hình hiệu quả. Google trả lời với Gemma vào tháng 2 năm 2024.

Các mô hình #

Gemma 2B và 7B #

Cả hai đều có sẵn các phiên bản pre-trained và instruction-tuned.

Hiệu suất #

Cạnh tranh trong phạm vi tham số #

Gemma 7B cạnh tranh với Llama 2 13B và Mistral 7B trên hầu hết các điểm chuẩn — đạt được hiệu suất tương đương với một nửa số tham số trong một số trường hợp.

Trường hợp sử dụng #

Triển khai cục bộ #

Tinh chỉnh #

Giấy phép #

Thân thiện với thương mại #

Giấy phép Gemma cho phép sử dụng thương mại với các hạn chế hợp lý (cấm vũ khí, lạm dụng, v.v.). Đây là một lợi thế so với các mô hình có hạn chế nặng hơn.

Cài đặt #

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("google/gemma-7b-it")
model = AutoModelForCausalLM.from_pretrained("google/gemma-7b-it")

input_text = "Giải thích cơ học lượng tử cho người mới bắt đầu."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0]))

Tác động với ngân hàng #

Quyền riêng tư và tuỳ biến #

Đối với các ngân hàng, các mô hình mở như Gemma có sức hấp dẫn đặc biệt:

Triển vọng #

AI mã nguồn mở trong 2024 #

Khoảng cách giữa các mô hình đóng và mở đang thu hẹp. Đến cuối năm 2024, các mô hình mở 70B+ tham số có khả năng cạnh tranh với GPT-4 trên nhiều tác vụ. Đây là tin tốt cho doanh nghiệp và phát triển AI có chủ quyền.

Kết luận #

Gemma là một động thái chiến lược: Google nhận ra rằng phát triển AI mở là một mặt trận quan trọng và không muốn nhường nó cho Meta và Mistral. Đối với các tổ chức tìm kiếm các lựa chọn AI riêng tư và có thể tuỳ biến, Gemma là một bổ sung được đón chào cho hệ sinh thái.

Cập nhật lần cuối .