Sebastien Rousseau

Google Gemma: biến đổi phát triển AI mã nguồn mở

Mô hình ngôn ngữ mở của Google cho các nhà phát triển

7 min read
Banner for: Google Gemma: biến đổi phát triển AI mã nguồn mở

Logo Gemma.class="img-fluid clearfix"

TL;DR. Gemma là họ mô hình ngôn ngữ mở của Google (2B và 7B tham số), được xây dựng từ cùng nghiên cứu và công nghệ với Gemini. Nó cho phép các nhà phát triển chạy AI cấp doanh nghiệp tại chỗ với giấy phép thân thiện với thương mại.

Điểm chính

  • Ý tưởng. Mô hình mở chất lượng cao cho phép triển khai tại chỗ và tuỳ biến.
  • Đổi mới. Hiệu suất cạnh tranh với các mô hình lớn hơn nhiều.
  • Trường hợp sử dụng. Triển khai trên thiết bị, tinh chỉnh cụ thể của miền, xử lý dữ liệu nhạy cảm.
  • Tác động. Đẩy nhanh cuộc đua AI mã nguồn mở (Llama 3, Mistral, Gemma).

Bối cảnh

Cuộc đua AI mở

Năm 2023, Meta phát hành Llama 2 dưới giấy phép thân thiện với thương mại, khởi đầu một cuộc đua AI mã nguồn mở. Mistral của Pháp tiếp nối với các mô hình hiệu quả. Google trả lời với Gemma vào tháng 2 năm 2024.

Các mô hình

Gemma 2B và 7B

Cả hai đều có sẵn các phiên bản pre-trained và instruction-tuned.

Hiệu suất

Cạnh tranh trong phạm vi tham số

Gemma 7B cạnh tranh với Llama 2 13B và Mistral 7B trên hầu hết các điểm chuẩn — đạt được hiệu suất tương đương với một nửa số tham số trong một số trường hợp.

Trường hợp sử dụng

Triển khai cục bộ

Tinh chỉnh

Giấy phép

Thân thiện với thương mại

Giấy phép Gemma cho phép sử dụng thương mại với các hạn chế hợp lý (cấm vũ khí, lạm dụng, v.v.). Đây là một lợi thế so với các mô hình có hạn chế nặng hơn.

Cài đặt

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("google/gemma-7b-it")
model = AutoModelForCausalLM.from_pretrained("google/gemma-7b-it")

input_text = "Giải thích cơ học lượng tử cho người mới bắt đầu."
inputs = tokenizer(input_text, return_tensors="pt")
outputs = model.generate(**inputs, max_new_tokens=200)
print(tokenizer.decode(outputs[0]))

Tác động với ngân hàng

Quyền riêng tư và tuỳ biến

Đối với các ngân hàng, các mô hình mở như Gemma có sức hấp dẫn đặc biệt:

Triển vọng

AI mã nguồn mở trong 2024

Khoảng cách giữa các mô hình đóng và mở đang thu hẹp. Đến cuối năm 2024, các mô hình mở 70B+ tham số có khả năng cạnh tranh với GPT-4 trên nhiều tác vụ. Đây là tin tốt cho doanh nghiệp và phát triển AI có chủ quyền.

Kết luận

Gemma là một động thái chiến lược: Google nhận ra rằng phát triển AI mở là một mặt trận quan trọng và không muốn nhường nó cho Meta và Mistral. Đối với các tổ chức tìm kiếm các lựa chọn AI riêng tư và có thể tuỳ biến, Gemma là một bổ sung được đón chào cho hệ sinh thái.

Cập nhật lần cuối .