Sebastien Rousseau

Akande: trợ lý giọng nói cách mạng hoá hỗ trợ cá nhân và điều hành

Một trợ lý AI dùng GPT cho tương tác tự nhiên và tóm tắt PDF

2 phút đọc

Akande trợ lý AI.class="img-fluid clearfix"

TL;DR. Akande là một trợ lý giọng nói mã nguồn mở sử dụng GPT của OpenAI cho tương tác ngôn ngữ tự nhiên, tóm tắt PDF và quản lý lịch — được thiết kế đặc biệt cho lãnh đạo cấp cao và các nhà điều hành.

Điểm chính

  • Ý tưởng. Một trợ lý cá nhân chạy cục bộ, tương tác bằng giọng nói, được tối ưu hoá cho năng suất điều hành.
  • Đổi mới. Bộ nhớ đệm hiệu quả để giảm chi phí API; tóm tắt PDF tài liệu dài.
  • Trường hợp sử dụng. Quản lý lịch, chuẩn bị cuộc họp, tóm tắt báo cáo.
  • Tác động. Trả lại hàng giờ mỗi tuần cho các tác vụ cấp cao.

Bối cảnh #

Vì sao một trợ lý điều hành #

Các nhà điều hành nhận hàng trăm email, hàng chục báo cáo và nhiều cuộc gọi mỗi ngày. Các trợ lý con người là vô giá nhưng không thể có sẵn 24/7. Akande là một trợ lý AI bổ sung — không thay thế con người, nhưng xử lý các tác vụ lặp đi lặp lại.

Tính năng #

Tương tác giọng nói #

Tóm tắt PDF #

Quản lý lịch #

Kiến trúc #

Giọng nói → Whisper → Text → GPT-4 → Logic → Action
                                   ↓
                            TTS → Giọng nói trả lời

Bộ nhớ đệm lưu các truy vấn lặp lại để giảm chi phí API.

Cài đặt #

git clone https://github.com/sebastienrousseau/akande
cd akande
pip install -r requirements.txt
python akande.py

Quyền riêng tư #

Akande được thiết kế để chạy cục bộ. Tài liệu nhạy cảm không cần được tải lên các dịch vụ đám mây. Đối với tích hợp GPT, chỉ các văn bản đã được lọc PII được gửi đi.

Kết luận #

Akande là một trợ lý nhỏ, tập trung giải quyết một nhu cầu cụ thể. Đối với các nhà điều hành nhận quá nhiều thông tin, nó cung cấp một lớp lọc thông minh, được tối ưu hoá cho quyền riêng tư và năng suất.

Cập nhật lần cuối .