.class="img-fluid clearfix"
TL;DR. Akande là một trợ lý giọng nói mã nguồn mở sử dụng GPT của OpenAI cho tương tác ngôn ngữ tự nhiên, tóm tắt PDF và quản lý lịch — được thiết kế đặc biệt cho lãnh đạo cấp cao và các nhà điều hành.
Điểm chính
- Ý tưởng. Một trợ lý cá nhân chạy cục bộ, tương tác bằng giọng nói, được tối ưu hoá cho năng suất điều hành.
- Đổi mới. Bộ nhớ đệm hiệu quả để giảm chi phí API; tóm tắt PDF tài liệu dài.
- Trường hợp sử dụng. Quản lý lịch, chuẩn bị cuộc họp, tóm tắt báo cáo.
- Tác động. Trả lại hàng giờ mỗi tuần cho các tác vụ cấp cao.
Bối cảnh #
Vì sao một trợ lý điều hành #
Các nhà điều hành nhận hàng trăm email, hàng chục báo cáo và nhiều cuộc gọi mỗi ngày. Các trợ lý con người là vô giá nhưng không thể có sẵn 24/7. Akande là một trợ lý AI bổ sung — không thay thế con người, nhưng xử lý các tác vụ lặp đi lặp lại.
Tính năng #
Tương tác giọng nói #
- Đầu vào giọng nói qua Whisper.
- Đầu ra giọng nói qua TTS chất lượng cao.
- Tương tác tự nhiên không cần từ kích hoạt.
Tóm tắt PDF #
- Tải lên một báo cáo 100 trang, nhận lại các điểm chính trong 30 giây.
- Trả lời các câu hỏi cụ thể về nội dung.
Quản lý lịch #
- "Lên lịch một cuộc họp 30 phút với Mai vào tuần tới khi cả hai chúng tôi đều rảnh."
- Tích hợp với Google Calendar và Outlook.
Kiến trúc #
Giọng nói → Whisper → Text → GPT-4 → Logic → Action
↓
TTS → Giọng nói trả lời
Bộ nhớ đệm lưu các truy vấn lặp lại để giảm chi phí API.
Cài đặt #
git clone https://github.com/sebastienrousseau/akande
cd akande
pip install -r requirements.txt
python akande.py
Quyền riêng tư #
Akande được thiết kế để chạy cục bộ. Tài liệu nhạy cảm không cần được tải lên các dịch vụ đám mây. Đối với tích hợp GPT, chỉ các văn bản đã được lọc PII được gửi đi.
Kết luận #
Akande là một trợ lý nhỏ, tập trung giải quyết một nhu cầu cụ thể. Đối với các nhà điều hành nhận quá nhiều thông tin, nó cung cấp một lớp lọc thông minh, được tối ưu hoá cho quyền riêng tư và năng suất.
Cập nhật lần cuối .