Sebastien Rousseau

Voice Speech Ai

Articles on AI, post-quantum cryptography, ISO 20022 and the future of payments.

TOPIC

Voice & Speech AI

Voice cloning, real-time speech recognition (Whisper), executive voice assistants, and the audio-intelligence stack reshaping the private-banking client experience.

Articles in this topic

Banner for Real-time automatic speech recognition (ASR)
OpenAI · Whisper · Metal

Fast Real-Time Speech Recognition on macOS: OpenAI Whisper

· Sebastien Rousseau

আপনার Mac-এ AI-চালিত, GPU-ত্বরান্বিত স্পিচ-টু-টেক্সটের শক্তি উন্মোচন করুন

A white, spherical modern device
Àkàndé · GPT4 · WhisperSTT

Àkàndé: GPT-Powered Voice Assistant for Executives

· Sebastien Rousseau

Àkàndé একটি ওপেন-সোর্স Python ভয়েস অ্যাসিস্ট্যান্ট যা OpenAI Whisper স্পিচ রিকগনিশন, GPT-4 চ্যাট কমপ্লিশন এবং স্থানীয় SQLite ক্যাশ একত্রিত করে fpdf2-এর মাধ্যমে PDF সারসংক্ষেপ তৈরি করে এবং কোনো ক্লাউড স্টোরেজ ছাড়াই সমস্ত ডেটা স্থানীয়ভাবে সংরক্ষণ করে।

A minimalist, modern corporate office
Azure · CherryPy · SpeechToText

Audio Analyser: Azure Speech, NLP, and Translation Pipeline

· Sebastien Rousseau

Audio Analyser একটি ওপেন-সোর্স Python টুল যা Azure Cognitive Services speech-to-text, Text Analytics NLP এবং Translator-কে একটি CherryPy ওয়েব অ্যাপ্লিকেশনে একত্রিত করে — অডিও রেকর্ডিংকে কাঠামোবদ্ধ ট্রান্সক্রিপ্ট, সেন্টিমেন্ট স্কোর এবং বহুভাষিক অনুবাদে রূপান্তরিত করে, Azure SDK-এর বাইরে ক্লাউড নির্ভরতা ছাড়াই।