Sprachassistent (Voice Assistant) (sprachssistent.py)

Ein KI-gestützter Sprachassistent, der Spracheingaben verarbeitet, mit einem KI-Modell kommuniziert und Antworten als Sprachausgabe wiedergibt.

Features

🎤 Spracheingabe über Mikrofon
🔄 Umwandlung von Sprache in Text (Speech-to-Text)
🤖 Verarbeitung durch Mixtral-8x7b KI-Modell
🔊 Umwandlung der KI-Antwort in Sprache (Text-to-Speech)
🌍 Vollständig auf Deutsch

Voraussetzungen

Python 3.9
Mikrofon
Lautsprecher
Internetverbindung
API-Zugang für das KI-Modell
mpg321, ffmpeg muss installiert sein

Verwendung

Programm starten:

python sprachassistent.py

Warten auf die "Bitte sprechen Sie jetzt..." Aufforderung
Frage oder Anweisung sprechen
KI-Antwort wird automatisch vorgelesen

Technische Details

Der Assistent nutzt folgende Technologien:

Google Speech Recognition für Speech-to-Text
Mixtral-8x7b als KI-Modell
gTTS (Google Text-to-Speech) für die Sprachausgabe
mpg321 für die Audiowiedergabe

KI-Model funktionen (tools.py)

Funktionen:

Urzeit
Bildgenerieren
tts (hörbücher, etc)

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
web		web
.gitignore		.gitignore
README.md		README.md
install.sh		install.sh
mochi_video_gen.py		mochi_video_gen.py
requirements.txt		requirements.txt
sdxl.py		sdxl.py
sprachassistent.py		sprachassistent.py
tools.py		tools.py
videogen.py		videogen.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Sprachassistent (Voice Assistant) (sprachssistent.py)

Features

Voraussetzungen

Verwendung

Technische Details

KI-Model funktionen (tools.py)

About

Releases

Packages

Languages

Jojoistauchdabei/agent

Folders and files

Latest commit

History

Repository files navigation

Sprachassistent (Voice Assistant) (sprachssistent.py)

Features

Voraussetzungen

Verwendung

Technische Details

KI-Model funktionen (tools.py)

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages