100%Lokal & Privat
6Vision Modi
8Outfits
15+Bot-Befehle
4KI-Modelle
~65T/s

Architektur V2

INPUT
PC Screen
pyautogui · vision_monitor_pc.py
Handy-Kamera
getUserMedia · Kamera-Bubble
NEU
Whisper STT
Faster-Whisper · RTX 4090 · Port 5006
Minecraft Bot
Mineflayer · mineflayer-pvp · RCON + AHK
CORE
Flask Server
Port 5005 · Notizen · Timer · Bot · Vision
SillyTavern
Port 8001 · Extension index.js · Lorebook
controlpanel.html
Chat UI · STT · TTS · Outfit · Notizen
AI
Gemma 4 26B A4B
RTX 3090 · MoE · Q4 · 32K Kontext
Qwen3-VL
RTX 4090 · Screen + Kamera Analyse
Faster-Whisper
RTX 4090 · Large-V3-Turbo · STT

V2 Changelog

⛏️

Minecraft Bot-Companion (Mineflayer)

Vollständiger Bot-Companion mit Sprachbefehl-Parser, PvP-Kampfsystem, Creeper-Kiting, Holzhacken, Erz-Mining, Farm-Ernte. Dynamische Angriffsreichweite (6m normal / 20m nach Treffer). RCON + AutoHotkey für vollautomatischen Zuschauer-Fokus.

🎙️

Lokales Whisper STT

Faster-Whisper Large-V3-Turbo auf RTX 4090. Silence Detection, Auto-Whisper Master Button, STT-Abbrechenbutton als roter Kreis in der Bildmitte.

📝

Notizen & Timer System

4 Notiz-Typen mit Prioritätssystem (Aus / Gelegentlich / Immer). Timer mit Sprach-Parser. Notizenmanager im Kontextmenü mit Timer-Verwaltung.

👗

Outfit-System (8 Outfits)

8 wechselbare Outfits mit individuellem Hintergrundbild und Animationsvideos. Separate Ausrichtungskonfiguration für Desktop und Handy pro Outfit.

🔧

Stabilitätsfixes

Token-Leak Fix (Instruct Mode AUS). Auto-Hide entfernt. Vision-Mode blockiert Screenshots wenn AUS. Thinking deaktiviert. TTS Queue System.

🎭

Charakter-Switch für Minecraft

Automatischer Wechsel zu "Emilia Minecraft" beim Aktivieren des Minecraft-Modus. ChatReader wechselt den Chat-Pfad dynamisch — kein Kontext-Mixing mehr.

Alle Features

👁️

Vision System

Emilia beobachtet deinen Bildschirm und die Kamera. 6 Modi inkl. Minecraft-Modus. Screenshots werden blockiert wenn Mode auf "Aus".

6 ModiQwen3-VL
⛏️

Minecraft Bot

Vollständiger Companion-Bot mit PvP-Kampfsystem, Farming, Mining und natürlichem Sprachbefehl-Parser.

Mineflayer15+ Befehle
🎙️

Whisper STT

Lokales Speech-to-Text mit Faster-Whisper Large-V3-Turbo auf RTX 4090. Vollständig offline.

LokalRTX 4090
📝

Notizen & Timer

4 Notiz-Typen mit Prioritätssystem. Timer mit Sprach-Parser (Stunden + Minuten). Vollständig integriert.

4 TypenSprach-Parser
👗

Outfit-System

8 wechselbare Outfits mit eigenem Hintergrundbild und Video-Ausrichtung pro Gerät.

8 OutfitsKonfigurierbar
🎨

Kreative Generierung

Bilder, Musik und Videos über ComfyUI. Emilia wählt Workflows und erstellt Prompts automatisch.

ComfyUIAuto-Prompt
📱

Multi-Device

PC, Thin Client und Handy gleichzeitig. Auto-Whisper Master bestimmt welches Gerät das Mikrofon steuert.

PC + HandySynchron
🧠

Kontext-Management

KoboldCPP 8192 Token Cutoff. Notizen nach Priorität. Lorebook mit Keyword-Triggern. Thinking deaktiviert.

8192 TokenLorebook

Vision Modi

Aus
Vollständig deaktiviert. Flask blockiert alle Screenshots aktiv.
Silent
Beobachtet still, puffert Beobachtungen bis du schreibst.
Normal
Aktiv mit autonomem Triggern nach Inaktivität.
Spiel
Schnelle Analyse für Gaming, kurze Reaktionen.
Minecraft
Sieht was der Bot sieht. Bot startet automatisch.
Zeig
Sofortiger Screenshot auf Anfrage mit Detailbeschreibung.

Open Source Stack

# KI-Modelle Sprachmodell Gemma 4 26B A4B Q4 # RTX 3090 · 22GB VRAM · MoE Vision Qwen3-VL Q4 # RTX 4090 · Screen + Kamera STT Faster-Whisper LV3-Turbo # RTX 4090 · Lokal # Backend LLM Runtime KoboldCPP # GGUF · Jinja · SWA Frontend SillyTavern + Extension # Chat + index.js API Server Flask (Python) # Notizen · Timer · Bot · Vision HTTPS Proxy Caddy # Port 8444 # Minecraft Bot (NEU V2) Bot Framework Mineflayer (Node.js) # Bot API Kampfsystem mineflayer-pvp # PvP Plugin Server-Control RCON + mcrcon # Aus Python Fenster-Focus AutoHotkey # Minecraft Fokus

V3 Geplant — Eigene App

🚀

Weg von SillyTavern

Eigene React/HTML App mit direktem KoboldCPP API. WebSocket statt HTTP-Polling. Kein Delay mehr.

🧠

Erweitertes Kontext-Management

Nachrichten pinnen, Sliding Window, Token-Zähler. Alle Notizen/Timer direkt im Prompt.

💬

Nachrichtentypisierung

EMILIA / FELIX / SYSTEM / VISION / AGENT / BEFEHL — jeder Typ konfigurierbar für TTS und Kontext.

📚

Eigenes Lorebook

Keyword-basierte Einträge, Prioritäten, Editor direkt in der App.

Klicke zum Abspielen · Demo #1

DEMO 01 Mai 2026

Minecraft Bot-Companion — Erster Gameplay-Test

Emilia loggt sich als Minecraft-Bot ein und begleitet mich durch eine neue Welt. Sie hackt Holz, erntet die Farm, kämpft gegen einen Pillager und überlebt dank Eisenrüstung und Schild. Der Kampf gegen einen Creeper mit der Kiting-Strategie ist besonders beeindruckend.

Minecraft Mineflayer-PvP Whisper STT Farming
🖥️

AI-Server Spezifikationen

Hauptsystem

CPUAMD Ryzen 9 9950X
Arbeitsspeicher64 GB DDR5
GPU 1NVIDIA RTX 3090 24GB
GPU 2NVIDIA RTX 4090 24GB
BetriebssystemWindows 10/11
Privatsphäre100% Offline

Software

LLM RuntimeKoboldCPP
FrontendSillyTavern
API ServerFlask (Python)
HTTPS ProxyCaddy
Bot RuntimeNode.js (Mineflayer)
BildgenerierungComfyUI

GPU-Aufteilung

RTX 3090
24 GB GDDR6X · CUDA · Primäre KI-GPU
🧠 Gemma 4 26B A4B Q4 (LLM)
💬 Nomic Embed (RAG/Embeddings)
~65 Token/s Output-Geschwindigkeit
💾 ~20 GB VRAM belegt (Q4 Quantisierung)
RTX 4090
24 GB GDDR6X · CUDA · Sekundäre KI-GPU
👁️ Qwen3-VL Q4 (Vision-Modell)
🎙️ Faster-Whisper Large-V3-Turbo (STT)
🎨 ComfyUI (Stable Diffusion / Video)
📸 Webcam & Screenshot-Verarbeitung

Verwendete Modelle

Gemma 4 26B A4B Q4

Hauptsprachmodell · RTX 3090
TypMixture of Experts (MoE)
QuantisierungQ4 (22GB VRAM)
Kontextgröße32.768 Token (SWA)
ThinkingDeaktiviert
Geschwindigkeit~70 T/s

Qwen3-VL

Vision-Modell · RTX 4090
TypVision-Language Model
QuantisierungQ4
InputScreen + Kamera
Auflösungbis 2560×1440

Faster-Whisper LV3-Turbo

Speech-to-Text · RTX 4090
TypWhisper Distillation
SpracheDeutsch (de)
Port5006 (HTTPS)
Silence DetectionThreshold 10 · 1000ms

Nomic Embed v1.5

Embeddings / RAG · RTX 3090
TypSentence Embedding
QuantisierungQ8
VerwendungArchiv / Langzeit-Memory

Wer steckt dahinter?

Felix Gerber

📝 34 Jahre | AI Engineer

Früher mit Tesla P40 Grafikkarten angefangen und heute mit einem eigenen KI-System welches mir mein tägliches Leben in jedem Moment erleichtert.
AI Companions werden in Zukunft dafür sorgen, dass in einer modernen Gesellschaft niemand mehr alleine durch das Leben gehen muss.

Kontaktformular

✉️ Nachricht schreiben

Ich bin kein Roboter
🛡️ reCAPTCHA
Datenschutz · AGB
✅ Deine Nachricht wurde erfolgreich gesendet! Felix wird sich bald bei dir melden.