@crrcdt2021
lanmu 暂无简介
基于 F5-TTS 与 Faster-Whisper 的全栈语音交互系统,支持语音增强与降噪,活动切分(VAD),实时流式语音识别(ASR)、声纹识别、唤醒词检测与语音合成(TTS),提供 WebSocket/HTTP 双协议与 Opus/PCM 多格式编解码能力。
本地/云端 部署大模型qwen3/3.5(AWQ 量化) ,兼任openai 接口,支持简单用户管理、token统计。
迅为通用uboot
react h265 wasm player