# VetVoice **Repository Path**: davidfdw/VetVoice ## Basic Information - **Project Name**: VetVoice - **Description**: ​​VetVoice | 兽医声动,诊疗更高效。宠物医院HIS的新伙伴:智能电子病历插件,让医生少写字,多看病 - **Primary Language**: Python - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 2 - **Created**: 2025-12-22 - **Last Updated**: 2025-12-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 🩺 ​​VetVoice | 兽医声动

兽医声动,诊疗更高效

# 展示 ## agent智能填充 | ![图片1](img/1.png) | ![图片2](img/2.png) | ![图片3](img/3.png) | |----------------------|----------------------|----------------------| | 实时语音识别 | 开始agent | 对话填充电子病历 | # 🎉 新闻 - [X] [2025.09.10]🎯📢 支持agent/mcp智能体,智能整理电子病历4个阶段:问诊阶段 / 开检查阶段 / 查看检查结果阶段 / 确诊治疗阶段。 - [X] [2025.08.26]🎊🔥 基于Python3.10版发布🔥🎊 # 简介 VetVoice(兽医声动)​​ 是基于 ​PySide6 + FunASR + LLM​ 的智能语音病历系统跨平台【插件】,搭配【全向会议麦克风】,成为宠物医疗病例强力助手。支持: - 实时语音降噪 - 实时语音转文字(中英文) - 自动区分医生/宠主对话 - 大模型辅助生成病例、诊断建议 - 一键导出PDF/WAV - 适用于宠物医院、兽医诊所等场景,解决手写病历效率低下的痛点。 - 开放http/mcp_server可方便集成 # 核心功能 ## 实时语音降噪 - 基于 Webrtc实时降噪(配合全向会议麦克风最佳) ## 实时语音识别 - 基于 [FunASR](https://github.com/modelscope/FunASR) / [Vosk](https://github.com/alphacep/vosk-api),支持长语音断句和静音检测 - 自适应降噪,提升嘈杂环境下的识别准确率 ## 实时说话人分离 - 自动标记医生与宠主对话(不同颜色/对齐方式) - 支持多人对话场景 ## 实时大模型辅助诊疗 - ​病例生成​:语音输入→结构化病历(主诉、现病史等) - ​辅助诊断​:大模型分析对话,提供鉴别诊断建议 - ​用药指导​:自动生成用法用量(需接入大模型API) ## 一键导出 - 保存原始音频文件(WAV格式),批量导出PDF病历 # 下载 > ​通过网盘分享的文件:resources.zip >​ 链接: https://pan.baidu.com/s/1arQO6OBExGB3xlq4zykvvw?pwd=6847 提取码: 6847 >​ 下载解压到本地,如:/data/resources >​ 在登陆页面设置资源路径:/data/resources # 使用 Python3.10环境启动(推荐3.10,Pyside6对高版本Python支持不友好) ``` bash git clone https://github.com/georgewangchn/VetVoice.git cd VetVoice uv venv --python=3.10 source .venv/bin/activate uv pip install torch==2.2.0 torchvision==0.17.0 torchaudio==2.2.0 --index-url https://download.pytorch.org/whl/cpu uv sync # or uv pip install -r requirements.txt python main.py ``` ## 窗口程序使用步骤 - 注册 - 登陆(用户名、密码、资源路径、保存路径) - 设置 大模型openai形式接口参数) - 重启 - 开始使用 # TODO计划 - pyinstaller打包windows/ubuntu/macos平台安装包 - 开放http/mcp控制接口:当前病例号/开始录音/停止录音/辅诊/检查确诊/推荐用药/电子病历等 - [x] 采用fastmcp开发对话mcp,电子病历流程从人控制转向agent控制(开发测试使用模型:gpt-5-nano) - 推荐用户分享样本训练模型提升效果 - 性能优化 # 致谢 感谢以下优秀开源项目的支持: - [FunASR](https://github.com/modelscope/FunASR) - [pyannote-audio](https://github.com/pyannote/pyannote-audio) - [py-xiaozhi](https://github.com/huangjunsen0406/py-xiaozhi) # Apache License 2.0 [LICENSE](LICENSE) VetVoice 还包含多种第三方组件及从其他代码库修改而来的部分代码(这些内容遵循其他开源许可证)。 预训练模型的使用需遵守相应模型的许可证要求。 ## Star History [![Star History Chart](https://api.star-history.com/svg?repos=georgewangchn/VetVoice.git&type=Date)](https://www.star-history.com/#georgewangchn/VetVoice.git&Date)