1. 语音识别模型(核心)· 基座模型:基于OpenAI Whisper(推荐whisper-tiny或776869737065722d626173652e6b6b)进行微调· 微调方法:采用LoRA(低秩适配)技术,仅更新少量参数即可达到较好效果· 识别语言:哈萨克语· 识别指令:20条固定短语,识别出哈萨克语,识别后播放录制好的音频· 目标性能:安静环境下识别率≥90%· 误唤醒率:每天≤5次(在普通家庭环境下)
2. 模型压缩与部署· 模型量化:将微调后的模型INT8量化,压缩至100MB以内· 部署硬件:瑞芯微RK3566/RK3588开发板(带NPU加速)· 推理延迟:从语音结束到输出结果≤500ms· 运行模式:纯离线,无需网络连接
3. 交付物要求· 微调后的哈萨克语语音识别模型(量化版+非量化版)· 模型在瑞芯微板子上的完整部署方案(含环境配置说明、启动脚本)· 提供简单的测试程序,能实时识别麦克风输入的20条指令并打印结果· 全部源码(含微调代码、量化代码)及使用文档
途傲科技为中小企业提供网站制作、网站建设、微信H5、微信小程序,多商户平台,多级分销系统,APP开发,手机网站,HTML5多端自适应网站,营销型企业站建设,及对技术人才的培养等都积累与沉淀了丰富的心得和实战经验。
如果您想定制同款软件,可以将需求提交给我们【免费提交需求,获取解决方案】
免责声明:文章部分内容收集于互联网,不代表本站的观点和立场,如有侵权请联系删除。
