加入 Gitee
与超过 1200万 开发者一起发现、参与优秀开源项目,私有仓库也完全免费 :)
免费加入
文件
克隆/下载
代码说明-先看我.txt 1.39 KB
一键复制 编辑 原始数据 按行查看 历史
代码中只需要填写:自己在讯飞开放平台创建的应用的APPID、APISecret和APIKey,也可以修改llm的角色设定(在函数gen_params()中)
参考项目(原项目)链接:https://github.com/MetaWu2077/Esp32_VoiceChat_LLMs
当前版本介绍(v2.0):
1.使用一块RGB_TFT屏幕显示对话信息;
2.保留了原来的boot键唤醒功能,新增了在线语音唤醒功能(使用讯飞stt服务);
3.新增了连续对话功能(一次唤醒即可进行连续对话);
4.可播放音乐,白嫖网易云音乐的服务器,但由于esp32内存原因,大概超过4MB大小的音乐放到一半会重新开始播放;
5.断网条件下,通过手机或电脑连接esp32热点打开特定网页(http://192.168.4.1)配置wifi和添加音乐信息;
6.优化了内存使用,多轮对话后不会在出现内存崩溃问题。
还想修改、添加的东西:
1.优化代码结构,增加函数,减少代码重复量,子功能独立封装库函数,减少main函数中的代码;
2.进一步优化音乐播放处理逻辑;(还好吧)
3.解决部分音乐放到一半会重新开始播放的问题;(这个好像是网易云的问题)
4.音量控制,主动断网; 完成
5.换更好的麦克风;
6.换更好的喇叭;
7.换成性能更优秀的esp32 s3开发板;
8.离线语音识别;
9.画pcb板,做外壳(想想也挺好的)。
Loading...
马建仓 AI 助手
尝试更多
代码解读
代码找茬
代码优化