1.创意方向介绍
该项目是基于ESP32-C3的AI对话助手,通过ESP32-C3芯片连接网络,然后通过麦克风接收声音后将pcm音频数据发送至STT语音识别服务转换为文字,再将文字发送至大语言模型API提问,最后将回答的文字发送至TTS语音合成服务,并通过NS4150B播放音频,过程中用TFT触摸显示屏进行交互显示。
2. 方案框图
系统的方案如下:
首先USB口通过CH343P芯片将USB信号转换成TTL信号给ESP32-C3烧录程序,MX25L6433是ESP32-C3的外挂FLASH,其次USB口提供了电源输入,通过ME6217这个LDO可以给整个系统供电,麦克风采集音频信号给ES8311这个芯片,然后ES8311通过IIC接口与ESP32-C3进行连接,ESP32-C3将音频信号通过联网将STT语音识别服务转文字,然后接入API大语言模型提问,最后将回答的文字发送至TTS语音合成服务,之后ESP32-C3控制NS4150B将处理后的音频信号通过喇叭放出来。
3. 器件介绍
主控芯片:ESP32-C3
ESP32-C3 是乐鑫的一款安全稳定、低功耗、低成本的物联网芯片,搭载 RISC-V 32 位单核处理器,支持 2.4 GHz Wi-Fi 和 Bluetooth 5 (LE),为物联网产品提供行业领先的射频性能、完善的安全机制和丰富的内存资源。ESP32-C3 对 Wi-Fi 和 Bluetooth 5 (LE) 的双重支持降低了设备配网难度,适用于广泛的物联网应用场景。
电源芯片:ME6217
ME6217系列是正电压稳压器具有低压差,高输出电压基于精度和低CRRENT消耗开发关于CMOS技术。内置低导通电阻晶体管提供低压差和大输出电流,内置过流保护器可防止负载电流超过输出的电流电容晶体管。开/关电路确保电池电量过长生命。与使用稳压器相比常规CMOS工艺,品种较多可提供电容器,包括小型陶瓷电容器。
存储器:MX25L6433F
MX25L6433F 是由 Macronix International 生产的一款 64Mb(8M x 8位)的串行 NOR 闪存芯片,采用 SPI 接口,数据传输速率最高可达 133MHz 。它具备多种读模式,包括单 I/O、双 I/O、四 I/O 以及八 I/O,以适应不同的应用需求。该芯片还支持多种擦写和编程算法,包括自动擦除和自动编程,以及程序和擦除的挂起和恢复功能 。
USB转TTL:CH343P
CH343P 是一款由沁恒推出的 USB 转串口芯片,属于第三代产品系列中的单串口型号。这款芯片基于 CH340 芯片进行技术革新,能够实现 USB 到高速异步串口的转换,支持最高 6Mbps 的串口波特率 。
音频解码:ES8311
ES8311 是一款高性能、低功耗的单声道音频编解码器(CODEC)芯片,具备以下特性:
- 24位立体声ADC(模数转换器)和DAC(数模转换器),支持高达192kHz的采样频率。
- 集成了I2S/PCM主从串行数据端口,可以处理多种标准的音频系统时钟,包括256/384Fs和USB 12/24MHz等非标准时钟。
- 通过I2C接口进行控制。
- ADC部分具备100dB的信噪比和-93dB的THD+N,支持模拟和数字麦克风输入。
- DAC部分提供110dB的信噪比和-80dB的THD+N,具备动态范围压缩和爆音抑制功能。
- 支持1.8V至3.3V的宽工作电压范围,播放和录音的最大功率为14mW,待机电流低,适合电池供电的应用场景。
- 适用于多种应用,如汽车、电话、玩具、2路无线电、行车记录仪、网络摄像机、硬盘录像机和监控设备等
音频功放:NS4150B
NS4150B 是一款由纳芯威科技生产的超低电磁干扰(EMI)的3W单声道D类音频功率放大器。这款芯片采用先进的技术,在全带宽范围内极大地降低了EMI干扰,减少对其他部件的影响 3031。
NS4150B 内置有过流保护、过热保护及欠压保护功能,这些特性可以有效地保护芯片在异常工作状况下不受损坏。它还利用扩频技术优化了电路设计,实现了高效率,最高可达88%,非常适合便携式音频产品
心得体会
本次活动提供了一个很好的平台让我去实现一个想法,能够学习一些东西,感谢硬禾学堂,而且得捷电子是一个很大的电子平台,物料都是从原厂发货,质量有保障,希望我接下来可以打板验证调试通过,顺利的做完整个项目,学习和积累更多的经验