(原) 搭建一个自己的人工智能系统

2024年5月1日 in 人工智能约700字，阅读约2 分钟。

打赏发消息给我

原创文章，请

打赏后转载，并注明出处。

最近两天试了ollama，一个可以离线使用的AI系统，载入各种可用的模型后，可以实现本的一些AI应用。

下载了十多个，因为并没有N卡，只是利用CPU来运算，速度有限，也只能用一些稍小的模型。

回到正题，实现自己人工智能的步骤：

购一个普通台机64GB，N卡16GB(>8K)
安装Whisper，用于实现语音转文字
安装Ollama，用于解决问题
TTS暂时可以用Win的

监听唤醒词 –> 录音 –> 静音时表示录音完毕 –> 发送到Whisper –> 文字识别并校正后发到 Ollama –> 返回文字 –> TTS转换成语音

节约一点，可以几个朋友搞一个？或者做个程序在后台监听，实时的解决你的问题。
或许以后会采用云服务的方式，人人一个AI。Win不是集成了一个到吗。关键还是要允许添加个人的私人数据。
之前在PiZero2上已经实现了唤醒词及简单的功能（例如开关灯），将Ollama加入就可以了。不过AI这种大算力的就得自己“云”一个服务器了。前段时间已经有类似成品发布(R1登场! Rabbit AI设备售价199美元)。
希望PiZero3能够在性能和电耗上更有优势。

附加需求：

TTS可以选择一个自己喜欢的声音
在使用中不断学习

谈一下对RabbitAI的感受：
体积大了，最好能佩戴在衣服上，或者无线的方式分割为两个部份，让它可以“感知”世界。
组件的方式或许不错，比如：视界模块(摄像头)、显示模块、核心模块、传感模块、续航模块，这或许更有利于不同的场景使用。
现在这个样子拿在手里，和自己使用手机有什么差别？并没有什么优势。

对于TTS，可以使用最近出来的ChatTTS或它的API调用。
试用了Win版本，听起来还是很自然的。音色少了一点。

相关文章