(原) 搭建一个自己的人工智能系统

原创文章,请后转载,并注明出处。

最近两天试了ollama,一个可以离线使用的AI系统,载入各种可用的模型后,可以实现本的一些AI应用。

下载了十多个,因为并没有N卡,只是利用CPU来运算,速度有限,也只能用一些稍小的模型。

回到正题,实现自己人工智能的步骤:

  1. 购一个普通台机64GB,N卡16GB(>8K)
  2. 安装Whisper,用于实现语音转文字
  3. 安装Ollama,用于解决问题
  4. TTS暂时可以用Win的

监听唤醒词 –> 录音 –> 静音时表示录音完毕 –> 发送到Whisper –> 文字识别并校正后发到 Ollama –> 返回文字 –> TTS转换成语音

节约一点,可以几个朋友搞一个?或者做个程序在后台监听,实时的解决你的问题。
或许以后会采用云服务的方式,人人一个AI。Win不是集成了一个到吗。关键还是要允许添加个人的私人数据。
之前在PiZero2上已经实现了唤醒词及简单的功能(例如开关灯),将Ollama加入就可以了。不过AI这种大算力的就得自己“云”一个服务器了。前段时间已经有类似成品发布(R1登场! Rabbit AI设备售价199美元)。
希望PiZero3能够在性能和电耗上更有优势。


附加需求:

  1. TTS可以选择一个自己喜欢的声音
  2. 在使用中不断学习

谈一下对RabbitAI的感受:
体积大了,最好能佩戴在衣服上,或者无线的方式分割为两个部份,让它可以“感知”世界。
组件的方式或许不错,比如:视界模块(摄像头)、显示模块、核心模块、传感模块、续航模块,这或许更有利于不同的场景使用。
现在这个样子拿在手里,和自己使用手机有什么差别?并没有什么优势。


对于TTS,可以使用最近出来的ChatTTS或它的API调用。
试用了Win版本,听起来还是很自然的。音色少了一点。

相关文章