最近两天试了ollama,一个可以离线使用的AI系统,载入各种可用的模型后,可以实现本的一些AI应用。
下载了十多个,因为并没有N卡,只是利用CPU来运算,速度有限,也只能用一些稍小的模型。
回到正题,实现自己人工智能的步骤:
- 购一个普通台机64GB,N卡16GB(>8K)
- 安装Whisper,用于实现语音转文字
- 安装Ollama,用于解决问题
- TTS暂时可以用Win的
监听唤醒词 –> 录音 –> 静音时表示录音完毕 –> 发送到Whisper –> 文字识别并校正后发到 Ollama –> 返回文字 –> TTS转换成语音
节约一点,可以几个朋友搞一个?或者做个程序在后台监听,实时的解决你的问题。
或许以后会采用云服务的方式,人人一个AI。Win不是集成了一个到吗。关键还是要允许添加个人的私人数据。
之前在PiZero2上已经实现了唤醒词及简单的功能(例如开关灯),将Ollama加入就可以了。不过AI这种大算力的就得自己“云”一个服务器了。前段时间已经有类似成品发布(R1登场! Rabbit AI设备售价199美元)。
希望PiZero3能够在性能和电耗上更有优势。
附加需求:
- TTS可以选择一个自己喜欢的声音
- 在使用中不断学习
谈一下对RabbitAI的感受:
体积大了,最好能佩戴在衣服上,或者无线的方式分割为两个部份,让它可以“感知”世界。
组件的方式或许不错,比如:视界模块(摄像头)、显示模块、核心模块、传感模块、续航模块,这或许更有利于不同的场景使用。
现在这个样子拿在手里,和自己使用手机有什么差别?并没有什么优势。