2024 年に独自の LLM おもちゃを DIY するための最も簡単なガイド
2024 年が来た、そして DIY LLM おもちゃ?もう完全に事です。技術的な魔法は必要ありません。ただあなたの好奇心だけで大丈夫です。私は思い切って、少しのコーディングとたくさんの楽しみを混ぜ合わせて、独自の話すおもちゃを作成しました。 AI の相棒を簡単に作りたいなら、ここが正しい場所です。一緒にテクノロジーの謎を解き明かし、AI の友達に命を吹き込みましょう。テクノロジーが日常生活とますます交差する世界において、独自の LLM おもちゃを作成することは、AI の謎を解くだけでなく、インタラクティブ テクノロジーの驚異へのパーソナライズされたゲートウェイを提供します。
まずは最終的な効果を見てみましょう。
正直、かなりすごいです。始める準備はできていますか?飛び込んでみましょう!
それはどのように機能しますか?
重要な手順は 3 つあります。
- 録音: おもちゃから UDP 経由で送信されたリアルタイム録音データを受信し、STT (Sound-To-Text) API を呼び出してサウンドをテキストに変換します。
- 考え方: 前のテキストを受信した後、LLM (Large-Language-Model) API がすぐに呼び出され、ストリーミング方式で LLM によって生成された文を取得します。次に、TTS (Text-To-Sound) API が呼び出され、文が人間の音声に変換されます。
- オーディオの再生: おもちゃは FoloToy サーバーによって生成された TTS (Text-To-Sound) オーディオ ファイル ストリームを受信し、順序に従って再生します。
開発前の準備
LLM おもちゃの作成を始める前に、必要なハードウェア、ソフトウェア、および技術的知識を理解することが重要です。このセクションでは、スムーズに開始するために必要なものをすべて準備する方法について説明します。
ハードウェア
Folotoy Core: ChatGPT AI 音声会話コアボードはプロジェクトの頭脳として機能し、AI との音声対話を可能にします。
おもちゃのコンポーネント: マイク、スピーカー、ボタン、スイッチ、電源などの必需品が必要です。私は、すぐに使えるセットアップとして Alilo Honey Bunny G6 を使用します。
タコ開発スーツ (その他の選択): 既存のおもちゃに AI 機能を搭載したいと考えている人に最適です。
購入の際、割引を受けるにはプロモーション コード F-001–9 を入力してください。
サーバー
MacBook Pro などの独自のマシンを利用して、おもちゃが音声インタラクションを処理して応答するための信 頼できるバックエンドを備えていることを確認します。あるいは、Google Cloud Engine (GCE) などのクラウド サービスを使用すると、プロジェクトをより広範なアプリケーションに拡張できます。
知識
- Docker (必須): Docker を理解することは、ソフトウェアをコンテナにデプロイし、プロジェクトを移植可能でスケーラブルにするために重要です。 Folo サーバーの起動に使用します。
- Git (必須): バージョン管理は、プロジェクトのコードベースを管理するために不可欠です。 Folo サーバーのコードベースを管理するために使用します。
- MQTT (オプション): 高度なカスタマイズを目指している場合は、MQTT (軽量メッセージング プロトコル) に精通していると、おもちゃとサーバー間の通信に役立ちます。
- EMQX (オプション): IoT、IIoT、コネクテッドカー用のオープンソース MQTT ブローカー。おもちゃの管理に使用します。
- ollama (オプション): 大規模な言語モデルをローカルで実行したい場合は、これを選択するのが良いでしょう。