Ollamaを使ってみる　その７（Tailscaleを利用したインターネット経由の通信）

2026年1月27日 2026年1月29日

管理人

はじめに

　今回はAPIやVPN接続を利用して、Ollamaを使ってみました。

　私が普段使っているノートPCでは大きなLLMだと処理が重いのですが、インターネットを経由して、デスクトップPCのOllamaで処理を行うように分散して運用しようと思っています。ついでに、OllamaのAPIについてもcurlコマンドで実行してみました。

▼LM StudioのAPIも最近確認していました。

▼以前の記事はこちら

APIについての確認

　今回はOllamaのAPIをcurlコマンドで利用して動作を確認します。

▼Ollamaについては以前の記事でインストールしています。

　まずは私のノートPCで確認を行います。

▼メモリはローカルLLMを実行するために、64GBに交換しています。

CT2K32G56C46S5 [64GB Kit (32GBx2) Crucial DDR5 5600 (PC5-44800) CL46 Unbuffered SODIMM 262pin]

Crucial(クルーシャル)

¥126,880 （2026/03/05 21:15時点 | Amazon調べ）

Amazon

ポチップ

▼以下のAPIのドキュメントに沿ってコマンドを実行していきます。

https://docs.ollama.com/api/introduction

　Windowsのコマンドプロンプトでcurlコマンドを実行していきます。まずはモデルの取得について試してみました。

curl http://localhost:11434/api/tags

▼ダウンロードされているモデルが表示されました。

▼ollama listコマンドでも確認できます。

　チャットの返答を得るためのAPIも試してみたのですが、ドキュメントのままでは実行できませんでした。Windowsの場合は囲み文字の変更やダブルクォーテーションのエスケープを行う必要があるようです。

curl http://localhost:11434/api/chat -d "{\"model\": \"gemma3:4b\",\"messages\": [{\"role\": \"user\",\"content\": \"why is the sky blue?\"}]}"

▼LM Studioのときにも似たようなことがあったのですが、単語ごとに出力されていました。

　"stream": falseを追加しました。

curl http://localhost:11434/api/chat -d "{\"model\": \"gemma3:4b\",\"messages\": [{\"role\": \"user\",\"content\": \"why is the sky blue?\"}],\"stream\": false}"

▼処理が終わってから出力されました。

　レスポンスが長かったので、Hello!とだけ聞いてみました。

curl http://localhost:11434/api/chat -d "{\"model\": \"gemma3:4b\",\"messages\": [{\"role\": \"user\",\"content\": \"Hello! \"}],\"stream\": false}"

▼3秒ぐらいで回答が返ってきました。

インターネット経由での通信

　TailscaleによるVPN接続を利用している、Windows 11のPC2台で通信を行います。Ollamaの処理はデスクトップPC側で行います。

▼Tailscaleについては、以下の記事で導入しました。

　OllamaのGUI画面でネットワークに関する設定項目があったので、設定しておきました。

▼タスクバーのラマを右クリックすると、Open Ollamaという選択肢があります。

▼SettingsのExpose Ollama to the networkを有効にしておきました。

　TailscaleのIPアドレスで、デスクトップPCのOllamaにリクエストを送信します。

　まずはモデルについて確認してみました。IPアドレスの部分は置き換えてください。

curl http://＜IPアドレス＞:11434/api/tags

▼先程とは異なるモデルが表示されています。

　gemma3:4bはダウンロードしていなかったので、gemma3:27bで試してみました。

curl http://＜IPアドレス＞:11434/api/chat -d "{\"model\": \"gemma3:27b\",\"messages\": [{\"role\": \"user\",\"content\": \"Hello! \"}],\"stream\": false}"

▼回答が返ってきました。

　なお、出力には13秒ぐらいかかっていました。

　APIでgemma3:4bのダウンロードを実行してみました。

curl http://＜IPアドレス＞:11434/api/pull -d "{\"model\": \"gemma3:4b\"}"

　もう一度、gemma3:4bを利用してリクエストを送信してみました。

curl http://＜IPアドレス＞:11434/api/chat -d "{\"model\": \"gemma3:4b\",\"messages\": [{\"role\": \"user\",\"content\": \"Hello! \"}],\"stream\": false}"

▼1秒ぐらいですぐに回答が返ってきました。

　通信しているものの、ノートPCよりも返答が速かったです。

最後に

　Tailscale経由でOllamaを利用でき、返答も速かったので、Raspberry Piから通信してLLMとやり取りできるようにしたいなと思っています。音声認識なども組み合わせて、ロボットに搭載したいところです。

　CTF関連でLinux環境でcurlコマンドを使っていましたが、Windowsのコマンドプロンプトだとエスケープする必要があったりして、入力しづらかったです。Ollamaは各種言語のライブラリがあるので、それを利用するのがやはり使いやすそうだと思いました。

▼APIの中にはモデルの作成もあったので、気になっています。

https://docs.ollama.com/api/create

カテゴリー: プログラミング

タグ: Ollama

Ollamaを使ってみる　その７（Tailscaleを利用したインターネット経由の通信）

はじめに

LM Studioを使ってみる　その１（インストール、ローカルLLMとの会話）

Ollamaを使ってみる　その５（画像とテキストのマルチモーダル処理、llama3.2-vision）

Ollamaを使ってみる　その６（ネットでの検索結果との併用、Node-RED）

APIについての確認

Ollamaを使ってみる　その１（Gemma2、Node-RED）

ちょっと買い物：ノートPCのメモリ交換（ASUS TUF Gaming A15、gpt-oss-20b）

インターネット経由での通信

Jetson Xavierを使ってみる　その２（通信周りの設定、Node-RED、TailScale）

最後に

コメントを残すコメントをキャンセル

CTFの勉強　その１（Virtual BoxでのKali Linuxのインストールと環境構築、OpenVPN）

USB接続で利用できるWi-Fi無線LAN子機を使ってみる

はじめに

LM Studioを使ってみる その１（インストール、ローカルLLMとの会話）

Ollamaを使ってみる その５（画像とテキストのマルチモーダル処理、llama3.2-vision）

Ollamaを使ってみる その６（ネットでの検索結果との併用、Node-RED）

APIについての確認

Ollamaを使ってみる その１（Gemma2、Node-RED）

ちょっと買い物：ノートPCのメモリ交換（ASUS TUF Gaming A15、gpt-oss-20b）

インターネット経由での通信

Jetson Xavierを使ってみる その２（通信周りの設定、Node-RED、TailScale）

最後に

コメントを残す コメントをキャンセル

CTFの勉強 その１（Virtual BoxでのKali Linuxのインストールと環境構築、OpenVPN）

USB接続で利用できるWi-Fi無線LAN子機を使ってみる

LM Studioを使ってみる　その１（インストール、ローカルLLMとの会話）

Ollamaを使ってみる　その５（画像とテキストのマルチモーダル処理、llama3.2-vision）

Ollamaを使ってみる　その６（ネットでの検索結果との併用、Node-RED）

Ollamaを使ってみる　その１（Gemma2、Node-RED）

Jetson Xavierを使ってみる　その２（通信周りの設定、Node-RED、TailScale）

コメントを残すコメントをキャンセル

CTFの勉強　その１（Virtual BoxでのKali Linuxのインストールと環境構築、OpenVPN）