Python
Ollamaを使ってみる その6(ネットでの検索結果との併用、Node-RED)新着!!
はじめに 今回は以前試していたPythonによる検索と、ローカルLLMを組み合わせてみました。 LLMが学習していないデータを、ネット上の最新の情報で補うというやり方に、RAG(Retrieval-Augmented […]
PythonでARマーカーを利用する(OpenCV、ArUco Markers)
はじめに 今回はPythonでARマーカーの生成やカメラでの検出について試してみました。 最近ロボットの自己位置推定にARマーカーを利用しているところを見ました。シミュレーションでもARマーカーを配置して、自己位置推 […]
Ollamaを使ってみる その5(画像とテキストのマルチモーダル処理、llama3.2-vision)
はじめに 今回はOllamaでllama3.2-visionを利用して、画像とテキストのマルチモーダル処理を試してみました。 最近GPT4oの画像に対する推論も試したことがあるのですが、ちゃんと認識していて驚きました […]
MuJoCoを使ってみる その1(環境構築、サンプルプログラムの実行)
はじめに 今回は物理シミュレーションを行うことができる、MuJoCoというソフトウェアを試してみました。 MuJoCoは以前の記事でGenesisを試していたときに見つけました。Genesisの開発でも利用されている […]
Pythonで画像に対する文字認識 その2(NDLOCR)
はじめに 今回はNDLOCRを利用した画像に対する文字認識を試してみました。 NDLOCRはQiitaの記事で見つけました。国立国会図書館が提供しているライブラリということで、前回試したEasyOCRよりも日本語の認 […]
Pythonで画像に対する文字認識 その1(EasyOCR、Node-RED)
はじめに 今回はEasyOCRを利用して、画像に対する文字認識を試してみました。 OCR系のソフトウェアはいろいろあって、Tesseractも使ってみたのですが、リアルタイムでの処理はEasyOCRでGPUを利用した […]
Ollamaを使ってみる その4(LLM同士の会話、Gemma3:4B、Python、Node-RED)
はじめに 今回はOllamaを利用して、ローカルLLM同士で会話させてみました。 以前の記事でPythonのライブラリを利用して、会話の履歴を保持したままやり取りできるようになりました。その出力を、ローカルLLMの入 […]
ローカルネットワーク内でサーバーを立てる その1(Ubuntu 22.04、JupyterLab)
はじめに 今回はローカルネットワーク内でPythonを実行できるサーバーを立ててみました。 Raspberry PiやミニPCでもSSH接続やサーバーアプリケーションを利用して、同一ネットワーク内でアクセスしていまし […]
Ollamaを使ってみる その3(Pythonでの利用、Node-RED、Gemma3:4B)
はじめに 今回はPythonでのOllamaの利用方法を確認して、サーバーとして実行できるようにしてみました。 これまでOllamaを利用するときは、Node-REDのollamaノードを利用していました。しかし、会 […]
Pythonで検索してローカルLLMで要約してみる(Ollama、Node-RED)
はじめに 今回は情報収集を自動化したかったので、Pythonで検索するプログラムを試してみました。 いつも通りNode-REDで実行できるようにして、他のノードと組み合わせることで、ローカルLLMの処理にもつなげてい […]
Faster Whisperを使ってみる(GPUでの実行、Python、Node-RED)
はじめに 今回はFaster Whisperを利用して文字起こしをしてみました。 Open AIのWhisperによる文字起こしよりも高速ということで試したことがあったのですが、以前はCPUでの実行でした。最近YOL […]
XIAO ESP32C3を使ってみる その6(DUALSHOCK 4との通信、Node-RED)
はじめに 今回はDUALSHOCK 4でXIAO ESP32C3を用いた小型ロボットを操作してみました。 以前調べていたときに、DUALSHOCK 4とXIAO ESP32C3はBluetoothの規格が違うので、直 […]
Node-REDのノードを開発してみる その4(dualshock4ノード)
はじめに 今回はNode-REDと、PS4のコントローラであるDUALSHOCK 4で通信できる、dualshock4ノードを開発してみました。 2年ほど前からESP32とDUALSHOCK 4で通信して、ロボットを […]
PythonでDUALSHOCK 4と通信する(Node-RED)
はじめに 今回はPythonでPS4のコントローラであるDUALSHOCK 4と通信してみました。 私が開発したpython-venvノードを利用すると、Node-REDでPythonのコードを実行できます。DUAL […]
Pythonでテキストを翻訳する(Googletrans、Node-RED)
はじめに 今回はPythonでGoogletransを利用した翻訳を試してみました。 書いてはいないのですが、これまで翻訳するのにdeep-translatorも使ったことがあります。他にも簡単に使えるものが無いか探 […]
Pythonで論文を収集する その1(arXiv、Node-RED)
はじめに 今回はarXiv APIを使って、Pythonで論文を収集してみました。 普段は論文を検索するときにGoogle Scholarを使っていたのですが、プログラムで自動化したかったのでChatGPTに相談して […]
PythonでgTTSを使ってみる(音声合成、Node-RED)
はじめに 今回はPythonでgTTS(Google Text-to-Speech)を使ってみました。 以前VoiceVoxも使ったことがあるのですが、英語も話すことができて、ローカル環境での音声の生成が早いものを探 […]
YOLOで物体検出 その2(Python、Node-RED)
はじめに 今回はYOLOをPythonで実行してみました。 以前の記事でYOLOを試したときは簡単なコマンドしか試していませんでしたが、実際にロボットに搭載して処理を行うにはPythonで実行する必要がありそうです。 […]
ROS1を使ってみる その2(PythonのコードでPublishとSubscribe)
はじめに 今回はPythonのコードでROSのPublishとSubscribeを実行してみました。 これまでOpen Manipulatorを操作するのにROSを使っていたのですが、そのためのソフトウェアは用意され […]
Pythonの仮想環境を作成する(venv、Windows)
はじめに 今回はPythonの仮想環境の作成についてまとめてみました。 Pythonを利用したNode-REDのノードを開発するときに仮想環境を詳しく調べていました。作成した仮想環境をコマンドで利用する方法は調べると […]
Whisperを使ってみる(音声認識、OpenAI、Python)
はじめに 今回はOpenAIのWhisperを使ってみました。 OpenAIのサービスはAPIキーを使って有料で利用するイメージがあったのですが、ソースコードはMIT Licenseで公開されているようですね。複数言 […]
Node-REDのノードを作成してみる その1(python-venv)
はじめに 今回はNode-REDでPythonの仮想環境を利用できるノードを作成してみました。 これまでNode-RED MCU用のノードを作成したことはありますが、Node-RED用は2つ目です。 もう一つVOI […]
PythonでVOICEVOX COREを使ってみる(音声合成)
はじめに 以前の記事でGoogle Cloud Platformの音声合成・音声認識を試したのですが、利用回数が多いとお金がかかります。やっぱり無料で実行したいということで、今回はVOICEVOXを使ってみました。 […]