GeMM ドキュメント
GeMM(Generative Media Manager)は、AI を活用した画像・動画・PDF・ドキュメント解析プラットフォームです。
全てのデータはローカル環境で処理され、クラウドにデータが送信されることはありません。
このドキュメントについて
| セクション | 内容 |
|---|---|
| 導入ガイド | インストールから初回起動まで |
| 機能仕様 | ビューモード・検索・解析機能の詳細 |
| REST API リファレンス | Backend API の詳細仕様 |
| リリースノート | バージョンごとの変更履歴 |
システム要件
| 項目 | 最小要件 | 推奨 |
|---|---|---|
| OS | Ubuntu 20.04+ / Windows 11 (WSL2) | Ubuntu 22.04 |
| GPU | NVIDIA CUDA対応GPU (VRAM 16GB+) | NVIDIA RTX 4090 (VRAM 24GB) |
| メモリ | 16GB | 32GB以上 |
| ストレージ | 50GB | 100GB以上(モデル含む) |
| Docker | Docker 24.0+ / Docker Compose v2 | 最新版 |
| NVIDIA Driver | 535+ | 最新版 |
| NVIDIA Container Toolkit | 必須 | 最新版 |
アーキテクチャ概要
GeMM は以下のサービスで構成されます:
| サービス | ポート | 説明 |
|---|---|---|
| Frontend | 3000 | Web UI |
| Backend | 8000 | REST API・データ管理・認証 |
| GeMM-Core | 8001 | AI推論サービス |
| PostgreSQL | 5432 | データベース |
| OpenSearch | 9200 | 全文検索・インデクシング |
全サービスは Docker Compose でまとめて起動できます。
対応メディア形式
- 画像:
.jpg,.jpeg,.png,.gif,.bmp,.webp,.tiff - 動画:
.mp4,.avi,.mov,.mkv,.webm,.flv,.wmv,.m4v,.mpg,.mpeg - ドキュメント:
.pdf,.txt,.md,.json,.xml,.csv
主要機能
- セマンティック検索 — 自然言語で画像・動画内のシーンを検索
- セマンティックビュー — AIエンベディングによるメディアの3D可視化
- Generative チャット — メディアの内容についてAIと対話
- 動画内検索 — テキスト埋め込み・画像埋め込み・物体検出による動画フレーム検索
- Vision RAPTOR — 長時間動画の高速セマンティック解析
- ドキュメント解析 — PDF/ドキュメントのテキスト抽出と要約
- NAS/共有フォルダ対応 — NFS マウントによるネットワークストレージ連携
詳しくは機能仕様をご覧ください。
お問い合わせ
エンタープライズプランのご相談・技術的なご質問は contact@shimmyo-lab.com までお気軽にお問い合わせください。