GeMM ドキュメント

GeMM(Generative Media Manager)は、AI を活用した画像・動画・PDF・ドキュメント解析プラットフォームです。

全てのデータはローカル環境で処理され、クラウドにデータが送信されることはありません。

このドキュメントについて

セクション内容
導入ガイドインストールから初回起動まで
機能仕様ビューモード・検索・解析機能の詳細
REST API リファレンスBackend API の詳細仕様
リリースノートバージョンごとの変更履歴

システム要件

項目最小要件推奨
OSUbuntu 20.04+ / Windows 11 (WSL2)Ubuntu 22.04
GPUNVIDIA CUDA対応GPU (VRAM 16GB+)NVIDIA RTX 4090 (VRAM 24GB)
メモリ16GB32GB以上
ストレージ50GB100GB以上(モデル含む)
DockerDocker 24.0+ / Docker Compose v2最新版
NVIDIA Driver535+最新版
NVIDIA Container Toolkit必須最新版

アーキテクチャ概要

GeMM は以下のサービスで構成されます:

サービスポート説明
Frontend3000Web UI
Backend8000REST API・データ管理・認証
GeMM-Core8001AI推論サービス
PostgreSQL5432データベース
OpenSearch9200全文検索・インデクシング

全サービスは Docker Compose でまとめて起動できます。

対応メディア形式

  • 画像: .jpg, .jpeg, .png, .gif, .bmp, .webp, .tiff
  • 動画: .mp4, .avi, .mov, .mkv, .webm, .flv, .wmv, .m4v, .mpg, .mpeg
  • ドキュメント: .pdf, .txt, .md, .json, .xml, .csv

主要機能

  • セマンティック検索 — 自然言語で画像・動画内のシーンを検索
  • セマンティックビュー — AIエンベディングによるメディアの3D可視化
  • Generative チャット — メディアの内容についてAIと対話
  • 動画内検索 — テキスト埋め込み・画像埋め込み・物体検出による動画フレーム検索
  • Vision RAPTOR — 長時間動画の高速セマンティック解析
  • ドキュメント解析 — PDF/ドキュメントのテキスト抽出と要約
  • NAS/共有フォルダ対応 — NFS マウントによるネットワークストレージ連携

詳しくは機能仕様をご覧ください。

お問い合わせ

エンタープライズプランのご相談・技術的なご質問は contact@shimmyo-lab.com までお気軽にお問い合わせください。