リリースノート
GeMM の各バージョンの変更履歴です。
コンテナイメージの更新は docker compose pull で取得できます。
GeMM は以下のコンテナイメージで構成されます:
| イメージ | 説明 | 配布元 |
|---|---|---|
gemm-core | AI推論エンジン | GeMM |
gemm-backend | バックエンドAPI | GeMM |
gemm-frontend | Web UI | GeMM |
postgres:15 | データベース | 公式イメージ |
opensearchproject/opensearch | 全文検索エンジン | 公式イメージ |
GeMM が配布するのは上3つのイメージです。下2つは公式イメージをそのまま使用します。
v1.3.8.10(2026-04-21)
Frontend
- 検出数の時系列チャートとしきい値スライダーを追加
v1.3.8.9(2026-04-21)
Frontend
- 解析結果の履歴表示・スナップショット・差分ビューを追加
GeMM-Core
- プロンプトテンプレートのバージョン管理に対応
v1.3.8.8(2026-04-21)
GeMM-Core
- 長時間動画の階層解析に対応
- 産業用途向けの解析精度を改善
- 検出処理のメモリ効率を改善
- 動画解析における各種不具合を修正
Frontend
- フルプレビューページに動画シーン構造・検出結果の表示を追加
v1.3.8.6(2026-04-14)
GeMM-Core
- Grounding DINO・OWL-v2オープンボキャブラリー物体検出器の追加
- 画像・動画解析への物体検出統合(バウンディングボックスオーバーレイ付き)
- 動画検出時のVRAM協調制御
- エンベディングベースの日本語→英語クラス名翻訳
- ハイブリッド検索(BM25+ベクトルRRF)の導入
- RAG top-k検索数の拡張(get_media_info: 5→20、search_document: 5→15)
- ツールルーターのファイル名正規表現修正
Frontend
- プレビューからチャットへのメディアピン機能
- 検出器UIの改善(ドロップダウン・アイコン・見出し)
v1.3.8.5(2026-04-14)
GeMM-Core
- キーワードオーバーライドをエンベディングベースのツールルーターに置換
- ツールルーター精度改善(79.3% → 96.6%)
- ノンブロッキングエンベディングエンドポイント対応
- プロンプトビルダー・ツールハンドラーのリファクタリング
Backend
- Djangoがgemm-coreのシーン検索結果をCLIP結果で上書きする問題を修正
- SQLパラメータ化・デッドコード削除などのコード品質改善
v1.3.8.4(2026-04-10)
GeMM-Core
- チャットモデルセレクター機能の追加
- メディア添付機能の追加
- compare_mediaのオーバーライド対応
- シーン類似度グラフの永続化・search_sceneオーバーライドの改善
- インデクサーの修正
Backend
- JWT認証でBasic authヘッダーをスキップするよう修正
- トークン期限切れ時にNoneを返すよう修正
v1.3.8.3(2026-04-03)
GeMM-Core
- メディア比較ツール(compare_media)の追加
- チャットモデルを4B/24kコンテキストに切り替え
- RAG制限の拡張
- センテンスレベルのリランキングによるRAGコンテキスト注入
- tokenizer.encodeを文字ベース推定に置換(RecursionError/SIGSEGV防止)
v1.3.8.1(2026-04-01)
GeMM-Core
- デフォルトのドキュメントパーサーをDoclingに修正
- ドキュメントチャンクをトークンカウントから除外
Frontend
- チャット・プレビューでのMarkdownレンダリング対応
- トークン閾値表示の修正
- チャットビューにステータスバナーを追加
- アクションバーの重なり・コンテキストメニューの修正
v1.3.8(2026-04-01)
GeMM-Core
- 2フェーズドキュメントパイプライン(Docling抽出 → LLM要約の分離)
- Docling画像抽出・プレビュー機能の追加
- 適応的Doclingバッチサイズ(VRAM/RAM に応じた動的調整)
- 非同期並列Docling抽出(セマフォによる同時実行制御)
- 抽出結果をRAMではなくディスクに保存(OOM防止)
v1.3.7.1(2026-03-28)
GeMM-Core
- OOMリーク調査用メモリプロファイリングログの追加
- リクエストごとの設定リセット・量子化APIフィールド修正・メモリクリーンアップ改善
v1.3.7(2026-03-26)
GeMM-Core
- Qwen2.5-VLを廃止し、Qwen3.5-4B-AWQを追加(Qwen3.5に統一)
- CLIP GPUバッチエンベディング対応(動的バッチサイズ・マルチモデルサポート)
- OOM保護のためのメモリ制限追加
v1.3.6(2026-03-24)
GeMM-Core
- 長時間動画向けアダプティブフレームチャンキング(RAM OOM防止)
- 複数動画の同時バッチ処理(VRAM/RAM制約の個別管理)
- シーン検出モードのマルチ動画バッチ対応
- 破損動画でのDecordハングを防止するタイムアウト追加
- RapidOCRモデルディレクトリの書き込み権限修正
v1.3.5(2026-03-23)
GeMM-Core
- テキストモデル選択が動画要約LLMに正しく反映されるよう修正
- デフォルトの動画要約LLMをQwen3.5に変更(8192コンテキスト、FP8 KV)
- 動画解析時の
enable_thinking=False設定を追加(不要な思考出力を抑制) - VLMの
gpu_memory_utilizationを0.85に引き上げ(Qwen3.5-9B対応)
v1.3.4(2026-03-23)
Backend
- 本番Dockerfileでentrypoint.shを使用(自動マイグレーション・シード実行)
- NFSマウントポイント作成の権限エラーハンドリング改善
- setup.shでNFSマウントポイントを自動作成
インフラ
- 本番イメージのECRリポジトリ名・タグを統一
v1.3.3(2026-03-19)
GeMM-Core
- チャットのシーン検索でフレーム類似度グラフを返すよう改善
- GroundingDINO APIを新バージョンのtransformersに対応(
box_threshold→threshold) - GroundingDINO実行時のChat LLM VRAM管理を修正
Frontend
- プレビューモーダルの拡大・全幅メディア表示対応
- プレビューページの動画表示を最大化(max-height制限撤廃)
- 新規タブで開いたプレビューページの戻るボタンを非表示化
- チャット内シーン検索グラフの表示修正(固定高さ・再レンダリング時のデータ保持)
v1.3.2(2026-03-18)
GeMM-Core
- Tool Calling LLMをELYZA-8BからQwen3.5-9Bネイティブtool callingに移行
- Qwen3.5-9B-AWQをVisionモデルとして追加、デフォルトに設定
- ドキュメント解析をDoclingに完全統一(PDFplumber廃止)
- DoclingのGPUバッチ処理有効化(レイアウト解析・OCR高速化)
- Docling実行前にGPUモデルをアンロードしVRAMを確保
- 起動時のChat LLMプリロード(torch.compileウォームアップ付き)
- ドキュメント/PDF解析のバッチLLM要約生成
- FP8 KVキャッシュ有効化(KV容量2倍)
- コンテキスト長を8192に拡張
- CUDA 12.8ベースイメージへのアップグレード(本番含む)
- vLLM V1のデッドロック・チャットタイムアウト問題を解消
- Embedding/CLIPをCPU常駐化し、GPU unload管理から除外
- PDF/ドキュメントバッチ処理中の不要なLLMリロードを抑制
- Qwen3.5の
<think>ブロックをVLM/LLM出力から除去 - VLMシステムプロンプトがユーザー指示に従うよう修正
- シングルフレームバッチの説明文分割を修正
- シングルGPU環境のCUDA_VISIBLE_DEVICES設定を修正
- チャット圧縮閾値を4000→6000トークンに引き上げ
Frontend
- Vision Chatの追加(画像・動画フレームをVLMに送信して直接分析)
- Vision Modeトグルボタンの追加
- ツール結果の画像を次のチャットに自動添付
- 画像添付時のtool callingスキップ(VLM直接分析)
- ドキュメント解析設定の非表示化(Docling一択のため)
- デフォルトプロンプトとOperation Panelの入力欄を同期
v1.3.1(2026-03-16)
GeMM-Core
- VLM/LLM設定の
model_nameキー修正
Backend
- 一括フレーム抽出時のOOM防止(セマフォによる同時実行制限)
- スタッフユーザーのアップロード・解析・検索レート制限を免除
- サーバーサイド解析デフォルト設定APIの追加
- 解析デフォルトAPIの認証・ユーザー取得の修正
v1.3.0(2026-03-11)
GeMM-Core
- AIモデルの精度向上
- CUDA 12.8 対応
Backend
- 一括削除APIにJWT認証を追加
- エンベディング生成のリトライロジック追加
- サムネイル生成の修正(ffmpeg対応追加)
Frontend
- ドラッグ&ドロップアップロード時のフォルダ構造保持を修正
- ファイルアップロードの安定性改善
- デフォルトのフレームレート設定の不整合を修正