リリースノート

GeMM の各バージョンの変更履歴です。

コンテナイメージの更新は docker compose pull で取得できます。

GeMM は以下のコンテナイメージで構成されます:

イメージ説明配布元
gemm-coreAI推論エンジンGeMM
gemm-backendバックエンドAPIGeMM
gemm-frontendWeb UIGeMM
postgres:15データベース公式イメージ
opensearchproject/opensearch全文検索エンジン公式イメージ

GeMM が配布するのは上3つのイメージです。下2つは公式イメージをそのまま使用します。

GeMM コンテナ構成図gemm-frontendWeb UIgemm-backendAPIgemm-coreAI推論PostgreSQLデータベースOpenSearch全文検索凡例:GeMM配布GeMM配布GeMM配布公式イメージ公式イメージAPIリクエストデータアクセス

v1.3.8.10(2026-04-21)

Frontend

  • 検出数の時系列チャートとしきい値スライダーを追加

v1.3.8.9(2026-04-21)

Frontend

  • 解析結果の履歴表示・スナップショット・差分ビューを追加

GeMM-Core

  • プロンプトテンプレートのバージョン管理に対応

v1.3.8.8(2026-04-21)

GeMM-Core

  • 長時間動画の階層解析に対応
  • 産業用途向けの解析精度を改善
  • 検出処理のメモリ効率を改善
  • 動画解析における各種不具合を修正

Frontend

  • フルプレビューページに動画シーン構造・検出結果の表示を追加

v1.3.8.6(2026-04-14)

GeMM-Core

  • Grounding DINO・OWL-v2オープンボキャブラリー物体検出器の追加
  • 画像・動画解析への物体検出統合(バウンディングボックスオーバーレイ付き)
  • 動画検出時のVRAM協調制御
  • エンベディングベースの日本語→英語クラス名翻訳
  • ハイブリッド検索(BM25+ベクトルRRF)の導入
  • RAG top-k検索数の拡張(get_media_info: 5→20、search_document: 5→15)
  • ツールルーターのファイル名正規表現修正

Frontend

  • プレビューからチャットへのメディアピン機能
  • 検出器UIの改善(ドロップダウン・アイコン・見出し)

v1.3.8.5(2026-04-14)

GeMM-Core

  • キーワードオーバーライドをエンベディングベースのツールルーターに置換
  • ツールルーター精度改善(79.3% → 96.6%)
  • ノンブロッキングエンベディングエンドポイント対応
  • プロンプトビルダー・ツールハンドラーのリファクタリング

Backend

  • Djangoがgemm-coreのシーン検索結果をCLIP結果で上書きする問題を修正
  • SQLパラメータ化・デッドコード削除などのコード品質改善

v1.3.8.4(2026-04-10)

GeMM-Core

  • チャットモデルセレクター機能の追加
  • メディア添付機能の追加
  • compare_mediaのオーバーライド対応
  • シーン類似度グラフの永続化・search_sceneオーバーライドの改善
  • インデクサーの修正

Backend

  • JWT認証でBasic authヘッダーをスキップするよう修正
  • トークン期限切れ時にNoneを返すよう修正

v1.3.8.3(2026-04-03)

GeMM-Core

  • メディア比較ツール(compare_media)の追加
  • チャットモデルを4B/24kコンテキストに切り替え
  • RAG制限の拡張
  • センテンスレベルのリランキングによるRAGコンテキスト注入
  • tokenizer.encodeを文字ベース推定に置換(RecursionError/SIGSEGV防止)

v1.3.8.1(2026-04-01)

GeMM-Core

  • デフォルトのドキュメントパーサーをDoclingに修正
  • ドキュメントチャンクをトークンカウントから除外

Frontend

  • チャット・プレビューでのMarkdownレンダリング対応
  • トークン閾値表示の修正
  • チャットビューにステータスバナーを追加
  • アクションバーの重なり・コンテキストメニューの修正

v1.3.8(2026-04-01)

GeMM-Core

  • 2フェーズドキュメントパイプライン(Docling抽出 → LLM要約の分離)
  • Docling画像抽出・プレビュー機能の追加
  • 適応的Doclingバッチサイズ(VRAM/RAM に応じた動的調整)
  • 非同期並列Docling抽出(セマフォによる同時実行制御)
  • 抽出結果をRAMではなくディスクに保存(OOM防止)

v1.3.7.1(2026-03-28)

GeMM-Core

  • OOMリーク調査用メモリプロファイリングログの追加
  • リクエストごとの設定リセット・量子化APIフィールド修正・メモリクリーンアップ改善

v1.3.7(2026-03-26)

GeMM-Core

  • Qwen2.5-VLを廃止し、Qwen3.5-4B-AWQを追加(Qwen3.5に統一)
  • CLIP GPUバッチエンベディング対応(動的バッチサイズ・マルチモデルサポート)
  • OOM保護のためのメモリ制限追加

v1.3.6(2026-03-24)

GeMM-Core

  • 長時間動画向けアダプティブフレームチャンキング(RAM OOM防止)
  • 複数動画の同時バッチ処理(VRAM/RAM制約の個別管理)
  • シーン検出モードのマルチ動画バッチ対応
  • 破損動画でのDecordハングを防止するタイムアウト追加
  • RapidOCRモデルディレクトリの書き込み権限修正

v1.3.5(2026-03-23)

GeMM-Core

  • テキストモデル選択が動画要約LLMに正しく反映されるよう修正
  • デフォルトの動画要約LLMをQwen3.5に変更(8192コンテキスト、FP8 KV)
  • 動画解析時のenable_thinking=False設定を追加(不要な思考出力を抑制)
  • VLMのgpu_memory_utilizationを0.85に引き上げ(Qwen3.5-9B対応)

v1.3.4(2026-03-23)

Backend

  • 本番Dockerfileでentrypoint.shを使用(自動マイグレーション・シード実行)
  • NFSマウントポイント作成の権限エラーハンドリング改善
  • setup.shでNFSマウントポイントを自動作成

インフラ

  • 本番イメージのECRリポジトリ名・タグを統一

v1.3.3(2026-03-19)

GeMM-Core

  • チャットのシーン検索でフレーム類似度グラフを返すよう改善
  • GroundingDINO APIを新バージョンのtransformersに対応(box_thresholdthreshold
  • GroundingDINO実行時のChat LLM VRAM管理を修正

Frontend

  • プレビューモーダルの拡大・全幅メディア表示対応
  • プレビューページの動画表示を最大化(max-height制限撤廃)
  • 新規タブで開いたプレビューページの戻るボタンを非表示化
  • チャット内シーン検索グラフの表示修正(固定高さ・再レンダリング時のデータ保持)

v1.3.2(2026-03-18)

GeMM-Core

  • Tool Calling LLMをELYZA-8BからQwen3.5-9Bネイティブtool callingに移行
  • Qwen3.5-9B-AWQをVisionモデルとして追加、デフォルトに設定
  • ドキュメント解析をDoclingに完全統一(PDFplumber廃止)
  • DoclingのGPUバッチ処理有効化(レイアウト解析・OCR高速化)
  • Docling実行前にGPUモデルをアンロードしVRAMを確保
  • 起動時のChat LLMプリロード(torch.compileウォームアップ付き)
  • ドキュメント/PDF解析のバッチLLM要約生成
  • FP8 KVキャッシュ有効化(KV容量2倍)
  • コンテキスト長を8192に拡張
  • CUDA 12.8ベースイメージへのアップグレード(本番含む)
  • vLLM V1のデッドロック・チャットタイムアウト問題を解消
  • Embedding/CLIPをCPU常駐化し、GPU unload管理から除外
  • PDF/ドキュメントバッチ処理中の不要なLLMリロードを抑制
  • Qwen3.5の<think>ブロックをVLM/LLM出力から除去
  • VLMシステムプロンプトがユーザー指示に従うよう修正
  • シングルフレームバッチの説明文分割を修正
  • シングルGPU環境のCUDA_VISIBLE_DEVICES設定を修正
  • チャット圧縮閾値を4000→6000トークンに引き上げ

Frontend

  • Vision Chatの追加(画像・動画フレームをVLMに送信して直接分析)
  • Vision Modeトグルボタンの追加
  • ツール結果の画像を次のチャットに自動添付
  • 画像添付時のtool callingスキップ(VLM直接分析)
  • ドキュメント解析設定の非表示化(Docling一択のため)
  • デフォルトプロンプトとOperation Panelの入力欄を同期

v1.3.1(2026-03-16)

GeMM-Core

  • VLM/LLM設定のmodel_nameキー修正

Backend

  • 一括フレーム抽出時のOOM防止(セマフォによる同時実行制限)
  • スタッフユーザーのアップロード・解析・検索レート制限を免除
  • サーバーサイド解析デフォルト設定APIの追加
  • 解析デフォルトAPIの認証・ユーザー取得の修正

v1.3.0(2026-03-11)

GeMM-Core

  • AIモデルの精度向上
  • CUDA 12.8 対応

Backend

  • 一括削除APIにJWT認証を追加
  • エンベディング生成のリトライロジック追加
  • サムネイル生成の修正(ffmpeg対応追加)

Frontend

  • ドラッグ&ドロップアップロード時のフォルダ構造保持を修正
  • ファイルアップロードの安定性改善
  • デフォルトのフレームレート設定の不整合を修正