リリースノート

GeMM の各バージョンの変更履歴です。

コンテナイメージの更新は docker compose pull で取得できます。

GeMM は以下のコンテナイメージで構成されます：

イメージ	説明	配布元
`gemm-core`	AI推論エンジン	GeMM
`gemm-backend`	バックエンドAPI	GeMM
`gemm-frontend`	Web UI	GeMM
`postgres:15`	データベース	公式イメージ
`opensearchproject/opensearch`	全文検索エンジン	公式イメージ

GeMM が配布するのは上3つのイメージです。下2つは公式イメージをそのまま使用します。

v1.3.19（2026-06-17）

GeMM-Core

文書・動画の要約が短く退化する不具合を修正

Frontend

チャット内のシーン類似度グラフでY軸表示を自動調整

v1.3.18（2026-06-10）

GeMM-Core

旧コードパスを整理し、システムの保守性を向上
チャット応答機能の一部不具合を修正

v1.3.17（2026-06-05）

GeMM-Core

チャット応答の信頼性を向上（質問と検索結果の主題不一致を検出する仕組みを追加）
英字キーワードを含む全文検索の精度を改善

v1.3.16（2026-06-03）

Frontend

フォルダツリーに手動更新ボタンを追加

v1.3.15（2026-06-03）

Frontend

ファイル移動時にフォルダツリー表示が更新されない不具合を修正

v1.3.14（2026-06-02）

GeMM-Core

チャット応答の信頼性を改善（否定条件・存在確認・引用根拠の取り扱いを強化）
動画シーン検索にハイブリッド検索（全文＋ベクトル）を導入し関連性を向上

Backend

セマンティックビューの表示不具合を修正
メディア再スキャン時に非表示設定が正しく反映されない問題を修正

v1.3.13（2026-06-01）

Backend

ファイルアップロード時のユーザー紐付けに関するセキュリティを強化
v1.3.12 アップグレード時のデータベース更新欠落を修正
v1.3.12 ビルドに含まれていなかったストレージモジュールを追加

v1.3.12（2026-06-01）

Backend

メディアファイルのストレージ抽象化レイヤを導入し、柔軟な構成に対応
フォルダ要約・統計表示・フレーム説明など複数ツールの実行基盤を刷新

v1.3.11（2026-05-28）

GeMM-Core

存在確認質問でのハルシネーションを抑制（チャット応答の堅牢性向上）
画像検索における誤回答を修正
文書検索の検索精度を改善

v1.3.10（2026-05-28）

Backend

検索・ツール実行基盤を刷新し、安定性と拡張性を向上
ハイブリッド検索（全文＋ベクトル）の不具合を修正

v1.3.9.2（2026-05-19）

GeMM-Core

チャットモデル切替時の不具合を修正

v1.3.9.1（2026-05-19）

GeMM-Core

チャットモデル切替時のタイムアウト処理を改善
v1.3.9 で発生していたBackfill機能のビルド不備を修正

Frontend

特定のメディアファイルを通常UIから非表示にする機能を追加

v1.3.9（2026-05-13）

GeMM-Core

日本語テキストエンベディングを刷新し、検索精度を大幅に向上
クエリ用・パッセージ用の埋め込み生成APIを最適化

Frontend

全件再インデックス機能を追加（古いインデックスの自動検出・再構築に対応）
既存データの再エンベディング（Backfill）UIを追加

v1.3.8.14（2026-05-12）

GeMM-Core

初回起動時に Gemma 4 のモデル重みを自動取得するよう対応

v1.3.8.13（2026-05-12）

GeMM-Core

新しい言語モデル Gemma 4 に対応
ナレーション品質を改善
ツール選択の精度を改善
フォルダ要約・統計表示などの新ツールを追加

Frontend

ランタイムでチャットモデルを切り替え可能に
検出器UIを明示選択方式に刷新（チャットUI下に常設）
検出対象を自然言語テキストで指定可能に

v1.3.8.12（2026-05-05）

GeMM-Core

動画シーン検索の精度・関連性を改善
チャット応答の品質を向上
ツール選択の安定性を改善

v1.3.8.11（2026-04-27）

GeMM-Core

動画解析の処理速度を改善

v1.3.8.10（2026-04-21）

Frontend

検出数の時系列チャートとしきい値スライダーを追加

v1.3.8.9（2026-04-21）

Frontend

解析結果の履歴表示・スナップショット・差分ビューを追加

GeMM-Core

プロンプトテンプレートのバージョン管理に対応

v1.3.8.8（2026-04-21）

GeMM-Core

長時間動画の階層解析に対応
産業用途向けの解析精度を改善
検出処理のメモリ効率を改善
動画解析における各種不具合を修正

Frontend

フルプレビューページに動画シーン構造・検出結果の表示を追加

v1.3.8.6（2026-04-14）

GeMM-Core

Grounding DINO・OWL-v2オープンボキャブラリー物体検出器の追加
画像・動画解析への物体検出統合（バウンディングボックスオーバーレイ付き）
動画検出時のVRAM協調制御
エンベディングベースの日本語→英語クラス名翻訳
ハイブリッド検索（BM25+ベクトルRRF）の導入
RAG top-k検索数の拡張（get_media_info: 5→20、search_document: 5→15）
ツールルーターのファイル名正規表現修正

Frontend

プレビューからチャットへのメディアピン機能
検出器UIの改善（ドロップダウン・アイコン・見出し）

v1.3.8.5（2026-04-14）

GeMM-Core

キーワードオーバーライドをエンベディングベースのツールルーターに置換
ツールルーター精度改善（79.3% → 96.6%）
ノンブロッキングエンベディングエンドポイント対応
プロンプトビルダー・ツールハンドラーのリファクタリング

Backend

Djangoがgemm-coreのシーン検索結果をCLIP結果で上書きする問題を修正
SQLパラメータ化・デッドコード削除などのコード品質改善

v1.3.8.4（2026-04-10）

GeMM-Core

チャットモデルセレクター機能の追加
メディア添付機能の追加
compare_mediaのオーバーライド対応
シーン類似度グラフの永続化・search_sceneオーバーライドの改善
インデクサーの修正

Backend

JWT認証でBasic authヘッダーをスキップするよう修正
トークン期限切れ時にNoneを返すよう修正

v1.3.8.3（2026-04-03）

GeMM-Core

メディア比較ツール（compare_media）の追加
チャットモデルを4B/24kコンテキストに切り替え
RAG制限の拡張
センテンスレベルのリランキングによるRAGコンテキスト注入
tokenizer.encodeを文字ベース推定に置換（RecursionError/SIGSEGV防止）

v1.3.8.1（2026-04-01）

GeMM-Core

デフォルトのドキュメントパーサーをDoclingに修正
ドキュメントチャンクをトークンカウントから除外

Frontend

チャット・プレビューでのMarkdownレンダリング対応
トークン閾値表示の修正
チャットビューにステータスバナーを追加
アクションバーの重なり・コンテキストメニューの修正

v1.3.8（2026-04-01）

GeMM-Core

2フェーズドキュメントパイプライン（Docling抽出 → LLM要約の分離）
Docling画像抽出・プレビュー機能の追加
適応的Doclingバッチサイズ（VRAM/RAM に応じた動的調整）
非同期並列Docling抽出（セマフォによる同時実行制御）
抽出結果をRAMではなくディスクに保存（OOM防止）

v1.3.7.1（2026-03-28）

GeMM-Core

OOMリーク調査用メモリプロファイリングログの追加
リクエストごとの設定リセット・量子化APIフィールド修正・メモリクリーンアップ改善

v1.3.7（2026-03-26）

GeMM-Core

Qwen2.5-VLを廃止し、Qwen3.5-4B-AWQを追加（Qwen3.5に統一）
CLIP GPUバッチエンベディング対応（動的バッチサイズ・マルチモデルサポート）
OOM保護のためのメモリ制限追加

v1.3.6（2026-03-24）

GeMM-Core

長時間動画向けアダプティブフレームチャンキング（RAM OOM防止）
複数動画の同時バッチ処理（VRAM/RAM制約の個別管理）
シーン検出モードのマルチ動画バッチ対応
破損動画でのDecordハングを防止するタイムアウト追加
RapidOCRモデルディレクトリの書き込み権限修正

v1.3.5（2026-03-23）

GeMM-Core

テキストモデル選択が動画要約LLMに正しく反映されるよう修正
デフォルトの動画要約LLMをQwen3.5に変更（8192コンテキスト、FP8 KV）
動画解析時のenable_thinking=False設定を追加（不要な思考出力を抑制）
VLMのgpu_memory_utilizationを0.85に引き上げ（Qwen3.5-9B対応）

v1.3.4（2026-03-23）

Backend

本番Dockerfileでentrypoint.shを使用（自動マイグレーション・シード実行）
NFSマウントポイント作成の権限エラーハンドリング改善
setup.shでNFSマウントポイントを自動作成

インフラ

本番イメージのECRリポジトリ名・タグを統一

v1.3.3（2026-03-19）

GeMM-Core

チャットのシーン検索でフレーム類似度グラフを返すよう改善
GroundingDINO APIを新バージョンのtransformersに対応（box_threshold → threshold）
GroundingDINO実行時のChat LLM VRAM管理を修正

Frontend

プレビューモーダルの拡大・全幅メディア表示対応
プレビューページの動画表示を最大化（max-height制限撤廃）
新規タブで開いたプレビューページの戻るボタンを非表示化
チャット内シーン検索グラフの表示修正（固定高さ・再レンダリング時のデータ保持）

v1.3.2（2026-03-18）

GeMM-Core

Tool Calling LLMをELYZA-8BからQwen3.5-9Bネイティブtool callingに移行
Qwen3.5-9B-AWQをVisionモデルとして追加、デフォルトに設定
ドキュメント解析をDoclingに完全統一（PDFplumber廃止）
DoclingのGPUバッチ処理有効化（レイアウト解析・OCR高速化）
Docling実行前にGPUモデルをアンロードしVRAMを確保
起動時のChat LLMプリロード（torch.compileウォームアップ付き）
ドキュメント/PDF解析のバッチLLM要約生成
FP8 KVキャッシュ有効化（KV容量2倍）
コンテキスト長を8192に拡張
CUDA 12.8ベースイメージへのアップグレード（本番含む）
vLLM V1のデッドロック・チャットタイムアウト問題を解消
Embedding/CLIPをCPU常駐化し、GPU unload管理から除外
PDF/ドキュメントバッチ処理中の不要なLLMリロードを抑制
Qwen3.5の<think>ブロックをVLM/LLM出力から除去
VLMシステムプロンプトがユーザー指示に従うよう修正
シングルフレームバッチの説明文分割を修正
シングルGPU環境のCUDA_VISIBLE_DEVICES設定を修正
チャット圧縮閾値を4000→6000トークンに引き上げ

Frontend

Vision Chatの追加（画像・動画フレームをVLMに送信して直接分析）
Vision Modeトグルボタンの追加
ツール結果の画像を次のチャットに自動添付
画像添付時のtool callingスキップ（VLM直接分析）
ドキュメント解析設定の非表示化（Docling一択のため）
デフォルトプロンプトとOperation Panelの入力欄を同期

v1.3.1（2026-03-16）

GeMM-Core

VLM/LLM設定のmodel_nameキー修正

Backend

一括フレーム抽出時のOOM防止（セマフォによる同時実行制限）
スタッフユーザーのアップロード・解析・検索レート制限を免除
サーバーサイド解析デフォルト設定APIの追加
解析デフォルトAPIの認証・ユーザー取得の修正

v1.3.0（2026-03-11）

GeMM-Core

AIモデルの精度向上
CUDA 12.8 対応

Backend

一括削除APIにJWT認証を追加
エンベディング生成のリトライロジック追加
サムネイル生成の修正（ffmpeg対応追加）

Frontend

ドラッグ＆ドロップアップロード時のフォルダ構造保持を修正
ファイルアップロードの安定性改善
デフォルトのフレームレート設定の不整合を修正