リリースノート
GeMM の各バージョンの変更履歴です。
コンテナイメージの更新は docker compose pull で取得できます。
GeMM は以下のコンテナイメージで構成されます:
| イメージ | 説明 | 配布元 |
|---|---|---|
gemm-core | AI推論エンジン | GeMM |
gemm-backend | バックエンドAPI | GeMM |
gemm-frontend | Web UI | GeMM |
postgres:15 | データベース | 公式イメージ |
opensearchproject/opensearch | 全文検索エンジン | 公式イメージ |
GeMM が配布するのは上3つのイメージです。下2つは公式イメージをそのまま使用します。
v1.3.19(2026-06-17)
GeMM-Core
- 文書・動画の要約が短く退化する不具合を修正
Frontend
- チャット内のシーン類似度グラフでY軸表示を自動調整
v1.3.18(2026-06-10)
GeMM-Core
- 旧コードパスを整理し、システムの保守性を向上
- チャット応答機能の一部不具合を修正
v1.3.17(2026-06-05)
GeMM-Core
- チャット応答の信頼性を向上(質問と検索結果の主題不一致を検出する仕組みを追加)
- 英字キーワードを含む全文検索の精度を改善
v1.3.16(2026-06-03)
Frontend
- フォルダツリーに手動更新ボタンを追加
v1.3.15(2026-06-03)
Frontend
- ファイル移動時にフォルダツリー表示が更新されない不具合を修正
v1.3.14(2026-06-02)
GeMM-Core
- チャット応答の信頼性を改善(否定条件・存在確認・引用根拠の取り扱いを強化)
- 動画シーン検索にハイブリッド検索(全文+ベクトル)を導入し関連性を向上
Backend
- セマンティックビューの表示不具合を修正
- メディア再スキャン時に非表示設定が正しく反映されない問題を修正
v1.3.13(2026-06-01)
Backend
- ファイルアップロード時のユーザー紐付けに関するセキュリティを強化
- v1.3.12 アップグレード時のデータベース更新欠落を修正
- v1.3.12 ビルドに含まれていなかったストレージモジュールを追加
v1.3.12(2026-06-01)
Backend
- メディアファイルのストレージ抽象化レイヤを導入し、柔軟な構成に対応
- フォルダ要約・統計表示・フレーム説明など複数ツールの実行基盤を刷新
v1.3.11(2026-05-28)
GeMM-Core
- 存在確認質問でのハルシネーションを抑制(チャット応答の堅牢性向上)
- 画像検索における誤回答を修正
- 文書検索の検索精度を改善
v1.3.10(2026-05-28)
Backend
- 検索・ツール実行基盤を刷新し、安定性と拡張性を向上
- ハイブリッド検索(全文+ベクトル)の不具合を修正
v1.3.9.2(2026-05-19)
GeMM-Core
- チャットモデル切替時の不具合を修正
v1.3.9.1(2026-05-19)
GeMM-Core
- チャットモデル切替時のタイムアウト処理を改善
- v1.3.9 で発生していたBackfill機能のビルド不備を修正
Frontend
- 特定のメディアファイルを通常UIから非表示にする機能を追加
v1.3.9(2026-05-13)
GeMM-Core
- 日本語テキストエンベディングを刷新し、検索精度を大幅に向上
- クエリ用・パッセージ用の埋め込み生成APIを最適化
Frontend
- 全件再インデックス機能を追加(古いインデックスの自動検出・再構築に対応)
- 既存データの再エンベディング(Backfill)UIを追加
v1.3.8.14(2026-05-12)
GeMM-Core
- 初回起動時に Gemma 4 のモデル重みを自動取得するよう対応
v1.3.8.13(2026-05-12)
GeMM-Core
- 新しい言語モデル Gemma 4 に対応
- ナレーション品質を改善
- ツール選択の精度を改善
- フォルダ要約・統計表示などの新ツールを追加
Frontend
- ランタイムでチャットモデルを切り替え可能に
- 検出器UIを明示選択方式に刷新(チャットUI下に常設)
- 検出対象を自然言語テキストで指定可能に
v1.3.8.12(2026-05-05)
GeMM-Core
- 動画シーン検索の精度・関連性を改善
- チャット応答の品質を向上
- ツール選択の安定性を改善
v1.3.8.11(2026-04-27)
GeMM-Core
- 動画解析の処理速度を改善
v1.3.8.10(2026-04-21)
Frontend
- 検出数の時系列チャートとしきい値スライダーを追加
v1.3.8.9(2026-04-21)
Frontend
- 解析結果の履歴表示・スナップショット・差分ビューを追加
GeMM-Core
- プロンプトテンプレートのバージョン管理に対応
v1.3.8.8(2026-04-21)
GeMM-Core
- 長時間動画の階層解析に対応
- 産業用途向けの解析精度を改善
- 検出処理のメモリ効率を改善
- 動画解析における各種不具合を修正
Frontend
- フルプレビューページに動画シーン構造・検出結果の表示を追加
v1.3.8.6(2026-04-14)
GeMM-Core
- Grounding DINO・OWL-v2オープンボキャブラリー物体検出器の追加
- 画像・動画解析への物体検出統合(バウンディングボックスオーバーレイ付き)
- 動画検出時のVRAM協調制御
- エンベディングベースの日本語→英語クラス名翻訳
- ハイブリッド検索(BM25+ベクトルRRF)の導入
- RAG top-k検索数の拡張(get_media_info: 5→20、search_document: 5→15)
- ツールルーターのファイル名正規表現修正
Frontend
- プレビューからチャットへのメディアピン機能
- 検出器UIの改善(ドロップダウン・アイコン・見出し)
v1.3.8.5(2026-04-14)
GeMM-Core
- キーワードオーバーライドをエンベディングベースのツールルーターに置換
- ツールルーター精度改善(79.3% → 96.6%)
- ノンブロッキングエンベディングエンドポイント対応
- プロンプトビルダー・ツールハンドラーのリファクタリング
Backend
- Djangoがgemm-coreのシーン検索結果をCLIP結果で上書きする問題を修正
- SQLパラメータ化・デッドコード削除などのコード品質改善
v1.3.8.4(2026-04-10)
GeMM-Core
- チャットモデルセレクター機能の追加
- メディア添付機能の追加
- compare_mediaのオーバーライド対応
- シーン類似度グラフの永続化・search_sceneオーバーライドの改善
- インデクサーの修正
Backend
- JWT認証でBasic authヘッダーをスキップするよう修正
- トークン期限切れ時にNoneを返すよう修正
v1.3.8.3(2026-04-03)
GeMM-Core
- メディア比較ツール(compare_media)の追加
- チャットモデルを4B/24kコンテキストに切り替え
- RAG制限の拡張
- センテンスレベルのリランキングによるRAGコンテキスト注入
- tokenizer.encodeを文字ベース推定に置換(RecursionError/SIGSEGV防止)
v1.3.8.1(2026-04-01)
GeMM-Core
- デフォルトのドキュメントパーサーをDoclingに修正
- ドキュメントチャンクをトークンカウントから除外
Frontend
- チャット・プレビューでのMarkdownレンダリング対応
- トークン閾値表示の修正
- チャットビューにステータスバナーを追加
- アクションバーの重なり・コンテキストメニューの修正
v1.3.8(2026-04-01)
GeMM-Core
- 2フェーズドキュメントパイプライン(Docling抽出 → LLM要約の分離)
- Docling画像抽出・プレビュー機能の追加
- 適応的Doclingバッチサイズ(VRAM/RAM に応じた動的調整)
- 非同期並列Docling抽出(セマフォによる同時実行制御)
- 抽出結果をRAMではなくディスクに保存(OOM防止)
v1.3.7.1(2026-03-28)
GeMM-Core
- OOMリーク調査用メモリプロファイリングログの追加
- リクエストごとの設定リセット・量子化APIフィールド修正・メモリクリーンアップ改善
v1.3.7(2026-03-26)
GeMM-Core
- Qwen2.5-VLを廃止し、Qwen3.5-4B-AWQを追加(Qwen3.5に統一)
- CLIP GPUバッチエンベディング対応(動的バッチサイズ・マルチモデルサポート)
- OOM保護のためのメモリ制限追加
v1.3.6(2026-03-24)
GeMM-Core
- 長時間動画向けアダプティブフレームチャンキング(RAM OOM防止)
- 複数動画の同時バッチ処理(VRAM/RAM制約の個別管理)
- シーン検出モードのマルチ動画バッチ対応
- 破損動画でのDecordハングを防止するタイムアウト追加
- RapidOCRモデルディレクトリの書き込み権限修正
v1.3.5(2026-03-23)
GeMM-Core
- テキストモデル選択が動画要約LLMに正しく反映されるよう修正
- デフォルトの動画要約LLMをQwen3.5に変更(8192コンテキスト、FP8 KV)
- 動画解析時の
enable_thinking=False設定を追加(不要な思考出力を抑制) - VLMの
gpu_memory_utilizationを0.85に引き上げ(Qwen3.5-9B対応)
v1.3.4(2026-03-23)
Backend
- 本番Dockerfileでentrypoint.shを使用(自動マイグレーション・シード実行)
- NFSマウントポイント作成の権限エラーハンドリング改善
- setup.shでNFSマウントポイントを自動作成
インフラ
- 本番イメージのECRリポジトリ名・タグを統一
v1.3.3(2026-03-19)
GeMM-Core
- チャットのシーン検索でフレーム類似度グラフを返すよう改善
- GroundingDINO APIを新バージョンのtransformersに対応(
box_threshold→threshold) - GroundingDINO実行時のChat LLM VRAM管理を修正
Frontend
- プレビューモーダルの拡大・全幅メディア表示対応
- プレビューページの動画表示を最大化(max-height制限撤廃)
- 新規タブで開いたプレビューページの戻るボタンを非表示化
- チャット内シーン検索グラフの表示修正(固定高さ・再レンダリング時のデータ保持)
v1.3.2(2026-03-18)
GeMM-Core
- Tool Calling LLMをELYZA-8BからQwen3.5-9Bネイティブtool callingに移行
- Qwen3.5-9B-AWQをVisionモデルとして追加、デフォルトに設定
- ドキュメント解析をDoclingに完全統一(PDFplumber廃止)
- DoclingのGPUバッチ処理有効化(レイアウト解析・OCR高速化)
- Docling実行前にGPUモデルをアンロードしVRAMを確保
- 起動時のChat LLMプリロード(torch.compileウォームアップ付き)
- ドキュメント/PDF解析のバッチLLM要約生成
- FP8 KVキャッシュ有効化(KV容量2倍)
- コンテキスト長を8192に拡張
- CUDA 12.8ベースイメージへのアップグレード(本番含む)
- vLLM V1のデッドロック・チャットタイムアウト問題を解消
- Embedding/CLIPをCPU常駐化し、GPU unload管理から除外
- PDF/ドキュメントバッチ処理中の不要なLLMリロードを抑制
- Qwen3.5の
<think>ブロックをVLM/LLM出力から除去 - VLMシステムプロンプトがユーザー指示に従うよう修正
- シングルフレームバッチの説明文分割を修正
- シングルGPU環境のCUDA_VISIBLE_DEVICES設定を修正
- チャット圧縮閾値を4000→6000トークンに引き上げ
Frontend
- Vision Chatの追加(画像・動画フレームをVLMに送信して直接分析)
- Vision Modeトグルボタンの追加
- ツール結果の画像を次のチャットに自動添付
- 画像添付時のtool callingスキップ(VLM直接分析)
- ドキュメント解析設定の非表示化(Docling一択のため)
- デフォルトプロンプトとOperation Panelの入力欄を同期
v1.3.1(2026-03-16)
GeMM-Core
- VLM/LLM設定の
model_nameキー修正
Backend
- 一括フレーム抽出時のOOM防止(セマフォによる同時実行制限)
- スタッフユーザーのアップロード・解析・検索レート制限を免除
- サーバーサイド解析デフォルト設定APIの追加
- 解析デフォルトAPIの認証・ユーザー取得の修正
v1.3.0(2026-03-11)
GeMM-Core
- AIモデルの精度向上
- CUDA 12.8 対応
Backend
- 一括削除APIにJWT認証を追加
- エンベディング生成のリトライロジック追加
- サムネイル生成の修正(ffmpeg対応追加)
Frontend
- ドラッグ&ドロップアップロード時のフォルダ構造保持を修正
- ファイルアップロードの安定性改善
- デフォルトのフレームレート設定の不整合を修正