Why is MySQL FULLTEXT so slow?

MySQL FULLTEXT is slow because it stores indexes on disk using B-tree pages, requires disk I/O for every query, and uses uncompressed posting lists. MygramDB solves this with in-memory N-gram indexing delivering consistent sub-millisecond latency.

How does MygramDB sync with MySQL?

MygramDB uses GTID-based binlog replication to sync with MySQL in real-time. It acts as a MySQL replica, receiving changes via the binary log. No ETL pipelines or manual sync needed. Write to MySQL as usual, MygramDB updates automatically.

How much faster is MygramDB than MySQL FULLTEXT?

On a 1.1M Wikipedia article dataset, MygramDB delivers sub-millisecond search latency compared to MySQL FULLTEXT at 500ms-2.5s. COUNT queries are thousands of times faster. With verify_text enabled (v1.5.0), results are exact match with MySQL. Benchmarks are reproducible via make bench-up.

Does MygramDB support Japanese/Chinese/Korean text?

Yes, MygramDB has excellent CJK support using ICU-based Unicode normalization and N-gram tokenization. It handles Japanese, Chinese, and Korean text perfectly without additional plugins or configuration.

What is the difference between MygramDB and Elasticsearch?

MygramDB is a single-binary deployment with direct MySQL binlog sync, sub-millisecond latency, and low operational complexity. Elasticsearch offers distributed search and advanced features but requires cluster management, ETL pipelines, and JVM tuning. Choose MygramDB for simpler MySQL-based applications; Elasticsearch for large-scale distributed search.

プロトコルリファレンス

MygramDBは、TCP経由でシンプルなテキストベースのプロトコルを使用します（memcachedと同様）。

SQLではありません

このページの SEARCH、COUNT、DUMP、REPLICATION はMygramDB独自のTCPコマンドです。SQL風のキーワードを含みますが、MySQLに送るSQLではありません。アプリケーションからJSONで呼びたい場合はHTTP APIを使ってください。

接続

TCP経由でMygramDBに接続：

bash

telnet localhost 11016

またはCLIクライアントを使用：

bash

./build/bin/mygram-cli -h localhost -p 11016

コマンドフォーマット

コマンドはテキストベースで、1行に1コマンドです。レスポンスは改行で終了します。

テーブル参照は DB 修飾形式 `database.table` を受け付けます。たとえば app_db データベースの articles テーブルは app_db.articles と指定します。単一データベース構成（設定されている個別のデータベースが1つだけ）の場合は、修飾なしのテーブル名も動作します。たとえば SEARCH articles hello はその唯一のデータベースに解決されます。2つ以上のデータベースにまたがる構成の場合にのみ修飾が必要となり、修飾なしの名前は曖昧として拒否されます。

TCPとHTTPの使い分け

TCPプロトコルは mygram-cli や管理コマンドに向いています。Webアプリケーションやブラウザ連携では、CORSやJSONレスポンスを扱えるHTTP APIの方が実装しやすいことが多いです。

SEARCH コマンド

指定されたテキストを含むドキュメントを検索します。

構文

SEARCH <db.table> <text> [OPTIONS]

基本例

シンプルな検索：

SEARCH app_db.articles hello

フィルタとページネーション付き：

SEARCH app_db.articles tech FILTER status = 1 LIMIT 10

レスポンス

OK RESULTS <total_count> <id1> <id2> <id3> ...

レスポンスの読み方

total_count は条件に一致した総件数で、その後ろに現在のページで返されたプライマリキーが続きます。本文やハイライトが必要な場合は、検索後に GET するかHTTP APIのレスポンス形式を検討してください。

詳細なクエリ構文、ブール演算子、フィルタ、ソート、高度な機能については、クエリ構文ガイドを参照してください。

COUNT コマンド

検索条件に一致するドキュメント数をカウントします（IDは返しません）。

構文

COUNT <db.table> <text> [OPTIONS]

例

COUNT app_db.articles tech AND AI FILTER status = 1

レスポンス

OK COUNT <number>

完全なクエリ構文については、クエリ構文ガイドを参照してください。

GET コマンド

プライマリキーでドキュメントを取得します。

構文

GET <db.table> <primary_key>

例

GET app_db.articles 12345

レスポンス

OK DOC <primary_key> <filter1=value1> <filter2=value2> ...

例：

OK DOC 12345 status=1 category=tech created_at=2024-01-15T10:30:00

見つからない場合：

ERROR Document not found

INFO コマンド

包括的なサーバー情報と統計を取得します（Redis形式）。

構文

INFO

レスポンス

Redis形式のキー・バリュー形式で複数のセクションを返します：

OK INFO

# Server
version: 1.0.0
uptime_seconds: 3600

# Stats
total_commands_processed: 10000
total_connections_received: 150
total_requests: 10000

# Commandstats
cmd_search: 8500
cmd_count: 1000
cmd_get: 500

# Memory
used_memory_bytes: 524288000
used_memory_human: 500.00 MB
used_memory_peak_bytes: 629145600
used_memory_peak_human: 600.00 MB
used_memory_index: 400.00 MB
used_memory_documents: 100.00 MB
memory_fragmentation_ratio: 1.20
total_system_memory: 16.00 GB
available_system_memory: 8.50 GB
system_memory_usage_ratio: 0.47
process_rss: 520.00 MB
process_rss_peak: 600.00 MB
memory_health: HEALTHY

# Index
total_documents: 1000000
total_terms: 1500000
total_postings: 5000000
avg_postings_per_term: 3.33
delta_encoded_lists: 1200000
roaring_bitmap_lists: 300000
optimization_status: idle

# Tables
tables: products, users, articles

# Clients
connected_clients: 5

# Replication
replication_inserts_applied: 50000
replication_updates_applied: 10000
replication_deletes_applied: 5000

メモリヘルスステータス

HEALTHY: システムメモリの20%以上が利用可能
WARNING: システムメモリの10-20%が利用可能
CRITICAL: システムメモリの10%未満が利用可能（OPTIMIZEは拒否されます）
UNKNOWN: ステータスを判定できない

CONFIG コマンド

CONFIGコマンドファミリーは、実行時の設定ヘルプ、検査、検証を提供します。

CONFIGは確認用

CONFIG SHOW や CONFIG VERIFY は設定の確認・検証用です。運用中に値を変更する場合は、変更可能なランタイム変数に限って SET / SHOW VARIABLES を使います。

CONFIG HELP [path]

設定オプションのヘルプを表示します。

構文:

CONFIG HELP [path]

パラメータ:

path (オプション): ドット区切りの設定パス（例: mysql.port）

例:

すべてのトップレベル設定セクションを表示:

CONFIG HELP

レスポンス:

+OK
Available configuration sections:
  mysql        - MySQL接続設定
  tables       - テーブル設定（複数テーブル対応）
  build        - インデックスビルド設定
  replication  - レプリケーション設定
  memory       - メモリ管理
  dump         - ダンプ永続化（自動バックアップ）
  api          - APIサーバー設定
  network      - ネットワークセキュリティ（オプション）
  logging      - ログ設定
  cache        - クエリキャッシュ設定

詳細情報は "CONFIG HELP <section>" を使用してください。

特定セクションのヘルプを表示:

CONFIG HELP mysql

レスポンス:

+OK
mysql - MySQL接続設定

Properties:
  host (string, default: "127.0.0.1")
    MySQLサーバーのホスト名またはIP

  port (integer, default: 3306, range: 1-65535)
    MySQLサーバーのポート

  user (string, 必須)
    レプリケーション用のMySQLユーザー名

  password (string)
    MySQLユーザーのパスワード

  database (string, 必須)
    データベース名

  use_gtid (boolean, default: true)
    GTIDベースのレプリケーションを有効化

  ...

特定プロパティのヘルプを表示:

CONFIG HELP mysql.port

レスポンス:

+OK
mysql.port

Type: integer
Default: 3306
Range: 1 - 65535
Description: MySQLサーバーのポート

CONFIG SHOW [path]

現在の設定値を表示します。機密フィールド（パスワード、シークレット）は *** でマスクされます。

構文:

CONFIG SHOW [path]

パラメータ:

path (オプション): 特定セクションのみを表示するドット区切りの設定パス

例:

現在の設定全体を表示:

CONFIG SHOW

レスポンス:

+OK
mysql:
  host: "127.0.0.1"
  port: 3306
  user: "repl_user"
  password: "***"
  database: "mydb"
  use_gtid: true
  ...

tables:
  - name: "articles"
    primary_key: "id"
    ...

replication:
  enable: true
  server_id: 12345
  ...

特定セクションを表示:

CONFIG SHOW mysql

特定プロパティを表示:

CONFIG SHOW mysql.port

レスポンス:

+OK
3306

CONFIG VERIFY `<filepath>`

設定ファイルをロードせずに検証します。

構文:

CONFIG VERIFY <filepath>

パラメータ:

filepath (必須): 設定ファイルのパス（YAMLまたはJSON）

例:

有効な設定を検証:

CONFIG VERIFY /etc/mygramdb/config.yaml

レスポンス（成功）:

+OK
Configuration is valid
  Tables: 2 (articles, products)
  MySQL: repl_user@127.0.0.1:3306

無効な設定を検証:

CONFIG VERIFY /tmp/invalid.yaml

レスポンス（エラー）:

-ERR Configuration validation failed:
  - mysql.port: value 99999 exceeds maximum 65535
  - tables[0].name: missing required field

DUMP コマンド

DUMPコマンドファミリーは、整合性検証を備えた統一的なスナップショット管理を提供します。

DUMP LOADは現在のデータを置き換える

DUMP SAVE は保存、DUMP VERIFY は検証、DUMP INFO は情報表示です。一方で DUMP LOAD は現在のインデックスとドキュメントストアをダンプ内容で置き換えます。実行前に対象ファイルとGTIDを確認してください。

DUMP SAVE

完全なスナップショットを単一のバイナリファイル（.dmp）に保存します。このコマンドは非同期で実行され、即座にレスポンスを返します。

構文:

DUMP SAVE [<filepath>] [--with-stats]

レスポンス:

OK DUMP_STARTED <filepath>
Use DUMP STATUS to monitor progress

例:

DUMP SAVE /backup/mygramdb.dmp --with-stats

DUMP STATUS で進捗を監視し、完了を確認できます。

DUMP LOAD

バイナリファイルからスナップショットを読み込みます。

現在の検索状態を置き換える

DUMP LOAD は現在のインデックスとドキュメントストアを置き換えます。実行前に DUMP VERIFY と DUMP INFO で、ファイル破損、GTID、テーブル識別子を確認してください。

構文:

DUMP LOAD [<filepath>]

例:

DUMP LOAD /backup/mygramdb.dmp

DUMP VERIFY

データを読み込まずにスナップショットファイルの整合性を検証します。

構文:

DUMP VERIFY [<filepath>]

例:

DUMP VERIFY /backup/mygramdb.dmp

DUMP INFO

スナップショットファイルのメタデータ（バージョン、GTID、テーブル数、サイズ、フラグ）を表示します。

構文:

DUMP INFO [<filepath>]

例:

DUMP INFO /backup/mygramdb.dmp

DUMP STATUS

非同期ダンプ操作（DUMP SAVE）の進捗を監視します。

構文:

DUMP STATUS

レスポンス:

OK DUMP_STATUS
save_in_progress: <true|false>
load_in_progress: <true|false>
replication_paused_for_dump: <true|false>
status: <IDLE|SAVING|LOADING|COMPLETED|FAILED>
filepath: <path>
tables_processed: <count>
tables_total: <count>
current_table: <table_name>
elapsed_seconds: <seconds>
result_filepath: <path>        (COMPLETED時)
error: <message>               (FAILED時)
END

ステータス値:

IDLE: ダンプ操作なし
SAVING: DUMP SAVE 実行中
LOADING: DUMP LOAD 実行中
COMPLETED: 最後のダンプ操作が正常に完了
FAILED: 最後のダンプ操作が失敗

例（保存中）:

OK DUMP_STATUS
save_in_progress: true
load_in_progress: false
replication_paused_for_dump: true
status: SAVING
filepath: /backup/mygramdb.dmp
tables_processed: 2
tables_total: 5
current_table: users
elapsed_seconds: 3.45
END

詳細なスナップショット管理、整合性保護、推奨運用、トラブルシューティングについては、スナップショットガイドを参照してください。

フィルターカラムのユニーク値とドキュメント数を集計します。

構文

FACET <table> <column> [search_text] [AND <term>] [NOT <term>] [FILTER <col> <op> <value>] [LIMIT <n>]

例

statusカラムの全値：

FACET articles status

検索結果に限定した値：

FACET articles category "機械学習" FILTER status = 1 LIMIT 10

レスポンス

OK FACET <num_values>
<value1>	<count1>
<value2>	<count2>
...

結果はカウントの降順でソートされます。

REPLICATION STATUS

現在のレプリケーションステータスを取得します。

構文

REPLICATION STATUS

レスポンス

複数行のキーバリュー形式：

OK REPLICATION
status: <running|stopped|not_configured>
current_gtid: <current_gtid>
processed_events: <count>
queue_size: <size>
END

status: 現在のレプリケーション状態
- running: MySQLからアクティブにレプリケーション中
- stopped: レプリケーションが手動で停止中
- not_configured: MySQLレプリケーションが設定されていない
current_gtid: 最後に処理されたGTID位置
processed_events: 処理されたbinlogイベントの総数
queue_size: キュー内の保留中イベント数（実行中のみ表示）

例（実行中）：

OK REPLICATION
status: running
current_gtid: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-100
processed_events: 5000
queue_size: 0
END

例（停止中）：

OK REPLICATION
status: stopped
current_gtid: 3E11FA47-71CA-11E1-9E33-C80AA9429562:1-100
processed_events: 5000
END

REPLICATION STOP

binlogレプリケーションを停止します（インデックスは読み取り専用になります）。

停止中はMySQLの変更を追従しない

REPLICATION STOP 中も検索はできますが、MySQL側の新しい変更は反映されません。メンテナンス後は REPLICATION START と REPLICATION STATUS で再開を確認してください。

構文

REPLICATION STOP

レスポンス

OK REPLICATION_STOPPED

REPLICATION START

binlogレプリケーションを再開します。

構文

REPLICATION START

レスポンス

OK REPLICATION_STARTED

OPTIMIZE コマンド

インデックスポスティングリストを最適化します（密度に基づいてデルタエンコーディングをRoaring Bitmapに変換）。

実行タイミング

OPTIMIZE は検索を止めずに実行できますが、一時的に追加メモリを使います。大きなデータセットでは、低トラフィック時間帯に実行し、事前に /info や INFO でメモリヘルスを確認してください。

構文

OPTIMIZE

動作

実行前チェック: メモリヘルスと可用性の検証
binlogレプリケーションを一時停止
ポスティングリストをバッチでコピーして最適化
クエリ処理は継続（古いインデックスを使用）
最適化完了後にアトミックに切り替え
binlogレプリケーションを再開

メモリ安全性

実行前メモリチェック：

システムメモリヘルスが CRITICAL（利用可能メモリ<10%）の場合は実行を拒否
インデックスサイズとバッチサイズに基づいて必要メモリを推定
要件：利用可能メモリ >= 推定メモリ + 10%の安全マージン
典型的なメモリオーバーヘッド：最適化中にインデックスサイズの約5〜15%

メモリ使用パターン：

インデックス部分のみが一時的に2倍になる（ドキュメントストアは変更なし）
全体的なメモリ使用量は約1.05〜1.15倍に増加
メモリはバッチ処理で段階的に解放

同時実行の制御

全テーブルを通じて同時に1つのOPTIMIZE操作のみ実行可能
最適化中は新しいOPTIMIZEコマンドは拒否されます
optimization_statusはINFOコマンドで確認できます

パフォーマンス

小規模インデックス（<10K terms）：<1秒
中規模インデックス（10K-100K terms）：1-10秒
大規模インデックス（>100K terms）：10秒以上
並行検索：最小限の影響（短いロック時間）
並行更新：安全だが短時間の競合が発生する可能性あり

レスポンス

成功時：

OK OPTIMIZED terms=<total> delta=<count> roaring=<count> memory=<size>

例：

OK OPTIMIZED terms=1500000 delta=1200000 roaring=300000 memory=450.00 MB

エラー：

すでに最適化中の場合：

ERROR Another OPTIMIZE operation is already in progress

メモリが危機的に低い場合：

ERROR Memory critically low. Cannot start optimization: available=1.50 GB total=8.00 GB

メモリ不足の場合：

ERROR Insufficient memory for optimization: estimated=2.50 GB available=1.80 GB

DEBUG コマンド

現在の接続のデバッグモードを有効/無効にして、詳細なクエリ実行メトリクスを表示します。

接続ごとの設定

DEBUG ON は現在のTCP接続にだけ効きます。別の mygram-cli セッションやアプリケーション接続には影響しません。

構文

DEBUG ON
DEBUG OFF

動作

接続ごとの状態: デバッグモードは現在の接続のみで有効/無効
クエリタイミング: 実行時間の内訳を表示（インデックス検索、フィルタリング）
検索詳細: 生成されたn-gram、ポスティングリストサイズ、候補数を表示
最適化の可視性: 適用された最適化戦略を報告
パフォーマンス影響: 最小限のオーバーヘッド、有効時のみメトリクスを収集

レスポンス

OK DEBUG_ON

または

OK DEBUG_OFF

デバッグ出力フォーマット

デバッグモードが有効な場合、SEARCHとCOUNTコマンドは追加のデバッグ情報を返します：

OK RESULTS <count> <id1> <id2> ...

# DEBUG
query_time: <ms>
index_time: <ms>
filter_time: <ms>
terms: <n>
ngrams: <n>
candidates: <n>
after_intersection: <n>
after_not: <n>
after_filters: <n>
final: <n>
optimization: <strategy>
order_by: <column> <direction>
limit: <value> [(default)]
offset: <value> [(default)]

デバッグメトリクスの説明

query_time: 総クエリ実行時間（ミリ秒）
index_time: インデックス検索に費やした時間
filter_time: フィルタ適用に費やした時間（フィルタがある場合）
terms: 検索用語の数
ngrams: 検索用語から生成された総n-gram数
candidates: インデックスからの初期候補ドキュメント
after_intersection: AND用語の交差後の結果
after_not: NOT用語のフィルタリング後の結果（NOTを使用した場合）
after_filters: FILTER条件適用後の結果（フィルタを使用した場合）
final: 一致したドキュメントの総数（LIMIT/OFFSET適用前）
optimization: 使用された戦略（例: merge_join、early_exit、none）
order_by: 適用されたソート（カラムと方向）
limit: 返される最大結果数（明示的に指定されていない場合は「(default)」と表示）
offset: ページネーションの結果オフセット（明示的に指定されていない場合は「(default)」と表示）

エラーレスポンス

すべてのエラーは以下の形式に従います：

ERROR <error_message>

例：

ERROR Unknown command
ERROR Table not found: products
ERROR Invalid GTID format

CLIクライアント機能

CLIクライアント（mygram-cli）は対話型シェルを提供：

タブ補完: TABキーでコマンド名を自動補完（GNU Readline必須）
コマンド履歴: ↑/↓矢印キーで履歴をナビゲート（GNU Readline必須）
行編集: Ctrl+A、Ctrl+Eなどでフル行編集（GNU Readline必須）
エラーハンドリング: グレースフルなエラーメッセージ（クラッシュしない）

対話モード

bash

./build/bin/mygram-cli
> SEARCH articles hello
OK RESULTS 5 1 2 3 4 5
> quit

単一コマンドモード

bash

./build/bin/mygram-cli SEARCH articles "hello world"

helpコマンド

対話モードでhelpと入力すると、利用可能なコマンドが表示されます：

> help
利用可能なコマンド:
  SEARCH, COUNT, GET              - 検索と取得
  INFO, CONFIG                    - サーバー情報と設定
  DUMP SAVE/LOAD/VERIFY/INFO/STATUS - スナップショット管理
  REPLICATION STATUS/STOP/START   - レプリケーション制御
  OPTIMIZE                        - インデックス最適化
  DEBUG ON/OFF                    - デバッグモードの有効化/無効化
  quit, exit                      - クライアント終了

参照

クエリ構文ガイド - 詳細なSEARCH/COUNTクエリ構文
スナップショットガイド - スナップショット管理と推奨運用
設定ガイド - サーバー設定
レプリケーション設定 - MySQLレプリケーション設定

プロトコルリファレンス ​

接続 ​

コマンドフォーマット ​

SEARCH コマンド ​

構文 ​

基本例 ​

レスポンス ​

COUNT コマンド ​

構文 ​

例 ​

レスポンス ​

GET コマンド ​

構文 ​

例 ​

レスポンス ​

INFO コマンド ​

構文 ​

レスポンス ​

メモリヘルスステータス ​

CONFIG コマンド ​

CONFIG HELP [path] ​

CONFIG SHOW [path] ​

CONFIG VERIFY <filepath> ​

DUMP コマンド ​

DUMP SAVE ​

DUMP LOAD ​

DUMP VERIFY ​

DUMP INFO ​

DUMP STATUS ​

FACET コマンド ​

構文 ​

例 ​

レスポンス ​

REPLICATION STATUS ​

構文 ​

レスポンス ​

REPLICATION STOP ​

構文 ​

レスポンス ​

REPLICATION START ​

構文 ​

レスポンス ​

OPTIMIZE コマンド ​

構文 ​

動作 ​

メモリ安全性 ​

同時実行の制御 ​

パフォーマンス ​

レスポンス ​

DEBUG コマンド ​

構文 ​

動作 ​

レスポンス ​

デバッグ出力フォーマット ​

デバッグメトリクスの説明 ​

エラーレスポンス ​

CLIクライアント機能 ​

対話モード ​

単一コマンドモード ​

helpコマンド ​

参照 ​

プロトコルリファレンス

接続

コマンドフォーマット

SEARCH コマンド

構文

基本例

レスポンス

COUNT コマンド

構文

例

レスポンス

GET コマンド

構文

例

レスポンス

INFO コマンド

構文

レスポンス

メモリヘルスステータス

CONFIG コマンド

CONFIG HELP [path]

CONFIG SHOW [path]

CONFIG VERIFY `<filepath>`

DUMP コマンド

DUMP SAVE

DUMP LOAD

DUMP VERIFY

DUMP INFO

DUMP STATUS

FACET コマンド

構文

例

レスポンス

REPLICATION STATUS

構文

レスポンス

REPLICATION STOP

構文

レスポンス

REPLICATION START

構文

レスポンス

OPTIMIZE コマンド

構文

動作

メモリ安全性

同時実行の制御

パフォーマンス

レスポンス

DEBUG コマンド

構文

動作

レスポンス

デバッグ出力フォーマット

デバッグメトリクスの説明

エラーレスポンス

CLIクライアント機能

対話モード

単一コマンドモード

helpコマンド

参照