検索ワード「-10,000円」を検索できるようにしたい

検索ワード「-10,000円」を検索できるようにしたい - 標準の区切り文字と「-」の働き

説明

とあるサイトで「-10,000円」をキーワードに検索した際、予想と異なるページが表示され、ちょっと驚いた。今回はその原因調査と対策についてまとめてみた。

標準の区切り文字と「-」の働き

まずは検索ワード「-10,000円」がどんなクエリーになっているのか現行バージョンの4.8.0で確認(適宜改行)。

(
(wp_posts.post_title NOT LIKE '%10%') AND 
(wp_posts.post_excerpt NOT LIKE '%10%') AND 
(wp_posts.post_content NOT LIKE '%10%')
) AND (
(wp_posts.post_title LIKE '%000円%') OR 
(wp_posts.post_excerpt LIKE '%000円%') OR 
(wp_posts.post_content LIKE '%000円%')
)

タイトル、抜粋、本文のすべてに「10」が含まれず、かつタイトル、抜粋、本文のいずれかに「000円」が含まれる投稿にマッチするクエリーになっている。まず「,」で2つに分割され、単語の先頭の「-」によって「NOT LIKE」が適用されている。また検索対象がタイトルと本文のほか、抜粋が追加されていることもわかる。

とりあえずバージョンをさかのぼりながら確認していくと、検索対象に抜粋が追加されたのはバージョン4.5.0だった。バージョン4.5.0以降では原則上記のクエリーとなることがわかった(バージョン4.7.0では'wp_query_search_exclusion_prefix'フィルターが用意され、「-」ではなく別の字に変更可能)。

さらにバージョンをさかのぼると、「-」によって「NOT LIKE」が適用される件はバージョン4.4.0で追加されいた。検索ワード「-10,000円」のクエリーは次のようになる。

(
(wp_posts.post_title NOT LIKE '%10%') AND 
(wp_posts.post_content NOT LIKE '%10%')
) AND (
(wp_posts.post_title LIKE '%000円%') OR 
(wp_posts.post_content LIKE '%000円%')
)

これに対し4.4.0より前のバージョン(ここでは4.3.1)で検索ワード「-10,000円」のクエリーは次のようになる。

(
(wp_posts.post_title LIKE '%-10%') OR 
(wp_posts.post_content LIKE '%-10%')
) AND (
(wp_posts.post_title LIKE '%000円%') OR 
(wp_posts.post_content LIKE '%000円%')
)

このようにバージョンによって検索ワードの解釈が異なるので、この点は注意したい。

検索ワードの「,」で分割問題

検索ワードが「,」で分割されることの対応については、分割される前に「,」を適当な字に置き換えて、クエリーが生成された後に「,」に戻す方法を試してみる。

function mytheme_pre_get_posts( $query ) {
	$s = $query->get( 's' );
	if ( !empty( $s ) && preg_match_all( '/(?<!\d)\d{1,3}(,\d{3})+(?!\d)/u', $s, $matches ) ) {
		$new_s = $s;
		foreach ( $matches[0] as $match )
			$new_s = preg_replace( '#'.$match.'#', str_replace( ',', '■', $match ), $new_s, 1 );
		$query->set( 's', $new_s );
	}
}
add_action( 'pre_get_posts', 'mytheme_pre_get_posts' );

function mytheme_posts_search( $search, $query ) {
	$query->set( 's', str_replace( '■', ',', $query->get( 's' ) ) );
	return str_replace( '■', ',', $search );
}
add_filter( 'posts_search', 'mytheme_posts_search', 10, 2 );

ここで使用したのは'pre_get_posts'アクションと'posts_search'フィルターである。
'pre_get_posts'アクションでは、検索ワードにカンマ区切りの数値がないか調べ、あった場合は「,」を「■」に書き換え、検索ワードとして格納し直している。なお、ここでは置き換え文字として「■」を使用しているが、実運用時する場合はもっと使用される可能性が低い字をあてるほうがよい。
'posts_search'フィルターは、検索ワードからクエリーを生成した後に実行されるフィルターでパラメータ$searchには生成されたクエリーが格納されている。そこで検索ワードとクエリーのそれぞれについて「■」を「,」に書き換えている。

上記を適用した結果、クエリーは次のようになる。

(
(wp_posts.post_title NOT LIKE '%10,000円%') AND 
(wp_posts.post_excerpt NOT LIKE '%10,000円%') AND
(wp_posts.post_content NOT LIKE '%10,000円%')
)
除外記号の「-」を「!」に変更

今度は除外記号の「-」を「!」に変更する。これはWordPressのバージョンによって対応が異なるが、4.7.0以降であれば先に触れたように'wp_query_search_exclusion_prefix'フィルターを利用するのが手っ取り早い。

function mytheme_search_exclusion_prefix( $exclusion_prefix ) {
	return '!';
}
add_filter( 'wp_query_search_exclusion_prefix', 'mytheme_search_exclusion_prefix' );

上記を適用した結果、クエリーは次のようになり、無事「-10,000円」が含まれるページが検索されるようになった。

(
(wp_posts.post_title LIKE '%-10,000円%') OR 
(wp_posts.post_excerpt LIKE '%-10,000円%') OR 
(wp_posts.post_content LIKE '%-10,000円%')
)

なおここでは「!」を使用しているが、検索ワードの区切り文字(記号)を指定してしまうと意図した検索結果が得られない場合があるので、その点は注意したい。

「,」を置き換えない方法

さて検索ワードを「,」で分割させない方法として、そのワードを「"」で囲む方法がある。'pre_get_posts'フィルターでそういった対応ができないわけではないのだが、元の検索ワードに「"」が含まれるケースを考えるといろいろと悩ましいので、今回は「,」を置き換える方法を採用した。

【追記】'wp_query_search_exclusion_prefix'フィルターで返す文字はシングルバイトでなければ正しく機能しない。またnullを返すことで、除外検索そのものを無効化できる(バージョン4.4.0より前のバージョンと同等になる)。

関連

  • query_posts - 条件を指定して投稿情報をロードする

お勧めコンテンツ

get_header(2009年11月12日 登録)

void get_header( [ string $name = null ] )
ヘッダパーツを記述したメインヘッダファイルheader.php(またはサブヘッダファイルheader-???.php)を読み込む。

get_page(2010年4月14日 登録)

mixed get_page( mixed & $page [ , string $output = OBJECT [ , string $filter = 'raw' ] ] )
任意のページ情報を取得する。

get_the_content(2014年3月3日 登録)

string get_the_content( [ string $more_link_text = null [ , bool $strip_teaser = false ] ] )
現在の投稿情報のコンテンツを取得する。

form_option(2014年1月30日 登録)

void form_option( string $option )
オプションの値をフォーム要素向けに表示する。

get_stylesheet_directory(2011年9月28日 登録)

string get_stylesheet_directory( )
現在のテーマ(スタイルシートがあるディレクトリ)のパス名を取得する。

最終更新日時 : 2017-07-21 09:46