検索のコツNo4:表記のゆれに注意する
日本語はけっこうあいまいな言語で、「表記のゆれ」というのは同じ意味を持つ言葉なのに、表記がいろいろあるということです。例えば送り仮名では「引っ越」、「引越」、「引っ越し」、「引越し」と4種類の表記のゆれが出てきます。Googleでは「もしかして」が表示される |
現在の検索エンジンは、この「表記のゆれ」になるべく対応するようにしていますので、それほど気にする必要はありませんが知っておいた方がよいでしょう。
Googleの場合は、「引っ越」で検索すると「もしかして: 引越し」と一番上に表示され、「表記のゆれ」に気がつく仕掛けになっています。
「コンピュータ」、「コンピューター」というカタカナ語による語尾の長音表記にも注意が必要です。2008年7月、マイクロソフトは新聞やテレビなどで採用されている国語審議会の内閣告示ルールに従ったカタカナ表記に変更しました。
→ マイクロソフト ランゲージ ポータル
※日本語のスタイルガイド(エクセル)がダウンロードできます。
「クラブ」、「倶楽部」のような場合はOR検索で検索するのがおすすめです。
検索のコツNo5:シソーラス辞書を活用する
検索に使うキーワードには同義語もあれば類義語もあります。また上位や下位関係にある言葉もあり、これらを把握できれば再現率、適合率を高めることができます。単語を分類し、体系づけた辞書がシソーラスです。語源はギリシャ語の宝物庫で、まさに「言葉の玉手箱」です。例えば高速道路の割引で話題の「ETC」の同義語、類義語を調べると「Electronic Toll Collection System」、「DSRC」、「ETCカード」、「イーティーシー」、「ノンストップ自動料金収受システム」などがでてきます。「DSRC」という言葉は知らなかったのですが、旧郵政省がITS向けに標準化を進めた狭域無線通信でETCに採用されているそうです、シソーラスを調べることによって検索の幅を拡げ、深みをつくることができます。
→ Weblio辞書
類義語ではありませんが、本来、「松阪肉」であるべき言葉を「松坂肉」と誤って入力するケースがけっこうあります。これは途中で間違いに気がつかないとなかなか判明しません。
→ Web2.0な日々 松阪肉それとも松坂肉?