FC2ブログ

2018-11

スポンサーサイト

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。

シソーラスファイルの編集時の注意点

ブログ一発目の情報。

シソーラスファイルの基本的な情報はこちらをご覧ください。

http://technet.microsoft.com/ja-jp/library/dd361734.aspx



このシソーラスファイルですが、同じ単語を2か所以上に登録するとエラーになります。
しかもファイルそのものが無効になります。

どの単語が原因なのかエラーを見ても分からないので注意しましょう。

というか、同じ単語を2か所以上に登録してはいけないと知らなかったあの頃……。
XMLの書き方などが原因かと色々探りましたよorz


しかし!
実はそれ以外にもエラーになる条件があります。

原因は同じ事なんですが、勝手に単語を違う解釈で認識して同じ単語と見なされてしまう事があります。
①伸ばし棒の有無の違い
  「コンピューター」「コンピュータ」

②カタカナの半角全角は区別されない
  「パソコン」「パソコン」

③ローマ字の大文字小文字は区別されない
  「PC」「PC」

④「&」や「/」(記号すべて?)は無視される
  「A&B」「AB」

⑤ローマ数字は無視
  「ドラクエⅡ」(Ⅱ=ローマ数字)「ドラクエ」

⑥自動で同意と見なされる単語(詳細不明)
  「チェン」「チェイン」



①②③はそもそも登録する必要はないのですが、とりあえずしてみよう!ってな感じでしたらハマりました……。


④⑤はおそらく記号をすべて無視しているのではないかと思います。
検索の時もそうですもんね。

良かれと思って登録すると痛い目見ます。


⑥は……、これホントにやっかいです。
詳細が公開されていない為、怪しい単語を実際に検索して同意語として扱われているかを確認するしかありません。
(私の知る限り)

誰か、情報を持っていたらぜひ下さい……。



それ以外でちょっと小ネタ。

・XMLでは無効な「&」を含めても問題ない
  A&Bのような単語を登録するとXMLエディターでは開けなくなりますが、シソーラスとしてはちゃんと認識します。

・ファイルは、必ず Unicode で保存する


ご注意下さい!


スポンサーサイト

● COMMENT FORM ●


管理者にだけ表示を許可する

トラックバック

http://sharepointyuzuki.blog54.fc2.com/tb.php/2-a43559df
この記事にトラックバックする(FC2ブログユーザー)

検索クエリの詳細なログ «  | BLOG TOP |  » ブログ開設

プロフィール

柚木

Author:柚木
コメント・トラックバックなどお気軽にどうぞ(^^)

連絡先:yuzuki-sharepoint★mail.goo.ne.jp(★を@に変換)

最新記事

最新コメント

最新トラックバック

月別アーカイブ

カテゴリ

リスト・ライブラリ (9)
検索関連 (3)
管理設定 (0)
開発 (14)
その他 (1)
未分類 (0)

検索フォーム

RSSリンクの表示

リンク

このブログをリンクに追加する

ブロとも申請フォーム

この人とブロともになる

上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。