Linuxを中心とした話題を投稿予定。 使用ディストリビューションであるFedoraが中心になると思われます。http://oedipa.wiki.fc2.com/にてTips Wikiを公開してます。
スポンサーサイト
上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
Blogとネットとデータマイニング
Blogはブームとなって広がっていますが、もちろんBlogをしない人も多くいる訳で。中にはBlogを好意的に思っていない人もいる訳で。
好意的に思っていない人達がその要因として挙げるもののひとつに、サーチエンジンの問題があります。Blogって、かなり早く検索エンジンに反映されてると思うんですよね。absinthさんもBlog内でよく仰ることなんですが、Blogで書いた内容が検索エンジンに引っかかり、それが本来探していた内容と大きく掛け離れたものであるなら邪魔になってしまうのではないか。そう云った心配というか悩みはやはりあります。
何かトラブってしまって検索を掛け、その結果同様のトラブルに遭遇した内容のBlogがあればそれは助かるかもしれません。実際私もLinuxでトラブったら検索を掛けますが、Blogの記事に助けられた事もしばしばあります。
しかしながら、確かに検索ワードが含まれてはいるけれど内容的には全く関係の無いBlogの記事にも遭遇するのは事実です。そう云った場合、Blogに好意的では無い人からすると、「邪魔だ」と感じてしまうのかもしれません。その記事があるために求めるサイトにたどり着くのが遅れてしまう訳ですから。
ですが、検索エンジンで検索を掛ける場合、大抵は単語をいくつか書き並べて検索する場合がほとんどです。詳しいことが分かっていないことを調べる場合は単語数が少なく、検索件数がどえらいことになってしまうことが多々あります。それはインターネットという膨大なデータの集まりから与えられた単語で検索を掛けた結果なので致し方ありませんが、もっと効率よく検索できないものか、そう感じる人は少なくないのではないでしょうか。
Blog以外にも、古くからは掲示板があり、また個人サイトもあったりと検索ワードを含むけれど内容は余り関係ないようなサイトはたくさんあります。それらをひっくるめた中からどうやって望みのデータを捜し出すか。そのために様々な研究がなされていますが、なかなか実働にまでは至っていないのが現状です。
ぱっと思い付くのが、メタデータによる検索といったところでしょうか。そのHTMLに関連するワードをメタデータとしてファイルに保存しておき、検索の際そのメタデータと照らし合わせて検索ワードが多く含まれるようなモノを上位に持ってくる、って感じです。とはいえ、これの弱点はどのようにしてそのメタデータを作成するか、なんですよね^^; 連想する内容をデータとして保存できたらよいのですが、画像や動画が含まれる場合はどうするのか、とか、課題は多いですね。私の友人が卒業研究でこういったデータマイニングに関する研究を行うとのことなので、卒研発表が楽しみだったりします(自分も大変なのだが)。
個人的には、Blogって便利なツールだと思っています。ほとんどの人がある程度自分の書くジャンルを絞っており、また自分の得意な分野について書いているので何かを調べるときにはそう云ったジャンルのBlogからリンクをたどったりして探すこともあります。それに、普段はなかなか知る機会の無い話題も出てきたりしますし。
信頼性に関してはネットなのでとりあえず複数サイトで同一の内容になっているかは確認しますが、他の参考サイトもリンクを辿っていけば割と簡単に見付かるので時間も掛かりません。備忘録として使っている人もいますし、意外とトラブルシュートに使えるツールだと感じてます。
Blog検索も結構始まってますし、「日記」と敬遠しないで読んでみると思わぬデータに巡りあえるかもしれませんよ?

関連記事
スポンサーサイト
コメント
この記事へのコメント
データに出会うことを求めて検索して ブログにひっかかり そのままそこの常連になってしまうなんて なかなか素敵な出会いであったりもしますね^^
2005/06/21(Tue) 21:44 | URL  | absinth #79D/WHSg[ 編集]
absinthさんこんばんは^^
そうですね、私もBlogを始めたばっかりの時はエキブロユーザも少なかったので、エキブロのブログトップでコンピュータとニュースのカテゴリのトラバ先にちょくちょくおじゃましたものです。そこでmarubegs8さんと出会って、atuko-kさんと出会って…、と何時の間にやら常連に。そこからさらに輪が広がってabisinthさん等に広がって、今に至ってます。
実際の生活と同じで、自分で足を伸ばして人づてなりなんなりで調べてみないと分からないこともたくさんありますものね。時間があるなら、はしごするのも楽しいものです^^
2005/06/21(Tue) 22:13 | URL  | code_air_edge #79D/WHSg[ 編集]
ところで、いつのまにかライフログに「FF7AC」があるのはびっくりしました!い、いつのまに?w リミットブレイクを発動したい気持ちです(謎
2005/06/21(Tue) 22:45 | URL  | marubegs8 #79D/WHSg[ 編集]
marubegs8さんこんばんは。
確かに、私もBlog検索にもGoogleを使ってますねぇ…^^; ブラウザから直接調べられるのは楽ですものね。
あ、FFVII ACは予約しましたよ~(笑) さすがに通常の方ですが。今から発送が楽しみです♪
2005/06/22(Wed) 21:20 | URL  | code_air_edge #79D/WHSg[ 編集]
コメントを投稿
URL:
Comment:
Pass:
秘密: 管理者にだけ表示を許可
 
トラックバック
この記事のトラックバックURL
この記事へのトラックバック
上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。