« TextFormations(ver 3.1) | フォーメーションデータよりおすすめ作成 | メイン | チームメイト検索を縦表示にしてみた | loopshoot Suggest Search ver0.5 »

「このエントリー中の選手一覧」の作り方 | loopshoot Suggest Search ver0.4


loopshoot Suggest Search はサッカー関連用語(主に選手名)をたくさんデータベースに持っています。
それを使って与えられた文章からサッカー関連用語を抜き出すというシステムをつくりました。

文章(またはURLから得た文章)をYahoo 日本語形態素解析APIで名詞をむき出し、その名詞をloopshoot Suggest Searchのデータベースと比較していきます。
一致したものはサッカー関連用語だとみなし、リンクを作成していく仕組みです。

1.スタートはこのページ

2.文章を貼り付ける

3.リンクを抜き出す

4.そのリンクのHTMLを作成する


例えば、ブログのエントリーに選手名のリンクがあれば、それはひとつの親切になるのかなと思います。

URLからサッカー関連用語を抜き出すことも出来るので、気に入ったページから一気に選手の情報を取得するなんて使い方も出来ます。
(この動作を簡潔にするためにブックマークレットもつくりました。→[このページのサッカー選手を探す]

--
肝心のサッカー用語を抜き出す精度ですが、これはまだまだかと思います。
Yahoo 日本語形態素解析APIでは"・"で繋ぐような名前はひとつの単語とは見てくれません。
あと、loopshoot Suggest Search自体が日本人にはあまり強くないので、日本人選手はやはり出てきにくいです。

それではよろしかったらどうぞ loopshoot Suggest Search 選手名リンク作成

ブックマークに追加する
関連エントリー(more)

トラックバック

このエントリーのトラックバックURL:
http://loopshoot.com/cgi/mt/mt-tb.cgi/1327

コメントを投稿

(いままで、ここでコメントしたことがないときは、コメントを表示する前にこのブログのオーナーの承認が必要になることがあります。承認されるまではコメントは表示されません。そのときはしばらく待ってください。)

このブログについて
サッカー好きなSEによる、自作Webアプリケーションの紹介とその開発日記です。
サッカーをもっともっと楽しむために、ブログを書いたり、Webアプリケーションを作ったりしてます。

簡単なプロフィール
loopshoot.comでは引き続きサッカー観戦記を中心にブログ更新中です。

目指せ「サッカーブログ地位向上」
RSSリーダーで購読する

ブックマークする

Feed loopshoot.comラボ

Feed loopshoot.com