« 1/1 可動 涼宮ハルヒ | トップページ | PC 用地デジチューナーの販売 4月上旬解禁 »

2008年3月27日 (木)

ニフティ、スパムブログを自動判別するフィルタリング技術を開発

 ニフティは3月26日、同社のマーケティング分野の研究機関であるニフティ研究所が、スパムブログを自動判別できるフィルタリング技術を開発したと発表した。

スパムプログは、アフィリエイトで広告収入を得ることや、特定のサイトへ誘導したりすることを目的として生成されるブログです。特定のキーワードを含む記事やニュースサイトなどから転載した記事を機械的に大量に生成して、各種検索サービスからアクセスされるようにすることもあり、コンテンツとして無意味なものだけでなく、一般のインターネットおよびブログサービスの利用者にとって迷惑になる場合もあります。

 まったくその通りでフィルタリング技術は大いに歓迎したい。意味なしのブログ (ひでのブログ自体意味ねーじゃん…と言われるかも知れないけど) や高額料金請求サイトへの誘導ブログを排除して欲しい。

 更に興味深いのは…

ニフティのブログ評判分析サービス「BuzzPulse(バズパルス)」で分析対象としているブログ記事のうち、2007年10月~2008年2月の各月ごとにそれぞれ約10万記事をサンプリングして、スパムブログの割合を調査しました。その結果、5ヶ月間の平均で、約40%がスパムブログという結果が分かりました。

 すげ~ブログ大国日本で4割のブログがスパムとは…

ひでのブログ http://hidekyan.cocolog-nifty.com/blog/

|

« 1/1 可動 涼宮ハルヒ | トップページ | PC 用地デジチューナーの販売 4月上旬解禁 »

「パソコン・インターネット」カテゴリの記事

コメント

この程度のsplog filterなら個人でも作れます。
わたくしがもうすでに作ったからです。

http://updatenews.ddo.jp/b/

しかし、一向に対策が進まないには別の理由があると思います。

投稿: tak | 2008年4月19日 (土) 17時12分

tak さん、こんにちは
http://blog.livedoor.jp/tak_tak0/
拝見しました。
splog の判断は簡単に言えばどの様な理屈で行う
のでしょうか?

投稿: ひで | 2008年4月19日 (土) 23時09分

splog の判断は簡単に言えば、
コピーコンテンツの検出です。

splogにはオリジナルのコンテンツは全く存在しないので、
コンテンツがどこか(「どこか」が、「どこ」と特定する必要はない)からのコピーであると特定できればいいのです。

投稿: tak | 2008年4月22日 (火) 15時20分

tak さん、解説ありがとうございます。
>splogにはオリジナルのコンテンツは全く存在しないので、
だとすると意味のない文章を作り上げる自動ブログ等は
splog とは判断されない可能性は高い訳ですね。

投稿: ひで | 2008年4月22日 (火) 19時58分

いえ、
わたくしのsplog filterはワードサラダでもちゃんと検出します。


ワードサラダは、投稿ツールの内部辞書からコピーしてきているので
これはもちろん定義「オリジナルコンテンツが存在しない」には反しません。

投稿: tak | 2008年6月 9日 (月) 19時42分

tak さん おひさしぶりです。
かつてワードサラダはフィルターをくぐり抜けることが
多かったと聞きますが、splog では検出出来るのです
ね。
ココログでも簡単に利用出来ればと…思います。

投稿: ひで | 2008年6月 9日 (月) 20時07分

コメントを書く



(ウェブ上には掲載しません)




トラックバック

この記事のトラックバックURL:
http://app.f.cocolog-nifty.com/t/trackback/145636/11869941

この記事へのトラックバック一覧です: ニフティ、スパムブログを自動判別するフィルタリング技術を開発:

« 1/1 可動 涼宮ハルヒ | トップページ | PC 用地デジチューナーの販売 4月上旬解禁 »