
2006年8月14日から2007年1月5日まで、
文章は機械が自動的にほかのブログの文を切り貼りして作成しています
というブログを更新していました。
ある標題について一文単位でほかのブログから文を引用して、
記事を作成しようというものです。
(旧名は「コピペトレンド」です)
もう更新を終えてしまったのですが、
どういう仕組みなのかを訊く人がそれなりにいるので、
中身を公開します。
なお、このブログについては、
2007年3月に、情報処理学会の全国大会というところで、
報告しました。
出席者は無反応でした。

使っていたスクリプト(zip)
PerlとJUMANが必要です。
データとの相性で処理が途中で止まることがあります。
これらの情報をどのように利用してもいいですが、
(いや、予稿とスライドの再配布はダメですが)
仕様そのものに欠陥がありますので、
なるべくならいろいろと改良をしてください。
私(井原)はよく分からないのですが、
共同製作者によれば、
スクリプトはBSDライセンスというのに基づいているそうです。

