Slashcode2.5とわたくし

スラッシュドット ジャパン

電車の中でのヒマつぶしに、スラッシュドット ジャパンの各記事をダウンロードしてmht化するperlスクリプトを自作してPalmのNetfront3でオフ読みしてたんですが、先週末にSlashcodeが2.5になってトップページはmhtファイルが作成できたものの、各記事のファイルが作成されない。
調べてみたら、html中のcharsetの取得で失敗してた。utf-8のハイフンが抜けてutf8*1でcharsetを探していた模様。アンカーの「もっと読む」でリンクをたどってたんだけど、いままではeuc-jpだったので問題なかったみたい。スクリプトの該当部分にハイフンを入れたら無事各記事のmhtも作成されてました。
あと、コメントの多い記事に「(スラッシュドット ジャパン システム負荷過大: コメント数制限中 50)」と出て、複数ページに分けられちゃうので一気にダウンロードできなくなってるんだけど、これって今回から? RSSにタレコミ全文が出るようになったのはいい感じ。

*1:Jcodeのパラメータはハイフンの入らないutf8なので。