うひぁー/.Jの一部のRSSフォーマットが変わってるー

2009年3月12日 17:05

/.Jの一部のRSSフィードの中身が変更された模様。そのため、日記RSSには(タグなどを含めて)エンコードされた日記本文ではなく、(HTMLタグを全部取っ払って)plain-text化された日記本文が入るようになった模様。

スラド日記のRSSを取ってきてごにょごにょして生成していたページの本文が全部真っ白になっていて気付きましたorz

これだとAタグとかの情報が抜けてしまうので、RSSで更新を検知したら本文HTMLを取得するように改造しますかね……。

Permalink | コメントを読む | hylomの日記

激安チューナーでTS抜き

2009年3月11日 14:36

以前「 激安USB地デジチューナー、視聴ソフトのバイナリ書き換えで著作権保護をスルー可能? 」で話題になったDY-UD200、MPEG-TSファイルの保存もできるようになっていた。

で、話題になった当初にとりあえず通販で購入していたわけだが、まだ発送用の外箱(段ボール)すら開封していません(汗)。

別にいまのところ録画して保存しておきたいTV番組はないし、面倒くさいという理由で放置しているわけなんだが、録画したいTV番組は突然現れるわけで準備だけはしておこうかねぇ……。

# Linuxで動けば話は早かったのだが

Permalink | コメントを読む | hylomの日記

Botで/.Jにログインさせようとすると……

2009年3月6日 12:17

Pythonでスクレイピングしてみようと、下記のようなコードを書く。

login_param = {
  "op":"userlogin",

  "unickname":"",

  "returnto":"http://slashdot.jp",

  "upasswd":"",

#  "login_temp":0,

  "userlogin":"ログイン",

}

 

login_param["unickname"] = loginname

login_param["upasswd"] = passwd

 

encoded_data = urllib.urlencode( login_param )

 

obj = urllib.urlopen(OTP_LOGIN_URL, encoded_data )

print obj.info()

で、これでログインさせようとすると、下記のようなヘッダが返ってくる。

Date: Fri, 06 Mar 2009 03:00:13 GMT
Server: Apache/1.3.34 (Debian) mod_gzip/1.3.26.1a mod_perl/1.29

SLASH_LOG_DATA: shtml

X-Powered-By: Slash 2.005001233

X-Bender: Senseless death! The folk singer's best friend!

Vary: Accept-Encoding

Connection: close

Content-Type: text/html; charset=utf-8

「X-Bender:」の内容は毎回ランダムに変わる。Cookieが返って来ていないのでもちろんログイン失敗なのだが、どうもボットかどうかをこちらが送るヘッダで判断しているようだ。ということで、今度は下記のようなコードでやってみたら成功。

login_host = "slashdot.jp"
login_path = "/login.pl"

 

login_param = {

  "op":"userlogin",

  "unickname":"",

  "returnto":"http://slashdot.jp",

  "upasswd":"",

#  "login_temp":0,

  "userlogin":"ログイン",

}

 

login_param["unickname"] = loginname

login_param["upasswd"] = passwd

encoded_data = urllib.urlencode( login_param )

 

headers = {

  "User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (.NET CLR 3.5.30729) "

  "Content-type": "application/x-www-form-urlencoded",

  "Accept": "text/plain",

}

 

obj = httplib.HTTPConnection( login_host )

obj.request( "POST", login_path, encoded_data, headers )

resp = obj.getresponse()

headers = resp.getheaders()

 

for item in headers:

    print item

しかしやっぱり変なヘッダは返ってきていたり(笑)。

x-leela:I'm a millionaire! Suddenly I have an opinion about the capital gains tax.

Pythonは標準でWWWアクセスを行うモジュールが付属しているのはとても良いのだが、いまいちどれを使うべきかで混乱するな。urllib2を使えばヘッダを自由にいじれるようだけど、それならhttplibでごそごそやったほうが直感的ではある。

Permalink | コメントを読む | hylomの日記

マジコン販売差し止め、ヤフオクにも

2009年3月2日 18:44

DSマジコン訴訟で東京地裁が輸入・販売の差し止め命令 」が出ました。ということで、 ヤフオク でも出品中止に。

個人的にはマジコン擁護派なんだけど、こんな状況になっちゃったからには規制もしょうがないかなぁ、という感じ。 なんか逆ギレしている人も出てきている ようですが、秋葉原の裏通りのアレゲな店で家族連れがマジコン買っているところを見てしまうともう何とも言えませんよ。

しかし、マジコンなんかファミコンの時代からあったのになんで今頃こんなにブームになっちゃったんだろうか。やっぱりネットの影響なんですかねぇ。

ここ最近の潮流として、アレゲなネットユーザーが盛り上がってから10年後に一般ユーザーにもそれが波及して社会問題になって取り締まられる、という例が多いような気がする。Winnyしかり、音楽の違法アップロードしかり、マジコンしかり。ということは、10年後ぐらいには地デジチューナー違法改造や携帯電話のJailbreak辺りが一般人の間でもブームになって取り締まられたりするのだろうか。まぁ、地デジが10年後も今のシステムで動いているかどうかは謎だけど。

Permalink | コメントを読む | hylomの日記

EmacsでPythonコードのタブ幅を4に

2009年2月27日 16:40

GNU Emacs 22.2.1 (i386-mingw-nt6.0.6001)でなんかTabでインデントしたPythonコードのインデント幅が8になって気持ち悪いので設定変更。

;;python-mode
(add-hook 'python-mode-hook

      '(lambda()

         (setq indent-tabs-mode t)

         (setq indent-level 4)

         (setq python-indent 4)

         (setq tab-width 4)))

M-x customizeで変更できないかな、と思ったらダメだった。

Permalink | コメントを読む | hylomの日記