うひぁー/.Jの一部のRSSフォーマットが変わってるー
激安チューナーでTS抜き
以前「 激安USB地デジチューナー、視聴ソフトのバイナリ書き換えで著作権保護をスルー可能? 」で話題になったDY-UD200、MPEG-TSファイルの保存もできるようになっていた。
で、話題になった当初にとりあえず通販で購入していたわけだが、まだ発送用の外箱(段ボール)すら開封していません(汗)。
別にいまのところ録画して保存しておきたいTV番組はないし、面倒くさいという理由で放置しているわけなんだが、録画したいTV番組は突然現れるわけで準備だけはしておこうかねぇ……。
# Linuxで動けば話は早かったのだが
Botで/.Jにログインさせようとすると……
Pythonでスクレイピングしてみようと、下記のようなコードを書く。
login_param = {
"op":"userlogin",
"unickname":"",
"returnto":"http://slashdot.jp",
"upasswd":"",
# "login_temp":0,
"userlogin":"ログイン",
}
login_param["unickname"] = loginname
login_param["upasswd"] = passwd
encoded_data = urllib.urlencode( login_param )
obj = urllib.urlopen(OTP_LOGIN_URL, encoded_data )
print obj.info()
で、これでログインさせようとすると、下記のようなヘッダが返ってくる。
Date: Fri, 06 Mar 2009 03:00:13 GMT
Server: Apache/1.3.34 (Debian) mod_gzip/1.3.26.1a mod_perl/1.29
SLASH_LOG_DATA: shtml
X-Powered-By: Slash 2.005001233
X-Bender: Senseless death! The folk singer's best friend!
Vary: Accept-Encoding
Connection: close
Content-Type: text/html; charset=utf-8
「X-Bender:」の内容は毎回ランダムに変わる。Cookieが返って来ていないのでもちろんログイン失敗なのだが、どうもボットかどうかをこちらが送るヘッダで判断しているようだ。ということで、今度は下記のようなコードでやってみたら成功。
login_host = "slashdot.jp"
login_path = "/login.pl"
login_param = {
"op":"userlogin",
"unickname":"",
"returnto":"http://slashdot.jp",
"upasswd":"",
# "login_temp":0,
"userlogin":"ログイン",
}
login_param["unickname"] = loginname
login_param["upasswd"] = passwd
encoded_data = urllib.urlencode( login_param )
headers = {
"User-Agent": "Mozilla/5.0 (Windows; U; Windows NT 6.0; ja; rv:1.9.0.7) Gecko/2009021910 Firefox/3.0.7 (.NET CLR 3.5.30729) "
"Content-type": "application/x-www-form-urlencoded",
"Accept": "text/plain",
}
obj = httplib.HTTPConnection( login_host )
obj.request( "POST", login_path, encoded_data, headers )
resp = obj.getresponse()
headers = resp.getheaders()
for item in headers:
print item
しかしやっぱり変なヘッダは返ってきていたり(笑)。
x-leela:I'm a millionaire! Suddenly I have an opinion about the capital gains tax.
Pythonは標準でWWWアクセスを行うモジュールが付属しているのはとても良いのだが、いまいちどれを使うべきかで混乱するな。urllib2を使えばヘッダを自由にいじれるようだけど、それならhttplibでごそごそやったほうが直感的ではある。
マジコン販売差し止め、ヤフオクにも
「 DSマジコン訴訟で東京地裁が輸入・販売の差し止め命令 」が出ました。ということで、 ヤフオク でも出品中止に。
個人的にはマジコン擁護派なんだけど、こんな状況になっちゃったからには規制もしょうがないかなぁ、という感じ。 なんか逆ギレしている人も出てきている ようですが、秋葉原の裏通りのアレゲな店で家族連れがマジコン買っているところを見てしまうともう何とも言えませんよ。
しかし、マジコンなんかファミコンの時代からあったのになんで今頃こんなにブームになっちゃったんだろうか。やっぱりネットの影響なんですかねぇ。
ここ最近の潮流として、アレゲなネットユーザーが盛り上がってから10年後に一般ユーザーにもそれが波及して社会問題になって取り締まられる、という例が多いような気がする。Winnyしかり、音楽の違法アップロードしかり、マジコンしかり。ということは、10年後ぐらいには地デジチューナー違法改造や携帯電話のJailbreak辺りが一般人の間でもブームになって取り締まられたりするのだろうか。まぁ、地デジが10年後も今のシステムで動いているかどうかは謎だけど。
EmacsでPythonコードのタブ幅を4に
GNU Emacs 22.2.1 (i386-mingw-nt6.0.6001)でなんかTabでインデントしたPythonコードのインデント幅が8になって気持ち悪いので設定変更。
;;python-mode
(add-hook 'python-mode-hook
'(lambda()
(setq indent-tabs-mode t)
(setq indent-level 4)
(setq python-indent 4)
(setq tab-width 4)))
M-x customizeで変更できないかな、と思ったらダメだった。