2008-09-02から1日間の記事一覧

Office 2008 for Macの中吊り

井の頭線でビビった。 普通のことなんだけど、僕の知ってるMicrosoftらしくないというか。

GroovyからSwing

GroovyからSwingってみましたが、なんかもう、普通ですね。PythonからTkinter使うのと大差ないというか。 JRubyから、Jythonから、とかいろいろあるけど、もう止めよう。 Swing自体は、今からSwing調べて覚えていくのはツライからたぶん深追いしない。Tkにし…

lxmlでshift_jisのwebページをパース

HTMLParserがエンコーディングを受け取るのでそこで教えてあげます。 http://codespeak.net/lxml/api/lxml.etree.HTMLParser-class.html In [71]: sjis_url = 'http://www.owabi119.com/bunrei.html' In [72]: sjis_src = urllib.urlopen(sjis_url).read() I…

lxmlでutf-8のマルチバイト文字を扱う on IPython on Windows

lxmlは2.1.1で。 気軽なパースはBeautifulSoupで十分だけど、アホみたいな19世紀に書かれたようなwebページのパースをするのに、XPathがないと死ぬと思ったので、lxmlを試してみた。UTF-8が宣言されたはてなのトップページをWindows上のIPythonでxpathる。 I…