RCurl でコンテンツをそのまま受け取るための回避策

RCurl というと R から libcurl を使うためのパッケージで、柔軟なリクエストを送ることができて便利ですよね。
が、コンテンツに Unicode (を表現する ASCII 文字列)を含むとそれを UTF-8 に書き換えるだけでなく、さらには \ を \ に変換してしまいます。
それによって JSON が壊れることがあります。
cf. JSON which includes Unicode characters is broken · Issue #1 · omegahat/RCurl

Latent Dirichlet Allocation (LDA) ゆるふわ入門

NLP 2013 の時期ですね。たぶんギリギリ NLPer の端くれの端くれの身としては参加したい気持ちも山々なのですが、いろいろあって今年は参加しないことにしました。
NLP 2014 は参加しようと思うので来年はかまってやってください。

R5 (ReferenceClass) で Singleton

こんな感じでどうでしょうか?

Singleton <- setRefClass(
    "Singleton"
    )
(function(new) {
    new  # to avoid lazy evaluation
    Singleton$getInstance <- function() {
        instance <- new()
        Singleton$.instance <- instance
        Singleton$getInstance <- function() {
            return(Singleton$.instance)
        }
        return(instance)
    }
})(Singleton$new)
Singleton$new <- NULL

MathJax 用 PukiWiki プラグインを作ってみた

「まだ PukiWiki 使ってるの?」と言われそうですが作りました。
mathjax.inc.php - PukiWiki

実践 git rebase --onto

あるプロジェクトにおいて、メインの開発ラインと、サブプロジェクト的な、メインプロジェクトの内容も多少書き換えつつ追加の機能を実装する実験的な開発ラインがあったとしましょう。
サブプロジェクトの開発中もメインプロジェクトの開発は進むので、サブプロジェクトはキリの良いところでメインプロジェクトのバージョンアップに合わせて merge や rebase をしてメインプロジェクトの変更を反映させなければならない。
そんな時に便利なのが git rebase –onto かなと思っています。

2 MB 超の画像データを無理矢理 localStorage に保存してみた

HTML5 にはローカルにデータを保存する仕組みがいくつかありますが、MobileSafari (iOS 6) の場合 localStorage は 5 MB までの容量制限があります。
JavaScript の文字コードは UTF-16 なので、ASCII 文字も 2 バイトの容量を食います。よって、ASCII 文字列を保存する場合は実質 2.5 MB までしか使えません。
バイナリデータは Base64 エンコードして保存するでしょうから、保存できるデータは元の容量で最大約 1.875 MB ということになります。
たった 5 MB しか保存できないのになんかもったいないですよね!

独立性の仮定と平均場近似の関係

PRML の10章(下巻 p. 178)に、変分推論において確率分布 q が次のように分解できる形を用いることに関して「物理学で平均場近似 (mean field approximation) (Parisi, 1988) と呼ばれる近似法に対応している.」と書いてあります。
q(\mathbf Z) = \displaystyle \prod^M_{i=1}q_i(\mathbf z_i)

Mac における MP3 ファイルの文字化けを直してみた

約2年半前、初めて Mac を買ったわけですが、Windows で使っていた MP3 ファイルを持ってくるとメタ情報が文字化けして困ったものです。iTunes のリストなんかは日本語の曲名がさっぱりわかりません。
当時いろいろ調べてみたところ、どうも ID3 タグの文字コードの問題ということまではわかっていたのですが、iTunes で ID3 タグの変換をすると直るとか、EasyTAG を使えばいいだとかの情報があっても結局直せませんでした><

ピュア R で MessagePack for R を作ってみた(unpack のみ)

MessagePack をご存知の方も多いかと思います。
ざっくり説明すると、サイズがコンパクトで、かつシリアライズ・デシリアライズを高速に行うことができる言語に依存しないデータ形式です。・・・という理解です。
有志によって様々な言語でも実装が行われていることも特徴かと思います。

JSX で生成されたコードを動的ロードしてみた

JSX は静的言語なので、JavaScript のように必要になったら動的にスクリプトをロードして、そのスクリプトに含まれるであろうオブジェクトにアクセスするのには不向きです。
ですが、そういうことをしたいねという話があったのでデモを作ってみました。
Sample for dynamic loading JavaScript generated by JSX

広告