ロードできない RMeCab を無理やりロードしてみた
RMeCab を使おうとしたらハマったのでメモを書き残しておきます。
insertSource を S4 メソッドにも使えるようにしてみた ~S4 メソッドの深い闇~
パッケージの開発を効率化するのに methods::insertSource という関数があります。
```text
evalSource package:methods R Documentation
twitteR に pull request を送ってみた ~R パッケージの修正と動作確認方法~
以前こんな記事を書きました。
OAuthに”対応”したtwitteRを試してみた - あらびき日記
RCurl でコンテンツをそのまま受け取るための回避策
RCurl というと R から libcurl を使うためのパッケージで、柔軟なリクエストを送ることができて便利ですよね。
が、コンテンツに Unicode (を表現する ASCII 文字列)を含むとそれを UTF-8 に書き換えるだけでなく、さらには \ を \ に変換してしまいます。
それによって JSON が壊れることがあります。
cf. JSON which includes Unicode characters is broken · Issue #1 · omegahat/RCurl
Latent Dirichlet Allocation (LDA) ゆるふわ入門
NLP 2013 の時期ですね。たぶんギリギリ NLPer の端くれの端くれの身としては参加したい気持ちも山々なのですが、いろいろあって今年は参加しないことにしました。
NLP 2014 は参加しようと思うので来年はかまってやってください。
R5 (ReferenceClass) で Singleton
こんな感じでどうでしょうか?
Singleton <- setRefClass(
"Singleton"
)
(function(new) {
new # to avoid lazy evaluation
Singleton$getInstance <- function() {
instance <- new()
Singleton$.instance <- instance
Singleton$getInstance <- function() {
return(Singleton$.instance)
}
return(instance)
}
})(Singleton$new)
Singleton$new <- NULL
MathJax 用 PukiWiki プラグインを作ってみた
「まだ PukiWiki 使ってるの?」と言われそうですが作りました。
mathjax.inc.php - PukiWiki
実践 git rebase --onto
あるプロジェクトにおいて、メインの開発ラインと、サブプロジェクト的な、メインプロジェクトの内容も多少書き換えつつ追加の機能を実装する実験的な開発ラインがあったとしましょう。
サブプロジェクトの開発中もメインプロジェクトの開発は進むので、サブプロジェクトはキリの良いところでメインプロジェクトのバージョンアップに合わせて merge や rebase をしてメインプロジェクトの変更を反映させなければならない。
そんな時に便利なのが git rebase –onto かなと思っています。
2 MB 超の画像データを無理矢理 localStorage に保存してみた
HTML5 にはローカルにデータを保存する仕組みがいくつかありますが、MobileSafari (iOS 6) の場合 localStorage は 5 MB までの容量制限があります。
JavaScript の文字コードは UTF-16 なので、ASCII 文字も 2 バイトの容量を食います。よって、ASCII 文字列を保存する場合は実質 2.5 MB までしか使えません。
バイナリデータは Base64 エンコードして保存するでしょうから、保存できるデータは元の容量で最大約 1.875 MB ということになります。
たった 5 MB しか保存できないのになんかもったいないですよね!
独立性の仮定と平均場近似の関係
PRML の10章(下巻 p. 178)に、変分推論において確率分布 q が次のように分解できる形を用いることに関して「物理学で平均場近似 (mean field approximation) (Parisi, 1988) と呼ばれる近似法に対応している.」と書いてあります。