Rcpp と PCRE で R での文字列抽出を 20 倍速くした

R で最も辛い処理の一つに文字列抽出が挙げられるでしょう。
「R言語上級ハンドブック」では regmatches, str_match_all, strapply などによる文字列抽出の方法を紹介しましたが、やはり他の言語と比べると辛いものがあります。1

  1. じゃあ文字列処理は他の言語を使えばいいかというと、そのためだけにいちいち R で処理した結果を別の言語に食わせてその結果を R で読み込むとか面倒じゃないですか。

position: sticky をエミュレートしてみた

エミュレートしてみました。動作確認は適当です。
https://gist.github.com/abicky/7c351a6ed1170d9a8c5f#file-sticky-js

R と SQL を対応付けてみた ~data.table 編~

data.table 便利ですよね。data.table::fread が read.table に比べて格段に速いので、データの読み込みのためだけに data.table を使うのもありかと思います。
ただ、data.table:::unique.data.table のように data.frame 感覚で関数を使うと意図しない結果になることもあるので、主要な操作を SQL と対応付けてまとめてみました。

Yosemite で Forget-Me-Not を使う

Mac と外部ディスプレイを着脱する際にウィンドウの配置を復元するために Forget-Me-Not を使っていたんですが、Yosemite (10.10.1) だと普通にインストールしても使えなくなったのでその対応方法です。1

  1. 似たようなアプリに Stay.app がありますが、着脱する際にウィンドウの配置を明示的に保存しないといけないのが辛かったので使ってません

blend-mode を使って PexJS の着色処理を若干速くした

以前こんな記事を書いたんで、それを PexJS に応用してみたというお話です。
iOS7 の MobileSafari でもサポートされた Canvas の blend-mode を試してみた - あらびき日記

1 つの HiveQL でグループごとの集約結果上位のものを抽出する

数年前は Pig で鬼畜なことをしていましたが、最近は Hive とかを使うようになって四苦八苦しているところです。
今回は 1 つの HiveQL で key ごとの集約結果上位のものを抽出してみました。

fakes3 と fakefs で Amazon S3 連携のテストを書いてみた

Amazon S3 からファイルを取得して、ローカルでごにょごにょするようなスクリプトに対してテストを書きたくて、なんとかそれっぽいものが書けたので備忘録として残しておきます。

PukiWiki の代わりに Gollum を導入してみた

プライベート用の技術メモとして学生時代から PukiWiki を使ってたんですが、今どき PukiWiki を使っててもなぁと思って Gollum を導入してみました。
Qiita の private posts もありかと思ったんですが、ちょっと使ってみた感じだと private posts には検索をかけられない感じでしょうか。

R の named vector から subset を得る際の最悪計算量は O(n^2)

昨日、久しぶりに Tokyo.R に参加して意識が高まったので、久しぶりに誰得な R ネタを投下してみようと思います。
使用した R のバージョンは 3.1.0 です。

Emacs で勝手に vc-follow-link が実行されて辛い

vc-follow-link が勝手に実行されるため、enhanced ruby mode で erm が死んで、毎回 erm-reset を実行することを強いられて辛い思いをしていました。
以下、再現手順、原因、対応方法です。

広告