Rの自作関数にコメントを付けられるようにしてみた

R5のメソッドでは usage を記述する仕組みが提供されています。S3関数でも usage 的な機能を提供しようとするとこんな感じかなぁと作ってみました。
usage.R at master from abicky/R_funcs - GitHub

数値っぽい表現を判定する正規表現を書いてみた

ググッてもすぐにヒットしなかったので、探すよりも自分で書いた方が早いと思って取り掛かったんですが、意外に時間がかかったので載せておきます。
最終的な正規表現を見るとかなりシンプルなんですが、何も考えないで書くと空文字列にマッチしたり、ドットにマッチしたりするかもしれないんで、意外にトラップが多いです。

Rユーザ会で「RではじめるTwitter解析」を発表してきました

先日11/26 (土) に開催されたRユーザ会にて「RではじめるTwitter解析」というタイトルで発表してきました。

OAuthに"対応"したtwitteRを試してみた

いつの間にかROAuthというパッケージが出てtwitteRがOAuth認証に”対応”していましたね!
早速使ってみました!

Tsukuba.R #9で「Rデータフレーム自由自在」を発表してきました

約1年ぶりにTsukuba.Rが開催されましたね!
僭越ながら本発表1枠、LT1枠で発表させていただきました。

Pigでの"正しい"繰り返し処理の書き方

最近Pigで変態的な使い方をしていますが今回もそんな話です。

改良版gruntで豚さんともっと対話して仲良くなろう!

「PigかわいいよPig!」と自分に言い聞かせながらHiveへの浮気心を抑えている今日この頃です。(いや、Hiveも勉強しないとなんですが・・・)
Hiveで便利なのはSQLライクに使えることも然ることながら、一度テーブルを作成してしまえば読み込み(select)の際にスキーマを定義しなくていいことじゃないかと思います。
Pigでデータ読み込む際に毎回同じ記述をしなければならないとか不毛な作業!
ちょっとしたデータだと読み込む際にスキーマ定義するのが面倒で列番号を指定して処理したりしますが、所望のフィールドが何番目か数えるのもこれまた不毛!

公式RTと非公開ツイートの関係についてのメモ

8月下旬に、Favmemoに公式RT・非公式RT機能を加えてほしいという要望を受けて「今月中を目処に実装します」と返答してから早2ヶ月が経ちました・・・
非公開ユーザのツイートは仕様上公式RTできないことや、RT元のツイートが削除されると公式RTも削除されることは有名かと思いますが、RT元のツイートが非公開ツイートになった場合どうなるのか知らなかったのでちょっと調べてみました。

Pigで直接データを記述する裏技

どうも、豚さんと戯れるようになってから早いもので半年近く経ちました。
Pigを使い始めて最初に思ったこと。

R用のコマンドラインオプションパーサ(PerlのGetopt::Longもどき)を作ってみた

@y_benjoさんがRのコマンドライン引数関係で苦しんでいらっしゃったので、以前作成した簡単なパーサをブログで公開しようと思いました。
Rのコマンドラインオプションをパースしたいなんて需要があるとは思っていなかったんですが、CRANにgetoptパッケージとoptparseパッケージという凝ったパッケージが存在するではないですか!!

広告