MeCab ソースコードリーディング私的メモ(形態素解析編)

先日、次のエントリーを書きました。
日本語形態素解析の裏側を覗く!MeCab はどのように形態素解析しているか - クックパッド開発者ブログ

日本語を含む Keynote を slideshare にアップロードする

次のエントリーにあるように、最近 Keynote を PDF に変換して slideshare にアップロードすると、Osaka 等一部のフォントを除いて日本語が表示されなくなりました。
KeynoteのスライドをSlideShareにアップロードすると日本語が表示されない問題 - Qiita

MobileSafari でプログレスバーを出さないように画像を読み込む

MobileSafari では、どうやら window load のタイミングで画像の読み込みを開始したとしても、その画像の読み込みが完了するまでプログレスバーが表示され続けます。setTimeout などで読み込み開始時間をずらせば回避できますが、プログレスバーが消えたタイミングを取得する術はありません。
何が困るって、バックグラウンドで画像を読み込みたいのに、プログレスバーの表示が終わる前に読み込みを開始するとめちゃくちゃ重いページみたいな印象を与えてしまうわけです。

Ruby で upcasting 的なことがしたくて upcastable という gem を作った

Ruby の良さを殺してると言われそうですが、upcasting っぽいことができる gem を作りました。初めて公開した gem なので至らないところもありますが…
https://github.com/abicky/upcastable

Redshift で UDF を使って YAML をパースする

Redshift で YAML の配列データをパースして、Hive の lateral view、Presto の unset 的な感じで配列を展開したかったんですが、結論から言うと、実用的なレベルでは実現できませんでした。
YAML の配列を Redshift でよしなに扱いたい場合、Redshift にデータを入れる時点で配列を複数の行に展開するのが良いんじゃないかと思います。

ert のテストには fundamental-mode の syntax table が使われる

nodejs-repl.el のテストを el-expectations から ert-expectations に移行したらテストにコケるようになったのでメモです。

Emacs で Helm v1.8.0 をストレスなく使うための個人的な設定

約 2 年前に helm に移行して、ずっと古いバージョンを使い続けていたんですが helm-ls-git が使えなかったのでアップグレードしました。
それに伴って、以下のエントリーの設定内容を v1.8.0 に対応させました。

CRFsuite で推定に使われるパラメータ情報を出力する

CRFsuite を使っていると、「このケースでこの結果だったら、このケースでも同じような結果になりそうなのにどうして異なる結果になるんだ????」と思うことがあるでしょうが、デバッグするのがけっこう大変です。

CRFsuite の正則化パラメータ最適化

例えば CRFsuite で l2sgd を使う場合、正則化パラメータとして c2 を指定できます。デフォルトは 1 です。

Mac で SimString を使ってみた

類似文字列検索ライブラリの SimString を Mac で使ってみました。
ちょっとググった感じだと Mac でのインストール方法が見つからなかったので、しょーもない内容ですが載せておきます。

広告