cURLでプロキシを通そうとするとハマった…

ここを参考にcURLでプロキシを通そうとするとハマりにハマりました.

UTF-8のtexファイルをコンパイルするためのシェルスクリプト

Ubuntuのパッケージで用意されているplatexはEUC-JPじゃないと文字化けします.
ちょっと調べてみたところ,ptetexptexliveに同梱されているplatexであればインストールオプションでUTF-8対応にできるみたいです.
ただ,前者はteTeXが2006年に開発中止となり,後者はTeX Liveが数GBという容量なので考えもの.
※ちなみに後者はここを参考にすればインストールできそうですが,自分の環境ではビルドに失敗しました…

特異値分解とLSIの意味

2012/3/24追記

わかりにくい部分や間違っている部分を修正した上でもっとちゃんとした解説エントリー書きました
潜在的意味インデキシング(LSI)徹底入門
——————

Auto Complete ModeのPerl辞書を作ってみた

EmacsのAuto Complete Modeはデフォルトでいくつかの辞書が用意されているんですが,何故かPerlは用意されていません.
ってことで作成しました.ここの内容そのまんまみたいなもんなんですが…

MySQL 5.1で日本語の正規表現を使うために ~mregexpインストール奮闘記~

MySQLではWHERE句に正規表現を使うことができるわけですが,日本語を扱う上ではいろいろと不具合があります.
例えば . が任意の1バイトとして扱われるため,任意の日本語1文字にはマッチしません.

mysql> select 'あいう' regexp 'あ.う';
+------------------------------+
| 'あいう' regexp 'あ.う'      |
+------------------------------+
|                            0 |
+------------------------------+

F値に調和平均を使う理由

追記 2010/8/15: 自分の頭の中で「必要な文書の数」 = 「検索結果の文書の数」としてしまっていたところを修正しました
追記 2010/11/20: F値に調和平均を使う理由(再)というエントリーを書きました.こっちの方がわかりやすいと思います!

Filefoxでファイルの非同期アップロード with 複数パラメータ

1ヶ月前に書こうと思ってたネタなんですが,後回しにしていて今に至ります…
HTML5のFile APIを使って,って内容にするつもりだったんですが,W3CのHTML5の仕様にあるのはDrag and Dropだけで,ひょっとすると他の機能はFirefoxの独自機能じゃないかと思ってHTML5とは言わないことにします.

索引語の重要度の指標TDVの定義って…

現在「情報検索と言語処理」を読んでます.(図書館で借りたせいで第2刷だからだいぶ古い…)
2.2節 索引付け で索引語の識別値(term discrimination value)という,索引語としての重要度を表す指標が紹介されていました.
新しく増刷されているものでは訂正されているかもしれませんが,次のように定義されています.

L-BFGS法はだからメモリが節約できるのか!

L-BFGS法 は limited memory BFGS ということで,準ニュートン法をBFGS法に基づいて省メモリで実現する方法です.(その程度の理解度です…)

HMM, MEMM, CRF まとめ

系列ラベリングで有名なHidden Markov Model(HMM)とConditional Random Fields(CRF).
CRFの前身(?)でもあるMaximum Entropy Markov Model(MEMM)も含めてこれらの3つについて自分なりにまとめてみたのでアップします.
ちなみにCRFの正則化などには触れていません.

広告