WEB+DB PRESS Vol.59 大規模データ分析
お久しぶりでございます。 技術評論者さまのWEB+DB PRESS Vol.59で少しだけ執筆させていただきました。 [実践]大規模データ分析というテーマで特集を組ませていただき、 1章 データマイニング入門 2章 テキ … [Read more…]
お久しぶりでございます。 技術評論者さまのWEB+DB PRESS Vol.59で少しだけ執筆させていただきました。 [実践]大規模データ分析というテーマで特集を組ませていただき、 1章 データマイニング入門 2章 テキ … [Read more…]
東工大の奥村先生監修、高村先生著の「言語処理のための機械学習入門」が発売されました。これは読まなければ!と思い、さっそく手に入れました。本書の感想は本当にシンプルな一言に尽きます。 「大学時代にこの本がほしかった。。。」 … [Read more…]
ほとんどネタ的な話なのですが,最近,OSSツールの多様化にともない,本当に便利になっているのですが,ツールの多様化とともに様々なプログラミング言語でプログラムを書かなかければならないことが増えてきました.Thriftなど … [Read more…]
お久しぶりです,木村です. 最近どうもやることが多くてエントリーを書けずにいました...これからはまたちょっとずつ書いていこうと思います.というかメモですね. 正規表現ライブラリRe2 つい先日Googleにより,正規表 … [Read more…]
寒くなってきましたね.秋です.ブログを更新する時間がなかなか確保できませんな今日この頃です. はじめに 今日は機械学習におけるソフトの「再利用」と「再実装」についておもしろい記事を見つけたので引用しながら考察したいと思い … [Read more…]
thriftとかhadoopなど,何やらいろいろと手を出してしまい,ここのところブログの更新が滞ってしまっていますが,今日は前から書きたかったトピックについて自分へのメモの意味も含めて記しておきたいと思います. はじめに … [Read more…]
ここまでの流れの整理をします。Thriftの調査の続きです。前回のエントリー(Thriftのスピードが改善しました)では、Thriftのperlクライアントが遅いのはNagleアルゴリズムが原因ではないかという仮説をたて … [Read more…]
今日帰宅したらACMから何やら届け物がきてて,中身をみたらなんとSIGIR 2009の論集でした.SIGIRというのは権威ある情報検索系の国際会議でとてもハイレベルな発表が集まります.僕は会員になっているのですが,ちゃん … [Read more…]
9/29 追記 本件に関して,一応の解決策を以下のエントリーにて記述しましたのでご参照ください. http://blog.broomie.net/index.cgi?id=38 shunyaです.最近Crystal Ke … [Read more…]
9/29 追記 Thriftのperlクライアントをデフォルトのままで使うとパフォーマンスがあまりよくないようです.高速に使いたい場合は以下のエントリーを参照してください. http://blog.broomie.net … [Read more…]