eclipse

Twitterから取得した「つぶやき」を品詞に分解する

前回のログで、TwitterからTweetとアカウント名称を取得した。 「エコノミスト」誌(6/4号)の特集記事のように、Tweetに含まれる語句のワードカウントをとるには、先のデータを品詞分解(形態素解析)しなければならない。ここでは、形態素解析エンジンとし…

Twitterからつぶやきを取得する。

「エコノミスト誌(6/4号;使える統計学)」で特集を組んだ「Twitterのつぶやきから景気動向指数を推定する」についてだが、第一ステップの簡単な絵を書くと、以下のようになる。 NTTデータさんが、Twitterの全データの取得権を持っている(これは、「権利を…

EclipseにHadoopの開発環境を作る。

2014/6/13 新しい記事があります。 「EclipseでHadoop2.4の開発環境を作る&ワードカウントのプログラムを作成する。」 - Hadoopを実験するにあたって、プログラムが作れる環境を構築した。 構築には、「30 分で NetBeans を使って Hadoop のプログラムを作…

Eclipse3.5(Galileo) PDT でデバッグ

スクリプト言語は簡易に出力が取れるし、込み入ったことは書きたくないので、あまりデバッガーの必要性を感じなかった。 EzoGPの方でPHPのCommand Line Interface(CLI)を使う必要が出て、コードもUTF-8で書いているので、Galileo PDTからscriptの実行(プ…

GalileoにGAE/Jプラグインを入れてみたものの。。。

ノートPCを使っている身なので、Galileo(Eclipse3.5)が出るときは相当に期待して、出た早々にインストールしてみた。というのも、Ganymede(Eclipse3.4)がひどく重たいから。OSはWindows XP(SP3)で頑なにVistaを避けてきたのだが、いっそのことUbuntuに…

Google App Engine/Javaを触ってみた

先日のログで書いたように、RIA型のアプリ、特にMushupアプリケーションやコンポジット・アプリケーションは、アーキテクチャ・モデルとしてのMVC2モデルから乖離していく。これは、同時にサーバーサイドの仕掛けも、大仕掛けのものから、コンポーネント化さ…