『現代日本語書き言葉均衡コーパス』デモンストレーション版

http://www.kotonoha.gr.jp/demo/
関連:
KOTONOHA計画
http://www2.kokken.go.jp/kotonoha/
特定領域研究「日本語コーパス
http://www.tokuteicorpus.jp/
実際に、どういったものなのか、という解説は、以下のページ詳しい。http://pc.nikkeibp.co.jp/article/NEWS/20070528/272720/?ST=pc_news
以下に、そのコンセプトとして重要だと思った箇所を引いておく。

こうした大量の言語データは「コーパス」と呼ばれ、言語にまつわる研究開発で活用されている。同研究所は現在、「現代日本語書き言葉均衡コーパス」と呼ぶ大規模コーパスの構築を進めており、今回公開したのはその一部。研究者に限らず誰でも無償で検索、閲覧が可能だ。「“風景”と“光景”など、辞書では違いが分かりにくい言葉でも、大量の用例を見ればすぐ分かる」(研究開発部門の前川喜久雄言語資源グループ長)など、一般の人にとっても、日本語の使われ方を知るうえで便利なデータとなりそうだ。

平たくいうと、「すっげぇ広範なところから採取した、用例集」ということですね。
こういう地味な研究は、もっとやって欲しいし、成果はできるだけ公開していただきたいものです。