Herfindahl Index Part 2

ヘルニアでノックアウト中、このブログ更新もすっかりさぼりまくってしまいました。この数日、ようやく痛みもおさまり始め、歩行エクササイズをはじめることができるようになりました。職場へは数時間しか行かず、あとはベッドの上で腹ばいで寝たまま、床にラップトップを置いて仕事をするという日々が続いていましたが、徐々に職場にいる時間が増やせそうです。皮肉なのは、家で仕事したほうがずっと生産性が高いこと。機械翻訳に関するタスクで、今の忙しさでは8月あたりまでは手がつけられないと思っていたものが、なんと先月中に仕上がってしまったという驚異のProductivity!ところが、ここ数日は職場にいる時間が長いせいか、なんとなくミーティングや相談にまきこまれる機会が増えたような・・・。家での仕事と職場との決定的違いは、やはり集中度。職場は個室ではあるものの、やはり周りから声を駆けられたり、キッチンで誰かと会ったらだべったりと、ちょこちょこ、気分転換のような感じで浪費されてしまう。ところがベッドに横たわっていれば実に快適で、ちょっといねむりしたかったら30分くらいカクッと横になれば頭すっきり。あとは3時間くらいは平気で集中して仕事をこなせます。もちろん欠点もあります。それは一日中仕事をしてしまうこと・・・(マジ)。今回は病気なので横たわっているしかないわけで、TVもない書斎のベッド上ではパソコンみているしかないというのもあります。でも、なんとなく「休憩取りながら仕事している」ような感じで、つらいということもありません。今は歩きに外に出たりと、一日ずっとやっていることはなくなりましたが、ベッド上で仕事するというのがこんなに生産性があがることとは気が付きませんでした。
さて、Home Officeならぬ"Bed Office"で仕事をしていて、ひとつ理解できたのが、以前に取り上げたHerfindahl Indexの数学的な意味です。一言で言えばエントロピー(entropy)だということです。これを機にろいろと情報エントロピーのことが理解できましたが、エントロピーというのは情報量のことですが、数値的には不確実性のことになります。
例えば、毎10分ごとに到着するバスと、いったいいつ来るか、何分ごとにくるのか一切わかっていないバスを比較します。前者のバスが「10時10分に到着したぞ!」とだれかがさけんだら、「あっ、そう」と驚きもしません。10分ごとにくるとわかっているわけですから、その情報の価値というのはほとんどありません。しかし、後者のバスが、「10時17分に到着するぞ!」といったら「へえー」となります。到着する時刻が不確定な状態で、いつくるかがわかったわけですから、その情報価値はすごいもんです。エントロピーといのはその情報価値のようなものを表すことができます。
前回、Herfindahl指数を使ったのは、翻訳の統一性をはかる目的でした。例えば、information entropyという用語に3つの翻訳が存在し、しかもそれぞれの頻度がそこそこある場合は、翻訳者はいったいどれをつかったらよいのかわかりません。ところが同じ3つあるケースでも、1つの訳は98%くらいを占め、残りの2つの訳は非常にまれなケースでしかつかわれていなければ、この1つめの訳を使えばほぼまちがいないとわかります。こういったときに、エントロピーが高いのは前者です。どれを使ってよいのかわからない状態で、「2つ目の訳を使ってください」と教えられたときの「ありがたさ」が大きいからです。ですから、エントロピーが高いほど、翻訳のぶれ(不統一度)が大きいといえるわけです。この考えはHHIを使っても同じで、HHIの場合は、指数が大きいほど、統一性が高いということになるだけです。
まあわかる人には一瞬にして理解できることなんでしょうが、何せ”ネタもと”は夕飯食べながら見ていたNHK経済羅針盤という有様ですから、数学的な意味なんて最初からわかるわけないんですよね。ヘルニアのおかげでこんなことも調べられる機会が持てて、逆によかったです。
でも皆さん、一日オフィスに座りっぱなしという方は特に腰には気をつけましょう!