標本データを具に見ること
さて、前回は本サイトのサブタイトル「一般人εの思考標本データ」という言葉の意味について述べた。今回は、なぜそのようなことをするのか、その行為自体の意味について書いてみたい。
ご覧の通りほとんど推敲もせず、文章を書き殴っているわけだけれど、それぞれの記事に深い意味なんてない。分散σ^2が大きい自分の思考を恥ずかしげもなく晒しているだけだ。それでも、このゴミのような文章に何かしらの意味があるかもしれない。普段考えていることをそのまま心にしまっておくのは、なんか勿体ないような気がしている。
機械学習において有名なベンチマークデータとして「タイタニックデータ」というものがある。これは、タイタニック号に乗船した客の属性(年齢、性別など)と生存状況を表したデータだ。機械学習の初学者向けのチュートリアルとして、属性から生存状況を予測する問題に使用される。この問題において、1つ1つの標本データは単なる1データでしかない。知りたいのは統計的な傾向として、どういう属性の人が生き残りやすいか、ということでしかないからだ。しかし、それぞれのデータは実際に存在していた「人」を表している。僕も機械学習を研究していたときにこのデータを使ったことがあるが、1つ1つのデータに意味なんか求めていなかった。しかし、よくよく考えてみると、そこに実際に生きていた人がいたのだ。時には、その一人ひとりに思いを馳せてみても良いのではないか。もちろん、機械学習的には何の意味もないのだけれど。この人はどんな思いでタイタニック号に乗船したのだろう。何かの記念日だろうか。親孝行だろうか。実は悲しみを抱えていたのだろうか。想像力は無限大だ。
僕がやりたいのはこういうことなのかもしれない。本来は自分の思考をちゃんと整理したうえで、きちっとした文章として世に出すべきだ。しかし、思考の標本データにも何かしら宿っているはずだ。自分でも何を言っているかよく分からなくなってきた。意味があると思ってやっているというより、意味が生まれるかもしれないという期待を込めているのかもしれない。いや、誰かが意味を見つけてるかもしれないと期待しているのかもしれない。