2018年3月13日火曜日

テキスト

やりかけだったテキストのデータベース化作業再開
これまで書いてきてものを年毎ひとつのまとまりにするだけのことなのだが、
30年分もあると、結構めんどくさい
PDFとして保存していたブログからテキストを取り出そうと思ったら、
画像として保存されているものなどあって、手こずった
最近知った、google drive、google doc経由でテキストを取り出す手法でなんとかテキスト化に成功
ひたすら、コピー&ペーストするだけの作業

これやって、なんの役に立のかという疑問はある
はじめて禁糖をやったのはいつか?といった自分の問いに応えるくらいのことである
(2004年のようです)

32ファイルあわせて、パソコン上のデータ量が4メガバイトに満たないことにおどろく
昔風にいえば、フロッピー1枚に収まってしまう分量
あるいは、デジカメ写真1枚分と言い換えてもよい
30年間、書き続けてきたものの分量とデジカメ写真1枚がデータ量的には等価
とは何を意味しているのか?

文字情報というのは抽象の極み、ということになるのでしょうね
俳句など十七音で世界を記すわけですから