●文献データの採集(その1)

 文献からデータを採集する場合、どのような点に気を付けたらよいで
 しょうか。また、データとして必ず取っておかなければならない情報に
 はどのようなものがあるでしょうか。

 例えば、次のような本文があったとします(ここでは、武藤禎夫編『噺
 本大系第九巻』東京堂出版
、の本文を利用させていただきます)。

 (167頁)
 ○茗荷{めうが}
 はたごやの女房、てい主に向{むか}ひ、こんや泊{とま}つた
旅人{たびうと}のこり
 は、余程{よほど}の物と見へます。
どふぞわすれて置{を}けはよいとい
 へば、てい主、ヲヽよい工面{くめん}が有る。何でもむせふにめう
 がをくわせて
見よふと、汁{しる}も菜{さい}も皆{みな}茗荷{めうが}だくさ
 んに入れてふる廻{まい}
ける。翌朝{よくてう}旅{たび}人は立つて行{いく}。おふかたお
 としていつたろうと跡{あと}をみれども、何もなし。扨\/めう
 がもきかなんだといへば、てい主、イヤ\/
 きいた\/。ソリヤ何を。ヲヽサ。
はたごをわすれて、はら
 わずにいにおつた。
                                 (『聞上手 二編』)


 この話は、茗荷を食べると物忘れがひどくなるということを利用して、
 旅人に忘れ物をさせようとい思わくがはずれて、むしろ宿代を払うの
 を忘れられた、という落ちのつく、有名な話(『木曽街道続膝栗毛』にも
 ネタとして用いられている)ですが、ここの用例をいくつか取ってみます。

 まず、「旅人」を「たびうと」と読んでいるところが目につきます(振仮名
 は、{}に入れてうしろに置いてあります)。また、《なんとかして》の意
 味で用いられている「どふぞ」、「見る」に意思の助動詞がついた「見
 よふ」、「ける」が文末に、係り結びなしに置かれている(いわゆる連
 体形終止の例、「はたご」で《旅籠代》を意味している用法など、注目
 される部分でしょう。

 これらをデータとする場合、当該の部分だけでなく、前後の文脈もあ
 ったほうがいいのですが、それだと今度は、どの語に注目したのか
 が分からなくなります。そこで、注目した語には、目立つような印をつ
 けることにします。また、資料を書いた人、資料名、いつ時代の資料
 か、資料のどこか、地の文か会話文か、などの情報も必要です(そ
 れらの情報については、テキストの解説などを読み込んで得ます)。

 というわけで、

 :旅人:たびうと::こんや泊{とま}つた【旅人{たびうと}】のこりは、
 余程{よほど}の物と見へます。:不知足散人序:『聞上手 二編』
 茗荷:1773:噺本大系9、167-2:発話、女房→亭主

 :どふぞ:どうぞ::【どふぞ】わすれて置{を}けはよいといへば:不知
 足散人序:『聞上手 二編』茗荷:1773:噺本大系9、167-3:発話、
 女房→亭主


 :よふ:よう::ヲヽよい工面{くめん}が有る。何でもむせふにめう
 がをくわせて見【よふ】:不知足散人序:『聞上手 二編』茗荷:1773
 :噺本大系9、167-5:発話、亭主→女房

 :ける:けり::汁{しる}も菜{さい}も皆{みな}茗荷{めうが}だくさんに
 入れてふる廻{まい}【ける】:不知足散人序:『聞上手 二編』茗荷:
 1773:噺本大系9、167-6:地


 :はたご:はたご::ヲヽサ。【はたご】をわすれて、はらわずにいにお
 つた。:不知足散人序:『聞上手 二編』茗荷:1773:噺本大系9、167
 -9:発話、亭主→女房


 のようなデータができあがります。これをさらに、エクセルの表として
 読み込んで、データベースとして利用する方法がありますが、それに
 ついては、また回を改めましょう。