古代スラブ文字データベースの作成

 

岩井憲幸 石川幹人

明治大学文学部

 

1. はじめに

 

われわれは文部省の支援を受け、平成10年度より4年計画で「古代ロシア文語の萌芽期における特性の研究―――『アルハンゲリスク福音書』を中心として」(科学研究費補助金基盤研究(C)、課題番号10610510、研究従事者:岩井憲幸、服部文昭)を進めている。その研究の一環として、コンピュータ上に古代スラブ文字のデータベースを作成している。このデータベースが作成できれば、従来紙ベースで行っていた語法や用例の検索作業が格段に効率化でき、しいては計量的なテクスト分析など、文献研究の可能性が大きく広がることが期待できる。

本報告では、古代スラブ文字に関わる研究の背景や意義を述べたのちに、現在入力を進めている古代スラブ文字データベースの作成法を述べる。最後に、本データベースの進捗状況と展望に触れる。

 

2. 本研究の背景・意義

 

スラブ語は9世紀になって初めて文字を得た。テッサロニケ生まれのビザンティウムの学者コンスタンティノス=キュリロスはグラゴル文字と後に称される文字を発明し、兄のメトディオスとともにビザンティウム皇帝の命をうけてモラビアに東方キリスト教の伝道に赴く。アプラコスとよばれる祭日祈祷用福音書抜粋ほか、いくつかのキリスト教文献をギリシア語から直接スラブ語に翻訳して携えていた。モラビアの地でスラブ人の弟子たちを育成するためである。グラゴル文字で書かれ、翻訳に用いられたスラブ語を今日古代教会スラブ語という[1]が、これがスラブ世界における最初の文語であった。かかる文字の発明と文語の制定は、スラブ文化史上の一大事件と評される。2人の兄弟が《スラブ人の使徒》と呼ばれるゆえんである。しかし2人の事業は聖・俗双方の国際情勢下にあって20年ほどでついえてしまう。のち彼らの弟子たちは苦難の末、ボヘミアとクロアチアへ、さらにブルガリアへと逃れてゆく。当時のスラブ語はむろん各地方において方言的な差をすでに有していたと考えられるが、それでもまだゆるやかな統一性をくずさず、古代教会スラブ語で書かれた文献は容易に読まれ、学ばれ、伝えられていった。ただし一方では地方的な変容もとげていったであろう。ルーシ(古代ロシア)は10世紀の末にキリスト教を国教と定め、この時ブルガリアから古代教会スラブ語の伝統が移入された。以後この言語はロシア語的な変化をこうむりながら、大まかにいって17世紀に至るまで唯一の文語としての地位を保つことになる。はじめ、ルーシの文語は古代教会スラブ語に直結する要素と、当時の東スラブ語の口語の要素とからなるハイブリッドな言語であったに違いない。ルーシの人々は規範性の高い古代教会スラブ語を学びつつ、模倣しつつ、時には無意識に、時には作為的に自分たちの言語要素を織りまぜていった。いくたの試行錯誤をへて、ようやくスタイルの上で自分たちにフィットした文語を獲得していったであろう。

本研究はロシア第3の文献『アルハンゲリスク福音書』(1093年成立。以下Archと略称する)を対象とし、このテクストを古代教会スラブ語の地方的変種とみて、テクストにあらわれるロシア語的現象―――いわゆるrusizm―――を総合的に把え、その変化の過程に古代ロシア文語の萌芽をみようとするものである。われわれの研究は現在第2の段階にあるが、第1の段階ではArchの1912年ファクシミリ版―――これ自体が稀覯書である―――のカラー写真(図1)を入手することから開始された。(なおArchの原本は国宝級の文化財で、原本からの写真すら今のところ撮影不可。)ついで2年ほどかけて写真からテクストを翻字した。この際原本の続け書きを分かち書きとし、聖書の章句番号を付し、また先行・後行の諸文献とも出来るかぎり比較検討した[2]。この作業から種々の知見を得たが、350ページほどのテクスト全体を詳細に把握するためには、索引の必要性が強く求められる。そこで現在の第2段階に入る[3]。テクスト全体をコンピュータに入力し、語彙索引と逆引索引を作成する。これによって、テクスト全体から特定項目ごとに用例を導き出し、最終的にこのテクストの言語自体を記述しうるであろう。

 

3. データベース作成法

 

今回入力の対象となった古代スラブ文字は、古いキリル文字である。キリル文字というと現代のロシアで使用されている文字であり、コンピュータ表示用のキリル文字フォントや、キーボードからの入力インターフェースソフトも多く出回っている[4]。しかし、古代スラブ文字は、文字形状が現代のキリル文字とは大幅に異なり、文字総数もヴァリアントを含めれば72文字[5]にのぼっているため、既存のソフトウェアをそのまま活用することは困難である。そこで、まず、文字形状をTrueTypeフォントとして、文献になるべく忠実なデザインで新たに作成することとした[6]。この作成にはTypeCraft Ver3.1 for Windows(キャノン販売)を使用した。

次に、ローマ文字に比較して多い文字数に対処するため、2バイトコードを利用することとした。72文字は、1バイトコードでも対処できない数ではないが、1バイトコードでは文字処理プログラムの制御文字と競合したり、データベースの可読性を低下させる問題が発生する。具体的な2バイトコードへの割付けは、図2のように、文字の読みに比較的近い平仮名を対応させた。すなわち、入力作業者が、読みにおおよそ対応する日本語をかな入力すると、画面に該当の古代スラブ文字が表示されることとなる。この、平仮名に割付けた古代スラブ文字TrueTypeフォントをIgor'-inと呼んでいる。

データベースの中身は日本語の平仮名の文字列となるので、日本語の文字処理プログラム言語を用いて、いろいろなデータ処理を行うことができる。われわれは、手軽さと普及の度合いから、DOSテキストの文書ファイルをデータベースに、その文字処理にはjperlを使っている。仮に、将来、古代スラブ文字が国際的な標準コードに割付けられることがあっても、簡単なプログラム開発でもって、データベースの中身をその標準コードに変換することが可能である。

2バイトコードを利用するにあたって1点問題が発生した。平仮名に割付けたTrueTypeフォントは、縦書き対応のため等幅フォントになっており、プロポーショナルにならないのである。等幅フォントでは、文字間隔が間延びしてなんとも読みにくい。そこで、印刷表示用に、1バイトコード(半角カタカナと英大文字)に割付けたTrueTypeフォントも作成した。このフォントをIgor'-outと呼んでいる。つまり、入力時は平仮名で入力するので表示フォントをIgor'-inにしておき、印刷清書のときは、文字処理プログラムでデータベースの中身を1バイトコードに変換して、フォントをIgor'-outに変えて表示印刷[7]するのである。図3に表示印刷例を示す。

 

4. 進捗状況と展望

 

現在、古代スラブ文字フォントが完成し、データ入力環境、整形印字出力環境が整った状態である。そして、Archの入力を試験的に開始し問題点を改善しているところである。今後、およそ1年をかけてArch全文を入力し、合わせて索引のプログラム開発を行っていく予定である。可能ならば、コンコーダンサーのような機能も実現したいと考えている。こうした試みから、古代ロシア文語成立の萌芽の一場面が、徐々に明らかになることを願っている。

 

謝辞

古代スラブ文字データベースの作成にあたり、次の諸氏にお世話になった。文字データ入力に山下大吾・島田潤の両氏(東京外国語大学大学院生)、文字フォント作成に久富武志氏(明治大学学生)、jperlプログラミングに嶋田和幸氏(明治大学大学院生)、技術的助言に和田悟氏(明治大学教員)および和田格氏(明治大学職員)である。ここに感謝の意を表する。

 

参考:文字のサンプル(久富武志氏のホームページ)

 

 

[1] この言語については次の書を見よ:木村彰一『古代教会スラブ語入門』白水社1985年

[2] 岩井憲幸・服部文昭『古代教会スラブ語の地方的変種から古代ロシア文語の萌芽にかかわる研究―――「アルハンゲリスク福音書」を中心として』平成7年度〜平成9年度科学研究費補助金(基盤研究(C)(2))研究成果報告書 私家版 1998年3月

[3] これまでの中間的な報告として次を見よ:岩井憲幸 <『アルハンゲリスク福音書』1092年のテクスト第2部分の外形的特徴について>「文芸研究」第81号 1999年2月。服部文昭<古代ロシア文語の統語論と語彙の資料としての『アルハンゲリスク福音書』>;岩井憲幸<『アルハンゲリスク福音書』の言語の主要特徴について> スラブと東欧研究センター資料集No.6「スラヴ語学文学研究の最前線」創価大学1993年

[4] たとえば、北海道大学スラブ研究センターの次のホームページを見よ。

http://src-home.slav.hokudai.ac.jp/

[5] 文字数についてはヴァリアントや、さらに、補助記号付きを異なる文字とみなすか否かなどで数え方は変わってくる。また、今回は文頭などに少数あらわれる大文字は、すべて小文字に変えて入力した。さらに、特殊記号28文字も別途作成して使用している。

[6] 原文献には数文字にわたって付加される記号(いわゆるtitlo, nomina sacra等)があるが、それらは括弧に展開するなどとして入力表示はしないこととした。LATEXを使って表示をする方法もあるにはあるが、データ形式や入力が煩雑になってしまう。

[7] 入力および印刷のためのワープロ環境にはMS-WORDを使用したが、MS-WORDでは、半角カタカナと英文字の間を自動的に空ける機能がデフォルトで働いている。この機能がキリル文字の間隔を空けてしまう副作用を及ぼしてしまうことが発覚した。MS-WORDでこの機能を解除する方法は、メニューバーから[書式→段落→体裁]とクリックすると該当のチェックボックスが現れる。この方法はヘルプで探すことが困難であり、マイクロソフト社のホームページのFAQから発見した。

 

(図は省略した)


ホームへ戻る
明治大学文学部 石川幹人