<HTML>
<HEAD>
<TITLE>namazu make index.</TITLE>
</HEAD>
<BODY BGCOLOR="WHITE">
<H2>インデックスの作成</H2>
<HR>
wgetでとってきたデータ(データは「ホスト名」というディレクトリに格納)
のインデックス辞書の作成。
<BR>
コマンドはこんな感じ
<UL>
<LI>mknmz -c\
<BR>
--replace='s#ホスト名/#http://ホスト名/#'\
<BR>
--replace='s#ホスト名/%7E#http://ホスト名/~#'\
<BR>
ホスト名
</UL>
なんでこぉなったかというと、、、
<UL>
<LI>wget で取ってくると、「ホスト名」というディレクトリにデータのコピーが
できる。
<LI>「~ユーザー名」の「~」は、%7E という文字列に置き換わる。
<LI>このままの状態で、mknmz を実行すると、
	<UL>
	<LI>% を 25 と置換する
	</UL>
ので、 ~miuraj が wget で %7Emiuraj になって、それが mknmz で %257Emiuraj
になってしまう。
</UL>
から。(最後まで読んでね、、、)
<P>
ちなみに、(参考にはならんだろうが)初回だからだと思うが、
<UL>
<LI>73ファイル(html,text のみ)、158,321バイト、2,646キーワードで経過時間は88秒
<LI>148ファイル、1,111,166バイト、16,250キーワードで経過時間は402秒
<LI>248ファイル、1,295,879バイト、13,675キーワードで経過時間は423秒
</UL>
だった。
<BR>
# それにしてもできるファイルが多いねぇ、、、
<P>
で、作ってみた。そんで検索したらパスが変、、、そぉか、フルパスか、、、じゃ作り直しだ。
<P>
というのでフルパスで書いたが、やはり駄目。
<P>
で結局、replaceを一つにしたら大丈夫だった。
<UL>
<LI>mknmz -c -O インデックスを置くディレクトリ\
<BR>
--replace='s#ホスト名/#http://ホスト名/#'\
<BR>
--no-encude-uri \
<BR>
ホスト名(ディレクトリ名のこと)
</UL>
<HR>
<ADDRESS>
miuraj@isc.meiji.ac.jp
</ADDRESS>
</BODY>
</HTML>
