万葉集/manyou.txt ver 3.00 の解説
manyou.txt ver 3.00 の解説
A、【はじめに】
最初に万葉テキストを作ってから約5年が経過しました。当初の作成目的は主に語句検索にあり、出来るだけ正確な本文テキストをコンピュ-タ上で実現するということにありました。しかし文学研究における活用段階になると、単なる本文テキストでは利用上煩瑳な作業が伴なうばかりか、コンピュ-タの持つ特質を十分に発揮出来るとは言えない状態であったと思います。
そこで今回、従来の本文テキストとは別に、文学上の利用という観点からテキストを組み替えてみました。キ-ワ-ドを付け加えましたので、単なる語句検索ばかりではなく、作者、作歌の場、歌の内容などを複合的に重ね合わせて歌を検索することが可能となっています。
ただし項目立てによる構造的なテキストになるために、それに対応した検索プログラムが必要になります。原則としてこのテキストは、GNUプログラムであるjgawkに対応した形にしております。付属のjgawkスクリプトをご使用いただとすぐに利用できます(別途jgawk.exe本体が必要です)。ただお手持ちのデ-タベ-スソフトでご使用の場合は、それに適合したデ-タフォ-マットに改変してください。ただし最大フィ-ルド長は約3000バイト近くあります。
B、【本ア-カイブに含まれるファイル】
manyou.txt 万葉集テキスト本体
m_gaiji.txt 外字表
t_readme.doc 説明ファイル
manyou.awk 万葉集テキスト検索用jgawkスクリプト
keyword.txt キ-ワ-ド検索語一覧
C、【作成の経過】
本来統一された計画の基に作成されたわけではなく、かなりの偶然がありますので、そのあたりのところを記しておきます。
1986年5月 北野達氏より自身で入力された角川文庫本による万葉集の訓読テキストの校正協力依頼がある。当時はdBASEによるファイルであった。そこで池田(現飯泉)三枝子氏と校正。テキストファイルに置き換える。
1990年3月 Jallc Text Archives に登録(ver1.0)。著作権の関係で会員配布とする
1992年5月 岡島昭浩氏より百数十カ所におよぶ正誤表が送られてくる。同時に仮名ファイルとユ-ティリティのsedスクリプトも製作される。Jallc Text Archivesにそれを基にした改訂版を再登録。
1994年5月 校訂をほどこした原文テキストを製作。同時に訓読文を改訂する。GNU準拠にしてjallc text archives に登録(ver2.0)。なおver1.0は廃棄。
1995年6月 internet上での配布が可能になる。
1997年3月 全てのファイルを統合したテキスト(ver3.0)に組み替える。ただしテキスト構造が異なるので、ver2.0はそのまま残す。
D、【デ-タ構造とそれぞれの説明】
歌を中心に1レコ-ドとします。
最大フィ-ルド長 約2970バイト (山上憶良 沈痾自哀文)
歌配列の一部錯簡(例えば07/1194~1207など)については、底本の配列によらず、旧国歌大観番号の配列順にしています。
1、#[番号]
旧国歌大観番号 巻/歌番号の形式で表示します。
(例) 01/0022
序文など歌とは独立していると認められるものについては、レコ-ドを独立させていますので、歌番号は空白になっています。
異伝歌が左注にある場合は、歌を中心に1レコ-ドとしています。その場合、歌番号に本歌の番号に続けて「S」を記入しています。また本歌を基準にした場合の左注注記を題詞に入れています。
(例)2628の異伝歌を1レコ-ドとして独立する。
#[番号]11/2628
#[題詞](寄物陳思)
#[原文]去家之 倭文旗帶乎 結垂 孰云人毛 君者不益
#[訓読]いにしへの倭文機帯を結び垂れ誰れといふ人も君にはまさじ
#[仮名],いにしへの,しつはたおびを,むすびたれ,たれといふひとも,きみにはまさじ
#[左注]一書歌<曰> 古之 狭織之帶乎 結垂 誰之能人毛 君尓波不益
#[校異]
#[KW],衣,序詞,女歌
#[番号]11/2628S
#[題詞](寄物陳思)一書歌<曰>
#[原文]古之 狭織之帶乎 結垂 誰之能人毛 君尓波不益
#[訓読]いにしへの狭織の紐を結び垂れ誰れしの人も君にはまさじ
#[仮名],いにしへの,さおりのひもを,むすびたれ,たれしのひとも,きみにはまさじ
#[左注]
#[校異]
#[KW],異伝,衣,序詞,女歌
2、#[題詞]
m_genbun.txt、m_kundok.txtにおいて「D」とヘッダにあったものです。
分類題、標題等もこのフィ-ルドに掲げますが、最初に表記されている箇所の歌番号の題詞に表記します。その場合、底本において2行にわたっているものは、「/」を入れて改行であることを示します。
(例)
題詞において、「・・・何首」とあって、個々の歌には題詞が付けられていないが、その題詞下にある歌については、#[題詞](・・・何首)と()書きにして記入します。
底本に見られる目録、及び卷頭卷末の標題卷数(万葉集巻第*)は付していません。 目録は後日、作る予定です。
3、#[原文]
m_genbun.txtの本文です。長歌も一レコ-ドに統合しています。また校異箇所もそのまま<>で示しています。また挿入注記(「一云」などm_genbun.txtにおいては、「I」とヘッダにあったもの)も、本文中に入れています。
底本が小字表記の場合は、[]を付しました。
(例)[女郎字曰大名兒也](2/0110)
序文など歌とは独立していると認められるものの本文も入れました。その場合は、歌番号は空白になっています。
3.1【原文校訂の基準】
西本願寺本を底本として、親本である元暦校本や類聚古集を尊重し、非仙覚本系統である紀州本などを参考としました。また当然のことながら活字校訂本の成果も十分取り入れています。
原文について、異同のある箇所はその文字を<>で括り、#[校異]に校訂理由を記しています。ただし参考として掲げた部分については、印はほどこしてはいません。
(例)#[原文]山越乃 風乎時自見 寐<夜>不落 家在妹乎 懸而小竹櫃(01/0006)
#[校異]<> -> 夜 [西(右書)][元][類][冷]
上記本文中に挿入した半角記号 <>[] について、表記分析などで研究上支障がある場合は、sedなどで削除していただいてもかまいません。
異同対象とする原文は底本における本文であり、本文への書き添えや訂正も異同箇所として記載しました。
(例)
#[番号]02/0085
#[原文]君之行 氣長成奴 山多都祢 迎加将行 <待尓>可将待
#[校異]尓待 -> 待尓 [西(訂正)][紀][金][温]
VER 2.0 から原文校訂を改変している箇所もあります。
4、#[訓読]
m_kundok.txtの本文です。長歌の体裁及び挿入注記の処理は、原文に同じです。
訓読は、現在の諸注釈書で行われている訓読を基礎として、校訂者の判断で行いました。意見の別れている箇所もありますので、本訓読に従えない場合は独自に書き換えていただいて結構です。ただし書き換え後のテキストの流布については、下記のご利用上の条件を遵守してください。
文字表記については、文字検索を前提とするため、出来るだけ平易な漢字を用い、現代の熟語表記を基準としました。ただし原文表記を尊重した箇所もあるために、数通りの表記が生じています。
(例) 川、河 我、吾 など
VER 2.0 から訓読、表記を改変している箇所もあります。
5、#[仮名]
m_kana.txtの本文です。長歌の体裁は原文に同じです。
岡島氏の製作になるもの基本としています。訓読を改めた部分もありますが、多くは岡島氏の体裁を残しています。難訓も岡島氏の工夫のままに「*****」としています。
訓読と同じく、VER 2.0 から改変している箇所もあります。
6、#[左注]
m_genbun.txt,m_kundok.txtにおいて「S」とヘッダにあったものです。
左注も、個々の歌には付されていないが、その説明下にある場合は、題詞の体裁にならって()で記入します。ただし、どの歌まで差しているのか意見が別れて不明な場合は、#[左注]?()とします。
7、#[校異]
m_koui.txtにあったものです。題詞、本文、左注の校異を一括して掲げ、「/」で区切っています。
考異は、* -> * [*][*][*] として、底本からの校訂を示し、また参考箇所は、 * [* ] * という形式を用いました。
(例)太 -> 大 [紀][冷][文](01/0001)
[紀][冷][文]により、底本の「太」字から「大」字に改めたことを示しています。
樹 [西(上書訂正)][元][類](06/1009)
見せ消ちや消去訂正で原字が読み取れず不明なものを、底本の訂正文字で改めたことを示しています。
沙 [元] 弥 [注釈] 紗(01/0015)
字は底本通り「沙」としたが、ただし参考として「弥」「紗」字も考えられることを示しています。
校異箇所が1レコ-ド中複数存在する場合は、「/」で区切ります。また題詞、本文、左注の校異を一括して記入します。
題詞、左注においては、実際に記載されている箇所のレコ-ドに記入しています。()書きの箇所には再記入していません。ただし序文など独立したレコ-ドのある校異は、歌本文のあるレコ-ドに記入しています。
8、#[KW]
キ-ワ-ドの項目です。歌の分類、作者、作歌場所(現代地名)、作歌状況、特徴などを中心に検索用単語を掲げています。ただし歌の特徴などは任意の認識に拠っていますので、各自で書き換えていただいてもかまいません。或いは統一性もとれていないかも知れません。また地名など諸説あるものについては、強いて判断を行わずに、併記しています。或いは認識不足から漏れ落ちている要素もあると思います。その場合は、補足してください。補足分をお知らせいただけると幸いです。
作者とその歌に関連する人名を区別するために、作者には、人物名の前に「作者:」と記入して検索の便に供しています。また歌中に地名表記がある場合は、「地名」というアイテムを入れており、題詞、左注などから詠まれた場所がわかる場合は土地名表記のみで、歌中の地名表現と詠まれた場所とを区別しています。
E、【原表記文字について】
題詞、左注、本文、割り注における異体字については、第2水準漢字までの本字を基準として、活字校訂本の採用している範囲で通用字にまとめました。なお第2水準までには含まれていない文字については全角のアルファベット大文字、小文字、仮名、カタカナ 1文字に置き換え、M_GAIJI.TXT に示しています。また一部現行の略体字に置き換えているものもあります。置き換えたものについては同じく M_GAIJI.TXT にまとめました。
上記異体字について、「歌」は、底本において「謌」「哥」の表記箇所は参考として掲げました。
以下の文字種は、統一しました。
乗、傳、兩、國、壮、寝、寳、将、巌(jis code 3460)、帶、弾、懐、拂、榮、樂、歡、 満、濕、濟、為、獻、當、疊、發、真、聲、聴、觸、雜、霊、齊(齋、斎すべて)、 衛来、参、拔、拜、挟、數、檢、焼、獣、稱、穂、総、縄、装、顕、飲、驛、驗、鶏、 麦、齒、齡、龜、櫟、靱、礪、
ただし以下の文字は、混在しており、原本通りとしました。
禮:礼、與:与、萬:万、蟲:虫、辨:弁、餘:余、體:体、茎:莖
「禰」は「祢」、「邇(JIS83 code 6D6E)」は「迩(JIS83 code 4676)」、「爾」は「尓」に統一しました。また他の略字は原則として本字に統一しています。 注意すべき文字は外字表に記しています。
[注意] 「邇(JIS83 code 6D6E)」「迩(JIS83 code 4676)」については、 JIS78とは逆になります。
「籠(JIS83 code 6446)」 と 「篭(JIS83 code 4F36)」も交替します。ご注意ください。
なお外字は、原文、訓読共通です。
F、【付属のjgawkスクリプト】
検索語は、5つまで可能です。以下の例にならってください。検索結果は常にman.tmpという新規ファイルに格納されます。
jgawk -f manyou.awk manyou.txt
0: 全項目"
1: #[番号]"
2: #[題詞]"
3: #[原文]"
4: #[訓読]"
5: #[仮名]"
6: #[左注]"
7: #[校異]"
8: #[KW]"
検索文字列は5つまでです"
search field: # 検索対象フィ-ルドを番号で選択
word: # 検索文字列を入力
・
・
・ # 以下5回までフィ-ルド選択、検索文字列入力可能。不要なときはリタ-ンキ-入力
1:and 2:or ? # and検索かor検索を選択(ただし検索語を2回以上入力したとき)
Default is 歌番号,題詞,訓読,左注( push return key only)
elseif do select, 歌番号 contains at default output
output field: # 出力フィ-ルドを番号で選択
・ # 特に指定せずにリタ-ンキ-だけを押すと、歌番号、題詞、訓読、左注
項目が自動的に出力
・
・ # 以下8回まで出力フィ-ルドを選択可能。不要なときはリタ-ンキ-入力。
ただし歌番号は常に自動的に出力項目の中に入っているので、指定は不要
doing output to man.tmp # man.tmp に検索結果を出力
(例)大伴家持の作歌で「悲し」の歌句が使われている用例を検索する場合。
#[KW]で大伴家持、#[仮名]で「かなし」をand検索、#[番号]と#[題詞]、#[訓読] を出力する。
jgawk -f manyou.awk manyou.txt
0: 全項目"
1: #[番号]"
2: #[題詞]"
3: #[原文]"
4: #[訓読]"
5: #[仮名]"
6: #[左注]"
7: #[校異]"
8: #[KW]"
文字列は5つまでです"
search field:8
word:作者:大伴家持
search field:5
word:[かが]なし # 「うらがなし」などに対応するために正規表現使用
search field: # 終了はリタ-ンキ-入力
1:and 2:or ? 1
Default is 歌番号,題詞,訓読,左注( push return key only)
elseif do select, 歌番号 contains at default output
output field:2
output field:4
output field: # 終了はリタ-ンキ-入力
doing output to man.tmp # man.tmp に検索結果が出力されているはず。
出力項目は、歌番号、題詞、訓読
type man.tmp
#[番号]03/0478
[題詞](十六年甲申春二月安積皇子薨之時内舎人大伴宿祢家持作歌六首)
[訓読]かけまくも あやに畏し 我が大君 皇子の命の もののふの 八十伴の男を 召し集 へ 率ひたまひ 朝狩に 鹿猪踏み起し 夕狩に 鶉雉踏み立て 大御馬の 口抑へとめ 御 心を 見し明らめし 活道山 木立の茂に 咲く花も うつろひにけり 世間は かくのみな らし ますらをの 心振り起し 剣太刀 腰に取り佩き 梓弓 靫取り負ひて 天地と いや 遠長に 万代に かくしもがもと 頼めりし 皇子の御門の 五月蝿なす 騒く舎人は 白栲 に 衣取り着て 常なりし 笑ひ振舞ひ いや日異に 変らふ見れば 悲しきろかも
#[番号]08/1507
[題詞]大伴家持<攀>橘花贈坂上大嬢歌一首[并短歌]
[訓読]いかといかと ある我が宿に 百枝さし 生ふる橘 玉に貫く 五月を近み あえぬが に 花咲きにけり 朝に日に 出で見るごとに 息の緒に 我が思ふ妹に まそ鏡 清き月夜 に ただ一目 見するまでには 散りこすな ゆめと言ひつつ ここだくも 我が守るもの を うれたきや 醜霍公鳥 暁の うら悲しきに 追へど追へど なほし来鳴きて いたづら に 地に散らせば すべをなみ 攀ぢて手折りつ 見ませ我妹子
#[番号]17/3958
[題詞](哀傷長逝之弟歌一首[并短歌])
[訓読]ま幸くと言ひてしものを白雲に立ちたなびくと聞けば悲しも
(以下略)
[参考] bat処理
検索作業には特に必要ありませんが、任意のエディタで自動的に読み込ませることにより、そのままエディタ上で確認できます。別途、指定する任意のエディタが必要で す。
(例) wz(ビレッジセンタ-)で読み込む。mawk.batと命名する。
jgawk -f manyou.awk manyou.txt
wz man.tmp
dos窓上で「 A>mawk 」と入力することにより、wzエディタを通じて検索結果が表示されます。
H、【写本】 けい眼したもの。いずれも影印本。
[西] 西本願寺本 竹柏会 昭 8. 8 (底本)
[嘉] 嘉暦伝承本 竹柏会 昭16. 8
[紀] 紀州本 後藤安報恩会 昭16. 8
[宮] 神宮文庫本 勉誠社 昭52. 4
[天] 天治本 竹柏会 大15. 4
天治本(冠纓神社蔵) 勉誠社 昭58.12
[類] 類聚古集 煥文堂 大 2.
[古] 古葉略類聚抄 佐々木信綱 大12. 2
[尼] 尼崎本 貴重図書影印刊行会 昭 7.11
[春] 春日本(残簡) 竹柏会 昭 4. 4
[壬] 伝壬生隆祐筆本 竹柏会 昭16. 2
[桂] 桂本 集英社 昭51. 4
[藍] 藍紙本 講談社 昭46.10
[元] 元暦校本 朝日新聞社(諸本集成) 昭 3.12
以下、活字校訂本のリストによる
[金] 金沢本
[文] 金沢文庫本
[温] 温故堂本
[京] 京大本
[細] 細井本
[大] 大矢本
[冷] 伝冷泉為頼筆本
【版本】
[寛] 寛永版本
【参考活字校訂本】
(楓) 鶴久・森山隆 おうふう 平 3. 5
(塙) 佐竹昭広他 塙書房 平 5. 3 初版33刷
[新訓] 新訓万葉集 佐々木信綱 岩波文庫 昭52. 9 58刷
[定本] 定本万葉集 佐々木信綱 岩波書店 昭23. 6
[新校] 新校万葉集 佐伯梅友他 創元社 昭32. 5 10版
校本万葉集 全17巻 岩波書店 昭57. 8 増補第2版(完結)
【参考注釈書(古注も含む)】 刊行年期は該当巻最終刊行年月
万葉集拾穂抄 北村季吟 新典社 昭52. 1
万葉集管見 下河辺長流 契沖全集 朝日新聞社 昭 2. 2
万葉集代匠記 初稿本・精撰本 契沖全集 岩波書店 昭49. 8
万葉集僻案抄 荷田春満 荷田全集 名著普及会 平 2.12
万葉集童蒙抄 荷田在満 他 荷田全集 名著普及会 平 2.12
万葉考 賀茂真淵 他 真淵全集 続群書類従完成会 昭60. 9
玉小琴 本居宣長 宣長全集 筑摩書房 昭51. 6
万葉集略解 加藤千陰 国民文庫刊行会 明44. 2
万葉集古義 鹿持雅澄 精文館 昭12. 3
万葉集新考 井上通泰 国民図書(株) 昭 4. 1
万葉集全釈 鴻巣盛広 大倉広文堂 昭10.12
万葉集講義 山田孝雄 宝文館 昭12.11
万葉集注釈 澤潟久孝 中央公論社 昭45.11
万葉集全註釈 武田祐吉 角川書店 昭32. 9
万葉集全注(未完のため一部利用) 伊藤博 他 有斐閣 平 5. 4
岩波古典大系『万葉集』 大野晋 他 岩波書店 昭48.12
小学館全集『万葉集』 佐竹昭広 他 小学館 昭56.12
新潮古典集成『万葉集』 伊藤博 他 新潮社 昭59. 9
角川文庫『万葉集』 伊藤博 角川書店 昭63. 2
講談社文庫『万葉集』 中西進 講談社 昭55. 2
旺文社文庫『万葉集』 桜井満 旺文社 昭50. 4
I、【ご利用上の条件】
原文、訓読、また訓読表記の責任は、校訂者が負います。従って、本テキストの著作権は校訂者にあります。ただし、誤字脱字など入力ミスによるご利用上の支障や損害は、責任を負いかねますので、あらかじめご了承下さい。
本テキストの配布は、GNU宣言に基づいた形で行いたいと思います。特に GNU licence とロゴマ-クはつけませんが、利用にあたってはGNU規定に準じてください。
無料での再配布は自由ですが、その際は必ずこのT_README.DOCと付録の外字表を添付し、これらの条件を了承された方のみの利用を認めます。
他から再配布を受けた方は、作成者に必ず一報をお願いします。以後のメンテナンスの連絡を提供したいと思います。
テキストを再校合して新たなテキストを作ることは自由ですが、 流布させる場合には、本テキストを延用したことを明示して下さい。(GNU licence に基づく)
研究を目的とした、本テキストのフォ-マットの改編は利用者の自由です。ただし本テキストを加工した印刷の場合は、利用したことを明示して下さい。 (同上)
校正には万全を期していますが、まだ気のつかない箇所があると思います。 万が一、誤字を発見された場合は、校訂者に一報をお願い申し上げます。
J、【入力協力芳名】(敬称略)
このテキストを製作するにあたって、下記の方々の協力をいただいております。記して深謝申し上げます。
#[原文]
池田(飯泉)三枝子(宇都宮大学) 基礎入力
川本純子(山口大学 平1年度卒) 同
上野淑子(山口大学 平3年度卒) 同
中村武司(山口大学 平4年度卒) 校正
河村奈津子(山口大学 平5年度卒) 同
石神晶子(山口大学 平5年度卒) 同
#[訓読]
北野達(米沢女子短期大学) 基礎入力
池田(飯泉)三枝子(宇都宮大学) 校正
川本純子(山口大学 平1年度卒) 同
#[仮名]
岡島昭浩(福井大学教育学部) 基礎入力
K、【謝辞】
#[仮名]の本文は、本来岡島昭浩氏のご好意で作成されたものであり、今回の改訂版にそのまま利用することを快く許可くださったことに感謝申し上げます。
L、【フロッピィディスクで入手された方に】
本テキストは、JALLC Text Archives での配布以外に、anonymous ftp を通しても配布しております。net上では、常に最新バ-ジョンを置いております。ご利用の方々に通知することなく、誤字訂正その他の変更を行う場合がありますので、出来ましたらnet上での再入手を推奨いたします。ftp server およびdirectryは、以下の所です。
ftp.cc.yamaguchi-u.ac.jp (IP Address 133.62.128.38)
/pub/text/jallc/ym
manyo_v3.lzh
netscape等プラウザを利用される場合
ftp://ftp.cc.yamaguchi-u.ac.jp/pub/text/jallc/ym
manyo_v3.lzh
または
http://www.edu.yamaguchi-u.ac.jp/~kokugo
なお、解凍については、MSDOS或いはUNIXのlha.exeで解凍出来ます。
1997.03.31 Ver 3.00 R1.0
1997.11.10 Ver 3.00 R1.1
753 山口市錦町7-21
E-mail makoto@edu.yamaguchi-u.ac.jp