汎用聖書形式タグ付け仕様書 (電網訳)
汎用聖書形式タグ付け仕様書 (はんようせいしょけいしきタグづけしようしょ)[1]
原題:General Bible Format Tagging Specification[2]
目的
[編集]この仕様書は,さまざまな聖書検索プログラムで使用する聖書テキストを用意するための手引きとなるよう意図されている。それらのファイルは,直接解析して使用することも可能だが,聖書検索プログラムが索引付けや別の形式への変換という形で処理を施すこともできる。他の形式への変換は比較的簡単だ。この形式は,DOS,Windows,その他のプラットフォームで動作している聖書検索プログラムに,詳細な書式化の多くをゆだねるよう設計されている。
警告
[編集]この形式はまだ開発中なので,特に脚注や相互参照の扱いに関して,幾つかの事柄が変わるかもしれない。さらに,この仕様書では少々あいまいで,GBFリーダの実装の時点で明確になる点も幾つかある。この形式で配布された聖書を利用するプログラムを書く前に,この文書の原文を確認して欲しい。この文書は2001年11月19日に最終更新された。この文書に対する直近の変更は,「WTf」タグの追加,および幾つかのタグに「非使用」や「廃止」の注意書きを付したことである。
汎用形式
[編集]汎用聖書形式(GBF)ファイルは,254文字以内に限定された行から成るプレインASCIIテキストファイルだ。各行はDOS標準のCR-LFの組み合わせの文字で終わる。GBFファイルは,タグ,単語,空白,句読点といったトークンの連続から成る。それらのトークンが行の変わり目をまたがることはない。読み取る際,行の終端は単一の空白と同じだ。例外は,直後に「CM」トークンを伴うときで,その場合それらは無視される。適切な位置に軽い改行を挿入するのは,表示したりテキストを別形式に変換したりするプログラムの責任だ。127より大きなASCII要素については,米Windows ANSI文字セットとみなされる。DOSやUnixを対象とするGBFリーダは,この範囲内の文字を,それらのプラットフォーム上の最も類似した文字に変換すべきだ。
タグ
[編集]GBFファイルの中のタグには数種類あるが,それは"<"文字に続く最初の文字によって示される。これらのタグの中には,ファイル先頭タグ,テキスト型タグ,ファイル末尾タグ,フォント属性タグ,段落属性タグ,情報タグ,同期標識,特殊文字などがある。すべてのタグは右大不等号(<)とタグを識別する2つの文字で始まり,左大不等号(>)で終わる。タグ識別子は変動しやすいものであり,将来は,追加文字,数字,および他の文字を含むよう拡張されるかも知れない。幾つかのタグは引数を取る(同期標識のように)。この引数はタグの終わり「>」の直前に挿入される。このバージョンのGBF仕様書を対象とするGBFリーダは,(仕様書に含まれていない)認識できないタグを無視するべきだ。(それらは恐らく,より新しいバージョンの仕様書で追加されたものだからだ。)開始と停止の異形を備えたタグにおいて,タグ識別子の2文字目は,開始タグでは大文字,停止タグでは小文字だ。
テキスト型タグ
[編集]互いに排他的なテキスト型タグ群は,続くテキストの論理的な内容を明示し,文字や段落の設定の初期設定を暗示する。これらの各テキスト種別に割り当てられる実際のフォントや段落の属性は,表示プログラムによって,なるべくなら利用者の何らかの入力をもとに決定される。
ファイル先頭タグは,ファイルの冒頭から始まり,以下の順序で出現する。
型 | タグ | 目的 |
---|---|---|
ファイルのヘッダの開始 | <H0vv> | SBFファイルのバージョン情報。(最初のバージョンは「00」。)ファイル中に表われる場合,これは最初のトークンであるべきだ。これは将来Unicodeへの移行が生じるかも知れない箇所だ。このタグより前のどんなテキストも無視される。 |
翻訳の長い表題 | <H1> | 冒頭部分の印刷,またウィンドウの長いタイトルや見出しのための,翻訳の長い表題を指定する。このタグは聖書の本文より前に現われるべきだ。(例,「The Holy Bible, God's Living Word Translation」や「American Standard Version」。) |
翻訳の略称 | <H2> | 翻訳の短い表題や略称を指定する。(例,「GLW」,「ASV」,「NASB 1995」,「NJB」,「Amplified」など。) |
著作権表示(短) | <H3> | 著作権が取得されているなら短い(最小限の)著作権表示。または「KJV text is in the Public Domain.」といった事柄。 |
著作権表示(長) | <H4> | 著作権・許可表示(全文)。次のフィールド(恐らく<TI>)が開始すると,著作権表示は終了する。 |
ファイル本体タグは,テキストの内容の型を示すのに必要なものとして用いられる。
型 | タグ | 目的 |
---|---|---|
外典 | <BA> | 外典・第二正典の諸書のテキスト |
注釈 | <BC> | 注釈(通常は聖書テキストの中ではなく,同期標識と共に別ファイルで使用される)。 |
翻訳の紹介 | <BI> | 読者への覚え書き,翻訳履歴など。 |
新約聖書テキスト | <BN> | 新約27書のテキスト |
旧約聖書テキスト | <BO> | 旧約39書のテキスト |
各書の序文 | <BP> | 聖書や外典の各書の,古代または近年の序文 |
ファイル末尾タグは以下の順序で現われるべきだ:
型 | タグ | 目的 |
---|---|---|
照合値 | <ZW> | 廃止 (SHASUMまたはSAPPSUMからの外部照合値に置き換わった。これまでの定義は以下の通り: 照合値(ファイルの冒頭からこの行の直前までのすべての行のSHA-1ハッシュ)。32桁の16進数を伴う。SBFリーダは,この正当性照合に失敗するSBFファイルをすべて拒否すべきだ。ハッシュ値は任意でDSSデジタル署名を伴うことができる。) |
Digital Signature | <ZX> | 廃止 (外部のPGPデジタル署名に置き換わった。これまでの定義は以下の通り: <H0vv>から<ZW>の直前までのファイルのDSS署名) |
登録ユーザID | <ZY> | 廃止 (使用しない。これまでの定義は以下の通り: 登録ユーザのユーザID,名前,組織,および照合値は,この部分にエンコードして記録される。) |
ファイルの終端 | <ZZ> | ここで読み取りを停止する。 |
型 | 開始タグ | 停止タグ | 目的 |
---|---|---|---|
詩編の各巻の表題 | <TB> | <Tb> | 詩編の5つの巻の冒頭に記す |
コメント | <TC> | <Tc> | 表示・変換利用に際して,この部分のテキストを無視する。 |
ヘブライ語の表題 | <TH> | <Th> | 詩編のヘブライ語の表題。ヘブライ語の表題は1節の同期標識の直後に現われるべきだ。 |
区分見出し | <TS> | <Ts> | 翻訳者や発行者の区分見出し。 |
書名 | <TT> | <Tt> | 画面に表示するための現在の書物の正式名。例,「The Good News According to John」。 |
フォント属性
[編集]テキスト属性タグの各対は,斜体のようなテキスト属性を示すのに必要なものとして,テキスト中に挿入される。これらは,プラットフォームの制限によって,すべての聖書ビューアできちんと表現されることもあれば,されないこともある。これらのテキスト属性はすべて,開始タグが章の同期標識の後で明示的に繰り返されなければ,各章の冒頭で無効になるものとみなされる。
属性 | 開始タグ | 停止タグ |
---|---|---|
太字(非使用) | <FB> | <Fb> |
小さい大文字(非使用) | <FC> | <Fc> |
斜体 | <FI> | <Fi> |
フォント名(非使用) | <FNname> | <Fn> |
旧約聖書の引用句(非使用) | <FO> | <Fo> |
赤色(イエスの言葉) | <FR> | <Fr> |
上付き文字(非使用) | <FS> | <Fs> |
下線(非使用) | <FU> | <Fu> |
下付き文字(非使用) | <FV> | <Fv> |
段落属性
[編集]これらのタグは,行揃えや字下げなどといった段落の属性を表わす。これらの属性はすべて,該当する開始タグが章の同期標識の後で明示的に繰り返されなければ,各章の冒頭で初期状態(字下げのない散文,左揃え,左から右方向)になるとみなされる。行揃えタグは方向タグと同様,互いに排他的である。
属性 | 開始タグ | 停止タグ | コメント |
---|---|---|---|
左から右方向(初期状態)(非使用) | <DL> | 欧米言語 | |
右から左方向(非使用) | <DR> | ヘブライ語,アラビア語など | |
上から下方向(非使用) | <DT> | 北京語など | |
中央揃え(非使用) | <JC> | 表題に用いる。 | |
均等揃え(非使用) | <JF> | 左揃えに置き換えてもよい。 | |
左揃え | <JL> | 行揃えの初期方式。 | |
右揃え | <JR> | 「セラ」用 | |
字下げされた引用文(非使用) | <PI> | <Pi> | 字下げされた長い引用文。 |
詩 | <PP> | <Pp> | (詩編のような)詩を表わす。 |
情報タグ
[編集]これらのタグは,マウスの右クリックによって別ウィンドウやページの下部に表示されるための,テキストに関するさまざまな追加資料を示す。開始タグと停止タグは,脚注や参照が当てはまる単語の範囲をさし示す。以下に「seq」で表わされている順序標識は,参照部分が重複する際に開始タグと停止タグを対応させるために用いられるもので,該当するテキストの範囲内においてユニークであることが保証されている英数字の短い文字列だ。
型 | 開始タグ | 停止タグ | 目的 |
---|---|---|---|
埋め込み脚注を伴うテキスト。 | <RB> | <RF> | <RB>と<RF>の間のテキストは,<RF>と<Rf>の間に,追加の説明,コメント,翻訳者の注釈を有している。<RB>と<RF>の間のテキストは,脚注をポップアップするためのハイパーリンクを引いたり,印刷されたテキストではより伝統的な上付き標識で目立たせることができる。 |
脚注の主文 | <RF> | <Rf> | <RF>タグと<Rf>タグの間は埋め込み脚注の主文だ。<RF>は直前に |
平行箇所(非使用) | <RPseq Book ch:vs> | <Rpseq> | Bookは番号か,空白を含まない略称。 |
相互参照(非使用) | <RXseq Book ch:vs> | <Rxseq> | Bookは番号か,空白を含まない略称。 |
単語情報タグ
[編集]型 | タグ | 目的 |
---|---|---|
ストロング・ナンバー(ギリシャ語) | <WGnnn> | ギリシャ語辞典の見出し語の序数。 |
ストロング・ナンバー(ヘブライ語) | <WHnnn> | 直前の単語に対応するヘブライ語辞典の見出し語の序数。 |
行間訳 | <WIword(s)> | 直前の単語に対応した語句。 |
原語の単語情報 | <WTxxxx> | xxxxは,直前の単語の時制・性・数などに対応する特有の意味を持つ,一つかそれ以上の文字: A = アオリスト |
呼びかけ形式 | <WTf> | このタグの直前の固有名詞は,じかに呼びかけられている(二人称)のであって,言及されている(三人称)のではない。 |
同期標識
[編集]節の同期標識は現在の書・章・節を示す。それぞれの種類の同期標識は,それが示す範囲(書・章・節)の冒頭に必要とされる。同期標識は範囲内で自由に繰り返されるかも知れない。同期標識で具体的な番号が明示されない場合,その番号は同種の直前の同期標識の番号より一つ大きいものとみなされる。
種類 | タグ | 例・コメント |
---|---|---|
書 | <SBxxx> | ヨハネ書の場合は<SBJohn>または<SB67>。 |
章 | <SCxxx> | 3章の場合は<SC3>,または(前の章が2章であれば)<SC> |
節 | <SVxxx> | (15節に続く)16節の場合は,<SV16>または<SV>。 |
日付(非使用) | <SDmmdd> | 4月30日の場合は<SD0430>。通常は聖書本文中で用いられることはないが,日ごとの朗読用に編集された注釈書の中で使われるかも知れない。mmddが省略された場合,その次の日とみなされる。 |
各書の標識は以下の数値・英語名・略称のいずれかだ。ステップはこの形式では使われないが,変換の際の参考のために列挙されている。
旧約聖書 書名 | 英語名 | 略語 | ステップ | 番号 |
---|---|---|---|---|
創世記 | Genesis | Ge, Gn | 1 | 1 |
出エジプト記 | Exodus | Ex | 2 | 2 |
レビ記 | Leviticus | Lev, Lv | 3 | 3 |
民数記 | Numbers | Nu | 4 | 4 |
申命記 | Deuteronomy | De, Dt | 5 | 5 |
ヨシュア記 | Joshua | Jos | 6 | 6 |
士師記 | Judges | Judg, Jdg | 7 | 7 |
ルツ記 | Ruth | Ru | 8 | 8 |
サムエル記第一 | 1 Samuel | 1 Sa, 1Sa | 9 | 9 |
サムエル記第二 | 2 Samuel | 2 Sa, 2Sa | 10 | 10 |
列王記第一 | 1 Kings | 1 Ki, 1Ki | 11 | 11 |
列王記第二 | 2 Kings | 2 Ki, 2Ki | 12 | 12 |
歴代誌第一 | 1 Chronicles | 1 Ch, 1Ch | 13 | 13 |
歴代誌第二 | 2 Chronicles | 2 Ch, 2Ch | 14 | 14 |
エズラ記 | Ezra | Ezr | 15 | 15 |
ネヘミヤ記 | Nehemiah | Ne | 16 | 16 |
エステル記 | Esther | Es | 17, 95, 100 | 17 |
ヨブ記 | Job | Job | 18 | 18 |
詩編 | Psalms | Ps | 19, 91, 92 | 19 |
箴言 | Proverbs | Pr | 20 | 20 |
伝道の書 | Ecclesiastes | Ec | 21 | 21 |
ソロモンの歌 | Song of Solomon | Song, Sol, SS | 22 | 22 |
イザヤ書 | Isaiah | Isa | 23 | 23 |
エレミヤ書 | Jeremiah | Je | 24 | 24 |
哀歌 | Lamentations | La | 25 | 25 |
エゼキエル書 | Ezekiel | Eze | 26 | 26 |
ダニエル書 | Daniel | Da | 27, 89 | 27 |
ホセア書 | Hosea | Ho | 28 | 28 |
ヨエル書 | Joel | Joe | 29 | 29 |
アモス書 | Amos | Am | 30 | 30 |
オバデヤ書 | Obadiah | Ob | 31 | 31 |
ヨナ書 | Jonah | Jon | 32 | 32 |
ミカ書 | Micah | Mi | 33 | 33 |
ナホム書 | Nahum | Na | 34 | 34 |
ハバクク書 | Habakkuk | Hab | 35 | 35 |
ゼパニヤ書 | Zephaniah | Zep | 36 | 36 |
ハガイ書 | Haggai | Hag | 37 | 37 |
ゼカリヤ書 | Zechariah | Zec | 38 | 38 |
マラキ書 | Malachi | Mal | 39 | 39 |
外典 書名 | 英語名 | 略語 | ステップ | 番号 |
---|---|---|---|---|
トビト書 | Tobit | Tob | 69, 93, 98 | 40 |
ユディト書 | Judith | Judi, Jdt | 70 | 41 |
エステル記(ギリシャ語) | Esther (Greek) | GrkEs | 71 (追加分のみ); 88 (完全版) |
42 |
知恵の書 | Wisdom | Wis | 72 | 43 |
シラ書 | Sirach | Sir | 73, 94, 99 | 44 |
バルク書 | Baruch | Bar | 74, 90 | 45 |
エレミヤの手紙 | Letter of Jeremiah | Let | 75 | 46 |
アザリヤの祈りと三人のユダヤ人の歌 | Prayer of Azariah and the Song of the Three Jews | Azar | 76 | 47 |
スザンナ | Susanna | Sus | 77 | 48 |
ベルと龍 | Bel and the Dragon | Bel | 78 | 49 |
マカベア記第一 | 1 Maccabees | 1Mac | 79, 96 | 50 |
マカベア記第二 | 2 Maccabees | 2Mac | 80, 97 | 51 |
エズラ記第一 | 1 Esdras | 1Esd | 81 | 52 |
マナセの祈り | Prayer of Manasseh | Man | 82 | 53 |
詩編151編 | Psalm 151 | P1 | 86 | 54 |
マカベア記第三 | 3 Maccabees | 3Mac | 84 | 55 |
エズラ記第二 | 2 Esdras | 2Esd | 83, 87 | 56 |
マカベア記第四 | 4 Maccabees | 4Mac | 85 | 57 |
新約聖書 書名 | 英語名 | 略語 | ステップ | 番号 |
---|---|---|---|---|
マタイによる福音書 | Matthew | Mat, Mt | 40 | 64 |
マルコによる福音書 | Mark | Mar, Mk | 41 | 65 |
ルカによる福音書 | Luke | Lu, Lk | 42 | 66 |
ヨハネによる福音書 | John | Joh | 43 | 67 |
使徒行伝 | Acts | Ac | 44 | 68 |
ローマ人への手紙 | Romans | Ro, Rm | 45 | 69 |
コリント人への第一の手紙 | 1 Corinthians | 1 Co, 1Co | 46 | 70 |
コリント人への第二の手紙 | 2 Corinthians | 2 Co, 2Co | 47 | 71 |
ガラテア人への手紙 | Galatians | Ga | 48 | 72 |
エフェソス人への手紙 | Ephesians | Ep | 49 | 73 |
フィリピ人への手紙 | Philippians | Phili, Php | 50 | 74 |
コロサイ人への手紙 | Colossians | Col | 51 | 75 |
テサロニケ人への第一の手紙 | 1 Thessalonians | 1 Th, 1Th | 52 | 76 |
テサロニケ人への第二の手紙 | 2 Thessalonians | 2 Th, 2Th | 53 | 77 |
テモテへの第一の手紙 | 1 Timothy | 1 Ti, 1Ti | 54 | 78 |
テモテへの第二の手紙 | 2 Timothy | 2 Ti, 2Ti | 55 | 79 |
テトスへの手紙 | Titus | Tit | 56 | 80 |
フィレモンへの手紙 | Philemon | Phile, Phm | 57 | 81 |
ヘブライ人への手紙 | Hebrews | He | 58 | 82 |
ヤコブの手紙 | James | Ja | 59 | 83 |
ペテロの第一の手紙 | 1 Peter | 1 Pe, 1Pe | 60 | 84 |
ペテロの第二の手紙 | 2 Peter | 2 Pe, 2Pe | 61 | 85 |
ヨハネの第一の手紙 | 1 John | 1 Jo, 1Jo | 62 | 86 |
ヨハネの第二の手紙 | 2 John | 2 Jo, 2Jo | 63 | 87 |
ヨハネの第三の手紙 | 3 John | 3 Jo, 3Jo | 64 (14節); 67 (15節) |
88 |
ユダの手紙 | Jude | Jude | 65 | 89 |
ヨハネの黙示録 | Revelation | Re | 66; 68 (12章が18節) |
90 |
特殊文字タグ
[編集]これらのタグはテキスト中の単一の文字を示す。
意味 | タグ | コメント |
---|---|---|
ASCII文字(非使用) | <CAxx> | xxは16進値 |
>(非使用) | <CG> | 左大不等号。 |
<(非使用) | <CT> | 右大不等号。 |
段落の終端 | <CM> | 段落や詩の行の終端。散文では空白行や字下げを生じさせることができる。 |
行の終端 | <CL> | 段落の終端以外の行の終端。詩的対句の最初の行で使われる。 |
Unicode文字(非使用) | <CUxxxx> | xxxxは16進値。 |
外部注釈・強調表示ファイル
[編集]外部注釈・強調表示ファイルは,個々の聖書研究者が,聖書検索プログラムを使って聖書を学びながら,注解やメモを記すためのものだ。注釈・強調表示ファイルが聖書テキストと同時に開かれる場合,注釈はポップアップ機能や別ウィンドウ,あるいは脚注としてのページ下部への出力によって読者に提供される。強調表示設定は聖書テキストの表示される背景に適用される。注釈・強調ファイルはプレインASCIIテキストだ。その中では,フォントや段落特性のための聖書テキストと同じタグに加え,以下のタグが使われる:
意味 | タグ | コメント |
---|---|---|
注釈ファイルの開始 | <HN> | このタグは最初のトークンであるべきだ。 |
注釈(非使用) | <NNref-ref> | このタグに続くテキストは,指し示されている参照範囲に含まれる聖書テキストに関連した注釈だ。参照範囲はBook ch:vs wdの形式で表わす。Bookは(空白を含まない)略称または番号,chとvsは数字。wdの数字は節中の単語の番号。wdが省略されると,節全体とみなされる。vsが省略されると,章全体とみなされる。chが省略されると,書全体とみなされる。二番目の参照範囲が省略されると,参照範囲は一番目の範囲だけを包含するものとみなされる。最初の単語と最後の単語は連続する部分とみなされる |
色(非使用) | <NC rrr ggg bbb ref-ref> | 強調表示背景色は,さし示されている参照範囲に適用される赤色(rrr)・緑色(ggg)・青色(bbb)に対応する0から255までの三つの数字で表わされる。参照範囲は注釈タグの場合と同様に解釈される。例えば,ヨハネ 3:16の全体を緑色で強調表示したいなら,タグは<NC 0 255 0 John 3:16>となる。ヨハネ 1:1の「In the beginning」を緑がかった青色で強調したいなら,タグは<NC 0 64 255 John 1:1 1-John 1:1 3>となる。 |
ファイルの終端 | <ZZ> | ファイルの最後のトークン。このトークンの後のものはすべて無視される。 |
日本語対応のための拡張案
[編集]日本語のエンコード形式にはUnicode(UTF-8)を採用する。
情報タグに以下のタグを追加する。
型 | 開始タグ | 停止タグ | 目的 |
---|---|---|---|
ルビ | <RUkana> | <Ru> | kanaは,<RU>タグと<Ru>タグに囲まれた部分に対応する振り仮名を表わす。表示プログラムにより,該当範囲の上部に小さい文字で表示されたり,直後のカッコ内に表示されることもあれば,完全に無視されることもある。 |
また,日本語は分かち書きに向かないので,「254文字以内に限定された行から成るプレインASCIIテキストファイル」という条件をどのように満たすかが問題。日本語と日本語の間の空白文字は無視することにすればよいか。(現時点ではこの条件を破っています。)