利用者:P9iKC7B1SaKk

提供:Wikisource

古今不及承珍奇の御肴 - 薄濃Wikitextにして公卿Wikisource居置publish[編集]

覚書[編集]

巷間、「🪳ゴキブリは1匹いたら100匹いる」とも言われているようだが、OCR誤検出もそれに似ている。ひとつひとつ目視確認して灰を吹き払うごとく撫で切りにするほかない。 P9iKC7B1SaKk (トーク) 2024年5月11日 (土) 10:21 (UTC)


やはり国史研究会の出版本は文字が大きいからかNDLOCRの誤検出が少なくWikitext化しやすい。ひたすら変体仮名「は」の誤検出の修正作業がつらい史籍集覧の入力から国史研究会の入力に戻ってくると快適さに格段の違いを感じる。以前、画像が粗く変体仮名だらけの我自刊我書「信長公記」を入力してから国史研究会「利家夜話」を入力した時も感じたが、あきらかに国史研究会本のほうがサクサク入力できる。なぜ誰も国史研究会本のWikitext化をやらないのか不思議なくらいだが、戦前の旧字・異体字のハードルを越えるのは容易ではないのかもしれない。P9iKC7B1SaKk (トーク) 2024年4月21日 (日) 10:33 (UTC)


SHOGUN」とかいう海外ドラマに、遊郭の隣に教会の土地を与えられて宣教師が唖然とする場面があるとの由。江戸時代初期に編纂された「慶長見聞集」では「武家諸法度」の直後に「ゆなぶろ繁昌の事」が配置され、明治時代に編纂された「史籍集覧」では「武家諸法度」の直前に切腹の作法を記した「凶礼式」が配置されているが、それぞれの発表時期を考えれば、お上の咎めを恐れない「慶長見聞集」のチャレンジャーぶりが際立つ。P9iKC7B1SaKk (トーク) 2024年4月16日 (火) 10:00 (UTC)


テンプレート:Unknown」にお知らせのためのcontact引数を追加した。さっそく「特別:固定リンク/218730」で使ってみたが、他人に「独自研究や私見はトークページに」と求めておきながら、自分自身は「殿中御掟」のヘッダー書誌情報に「殿中御掟」を「日本国の立憲主義の先駆けとなった室町幕府の憲法である」と書いているのがやや心苦しい。地方政権のものも含めて日本国の立憲主義の先駆けを考えるなら、永禄10年(1567年)制定の「六角氏式目」のほうが2年早い。P9iKC7B1SaKk (トーク) 2024年4月13日 (土) 00:20 (UTC)


中国語版の日本書紀はs:zh:Talk:日本書紀の底本情報が正しいとすれば、振り仮名、返り点、頭注を勝手に捨ててしまっており底本編者に対する敬意を欠く編集である。また、中国語版ウィキソースは返り点テンプレートがないので、日本語ウィキソースにとっては外部サイトとみなすべきである。要約ログが空欄の編集は、たとえそれが古参ユーザーの編集であろうと躊躇なく差し戻しする。P9iKC7B1SaKk (トーク) 2024年4月7日 (日) 21:00 (UTC)


青空文庫の「即興詩人」とNDLJPの「即興詩人 上巻」がいずれも「券(わりふ・てがた)」という字を「劵(あきる・つかれる)」と誤出力している。「券」と「劵」の音読みは同じ「ケン」だが字の意味がまったく違うので異体字とみなせるか微妙。P9iKC7B1SaKk (トーク) 2024年3月28日 (木) 23:51 (UTC)


どうも2024年3月23日ごろからHTML生成時のLintエラーチェックでnight-mode-unaware-background-colorがもれなくヒットするようになったらしく、古いページも特別:PurgeでHTMLを再生成するとnight-mode-unaware-background-colorエラーになる。P9iKC7B1SaKk (トーク) 2024年3月26日 (火) 11:17 (UTC)


一か月ブロックされていた間に、令和8年NHK大河ドラマが「豊臣兄弟!」に決まり、浅井久政や武田信虎を演じた名優・寺田農氏が死去した。浅井久政の首の扱いについては、信長公記では「薄濃」とのみあるが、浅井三代記では「この長政の首と義景の首とを肉をさらし取朱ぬりに被成安土にて其翌年より正月の御禮に參上せらるゝ大名衆へ御盃の上に御肴にそ出にける」とあり久政の首について言及はないが、薄濃と朱ぬりは両立しうる。とりあえず「浮世の有様」2~6を追加しおえた。「浅井三代記」などの返り点「レ」を含むURLリンクが壊れているので要修正。 P9iKC7B1SaKk (トーク) 2024年3月25日 (月) 16:03 (UTC)


軍記物ばかり入力するのもどうかと思い、「浮世の有様/1」を入力してみた。章立てに一貫性がないため、分冊化にやや手間取った。残りの「浮世の有様」2~6についても随時ウィキソースに追加していく予定。 P9iKC7B1SaKk (トーク) 2024年2月18日 (日) 12:12 (UTC)


機械翻訳の件は、そもそも技術的にもウィキのルール的にも実現不可能なものであり、機械翻訳という理由で削除できる仕組みを作れば、管理者ユーザーには繊細な削除判定業務が増えて負担がかかる。入力途中の不完全な作品はほかにいくらでもあるにもかかわらず、特定作品を「機械翻訳だから」という理由で削除するには、それなりの正統な理由が必要になるからだ。いまだに機械翻訳という理由で作品を削除できると思っているユーザーがいるらしきことからもわかるように、認知能力の問題は簡単に解決しない。私をブロックしたところで解決できない。P9iKC7B1SaKk (トーク) 2024年2月11日 (日) 03:29 (UTC)


軍記物ばかり入力するのもどうかと思い、ひらがな主体の快適な入力を期待して平安貴族の関連文書を入力すべく着手した「古事談」と「江談抄」が漢文主体で、期せずして「甲陽軍鑑/品第二」武田信繁家訓を入力して以来の膨大な返り点との戦いとなった。P9iKC7B1SaKk (トーク) 2024年2月10日 (土) 10:36 (UTC)


Proofread作品の入力完了後に広範囲なOCR由来の誤字を発見してしまう徒労感は大きい。かつての「成吉思汗実録」入力で懲りた。ひとつのテキストデータだけで完結する標準名前空間の作品であれば、誤字の一括変換は簡単なのだが、ProofreadのPageとして誤字が分散していた場合、それぞれのPageで編集を行う必要があるため。漢字を多く使う日本語版や中国語版はウィキソースの校正機能と相性が良くない。日本語版はさらにそこにルビの細かい字も加わる。文字をストレスなく目視確認するにはWebブラウザのフォントサイズでは小さすぎるため、入力者が漢字の多い作品のProofread利用を避けるようになってしまう。Proofreadを使った校正はただの手段にすぎず、目的ではないので、選択肢から外した。ウィキソースのルールではProofreadの開発者の心やProofread校正に価値を見出す人の心を傷つける侮辱・マナー違反行為かもしれないが、あえて書く。P9iKC7B1SaKk (トーク) 2024年2月8日 (木) 05:54 (UTC)


普通の人は相手の立場に立って考える能力があるため、自責の念が生じやすい。逆に発達障害の人は相手の立場に立って考える能力が弱いため、自分の気持ち「快・不快」がすべてに優先し議論の途中で突然「私の気持ち」について語り出し、自分の気持ちを傷つけるあなたはマナー違反であると主張する。そうなると普通の人は、相手に配慮して譲歩してしまうので、結果的に、発達障害の人ばかりが議論に勝ち残る。複雑な要素で成り立つ実社会の議論では起こりにくいこのようなことが、ウィキペディアの議論では簡単に起きてしまう。P9iKC7B1SaKk (トーク) 2024年2月5日 (月) 10:36 (UTC)


わたしのことを未成年と罵倒しつつ大阪物語の書誌情報を書き換えた温厚知新というユーザーのトーク書き込みを白紙化した。「他人を荒らし呼ばわりしてはならない」というマナーに抵触するかもしれないことを覚悟のうえでのこと。他人をブロック恫喝や誹謗中傷してくる荒らしに、編集介入という成功体験をこれ以上与えない。以前ウィキペディアの「甲陽軍鑑」での温厚知新の編集に「感謝」を送ったことで温厚知新に誤った成功体験を与え、かえって温厚知新を増長させてしまった。今後、私は威圧的で卑怯なユーザーに友好的な態度をとらない。全力で戦い抜く。P9iKC7B1SaKk (トーク) 2024年2月5日 (月) 08:34 (UTC)


ウィキペディアやウィキソース界隈では教養のない者ほど旧字や古典引用のハンドルネームを使って教養が高いかのように装う傾向がある。他人から不敬と思われるようなハンドルネームを平然と使い続けられるのも教養のなさゆえである。他者に編集作業の品質で劣るという自覚があるため、自治作業に自分の居場所を見つける。自治作業には他人の揚げ足を取る快感がともなう。わたしはこれ以上、彼らにどす黒い成功体験を与えたくない。最近、見張り番の醜い心理を看破した 慶長見聞集「花折る咎に縄かゝる事」の入力作業をしたことで一層そう思うようになった。P9iKC7B1SaKk (トーク) 2024年2月5日 (月) 06:02 (UTC)


排他的な人をいったんコミュニティから追い出すために、排他的な態度を取るという自己矛盾が起きていることは私自身よくわかっている。認知能力に問題のある排他的な人に対処する場合、残念ながらこうせざるを得ない。排他的な人に寛容であってはいけないからだ。また私が「発達障害」という表現を用いるのは侮辱の意図ではない。むしろ逆であり、人格攻撃することなく一連の問題を理解し共有するために発達障害という表現を用いている。認知能力の問題は、支配欲が強すぎるとか性格に難があるとかいうことよりも、もっと深刻で解決困難なものだからである。P9iKC7B1SaKk (トーク) 2024年2月4日 (日) 11:28 (UTC)


認知能力の低い人はせめて宥和的であってほしいのだが、発達障害によって自らを客観視することができない排他的な人がコミュニティの多数派(といって数人だが)を形成してしまっている。これは認知能力の問題なので和解はそもそもできない。私をブロックすることに賛成票を投じた人は、自らの意志でウィキソース・コミュニティから出て行ってほしい。心から願う。P9iKC7B1SaKk (トーク) 2024年2月4日 (日) 04:50 (UTC)


「精神主義と規律主義は無能者にとっての絶好の隠れ蓑である」という言葉は作家・司馬遼太郎が『坂の上の雲』で述べたものである。入力作業をろくにやらずウィキソースで作品削除やユーザーブロックなどの自治にいそしむ「善意」の人の行動原理もこれではないだろうか。他人の行動を管理する支配欲の充実を一度味わってしまうと、地味で根気のいる入力作業がバカバカしくなるのであろう。気高き侍が農民を見下す心理によく似ている。今ここで表面的に和解しても、手強い相手は撫でてやり過ごし次の獲物を物色するだけなので、いずれ新しい被害者が出てしまう。どちらかが滅ぶまで徹底的に戦うしかない。厭離穢土欣求浄土。根切り。撫で切り。P9iKC7B1SaKk (トーク) 2024年2月3日 (土) 09:46 (UTC)


甲陽軍鑑」を「テンプレート:NDLJP899828」に移行する作業を行った。影響を最小化するため深夜の作業にしたが、思いのほか円滑に移行できた。他の作品も必要に応じてテンプレート化する。それはさておき、管理者の立場を利用して客観性を装いつつ一般ユーザー追い詰める快感や、自治と称して他人の作った作品を削除する快感は、地味な入力や校正では得られないものだろう。作品を削除する達成感よりもユーザーをブロックする達成感のほうがさらに大きく、獲物を追い込んで仕留めるゲーム感覚に病みつきになるのかもしれない。紳士的にふるまって同意を集める演技もゲームの一部であり、鳴りを潜めつつ獲物を仕留める別の機会を探るのもまたゲーム感覚があって楽しいに違いない。そういった「狩り」の成功体験の積み重ねの上に今の日本語版ウィキソース・コミュニティが存在している。以前にも書いたが、日本語版ウィキソースは他言語版に比べて作品数が少ない。サーバーに負荷がかかっているわけでもないのに、やたらと作品を削除していく原動力は善意による自治ではなく入力者の憤りや失望を楽しむ「狩り」のゲーム感覚なのである。今、グローバル管理者の仲介で和解しようとも、いずれ再び本性をあらわす。私と彼ら、どちらかが日本語版ウィキソース・コミュニティから去るほかない。共存はありえない。私がこのような見立てをする理由は私自身が悪人だからである。悪人の行動を予測するには悪人の資質を備えている必要がある。大量虐殺を行ったチンギス・ハーンや織田信長の伝記をわざわざウィキソースにあげるような感性の持ち主が善人のはずがないし、実際、私は善人のふりをしているにすぎない。チンギス・ハーンはモンゴル統一期にオン・ハンを「殺し好きの翁(おきな)」と批判したが、モンゴル統一後はオン・ハン以上に多くの人を殺した。私もまかり間違って作品やユーザーアカウントの生殺与奪を握る立場になれば「狩る」ことに喜びを見出すようになるかもしれない。P9iKC7B1SaKk (トーク) 2024年2月2日 (金) 19:51 (UTC)


もし誰も「Wikisource:井戸端/Archive9#機械翻訳の濫用?」に反対票を投じなかったらどうなったか。発達障害の人は自分の心を守る防衛機制により、何事もなかったようにそれまで議論していたことに飽きて忘れ去り、しばらく経ってから新鮮な気持ちで再び議論をはじめてしまう、を延々と繰り返すだろう。当然、そこに自己反省や責任感は存在せず、そもそも自らの行動の結果に対してさほど興味がないので、作品の入力もあまりしない。作品入力そっちのけで他人の入力作品を削除することが快感になっており、他人から不気味に思われていることにも気づけない。私と会話が成立しない人たちのひとりにいたっては管理者という責任ある立場にありながら、都合の悪い問い合わせに常に無回答なのも防衛機制によるものである。防衛機制の結果として、問い合わせしてきた相手を逆恨みして良くない行動に出る可能性すらあるため、他の管理者による監視をお願いしている次第である。なお、今の私の言い回しにオン・ハンや足利義昭を批判するチンギス・ハーンや織田信長のネチネチした言い回しの既視感があるのは、成吉思汗実録や信長公記などの入力作業をした影響もあるだろう。P9iKC7B1SaKk (トーク) 2024年2月2日 (金) 16:13 (UTC)


私は「Wikisource:井戸端/Archive9#機械翻訳の濫用?」で賛成票を投じた人と、会話が成立しないことに気づくのに時間がかかった。実現不能なことを可能と決めつける針小棒大な議論をやめさせるべく反論した私のほうが、逆に針小棒大であるとしてブロック依頼が出されて今に至る。論理的思考力の問題により自己批判の視点を持てない人ばかりが掲示板の古株住人として残り、常識的な感性の人が疲弊して去っていく現象が起きている。これは性格の問題ではなく認知能力の問題であるという点を理解しておく必要がある。心を入れ替えたところで文章力や数学力が向上しないことと同じ問題。P9iKC7B1SaKk (トーク) 2024年2月2日 (金) 14:28 (UTC)


日本語版ウィキソースはコミュニティ住民の入れ替えが必要。気持ちや心がけの問題ではなく認知能力の障害がもたらす問題なので、話し合いだけでは解決できない。P9iKC7B1SaKk (トーク) 2024年2月2日 (金) 05:55 (UTC)


発達障害の人が、素早く入力できる健常者に対して嫉妬心や焦りを抱くのはあるていど理解できる。健常者のように効率的に作業できない鬱屈が常に発達障害の人の心にあり、他人の作った記事を削除することで鬱憤を晴らしたいのかもしれないが、他人の記事の削除などという陰湿で無礼なことに情熱を傾けるべきではない。P9iKC7B1SaKk (トーク) 2024年2月1日 (木) 10:08 (UTC)


発達障害の人は一旦こうと決めてしまうとそれ以外の考え方をできないため、反論を侮辱と受け取りやすく論理的な対話が困難なことが多い。また、時系列順に物事を並べることが苦手なため、何カ月も前に書かれた解決済みの他人の過去の言葉を読んで怒りに火がつくなどして他人とトラブルになりやすい。そういう人も個性として可能な限り尊重してあげたいのだが、本人が私を排除すべく攻撃的な言動をしてきた場合は対応せざるを得ない。本当に残念なことだ。ウィキソースは、書き写しや校正に論理的思考力がほとんど必要ないため、発達障害の人にとっても居心地の良い環境といえる。居場所があるのは良いことといえる。議論や複雑な判断など論理的思考力が必要な時にもめ事が起きてしまうが、本人が発達障害であることを他ユーザーが事前に知っていれば、もめ事を回避できるかもしれない。P9iKC7B1SaKk (トーク) 2024年2月1日 (木) 09:09 (UTC)


国民文庫刊行会 編『雑史集』(「テンプレート:NDLJP1906666」に相当)は、ルビが多いためNDLOCRの精度が低くく入力・校正の負担が大きいのだが、比較的史料価値が高いとされる作品が多いので、普段はあまりやらない校正を優先的にやっておく。P9iKC7B1SaKk (トーク) 2024年1月30日 (火) 15:56 (UTC)


国民文庫刊行会 編『雑史集』の全テキストをWikitext化したところ、テキストサイズが自分の入力作品で最大の1742KBとなった。「聚楽物語」は秀次事件を詳細に記した作品としては「近世軍記 (国枝清軒)」に続けて二回目となった。聚楽物語と近世軍記は事件の詳細を記述しているにもかかわらず「畜生塚」という単語は出てこないのだが、なぜか「三河物語」には「畜生塚」という単語が出てくる。聚楽物語と近世軍記は「畜生塚」に蔑称の語感があるとみなして記すのをはばかったのだろうか。 P9iKC7B1SaKk (トーク) 2024年1月27日 (土) 07:24 (UTC)


テンプレート:NDLJP3441711テンプレート:NDLJP3441726でテキストのテンプレート化を試してみた。テンプレートは他ページを使ったプレビューができるので、標準名前空間よりも修正作業が少し楽。続々群書類従の4作品については調査をがんばるとかえって首が締まる予感しかないので、Unknownテンプレートを貼りつけたまま放置したい。扨、百田氏がガン宣告されたとの由。『モンゴル人の物語』完結させてほしい。P9iKC7B1SaKk (トーク) 2023年12月29日 (金) 03:22 (UTC)


「続々群書類従」を底本とする4作品を即時削除に申請した。おそらく「続羣書類従」も同様の著作権問題を抱えている。「謙信家記」と同名作品が収蔵されている先日も触れた「続群書類従 第21輯ノ上 合戦部 https://dl.ndl.go.jp/pid/936494/1/1 」は、公開範囲が「インターネット公開(裁定)」となっている。黒川真道氏は大正5年(1916年)出版の「越後史集 天」解題で「謙信家記」について「此の書、続羣書類従第六百四に収めたれども、未だ出版に至らず。」と記している。インターネット・アーカイブの奥書画像によれば「『続羣書類従』第21輯 上 (合戦部)」は大正12年(1923年)出版とされているが、その出版物は日本国内では著作権が有効ということになる。 P9iKC7B1SaKk (トーク) 2023年12月15日 (金) 20:22 (UTC)


甲乱記」を作成。当初、インターネットアーカイブの「続群書類従 第21輯ノ上」 https://archive.org/details/p1zokugunshoru218800uoft/ を一冊丸ごとWikitext化する計画だったが、同書が国立国会図書館デジタルコレクション https://dl.ndl.go.jp/pid/936494/1/1 にもあり公開範囲が「インターネット公開(裁定)」とされていたので日本国内の著作権に抵触する恐れがあり断念した。代替として国史研究会の「武田三代軍記2」 https://dl.ndl.go.jp/pid/948812/1/1 に合刻されている「甲乱記」をWikitext化したのが経緯。国史研究会の「武田三代軍記2」は公開範囲が「インターネット公開(保護期間満了)」なので問題なし。 P9iKC7B1SaKk (トーク) 2023年12月13日 (水) 16:42 (UTC)


現状のNDLOCRは「簗」という字が「築」として誤検出される確率が高いらしい。これは桶狭間の戦いで一番手柄をあげた簗田氏が人知れずWeb検索から除外されている恐れがあることを意味する。人名・地名など固有名詞のOCR誤検出による誤字は、見つけ次第直すように心がけたい。P9iKC7B1SaKk (トーク) 2023年12月5日 (火) 11:20 (UTC)


ウィキソースの検索結果『「をなして、年若なる deepcat:越後史集」の検索結果 - Wikisource』で「(カテゴリ 1916年)」として表示される現象はダブルクォートで括った『「"をなして、年若なる" deepcat:越後史集」の検索結果 - Wikisource』では起きていないので、形態素解析で分割された検索キーワードのいくつかが、{{PD-old-auto-1996}}のWikitext展開後の文字列にヒットし「(カテゴリ 1916年)」とみなされたされたものと思われる。『「をなして、年若なる deepcat:中国」の検索結果 - Wikisource』で他作品も同じようにカテゴリが表示されるので、検索の仕様であり特に問題なしと判断。 P9iKC7B1SaKk (トーク) 2023年12月3日 (日) 13:46 (UTC)


越後史集 天」群書を作成。ヘッダーに記述するための書誌情報を探していて、そのうちのいくつかの川中島合戦関連の文書が偽書(令和3年4月の読売新聞コラム)らしきことを知る。以前、勝海舟の「氷川清話」が青空文庫で校正中のまま10年寝かされているのが気になって、自分が先にウィキソースにあげてやろうかと適した底本を探していたところ、編者の吉本襄が勝海舟の談話を剽窃・改竄した代物であることがわかり、ウィキソースにあげる価値なしとして断念したことがあったが、今回の上杉家関連文書はどこがどう偽書なのか確認するためにもウィキソースにあげる価値ありと判断した。 P9iKC7B1SaKk (トーク) 2023年11月26日 (日) 21:01 (UTC)


以前「テンプレート・トーク:New_texts」でPage名前空間ページと同じ校正状態管理機能を標準名前空間ページに導入すべきと主張したが、これはユーザー翻訳物の校正状態管理機能にも利用できる。翻訳は日本語訳の底本がない以上は、そのままIndexやPageによる校正機能を使えないので(翻訳の校正に使えないこともない)、標準名前空間ページにも校正状態を追加するほかない。また、ウィキソースのキーワード検索には校正状態を条件にして絞り込むクエリ機能は存在しないため、すでにウィキソースの機能として「カテゴリ:校正状態別のページ」のように校正状態がカテゴリ分類されているが、良質なユーザー翻訳と低質なユーザー翻訳の選別を行うのもカテゴリによる分類が適している。以前述べたように、英語版や中国語版には、Translation名前空間が存在しているが、ユーザー翻訳の品質を管理する機能はないため、結局カテゴリでふるい分けするしかない二度手間となる。「deepcat」クエリの前にハイフンをつける「-deepcat」クエリによってカテゴリを除外できるが、名前空間でそのようなことはできない。このTranslation名前空間の二度手間感は、作者名前空間の二度手間感とよく似ている。P9iKC7B1SaKk (トーク) 2023年11月23日 (木) 11:09 (UTC)


標準ページ、Pageページ、利用者ページなどもテンプレートやモジュールのように別ページでプレビューできるようにして欲しいのと、Lintエラーをプレビュー時に確認できるようにして欲しい。現状は、変更をいちいち保存しないと結果を確認できないので、たやすくログが埋め尽くされてしまい、保守の点からもよろしくない。P9iKC7B1SaKk (トーク) 2023年11月22日 (水) 21:17 (UTC)


三壺聞書」を作成しました。校訂者が1946年死去で著作権の説明が必要と思われたため、トークに書き込まないとする自主ルールの例外として「トーク:三壺聞書」を開設しました。P9iKC7B1SaKk (トーク) 2023年11月21日 (火) 19:30 (UTC)


ウィキメディアの同タイトル貴重書の挿絵だけを転載した「軍用記」と同じように、「北条五代記」でも各巻での表示を念頭に北条五代記第一巻の挿絵ページをギャラリー出力できないか試したのですが、サーバーの負荷が大きいらしくちゃんと表示されないことがあるようです。P9iKC7B1SaKk (トーク) 2023年11月20日 (月) 00:06 (UTC)


ブロック賛成票を材料にして私に意見の変更を強要するユーザーがいるようです。井戸端に私に対する婉曲な侮辱表現を投稿しているようなので、言動がさらにひどくなるようであれば、他の管理者に対応をお願いしなければならなくなるかもしれません。P9iKC7B1SaKk (トーク) 2023年11月19日 (日) 13:43 (UTC)


東アジア三か国でなぜ日本語版ウィキソースだけが突出して作品数が少ないのかを考えると、ルビと旧字と変体仮名に原因があるものと思われます。公的機関の文書や翻訳物を除けば、ウィキソースにあげることのできる日本語の作品は、戦前のものばかりなので、旧字が必須になります。旧字や異体字を現代人が読みやすい文字に置き換えるには、Javascriptなど各種ツールを使ってWikitextそのものを常用漢字にして保存するか、HTML生成時に常用漢字に置き換えるかの二択になります。私は底本テキストに対する改変をなるべくしたくなかったので、後者の解決策として「モジュール:CharacterJPN」を用意しました。以前、他のユーザーさんにトークで「陳」の校正について話しかけたことがありましたが、これは修正すべきか考える労力と時間がもったいない、という実利的な話でした。作業効率を上げるには、いちいち考える時間を減らす必要があります。NDLOCRが出力している旧字テキストをベースに作業をするには、手作業で新字変換せずに変換ツールに丸投げするのがやはり楽です。いかにしてウィキソースの入力効率をあげることばかりを考えていた・いるので、他のユーザーさんと見えている世界が違っているかもしれません。P9iKC7B1SaKk (トーク) 2023年11月18日 (土) 10:29 (UTC)


今にして思えば、誘導という意味ではWikisourceリンクをJOT Newsさんに提案してもよかった。「w:延暦寺」に「徒然草_(國文大觀)#文保3年園城寺焼き討ち」へのWikisourceリンクを張ったり、「w:風林火山」に「孫子_(武經七書)#風林火山」へのWikisourceリンクを張ったように、「w:イスラム銀行」などにクルアーン該当箇所へのWikisourceリンクを貼って誘導するのが、むしろ自然に思える。自分が入力した作品にアンカーを勝手に埋め込まれて不快に思うかたもいるかもしれないが、アンカー設置は、見た目や検索結果に影響を与えるわけではないので許容してもらいたいところ。P9iKC7B1SaKk (トーク)


https://wikisource.org/wiki/Main_Page に各言語のウィキソースがリストアップされており、日本語ウィキソースは収容作品数において二番手クラスの「10,000+」に甘んじています。現時点、日本語版ウィキソースの作品数は14,175ですが、漢字文化を共有する中国語版は452,931、韓国語版は23,267で、日本語版が三か国中最下位であり、人口比で考えればさらに記事数の格差は大きくなります。品質が大切とはいえ、低質な作品を減らすことに注力しすぎれば、作品数の格差はますます広がります。ちなみに英語版や中国語版は、名前空間が日本と少し異なっており、PortalやTranslationという名前空間があります。Translation名前空間にはユーザーによる翻訳作品が収納され、英語版中国語版ではすでに3000から4000件台のユーザー翻訳作品が存在します。既定の検索対象にTranslation名前空間が含まれるので、非ログインユーザーなど既定の設定では翻訳作品が検索にヒットします。翻って日本語版では「カテゴリ:ウィキソースによる翻訳物」に1200ほどの作品が存在します。英語版や中国語版に比べて総作品数に占めるユーザー翻訳作品の割合が高めなのは事実と言えます。P9iKC7B1SaKk (トーク) 2023年11月17日 (金) 23:51 (UTC)


以前、井戸端に書きましたが、カテゴリページはある程度ユーザーの自由裁量でページを編集できる貴重なページなのでもっと手の加わったカテゴリページがあってもよいかと。今にして思えば、JOT Newsさんは各作品に「金融」カテゴリを追加するのではなく、逆に「カテゴリ:金融」ページに便乗する形で主観的な作品リンクリスト集を追記していれば、よほど内容がひどくない限りそのまま続けることができたと思います。カテゴリページは検索対象にされにくいので、他の人への実害はほぼありません。手作りの作品リンクリスト集という点ではPortalページにすでに役割ありますが、Portalページは標準名前空間の検索対象になるのであまり主観的な編集をすると問題があります。そんなわけでカテゴリ:甲陽軍鑑に文字通りバナー(banner)を貼りつけてみました。最初は武田神社の画像を貼りつけていたのですが、見づらいだけなのでやめた経緯があります。 P9iKC7B1SaKk (トーク) 2023年11月16日 (木) 10:21 (UTC)


モジュール:CharacterJPNに関数replace_kanji_number_to_arabicを追加しました。引数trimfirst=1の場合は最初の漢数字だけを数値に置き換えるので、サブページのタイトル文字列に含まれる漢数字を算用数字換算のソート順番付けとして使いたい時などに有用です。 P9iKC7B1SaKk (トーク) 2023年11月15日 (水) 08:51 (UTC)


こまかい確認はまだだが、とりあえずブロック開始前に「甲陽軍鑑」をあげることができた。この作品はサブページが多いので「カテゴリ:甲陽軍鑑」に入れることで、各種カテゴリページが甲陽軍鑑サブページで埋め尽くされるのをなるべく抑えることができたはず。 P9iKC7B1SaKk (トーク) 2023年11月14日 (火) 10:38 (UTC)


破壊行為との直接表現を避ける目的で婉曲表現としてバンダリズムが採用されても、それを侮辱と受けとめる人がいれば、バンダリズムの意味は変わっていく。同じようにサッカーのファールを婉曲表現としてバンダリズムの代替として導入したとしても、ファールには「罪」という意味があり、バンダリズム以上にファールに強い批判性に感じる人も多く出てくるだろう。井戸端への最後の書き込みとして「持続困難」を提案した。「持続困難」で傷つく人が出たらまた新しい表現を考える必要があるだろう。今後は井戸端や他人のトークに書き込むことは一切せず、作品入力に専念します。 P9iKC7B1SaKk (トーク) 2023年11月14日 (火) 03:13 (UTC)


コンピューターから頻繁にviolationと警告されることに慣れた情報系の人と、お縄を頂戴するほうの深刻なviolationに慣れた金融系の人とでは、同じviolationという単語でも見えている世界が違ってくる。ここのコミュニティは後者に近い感じがする。他の国のウィキソースコミュニティはどうなのだろうか。 P9iKC7B1SaKk (トーク) 2023年11月13日 (月) 16:16 (UTC)


「セッ○スは生々しくて侮辱的だから使うな、まぐ○いと呼べ」という感じの不思議な感覚。ま○わいが生々しいのでやんわり表現するためにマナーや婉曲表現として使っていたであろうカタカナ語のセッ○スが、特定の言論空間ではむしろ侮辱になりうるという不思議な感覚。慣れなければ。 P9iKC7B1SaKk (トーク) 2023年11月13日 (月) 15:40 (UTC)


機械翻訳された作品を削除したいのであれば、削除候補をリストアップする既存または新規の仕組みをまず利用すべきなのに、そういった提案がまったく無視されるばかりか、すぐに削除できるようにしたいあまり「一般論としての機械翻訳がいかに問題か」という証拠を積み上げる方向で話を進めようとしていることに懸念を抱かざるを得ない。コミュニティが正常な判断力を保てていない証左に思える。井戸端に書き込むと荒らしと思われてしまうだけなのでここに書く。 P9iKC7B1SaKk (トーク) 2023年11月13日 (月) 13:08 (UTC)


ログに必ずコメントを残すのはバージョン管理システム上で共同作業を行う時のイロハのイなのですが、日本語版のWikipediaやWikisourceで誰もログにコメントを残していないのは、コミュニティが実社会でそういった経験が乏しい人ばかりであることが察せられます。テンプレートやモジュールを自分で作ろうとする人が自分以外ほとんど見当たらない理由がわからなかったのですがこれで合点がいきました。それはさておき、先月下旬以降しばらく作品への書き込みがとまっていたのは怠けていたのではなく、ローカル環境でわりと大がかりな作品に取り組んでいたからでした。今週中にあげる予定です。さてまた、コミットログを読んで激昂する人に実社会で出会ったことがなかったので困惑しましたし、あろうことか日本語ウィキソースの管理者まで担当しているというのが驚きでした。今後どうなるのかわかりませんが、皆様のご活躍とますますの発展をお祈りいたします。 P9iKC7B1SaKk (トーク) 2023年11月13日 (月) 10:18 (UTC)


絵文字は、ウィキペディアやウィキソースでほとんど使われない文字であり、目立ってテキストに埋もれにくいので、テンプレート実装やテストによく使っています。 P9iKC7B1SaKk (トーク) 2023年10月28日 (土) 05:53 (UTC)


テーブルを使わずに項目を規則的に並べる「テンプレート:Flex」を作成し早速「邦文日本外史」に導入しました。最終巻の「卷之廿二 德川氏正記德川氏五。」がいい感じにシメになって、パクス・トクガワーナ感が出ていて我ながら気に入りました。 P9iKC7B1SaKk (トーク) 2023年10月22日 (日) 02:08 (UTC)


江戸時代の武家故実書『軍用記』を作成しました。例によってWebブラウザで検索しやすいよう旧字版と新字版の両方を作りました。底本は活字のみで挿絵が一切ないので「c:Category:軍用記」にあげられていた『軍用記』の挿絵を「テンプレート:Css image crop」経由で利用させてもらいました。 P9iKC7B1SaKk (トーク) 2023年10月20日 (金) 15:01 (UTC)


ウィキペディアの各記事にウィキソースへのリンクを貼る作業が思いのほか楽しくつい色々貼りつけてしまいました。ウィキペディアでの私の所業については「w:ja:特別:投稿記録/P9iKC7B1SaKk」でご確認いただけます。とくに「北条五代記」は後北条氏と関係ない小ネタが載っていてリンクの貼り甲斐がありました。 P9iKC7B1SaKk (トーク) 2023年10月13日 (金) 06:49 (UTC)


後北条氏の物語「北条五代記」を作成しました。全テキストサイズは800KB強だったのでひとつのページでいけると思ったのですが、ルビが全部で19814個あることなどが原因でテンプレートサイズの制限にひっかかったので、原書と同じ十巻に分冊化しました。ルビだけ比較するならウィキソースでルビが一番多い「河底の宝玉」の22269個よりも少ないのですが、他の要因が加わってテンプレートサイズの制限に達したものと思われます。 P9iKC7B1SaKk (トーク) 2023年10月12日 (木) 03:21 (UTC)


『続々群書類従』第十二を底本とする「吉利支丹物語」を作成しました。キリスト教に強い関連がある作品ですがキリスト教そのものの文書ではないため、「悪魔 (芥川龍之介)」と同様、カテゴリ:キリスト教には追加していません。 P9iKC7B1SaKk (トーク) 2023年10月4日 (水) 11:13 (UTC)


『続々群書類従』第十を底本とする「朝倉宗滴話記」、「北条幻庵覚書」、「黒田家老士物語」を作成しました。いずれも新字版のみとしました。Wikitextそのものは旧字で記述しましたが、他作品同様「モジュール:Remix」経由で新字でHTML出力しています。 P9iKC7B1SaKk (トーク) 2023年10月3日 (火) 02:33 (UTC)


せっかくなので「利家夜話」と同じ底本『利家夜話 : 三巻,微妙公御夜話,命期集 : 一名・貞山公行状』に掲載されていた著者不明の伊達政宗晩年の言行録「命期集/国史研究会」、「命期集」を作りました。てっきり軍記物かと思っていたのですが、ただただ晩年の平和な文化人・趣味人としての伊達政宗の姿が描かれていたので、カテゴリは随筆にしました。日本語版Wikipediaトップページによると本日9月30日は織田信長による比叡山焼き討ちがあった日らしいので、何かの縁と思い「w:延暦寺」に「徒然草_(國文大觀)#文保3年園城寺焼き討ち」へのWikisourceリンクを張っておきました。 P9iKC7B1SaKk (トーク)


モジュール:Remix」と「モジュール:CharacterJPN」の汎用性確認を兼ねて「利家夜話/国史研究会」、「利家夜話」を作ってみました。この作品は国立国会図書館デジタルコレクションのOCRテキストがかなり正確だったので、サクサク入力できました。楽に入力できた副作用でかえって私のチェックが甘くなっているかもしれません。 P9iKC7B1SaKk (トーク) 2023年9月29日 (金) 04:28 (UTC)


織田信長の一次史料である信頼性の高い伝記とされる『信長公記』をPDFで公開していたWebサイトが閉鎖されたらしく残念の極みだったのでウィキソースに作りました。当初は原書と同じ16巻に分冊化つまりサブページ化するつもりだったのですが、テキストサイズは500KBもないので一つのページにしました。底本に近い「旧字版・信長公記」のほかにWebブラウザで検索しやすいよう「新字版・信長公記」も設置しました。「モジュール:CharacterJPN」を使って新字にしています。「モジュール:音訳蒙文元朝秘史🛐阿備巴備」から分離独立させた新モジュール「モジュール:Remix」を使って底本の改行位置を維持したまま入力・校正できるのは便利です。校正の負担が減ります。 P9iKC7B1SaKk (トーク) 2023年9月26日 (火) 06:50 (UTC)


日本語環境固有の文字処理を提供するモジュールがなかったので「モジュール:CharacterJPN」を作りました。関数kanji_old2newは、テキスト中の旧字を動的に新字に置き換えます。底本に近いオリジナルの異体字版テキストを維持したまま平易化版テキストを動的に作りたい時に役立つかと思います。今のところ「モジュール:CharacterJPN」には旧字を新字に変える関数kanji_old2newがあるだけで、変体仮名などの平易化に対応する関数はありません。 P9iKC7B1SaKk (トーク) 2023年9月23日 (土) 01:39 (UTC)


底本の改行位置を残したまま行結合する機能を強化し、CJK文字や全角英数記号に加えてルビテンプレートRubyにも対応しました。サンプルは「bindCJKテスト」です。「Wikisource:井戸端#底本の改行位置を維持したまま文を結合してHTML表示する機能」にも書きましたが、試験導入した「邦文日本外史/卷之廿二」の該当ページを校正する方は可能な限り底本の途中改行を維持するようお願いします。 P9iKC7B1SaKk (トーク) 2023年9月10日 (日) 02:47 (UTC)


テンプレート:Foreach」を作りました。与えられた値を順番に処理するテンプレートです。 P9iKC7B1SaKk (トーク) 2023年9月8日 (金) 21:23 (UTC)


モジュール:音訳蒙文元朝秘史🛐阿備巴備|conjure」を「テンプレート:Conjure」に置き換えるとテンプレート読み込みサイズが制限値を越えるページがいくつか見つかったので、置き換え作業を行わないことにしました。 P9iKC7B1SaKk (トーク) 2023年9月8日 (金) 18:45 (UTC)


テンプレート:Conjure」を作りました。モジュール:音訳蒙文元朝秘史🛐阿備巴備|conjure」を直接呼び出しているページをこの「テンプレート:Conjure」呼び出しに置き換える予定です。 P9iKC7B1SaKk (トーク) 2023年9月8日 (金) 16:31 (UTC)


テンプレート:Demoshow」を作りました。数値文字参照だけでなく全角文字からの変換を可能にしたことで視認性の高いWikitextの説明支援テンプレートになったと思います。 P9iKC7B1SaKk (トーク) 2023年9月8日 (金) 02:25 (UTC)


モジュールに渡す引数を<nowiki>...</nowiki>タグで囲むことで処理前のwikitextをそのまま渡せないか試したのですが、<nowiki>...</nowiki>で囲まれたデータはサーバー側で保護された識別子で渡されてモジュール側で利用できないため断念します、…というか以前にも試してその時も断念したような気が。 P9iKC7B1SaKk (トーク) 2023年9月7日 (木) 19:59 (UTC)


いろいろ変えて作品ページからヘッダーだけを抜き出す「テンプレート:Copyheader」の信頼性をあげました。「テンプレート:Inheritcat」にせよ「テンプレート:Copyheader」にせよ「モジュール:音訳蒙文元朝秘史🛐阿備巴備|conjure」をテンプレート内で呼んでいるのですが、いずれ別のモジュール、具体的には巨大な関数summonを除いた軽量な新モジュールに置き換えます。今のところモジュール名は「Remix」にする予定です。「Wikisource:井戸端#底本の改行位置を維持したまま文を結合してHTML表示する機能」でモジュール名や要望を受け付けていますので、意見のある方はぜひご提案ください。 P9iKC7B1SaKk (トーク) 2023年9月6日 (水) 18:49 (UTC)


作品ページのヘッダーを拝借して貼りつける「テンプレート:Copyheader」を作りました。「カテゴリ:史記」などの作品用カテゴリで用いることを想定しています。それはさておき、中国語圏から日本語版ウィキソースにアクセスしてもらうために「校正増注元親征録」にリンクするWikisourcelangを中国語版ウィキペディアの「w:zh:成吉思汗」に貼りつけたのですが、成吉思汗の誕生日をめぐって編集合戦が行われていて困惑。 P9iKC7B1SaKk (トーク) 2023年9月4日 (月) 20:33 (UTC)


2023年9月1日 (金) 09:39(UTC)時点で「カテゴリ分類されていないページ」が895件あったのですが、カテゴリ追加して減らしてみました。キャッシュが更新されるまで情報は古いままです。Wikisource:井戸端にも書きましたが、「テンプレート:InheritParentCategory」を「テンプレート:Inheritcat」に名称変更しました。他のテンプレートと命名規則を合わせるためです。サブページにいちいちカテゴリ貼りつけをしたくないときは便利と思います。 P9iKC7B1SaKk (トーク) 2023年9月3日 (日) 11:40 (UTC)


特別:カテゴリ未導入のページ」でカテゴリ分類されていないページにカテゴリを追加する作業をやっていますが、DEFAULTSORTなどをちゃんと設定しないと漢数字順に正しく並ばないので必須と今さら納得。青空文庫についてはウィキソースの趣旨にあう作品はすでに他のかたがインポート済みなので、急ぐ必要ないかなという感じです。 P9iKC7B1SaKk (トーク) 2023年9月2日 (土) 09:08 (UTC)


Wikisource:井戸端#サブページを含む作品のカテゴリについてにも書きましたが、「テンプレート:InheritParentCategory」を作りました。サブページのカテゴリ割り当て作業が楽になると思います。 P9iKC7B1SaKk (トーク) 2023年8月31日 (木) 20:12 (UTC)


サブページのカテゴリを自動設定する「テンプレート:Inherit categories」を「モジュール:音訳蒙文元朝秘史🛐阿備巴備|inherit_categories」のラッパーとしてひとまず作ってみます。このページも何度かテストのために書き変わります。 P9iKC7B1SaKk (トーク) 2023年8月31日 (木) 15:14 (UTC)


数時間前までテンプレートが「カテゴリ:ヘルプ」からの「deepcategory:ヘルプ」検索にまったくヒットしなかったのですが、今調べたらテンプレートがちゃんと「deepcategory:ヘルプ」でヒットしました。一週間も待たなくて良いようです。 P9iKC7B1SaKk (トーク) 2023年8月29日 (火) 09:17 (UTC)


テンプレートが「カテゴリ:ヘルプ」からの「deepcategory:ヘルプ」検索にまったくヒットしないのはどうも「WDQSのSPARQLカテゴリサービス」の仕様らしく毎週月曜にアップデートされるようです。折り悪くサーバー側でカテゴリのインデックス(?)をアップデートした直後に私のほうでカテゴリ編集したのかもしれません。以前「カテゴリ:日本の中世文学」がなぜか太平記のサブページにほとんど検索ヒットしない現象について触れましたが、きっと関係があるはずです。来週月曜を気長に待ちます。 P9iKC7B1SaKk (トーク) 2023年8月28日 (月) 17:50 (UTC)


まことに勝手ながら「ヘルプ:目次」にカテゴリ検索窓を追加しました。「Category:ヘルプ」は「Category:ウィキソース」に含まれるので、理想としては広範囲に探せる「Category:ウィキソース」でカテゴリ検索したほうが良いのですが、検索中にエラーが発生しました: Deep category query returned too many categoriesというエラーが出て検索に失敗するので、「Category:ヘルプ」以下を検索対象としました。また、Wikisource名前空間でヘルプ検索に相当すると思われるページとほぼすべてのヘルプ名前空間のページに「Category:ヘルプ」を追加しました。Wikisource名前空間のうち「Category:ヘルプ」に含まれないページは検索クエリ「-deepcategory:ヘルプ」で確認できます。 P9iKC7B1SaKk (トーク) 2023年8月27日 (日) 13:28 (UTC)


今さらかもですが、モジュールはリダイレクトできないという知見を得ました。「Wikisource:井戸端#底本の改行位置を維持したまま文を結合してHTML表示する機能」で話題にしていますが、トランスクルージョンや繰り返しの機能を持った新モジュールの名前を募集中です。 P9iKC7B1SaKk (トーク) 2023年8月27日 (日) 10:36 (UTC)


主なタグdiv,dl,ol,p,span,ulの規定のline-heightを2emにするスタイルシート「テンプレート:Ruby/line-height-2em.css」を作成しました。見た目の違いは「山月記」と「山月記へのline-height-2em.css適用サンプル」で確認できます。Windows版FirefoxなどWebブラウザのウィンドウの幅を狭くしてテキスト回り込みを多くすると、違いがわかりやすくなります。 P9iKC7B1SaKk (トーク) 2023年8月24日 (木) 13:44 (UTC)


HTML版の青空文庫を読んでいても内容が頭に入ってこない原因は何なのかを考えたところ青空文庫の問題ではなくルビで行間の大きさが変わるのが原因のひとつのようです。テストページ「line-heightテスト」を作って試したところ行間の大きさが変わる現象はWindows版Firefoxで顕著であるとわかりました。macOS版Safariはfont-sizeが小さい時にのみ顕著です。「line-height:2em;」とするのが確実なのかもしれませんが、Windows版Firefoxでのみ気になる程度なので他への影響を考えると何もしないのがよさそうです。P9iKC7B1SaKk (トーク) 2023年8月23日 (水) 18:51 (UTC)


ルビによるテンプレートサイズの限界を試したいという不純な動機により、Wikisource:WikiProject_青空文庫に参加することにしました。今のところ尾佐竹猛校訂『大岡政談』が75892個で青空文庫のルビ最大利用作品のようですが、尾佐竹猛は1946年10月1日没で95年ルールにより1929年4月15日発行の尾佐竹猛校訂『大岡政談』は来年2024年4月15日(月)まではWikisourceにアップロードできない計算になります。現在Wikisourceで最もルビが多いのは「河底の宝玉」の22269個で、青空文庫インポート作品で最もルビが多いのは「ロミオとヂュリエット」の12665個で、rubyタグを直接使っている作品でルビが多いのは「亜細亜諸国との和戦は我栄辱に関するなきの説」の1723個になります。 P9iKC7B1SaKk (トーク) 2023年8月22日 (火) 06:53 (UTC)


テンプレート:NDLJP」を使っている標準ページに「カテゴリ:国立国会図書館デジタルコレクション」を付与するようにしたのですが、テンプレート:NDLJPを使っていない標準ページを探す「検索クエリ」で調べたところ現時点で「テンプレート:NDLJP」を使っている標準ページが602個で、使っていない標準ページが798個となっています。底本のURLリンクに「テンプレート:NDLJP」を使うように少しずつ変えていく予定です。 P9iKC7B1SaKk (トーク) 2023年8月18日 (金) 09:55 (UTC)


成吉思汗実録/序論」の系図「Page:成吉思汗実録.pdf/27」をspanではなくdivで囲むことでnowrap対応しました。Pageのプレビューでは確認しきれないため変更をいちいち公開せねばならず、少々不便。テンプレートやモジュールのように他ページを使ってプレビューできれば良いのですが。P9iKC7B1SaKk (トーク) 2023年8月16日 (水) 04:14 (UTC)


成吉思汗実録/序論」の系図「Page:成吉思汗実録.pdf/27」がスマホなど横幅の狭いデバイスで行中折り返しするのを防止するためにnowrapにしたところ、今度はnowrapでWebページの横幅が大きくなった分だけスマホでのWebブラウザ表示の初期サイズが小さくなり、標準名前空間ページでの背景色などの見た目が不格好になったので元に戻しました。とほほ。 P9iKC7B1SaKk (トーク) 2023年8月14日 (月) 17:22 (UTC)


カテゴリ:中国」を「ウイグル」でカテゴリ検索すると「成吉思汗実録」がやたらとヒットするので原因を調べたところ、「カテゴリ:中国」が「カテゴリ:訓読漢文」の三つほど上の上位カテゴリだったことが原因でした。「カテゴリ:訓読漢文」は返り点{{}}などの訓点テンプレートを使うと付与されるので、「カテゴリ:中国」を「ウイグル」でカテゴリ検索すると「成吉思汗実録」がヒットするのは正常な動作です。検索に関するユーザー個人設定とは別に検索対象を標準名前空間のみに絞ってdeepcategory検索する{{カテゴリ検索}}の機能はわれながら便利だなと思った次第。P9iKC7B1SaKk (トーク) 2023年8月14日 (月) 03:30 (UTC)


検索パラメータ「deepcategory:」を使った{{カテゴリ検索}}で「太平記」の検索ヒット具合を調べているのですが、「カテゴリ:太平記」の上位カテゴリにあたる「カテゴリ:日本の中世文学」と「カテゴリ:軍記物語」のうち「カテゴリ:日本の中世文学」がなぜか太平記のサブページにほとんど検索ヒットしない現象が発生していたのですが、今試すとちゃんと太平記のサブページが検索ヒットしました。検索インデックスのようなものが時間をおいて更新されていたのかもしれません。とりあえずなにより。P9iKC7B1SaKk (トーク) 2023年8月14日 (月) 02:29 (UTC)


ルビ{{Rbcmnt2}}のスタイルシート「Rbcmnt/bi.css」に@mediaとメディアクエリを使ったiPhone環境でのフォントサイズ拡大を追加しましたが、AndoroidだけでなくiPad Proなど画面の大きいスマホやタブレットをまったく網羅できていません。metaでviewportが有効になる機能がかえって仇になった感じで、どこまで続くぬかるみぞ、と言ったところです。 P9iKC7B1SaKk (トーク) 2023年8月12日 (土) 04:49 (UTC)


ルビ{{Rbcmnt2}}をiPhoneでデスクトップ表示すると、文字が小さくなってしまう。display: inline-blockを使った時に起きる。モバイルの時だけ特定cssを使えないか調べましたが、Wikisourceでは対応していない模様。あきらめてこのままとします。それはさておき、句読点のない白文の漢文の読み下しの難しさに閉口しています。 P9iKC7B1SaKk (トーク) 2023年8月6日 (日) 16:38 (UTC)


ゴミ拾いをやっているそばでゴミを捨てる人をみたらさすがにムッとする人が多いはず。ゴミを捨てる側に悪気はなく、むしろゴミ拾いという娯楽を提供してあげている、ぐらいな感覚なのかもしれない。結局のところ直接言わないと改まらない。態度で示すだけでは正しく伝わらないばかりか逆に受け取られることさえある。 P9iKC7B1SaKk (トーク) 2023年7月28日 (金) 16:40 (UTC)


モジュール:音訳蒙文元朝秘史🛐阿備巴備のconjure関数に、ヨーロッパ語のハイフン付き途中改行を除去する引数bindwestを追加しました。底本の改行位置情報を損なうことなくWikitext化できるのは底本と照合しながら校正するうえで大きな利点だと思います。 P9iKC7B1SaKk (トーク) 2023年7月26日 (水) 21:55 (UTC)


Firefoxでばかり作業していたせいでChromeやEdgeの挙動確認がほったらかしでした。Wikitextの単純な改行の解釈がWebブラウザごとに異なるので、モジュール:音訳蒙文元朝秘史🛐阿備巴備のconjure関数に、CJK文字と全角英数で挟まれた改行を除去する引数bindCJKを追加しました。我ながら便利だと思います。bindCJK=1を指定すれば底本の改行位置情報を泣く泣く捨てる必要がなくなります。 P9iKC7B1SaKk (トーク) 2023年7月26日 (水) 08:04 (UTC)


{{Rbcmnt2}}が{{合字}}テンプレート「シテ」を含むルビを改行してしまうのは文字列「シテ」を囲むspanタグが原因のようです。
以下は「あい<span>うえ</span><span>お</span>」をルビにした場合の、{{Ruby}}、{{Rbcmnt}}、{{Rbcmnt2}}の表示例になります。
blockテキストがspan要素を勝手に改行させてしまうのを抑止するにはblockではなくinline-blockにして自分でルビ末尾改行する方法がありますが、それだとルビの中央揃えが効かなくなるので、今のままとします。

アイウエオあいうえ、​アイウエオ​​あいうえ、​あいうえ​アイウエオ​

Index:Hōbun Nihon Gaishi.pdf」の漢文部分の文字起こしはやらなくて良いらしいので、とりやめます。 P9iKC7B1SaKk (トーク) 2023年7月26日 (水) 03:51 (UTC)


校正増注元親征録』の作業が終わったので、次は「Index:Hōbun Nihon Gaishi.pdf」の漢文部分の文字起こしの手伝いでもやろうかと思います。「Wikisource:Google OCR」で指摘されているように次世代デジタルライブラリーに全文OCRテキストがすでにあり、Tesseract OCRやGoogle OCRよりも旧字の再現性が格段に高いようなので、使わない手はありません。『邦文日本外史』の場合は「邦文日本外史 - 次世代デジタルライブラリー」の「この資料の全テキストデータ」から邦文日本外史のOCRテキストをダウンロードできます。 P9iKC7B1SaKk (トーク) 2023年7月24日 (月) 08:35 (UTC)


校正増注元親征録』の書き込み開始は7月下旬以降としていたのですが、本物のページを使わずに複数ページを使うテンプレート(のように呼び出す通常ページ)の挙動を確認するのは限度があったので、予定より前倒しで書き込みました。テンプレートがちゃんと動いてくれたので、無事、百田尚樹氏の『モンゴル人の物語』よりも先に終えらせそうです。「テンプレート:Rbcmnt2」を使うとテンプレートサイズが大きくなるので本編を9分割しました。9分割したのは以下の縁起を担いだから、というのありますがテンプレートサイズの制約上7つ以上に分ける必要に迫られていたので、ちょうど良かったです。

九つ九つは、九九 八十一にあらず、九つづゝと云ふことなり。蒙古人は、九の數を尙ぶゆゑに、贈︀物にも九を用ふとは、阿不勒噶資の書にも見えたるが、元史にも、遼王 耶律 畱哥の寡婦 姚里 氏の太祖︀に謁︀したる時、人 馬 金 幣みな九つづゝ賜はれることを載せ、また高麗史 金就礪の傳にも、蒙古の元帥 哈眞より高麗の趙沖 金就礪 二將に少女 九人づゝ 駿馬 九匹づゝを遺れることを載せたり。…又 蒙古人の九を尙び白を尙ぶ風俗は、後世までも變はらずと見えて、蒙古 游牧記に「崇德 三年、喀爾喀 三汗、竝遣使來朝、各貢白馬八白駝一、謂之九白之貢、歲以爲常」とあり。

『成吉思汗實錄』 注「九を尙ぶ蒙古の俗」から引用

P9iKC7B1SaKk (トーク) 2023年7月19日 (水) 08:30 (UTC)


Wikitextは、難読化させるつもりがなくても、意図しないWikitext変換を回避するために改行を除去したり数値参照エスケープしたりするだけでたやすく難読化すると改めて実感。結果的に他の人が触りづらいテキストになってしまいます。数値でもアルファベットでもないASCII文字の多くがWikitextで特殊な意味を持っているゆえの宿命ともいえます。一般的な用途から外れたとたんに書きづらさ・読みづらさが劇的に増すのはスクリプト言語でも良くあることですが。P9iKC7B1SaKk (トーク) 2023年7月17日 (月) 02:33 (UTC)


『校正増注元親征録』の日本語訳がようやく一巡し終わり、改めて確認作業中です。現実問題として著名な漢和辞典といえども古典に出てこない中国語をあまり網羅できていないので、Webサイトの中国語辞典サービスを使うことがしばしばありました。一方、中国語から日本語への文章の自動翻訳はそのまま使えるものではなく参考になることもあるという程度でした。例えば、私のように中国語をあまり知らない人が「眼」を「穴」と訳すためには「眼」を辞書で調べる必要がありますが、「眼」は「目」のことだと決めつけてしまうと、辞書で調べるひと手間を怠ってしまいます。文章を丸ごと自動翻訳すれば「眼」を「穴」と翻訳してくれる可能性がわずかながらあります。『校正増注元親征録』をウィキソースに書き込むのは7月下旬以降になります。 P9iKC7B1SaKk (トーク) 2023年7月15日 (土) 00:36 (UTC)


合字テンプレートを使うとrbcmnt2ルビに改行が入ってしまう。要調査

林檎🍎葡萄​エキ𬼀​驛​🚴​エキシテ​驛​🍇​驛​​エキ𬼀🍋​驛​​エキシテ匍匐🍈

P9iKC7B1SaKk (トーク) 2023年6月28日 (水) 07:11 (UTC)


Wikisourceは複数のラベルを含むひとつの大きなWikitextのページを作って、適宜ラベル単位で抽出して利用すれば、一括編集とトランスクルージョンの良いとこどりができるようですが「## ○○ ##」でラベルにできるのはPage名前空間だけで、その他の名前空間では<section begin="○○" />と<section end="○○" />で正しく囲む必要があるので、編集ミスが起きやすそうな印象。Page名前空間にひとつの大きなWikitextとして保存しておくのがよさそうです。『校正増注元親征録』は7月下旬以降に完成の見込みです。日本語への翻訳作業はどうやら文章を書くための脳の部位を酷使するようで、SNSなどに駄文を書いてしまうのを抑える良い効果があるようです。 P9iKC7B1SaKk (トーク) 2023年6月15日 (木) 11:35 (UTC)


Wikisource:井戸端に残り続けていた話題「ご利用のウィキは間もなく読み取り専用に切り替えます」をアーカイブに移しました。いつまでも「閉店セール」を続ける怪しい店のような変な感じだったので。それはさておき那珂通世の『校正増注元親征録』を少しづつですが文字起こしと現代日本語訳をしています。少なくとも百田尚樹氏が週刊新潮で連載している『モンゴル人の物語』が完結するよりも前に終わらせてWikisourceにあげたいです。 P9iKC7B1SaKk (トーク) 2023年6月10日 (土) 15:33 (UTC)


改めて感じるのは、Indexとの結びつきを忠実に守るPage編集は作品の誤字を一括修正するのに向かないということ。修正したい各Pageをいちいち開いて編集するのは苦行に近い。あきらかに「音訳蒙文元朝秘史」の巻一~続集巻二のように一つのファイルにまとまっているほうが編集しやすい。『校正増注元親征録』は底本にルビがないので、テンプレートサイズの超過はないはず。ルビを使う現代語訳テキストを底本テキストと分離して管理するのがよさそう。底本テキストをたくさんのPageに分散させるのは一括修正の都合上あまり良くない。二つ三つ程度の巨大なPageテキストを作って必要個所をセクション指定で引っ張り出すような、IndexとPageが関連付けられた本来の使い方とは異なるPageの使い方をするのがよさそう。 P9iKC7B1SaKk (トーク) 2023年5月2日 (火) 12:46 (UTC)


那珂通世の『校正増注元親征録』を念頭にトランスクルージョンの「テストページ」を作ったのですが、pagesノードに余分な高さが紛れ込んでいます。以前の「音訳蒙文元朝秘史/序、凡例(英語)」では各Pageを逆方向に読み込んだせいか逆に高さが足りず改行を自分で書いて調節していたのですが、結局「モジュール:音訳蒙文元朝秘史🛐阿備巴備」のconjure関数を使って対処していました。親征録では底本にない現代語訳をセクションを使って挿入したいので、fromsection,tosection,onlysectionと同じ機能をconjure関数に追加する必要が出てきました。P9iKC7B1SaKk (トーク) 2023年4月29日 (土) 01:08 (UTC)


音訳蒙文元朝秘史s:ja:特別:LintErrors/misc-tidy-replacement-issuesでdiv-span-flipエラーがたくさん発生していたので修正。spanタグの中にdivタグがあったことが原因。総訳2行でdivとindentの使用をやめることで解決。原因調査に使わせてもらった1941HaseGenka.djvuも修正しました。 P9iKC7B1SaKk (トーク) 2023年4月18日 (火) 21:03 (UTC)


テストページを作らずに、このページの履歴機能だけでやりくりできないか試してみた。サンプルページが無駄にWikisourceサーバーの検索対象にヒットするのを避けるうえでも、履歴を使うやり方が有用に思える。「w:モジュール:Transcluder」のセクション抽出機能はテキスト全体を読み込んでstring.gsub()で正規表現による抽出をしている。正規表現パターンを直接渡す「音訳蒙文元朝秘史🛐阿備巴備|conjure」とコストはさほど変わらない。 P9iKC7B1SaKk (トーク) 2023年4月14日 (金) 23:24 (UTC)


display:inline-blockを使った両ルビ「テンプレート:rbcmnt2」を新規作成しました。テンプレートサイズが大きくならないよう、templatestylesの呼び出しを減らすことで、どうにか実用に耐えるものができたと思います。 i-PhoneやmacOSのsafariでもちゃんと両ルビ表示できていることを確認しました。「音訳蒙文元朝秘史🛐阿備巴備」の文字列置換関数conjureを使って、rbcmnt2を「成吉思汗実録」と「音訳蒙文元朝秘史」に全適用しました。 P9iKC7B1SaKk (トーク) 2023年4月11日 (火) 19:57 (UTC)


w:モジュール:Transcluder」を参考にしてトランスクルージョンを含むページをmw.title.new()→title:getContent()→mw.getCurrentFrame():preprocess()で返されたhtml文字列をmw.ustring.gsub()でルビ書式変換できないかと試してみましたが、pagesノードは“<div class="reflist" style=" list-style-type: decimal;"> ?'"`UNIQ--references-00000133-QINU`"'?</div>”という文字列に置き換わるだけで、ここではhtml展開されないようで、pagesノード部分を書式変換できないことがわかりました。残念。P9iKC7B1SaKk (トーク) 2023年4月7日 (金) 14:46 (UTC)


音訳蒙文元朝秘史」の巻一から続集巻二までがカテゴリ:75%に表示されない。 音訳蒙文元朝秘史をモジュールでpreprocess()した時はTextqualityテンプレート呼び出しするとincludeonlyノード内にある“[[Category:{{{1}}}]]”がスキップされるのかもしれない。P9iKC7B1SaKk (トーク) 2023年4月5日 (水) 21:35 (UTC)
→ 巻一から続集巻二までカテゴリ:75%に表示されていることを確認。時間が経って反映された? P9iKC7B1SaKk (トーク) 2023年4月7日 (金) 14:46 (UTC)


音訳蒙文元朝秘史」の巻一から続集巻二までのルビをrbcmntテンプレートから両ルビに変更しました。ただしトランスクルージョンを使って出力している「序、凡例(日本語)」などは従来どおりrbcmntテンプレートのルビです。テンプレートやモジュールから同一ページのrbcmntと両ルビを切り替える方法はなく別名ページにするしかなさそうなのですが、ルビ書式が違うだけの同内容ページが大量に作られるのはあまり好ましくないので、別名ページを作るのはひとまず避けることにしました。「成吉思汗実録」や「成吉思汗実録続編」については、このままrbcmntを使い続けることにします。トランスクルージョンで使うページを文字列データとして読み込んで🛐阿備巴備するには「w:モジュール:Transcluder」が参考になりそうですが、今回は深追いしないでおきます。 P9iKC7B1SaKk (トーク) 2023年4月5日 (水) 18:21 (UTC)


懲りずに両ルビ対応する方法を検討中。Firefoxでルビ検索やルビコピペできない欠点はあるものの、底本ルビ位置の再現性という点では、やはり両ルビのほうが優れています。利用者定義のURLクエリを受け取る仕組みがないので固定名の項目を新規作成するほかなさそう。両ルビ対応した場合にテンプレートの読み込みサイズが制限を超える項目は、成吉思汗実録/序論のほかに、成吉思汗実録/巻の六成吉思汗実録/巻の十一-1などがあるようです。 P9iKC7B1SaKk (トーク) 2023年4月1日 (土) 18:10 (UTC)


音訳蒙文元朝秘史」の校正が折り返し地点の巻六まで終わったのですが、まだ終わりそうになく、校正漏れもちょくちょく見つかる状態… P9iKC7B1SaKk (トーク) 2023年3月31日 (金) 11:41 (UTC)


両ルビ対応テンプレートrbcmntをユーザー環境に応じて処理分岐できないか調べたのですが、テンプレートとモジュールにはユーザー環境の情報を得る機能が皆無なので、断念しました。CSSやJavascriptはクライアント側のWebブラウザが管理することなので、Wikiサーバー側で動くテンプレートやモジュールからは見えないという当たり前な壁も存在しました。当初、テンプレート・トーク:Rubyでご紹介いただいたrubyタグによる両ルビを考えていたのですが、いざ「成吉思汗実録/序論」などでプレビュー表示するとなぜかテンプレート読み込みサイズが制限値を越えてしまうので、実装変更そのものを中断することにしました。

  • 予定していたテンプレート実装例:

{{#if:{{{1|}}}|<ruby style="ruby-position: over"><ruby style="ruby-position: under">{{{1|}}}<rt style="color:olive; font-size:small;">{{{3|}}}</rt></ruby><rt style="color:teal; font-size:small;">{{{2|}}}</rt></ruby>}}{{#if:{{{L|}}}|<sup>{{{L}}}᠋</sup>|}}{{#if:{{{R|}}}|<sub>{{{R}}}᠌</sub>|}}

  • 予定していた出力例:

帖木眞Temüžin人名

P9iKC7B1SaKk (トーク) 2023年3月24日 (金) 14:56 (UTC)


Wikipediaのヘルプ「ページサイズ」には「ページサイズは2,048キロバイトが上限」とあるが、「音訳蒙文元朝秘史」の分冊と一括編集を両立するモジュール「音訳蒙文元朝秘史🛐阿備巴備」は1,991キロバイト(残り57キロバイト)で収まった。 P9iKC7B1SaKk (トーク) 2023年3月19日 (日) 15:21 (UTC)


モジュールで分冊と一括編集を両立できないか調べたが、そもそもモジュールから出力される文字列はWikitext展開できないので、不可。 P9iKC7B1SaKk (トーク) 2023年3月13日 (月) 11:30 (UTC)
→ preprocess()を使えばWikitext展開できる P9iKC7B1SaKk (トーク) 2023年3月18日 (土) 18:19 (UTC)


分冊と一括編集を両立する方法を検討。→ 1300KB強のひとつのテンプレートとして統合し、各項目でテンプレート呼び出し時に引数に応じて切り出して表示できるようにしようとしたが、サイズが巨大すぎて構文解析に時間がかかるらしくエラーになってしまう。以下はエラー文言。利用者側でできることはもうなさそうので分冊と一括編集の両立は断念する。

Error
Our servers are currently under maintenance or experiencing a technical problem. Please try again in a few minutes.

Error: 500, Internal Server Error at Sat, 11 Mar 2023 14:46:30 GMT

P9iKC7B1SaKk (トーク) 2023年3月11日 (土) 14:59 (UTC)


テンプレート:Rbcmnt の文字列を左ルビでWikisource内検索できているか試すテスト
​曷思麥里​​喇失惕​​延袤萬里​ ​曷思麥里​​フスメリク​​fusumerik​ ​bogoruchu​​jerume​​muhuari​P9iKC7B1SaKk (トーク) 2023年3月5日 (日) 10:22 (UTC)


音訳蒙文元朝秘史へのリンクをWikisourceの項目に置き換えるテスト。
🟠テストここから🟠

§69(02:01:02)白鳥庫吉訳『音訳蒙文元朝秘史』(東洋文庫,1943年) Open original book in Wikimedia

🐑🐑🐑🐑

§112(03:20:03)白鳥庫吉訳『音訳蒙文元朝秘史』(東洋文庫,1943年) Open original book in Wikimedia

🐐🐐🐐🐐

§273(12:25:10)白鳥庫吉訳『音訳蒙文元朝秘史』(東洋文庫,1943年) Open original book in Wikimedia

🐏🐏🐏🐏
🟠テストここまで🟠
P9iKC7B1SaKk (トーク) 2023年3月5日 (日) 02:44 (UTC)


Unicodeにない外字画像を使うテスト。クリップボードにコピーした時に外字画像が代用組み合せ文字に置き換わるようにする。名前競合しないよう要注意。
🟡テストここから🟡
※[#「克+鳥」]※[#「克+鳥」]※[#「窟+鳥」]※[#「鼠+革」]※[#「翔のへん+圼」]かきくけこ
🟡テストここまで🟡
P9iKC7B1SaKk (トーク) 2023年2月28日 (火) 23:34 (UTC)


音訳蒙文元朝秘史」は字が大きいから楽だろうと思っていたら甘かった。縦に横書きされたアルファベットのアクセント記号を読まなければならないので「成吉思汗実録」のルビ並みに厄介。「成吉思汗実録」ではPDFサイズを150%表示で入力作業していましたが、「音訳蒙文元朝秘史」では180%表示にしてます。 P9iKC7B1SaKk (トーク) 2023年2月26日 (日) 23:53 (UTC)


音訳蒙文元朝秘史」の巻一の入力テキストがひとまずできたので、このページに張り付けてプレビューを確認してみたところテンプレートがサイズオーバーし巻一の49節中36節しか読み込めませんでした。「音訳蒙文元朝秘史」は「成吉思汗実録」よりも、全12巻すべてを3冊に分冊する必要がありそうです。「音訳蒙文元朝秘史」は「成吉思汗実録」と違って訳者注がないので、巻一から巻十二まで分量はほぼ均一でサイズ見積もりはしやすい。「音訳蒙文元朝秘史」は全12巻を3冊毎に分冊化した全36巻になる見込みです。ページのトランスクルージョンを使わず直接書き込むことで修正の手間を少しでも減らしたい。610ページに修正をかけるよりは36ページに修正をかける方がまだ気分的に楽なので。P9iKC7B1SaKk (トーク) 2023年2月22日 (水) 22:59 (UTC)


音訳蒙文元朝秘史は少しづつWikisource上に書き込む予定」としていましたが実際に始めていると、途中で広範囲にわたる間違いに気づいて修正する作業がかなり多いです。トランスクルージョンする作品だとPage単位の編集なのでかえって一括変換などが煩雑になります。やはり、実録のように完成度をあげてからまとめて書き込むほうが近道のようです。「音訳蒙文元朝秘史」は1ページ作るのに要する時間が「成吉思汗実録」の3倍以上かかる気がします。漢字音写という底本の性質上、使われる漢字は少ないので、習熟するほどに速度があがることを期待しつつローカルで作業中です。 P9iKC7B1SaKk (トーク) 2023年2月20日 (月) 14:52 (UTC)


目下、「音訳蒙文元朝秘史」の文字起こし中ですが、難易度は「成吉思汗実録」より高く、かなり時間がかかりそうな印象です。まとめて書き込んだ「成吉思汗実録」や「成吉思汗実録続編」とは手法を変え、「音訳蒙文元朝秘史」は少しづつWikisource上に書き込む予定です。 P9iKC7B1SaKk (トーク) 2023年2月17日 (金) 15:26 (UTC)


バベル利用者情報
jaこの利用者は日本語母語としています。
en-2This user is able to contribute with an intermediate level of English.
言語別の利用者
Fxこの利用者はMozilla Firefoxを使用してウィキソースに寄稿しています。
この利用者はウィキプロジェクト 青空文庫参加しています。