多色ハイライトと自然な単位の連携

このページでは多色ハイライトと自然な単位が連携することで、とある効果がノーコストで手に入ることを示します。多少冗長になっても正確さを重要視する文章、それが故に難解とされる文章に対しては絶大な効果があります。

連携

復習(多色ハイライト)

今回の話と関連する部分を復習します。

復習(自然な単位)

自然な単位も同様に、今回の話と関連する部分だけです。

第一の効果 - 違いの浮き上がり

等式の存在

最初に書いてしまいますが、

「自然な単位」=「基底語」+「限定子」

という関係があります。自然な単位全体はボールド強調されます。 そして「基底語」しばしば重要語として多色ハイライトされます。 するととある自然な単位の中でハイライトがかかっている部分と、かからない部分が発生します。 後者のかからない部分が「限定子」になります。 「限定子」が自動的に(影という形ではありますが)強調されます。

具体例1(似たような用語)

上は形式的すぎるので具体例を挙げます。 ボタンを押して切り替えてみてください。
ギミックボタン
効果を切り分けすると、以下の二つが重畳されています。
  1. ディスクゴルフフットゴルフ、などはいずれも名詞なので全てボールド強調されます。
  2. 基底語の「ゴルフ」、「Golf」が重要語としてハイライトされます


  3. 上の二つにより結果として、

  4. 〇〇ゴルフ」の「〇〇」が多色ハイライトの影の形で強調されます。
何も強調されていない初期状態と見比べてみてください。同じゴルフが列挙されていますが、それぞれがどう違うかが一目瞭然になります。

難解な文章との関係

「難解な文章」、この技術の説明で何度も出てきますが、正確さを重視して冗長さを厭わない系の文章とどこかで定義しました。そのような文章は省略を行わないので文章が長くなり同じ単語もたくさん並んで読みづらいです。また教科書だったり論文だったり法律だったり公文書だったりの内容を間違って解釈されては困る系の文章で、得てして内容も難しく読みづらいです。また上記分野は物事の理屈を説明する系の文章が多く、その場合には多色ハイライトの回で説明したように、「基底語」が何度も繰り返し出てきます。「基底語」+「限定子」も次の「基底語1」としてしばしば扱われ「「基底語」+「限定子」」 + 「限定子1」と再帰的にこの連鎖は続きます。同じ単語がたくさん並びます。その際に多色ハイライトだけでも基底語が割り出されて緩和されますが、自然な単位と合体すると「ハイライトのかかっていないボールド部」が自動的に「限定子」だと理解できます。(※)。

第二の効果 - 自然な単位カテゴリ内の第三勢力

(これは副次的な効果ですが、そこそこ大きな効果です) 自然な単位にハイライトが施されることで、以下の3つの部分が文章中に出てきます。 この2つ目、「ボールドあり && ハイライトなし」が、いい感じで浮かび上がってきます。 これは「自然な単位」だけ、ボールドだけを考えていた際には出てこない見え方です。 説明だけだと分かりづらいので、次に出てくる二つの具体例で確認してみます。

具体例2(Wikipediaの記事)

以下は「細胞膜」に関するWikipediaの記事の冒頭です。少しかじった人は読めるかもですが、門外にはちょっと難しい系の文章です。
0. 初期状態

細胞膜(さいぼうまく、cell membrane)は、細胞の内外を隔てる生体膜で[1][2]、タンパク質が埋め込まれた脂質二重層によって構成される。 形質膜や、その英訳であるプラズマメンブレン (plasma membrane) とも呼ばれる。 細胞膜は、イオンや有機化合物に対する選択的透過性によって、細胞や細胞小器官への物質の出入りを制御している[3]。 それに加えて細胞膜は、細胞接着やシグナル伝達などさまざまなプロセスに関与し、細胞壁やグリコカリックスと呼ばれる炭水化物に富む層などの細胞外構造の接着表面として機能し、細胞骨格と呼ばれるタンパク質繊維の細胞内ネットワークにも関与する。 合成生物学の分野では、細胞膜の人工的な再構成が行われている[4][5][6]。
これを攻略するのですが、
  1. 多色ハイライトのみ
  2. ボールドのみ
  3. 多色ハイライト&ボールド
の3つがあります。多色ハイライトとボールドの連携の効果を確認するには、それぞれ単体との比較が必要です。

多色ハイライト単体との比較

ボタンを押すと、(1)多色ハイライトのみ、と(3)多色ハイライト&ボールドが切り替わります。
ギミックボタン
(1)多色ハイライトのみ

細胞(さいぼうまく、cell membrane)は、細胞の内外を隔てる生体膜で[1][2]、タンパク質が埋め込まれた脂質二重層によって構成される。 形質膜や、その英訳であるプラズマメンブレン (plasma membrane) とも呼ばれる。 細胞は、イオンや有機化合物に対する選択的透過性によって、細胞細胞小器官への物質の出入りを制御している[3] それに加えて細胞は、細胞接着やシグナル伝達などさまざまなプロセスに関与し、細胞壁やグリコカリックスと呼ばれる炭水化物に富む層などの細胞外構造の接着表面として機能し、細胞骨格と呼ばれるタンパク質繊維の細胞内ネットワークにも関与する。 合成生物学の分野では、細胞の人工的な再構成が行われている[4][5][6]
(3)多色ハイライト && ボールド

細胞さいぼうまくcell membrane)は、細胞の内外を隔てる生体膜[1][2]タンパク質が埋め込まれた脂質二重層によって構成される。 形質膜や、その英訳であるプラズマメンブレン (plasma membrane) とも呼ばれる。 細胞は、イオン有機化合物に対する選択的透過性によって、細胞細胞小器官への物質出入りを制御している[3] それに加えて細胞は、細胞接着シグナル伝達などさまざまなプロセスに関与し、細胞グリコカリックスと呼ばれる炭水化物に富む層などの細胞外構造接着表面として機能し、細胞骨格と呼ばれるタンパク質繊維細胞内ネットワークにも関与する。 合成生物学の分野では、細胞の人工的な再構成が行われている[4][5][6]


多色ハイライト単体だと、重要語である「細胞」「細胞膜」がどの位置にあるかは明らかになります。一方でそこにボールド(自然な単位)が加わると、重要語である「細胞」に関連するものとして、「細胞膜」、「細胞の内外を隔てる生体膜」、「細胞小器官」、「細胞接着」、「細胞壁」、「細胞外構造」、「細胞骨格」、「細胞内ネットワーク」といった単語がまず視認できます。


ボールド単体との比較

ボタンを押すと、(2)ボールドのみ、と(3)多色ハイライト&ボールドが切り替わります。
ギミックボタン
(2)ボールドのみ

細胞さいぼうまくcell membrane)は、細胞の内外を隔てる生体膜[1][2]タンパク質が埋め込まれた脂質二重層によって構成される。 形質膜や、その英訳であるプラズマメンブレン (plasma membrane) とも呼ばれる。 細胞は、イオン有機化合物に対する選択的透過性によって、細胞細胞小器官への物質出入りを制御している[3] それに加えて細胞は、細胞接着シグナル伝達などさまざまなプロセスに関与し、細胞グリコカリックスと呼ばれる炭水化物に富む層などの細胞外構造接着表面として機能し、細胞骨格と呼ばれるタンパク質繊維細胞内ネットワークにも関与する。 合成生物学の分野では、細胞の人工的な再構成が行われている[4][5][6]
(3)多色ハイライト && ボールド

細胞さいぼうまくcell membrane)は、細胞の内外を隔てる生体膜[1][2]タンパク質が埋め込まれた脂質二重層によって構成される。 形質膜や、その英訳であるプラズマメンブレン (plasma membrane) とも呼ばれる。 細胞は、イオン有機化合物に対する選択的透過性によって、細胞細胞小器官への物質出入りを制御している[3] それに加えて細胞は、細胞接着シグナル伝達などさまざまなプロセスに関与し、細胞グリコカリックスと呼ばれる炭水化物に富む層などの細胞外構造接着表面として機能し、細胞骨格と呼ばれるタンパク質繊維細胞内ネットワークにも関与する。 合成生物学の分野では、細胞の人工的な再構成が行われている[4][5][6]


ボールドの時点では「モノ」が示されます。それにより現実を眺める際と同様の2D的な読書が可能となります。 更にそこに多色ハイライトを加えると、ハイライトの加わっている単語(「細胞膜」、「細胞の内外を隔ている生体膜」、「細胞小器官」など)とハイライトの加わらないボールドのみの単語(「タンパク質」、「脂質二重層」、「形質膜」)の二つに分けられます。 カラーの有無でどう変わるか、画像で考えてみます。 絵の中に何があるか、の観点で以下の二つを見比べてみてください。
ギミックボタン

1. 白黒

折返し

2. カラー

スタック


カラーになると、「カラー」と「白黒」の二つに分けられます。分けたあとで「白黒」の方から例えば、つぶつぶの果物(よく見るとグレープ)だったり、葉っぱやフルーツたちを収容しているバスケット、などです。 これは絵の例ですが、現実を記号化したものである言語、文章でも同様です。
  1. 色がついている「モノ」な部分
  2. 色がついてないけど「モノ」な部分(ボールドのみ)
  3. そうでない部分(モノ以外)
絵と違うのは「モノ以外」が出てくる点ですが、分類が3つになっただけで本質は変わらないです(※)。 ボールドが存在しないと、つまり多色ハイライトだけだとここまでの鮮やかさは出てきません。「多色ハイライト単体との比較」の部分を再度眺めてみてほしいです。

(※)色がついている「モノじゃない部分」は?という質問は鋭い質問だと思います。テキストトランスフォーマー(PPL++)はそういう、色がついている「モノじゃない部分」を極力出てこないようにしています。オートハイライト時にはボールド以外にはハイライトは施さない、マニュアルハイライト時には施す(違和感がないようにボールドにしておく)、という区別をしてたりします。マニュアルハイライトはある意味でテキスト検索的な意味合いがあるので、網羅的にハイライトされているのが自然だからです。さらにハイライト対象にした時点である意味で「キーワード」というモノなので、ボールドにするのが自然、という若干詭弁ぽい、しかし全体の整合を採るには大事、なスタンスでプログラムを組んでいます。

細胞膜(全文・サンプル)


細胞膜

先程の文章を冒頭に持つ細胞膜に関するWikipediaの記事です。左下のボタンで起動です。自由に観察・実験してみてください。 オススメは「細胞膜」全体をマニュアルハイライトしてしまう(やり方は こちら)ことです。すでにオートハイライトで「細胞」まわりが自動ハイライトされているはずですが、「細胞膜」は記事の名称そのものなので特段に区別します。そうすると、主題(細胞膜)と「それ以外の細胞要素」を分けて観察が出来ます。

具体例3(ChatGPT)

ChatGPT

せっかくなのでもう一例。ChatGPTの出力する文章も、正確さを重視して冗長さを厭わない系の文章です。この冗長さが故にChatGPTが微妙だという人も少なからずいます(私の周囲を見ていると)。しかしこのようにハイライト+自然な単位を入れるとどうでしょうか?読むのが苦手な人もそうですが、読めていると思っている人も意外と読めてないと分かるかも知れません(私もそうでした)。 リンク先の文章は二つの摩擦についての話をしています。「摩擦」がオートハイライトされるので「静止摩擦」「動摩擦」の二つが話題になっているのが分かります。両者をマニュアルハイライトすると更に楽に読めるようになります。

まとめ

自然な単位(モノ)は限定子+基底語で表現されます(ボールド体)。基底後は重要語なのでしばしば多色ハイライトの対象となります。その際にボールドかつ非ハイライト部として「限定子」がノーコストで強調されることになります。これは物事を説明する系、読者に理解を促す系の文書、さらに正確性を重視し冗長性を厭わない文書の攻略に極めて有効です。更に、(1)ハイライトが全部ないし一部かかるボールド(その文章中でトピックになっているモノ)、と(2)ハイライトが全くかからないボールド(それ以外のモノ)、(3)どちらもかからない(モノ以外)がきれいに分かれます。ボールドのみ(ハイライトなし)の場合と比べて(2)が際立つのが大事です。

予告

次は文章アライメント(「適切な位置での改行と左揃え」)についての説明です。これは立ち位置的には「自然な単位」に関係しますが、毛色が違うので独立させました(※)。ネタバレすると個々の文章も「自然な単位」です。普段の読書ではそれが整然としない状態で読んでいます。そのあたり画像での比喩も含めて説明する予定です。

駄文

(若干ポエムです)私はこの事実(自然な単位 = 限定子 + 基底語、基底語をハイライトすると自動的に限定子が浮かび上がる)に気づいた際には得も言われぬカタルシスを感じました。非常にシンプルな原理ですが深遠です。そしてこの技術に対する疑いを一掃しました。開発者としてはしばしばメタ視点(このやりかた、パラメータは本当にうまくいっているのかを確認する)に入り込んで、逆に読みづらくなったりします。そのたびに自信を失ったり、色々投げ捨ててこの方向に進んで良いんだろうか、と、自問自答していましたが上の事実(事実と言ってしまいます)に気づくと、これは事実なので慌てなくても勝手に広まるだろうと。まあ広まらなくても実際にソフトウェアに落とし込んだこと、それによりこの深遠な事実に気づけたこと、これだけでも十分お釣りがくる開発でした。ゆっくり急ぐ感じで釣り針を垂らしています。

駄文2

文章アライメントの技術自体はそんなに難しくないので考え自体は既に合ったと思います。私も遊びで数年前につくっていたギミックです。ただし素の文章、つまり白黒の文章でこれをやってもあまりメリットが感じられないというか、むしろ連続して読む分にはリズム感が損なわれて、つまり右端が揃ってないことで読みづらくなるとして放置していました。 一方でPPL++の開発としては今回までの「多色ハイライト」と「自然な単位(ボールド)」のみで十分だと思っていました、半年前までは。 偶然、確かBlueskyというSNSで誰かと絡んでいるときに、そういえばこんなの(文章アライメント)つくってたなぁ、って。デモしてあげようかなって流れでああそういえばPPL++と連携させたらどうなるかな、あたりで気づきました。偶然って怖いですねぇって。実際、今までの説明もいかにも演繹的に展開していますが、全て偶然だったりします。「自然な単位」の存在が開発の発端ではありますが、最初は網羅的ではなかったです。ハイライトの際にそれを含む名詞句を全て同じ色でハイライト(それもマーカー的ではなく文字自体を変える)、といった具合です。これもスラッシュリーディングの再現、という別のネタから今の路線に方向修正されました。この辺りも別の機会に書いてみたいです。

今考えると次回の文章アライメントがあって漸く完成します。多色ハイライト、ボールドといった強調は「句点を見えづらくします」。さらに、皆さん気づかないかも知れませんが、硬い文章は一定の文法というか書体、ルールに従って書かれています。文単位で、です。文章アライメントを施し、かつ多色ハイライト、ボールド強調をして初めて気づきます。書き手側の労力に。それを活かすと非常に読みやすく、かつきれいなシンメトリを感じることと思います。具体例は既に トップページに出てきています、「文章の例」というやつです。あれは典型例ですね。最初から改行していてよ、それに改行しているのが殆どでしょう?と思われるかもですが、このように1行化されている文章は結構多いです。試しに手元の教科書などを見てみてください。